python数据分析三剑客(python数据分析从小白到专家)
python编程入门三剑客怎么样
Python凭借着简单易学、功能强大,已经跃居编程语言热门榜的位置
python培训机构哪里好?
Python培训现在市面上做的挺多的,适合自己的才是最好的。我报名的千锋,我是在听过千锋试听课之后才决定的,而且他家的试听可以俩个星期,足够了解一个机构了。这样的机构真的是很有实力的,课程内容都很丰富,课程设计由浅入深,更容易使我们接受。老师的讲解也比较细则,解答问题也比较及时,只要课上认真听,课下多练习,就能够收获很大。当然,如果你自己不学习就是找再好的机构老师也是没用的,只有找到好的机构,再加上自己的努力才能够达到学习的目的。
什么是不属于数据分析和处理的三剑客
Scipy。不属于数据分析和处理的三剑客是Scipy,SciPy是一个开源的Python算法库和数学工具包,SciPy包含的模块有最优化、线性代数、积分、插值、特殊函数、快速傅里叶变换、信号处理和图像处理、常微分方程求解和其他科学与工程中常用的计算。
Python自学可以吗?
一周或者一个月。
如果完全靠自己自学,又是从零基础开始学习Python的情况下,按照每个人的学习和理解能力的不同,我认为大致上需要半年到一年半左右的时间。
当然了,Python学习起来还是比较简单的,如果有其他编程语言经验,入门Python还是非常快的,花1-2个月左右的时间学完基础,就可以自己编写一些小的程序练练手了,5-6个月的时间就可以上手做项目了。
从一定程度上来说,一些零基础的初学者想要利用两个月的时间掌握好Python是不太可能的,学习完Python后想要应聘相对应的工作岗位,即便是选择最快的学习方式也是很难实现的,无法快速实现就业。
网页常识
1.做网页必备的知识做网页必备的知识,和怎样做网页
Html基础。
.不过这个一般不用学,多看看网页的代码就会得差不多了.. 如果刚开始学,建议使用微软的"Frontpage",这个软件继承了微软的WYSIWYG风格(英文:What You See Is What You Get,即:所见即所得),你可以很快很简单地做好一个网页. 以后慢慢可以学着用Macromedia公司的"Dreamweaver".比较专业. 需要注意的是,在做网页的同时,必须掌握一些图片制作的软件技术,像PS或者Fireworks.这样有利于自己随心所欲的设计和制作. 如果有什么不明白的,可以给我发消息.。
2.一个人做网站需要掌握哪些知识
这个问题 也许只有我知道了 ,我就是一个人做网站的 。其实做网站 不一定要把全部知识学会 。
网站 分为两个部分,前端和后端 。(为什么要罗嗦这个 ,因为怕刚接触的人不知道) 前端 ,也就网页在浏览器呈现给 浏览者看的内容 。这一部分 要掌握的 技术:
1. xhtml 或者html5
2. css
3. javascript
4. jquery
5. photoshop 软件 修图用的
6. illustrator 软件 制作图形用的
7. 还有 网页三剑客 ,是什么这里不说了 ,就是三款软件 。不过本人 开始的时候用过,现在基本不用了。
8. 还有就是 代码编辑器的使用。
9. 网页美工。
上面这些不一定要全部掌握 必须掌握的 1.2. 是必须要会的。
到这里 网页前端 要学习的内容也就差不多了。
后端要学习的内容 ,包含前端学习的所有内容 。在加上 编程语言
1. 这是我最喜欢的语言
2. asp
3. java
4. asp
5. python
上面这些 语言之需要 学会一种就可以了 。其实 就是 控制网站 程序的 一种语言 。当然我是这么理解 的。
到这里 其实 也没有全部 讲完 。 还有一些 前端 框架的使用 。这里就不细说了 ,因为对于一个新手来说 ,当接触网站一段时间 慢慢就都知道了。
还有一些知识 ,就是网站程序的使用 ,和一些开源程序的使用和学习了 。其实做网站 主要是 分为 两种 ,一种是用开源程序建设网站 ,一种是 自己写编程 开发网站 。这里就不细说了 。有什么不明白的 在追问吧 。 其实 要说 做网站 的事情 ,就是现在 我也没有说明白 ,因为做网站 太简单 。要看你做的什么网站 ,做网站也太难 ,也看你做的什么网站 。
3.谁可以教我网站的知识
新人做网站必备的一些基础知识
1语言
一个网站首先展现给大家的是网页,网页内包含文字、图象、音频等信息。大家都知道html或者htm格式是网页的基本格式,理所当然html语言是一个站长首先要学习的。html语言不难学,作为标记语言,前后两个标记相对应,html代码清晰易懂。虽然现在整站程序(包括CMS,BLOG等)已经广泛与市面,但是修改模板,网页排版等方面,都需要html语言知识,所以html是必学的。
2.动态语言(包括asp,,java等)
相对于html是静态语言,动态语言这几年很受欢迎。因为它的效果和作用远不是html能比的。学习动态语言有一定的难度,建议先学习一门编程语言,VB或者C语言都是不错的选择,众所皆知,C语言和还有java都相近,而且学会了基本编程语言都,再去学习asp和简直易如反掌,因为语言具有相通性,基本的算法都差不多。
3.网络安全知识
现在的一些小黑老喜欢拿网站开刀,大家最好学习一些关于网络安全方面的知识,比如后台地址的隐藏,数据库的防暴库(常见的数据库连接文件conn或者const都是比较容易出错的地方),密码的强度(md5密码纯数字可以一下子解密,最好用数字加英文加特殊符号),如果你用的是人家做的整站程序,需要随时关注此程序在各大黑客站点上是否有漏洞暴出.前些日子的wind和最近的oblog漏洞都很严重,有漏洞的一定要及时补上。
非技术知识体系
1.统计
统计可以用51.la或者zz的统计代码,每天抽出3-5分钟时间看下统计结果,分析下主要的ip来自哪里,哪里的推广效果最好,哪个关键字是你的专长,这样才能更有针对性的宣传推广。
2.搜集
刚开始做站,不可能做到每一篇文章都是原创,那就要搜集别人的经验文章,但不是照搬发表。要学会利用搜索引擎,比如baidu和google的一些特殊功能:site:cash8可以查到收录了多少篇;"link:cash8"将找出所有指向网站主页的网页,这些技能网上找下就可以了。
3.编辑
编辑包括文字编辑和美工。搜集回来的文章大多有人家的连接或者一些没用的信息,要学会过滤和整理,技术性的文章要易懂,经过整理后再发表。美工方面,最好学会PS和DW的基本用法,基本上自己的网站不要用别人来帮你做图片了就OK。
4.推广宣传
最好的宣传莫过于口碑宣传了,有人觉的你的网站好自然会介绍给他的朋友,平时多到论坛或者其他交互性的网站去帮助人家解决问题,我想一般人都会感激帮助他的人,在签名档放个连接就行了,所产生的流量是稳定而且卓有效果的,千万不要去发AD,不仅没什么效果,也会留下坏印象。发表一些整理好的文档,比如电子书,有美工底子的可以做电子杂志等,这些被称为病毒式传销,效果是很大的。
5.SEO优化
搜索引擎优化大同小异,不要过分seo,一个真正的好站,人心所向,百度不可能不给你靠前的。
6.人脉网络
人际关系,如果想做大,做强,一个人很难在互联网上站稳脚跟,有所建树,你要调动所有可利用 的资源,为一个前途的打下基础;打造一个有战斗力的团队;多交一些这行的朋友,站长也好,网友也好,他们都能成为你的老师,三人行,必有我师。记住,要真心去交,朋友才是最宝贵的,不随时间而改变。
4.“网页设计”要学哪些什么知识
熟悉HTML/CSS/JS等网页基本元素,完成阶段可自行制作完整的网页,对元素属性达到熟悉程度。
用Dreamweaver自己先找个简洁点的网站模仿着做,如果不会Dreamweaver那么就先买本Dreamweaver的书看看吧。很简单的就学会了,然后了解CSS。会了CSS就可以做静态页面了,你可以找个简洁点的公司网站,模仿着做。静态页面做熟练了,就会有需求学动态脚本语言了,PHP,ASP等动态语言。
如果只想建立一个自己的主页,事实上并不需要掌握太深奥的知识,因为笔者认为,网上有很多现成的资源可以利用,如果自己去花钱买书专门来学,恐怕有点“杀鸡用牛刀”,花大力气办小事情的感觉。当然,如果要学会制作主页,笔者认为至少需要以下方面的知识:
HTML:最基本的知识,如果HTML知识掌握得好,可以用记事本就可以熟练编写网页(当然,不推荐这么做,因为有现成的工具可以帮助编写HTML,但拥有这种能力是很好的)会对日后使用编辑主页,编写ASP或PHP代码有极大帮助。
ASP或PHP:ASP和PHP可以称得上编写动态主页的主流语言环境。对于入门者如果编程经验很少,可以从简单的语言起步,如微软公司的 VBScript脚本语言,如果已经有不少编程经验,建议学习PHP或JavaScript语言,PHP在商业网站中应用得较为广泛。如果希望谋一份网站制作的工作,学好PHP还是很值得的;
对于JavaScript而言,可用于服务器端(比如ASP编程),也于应用于客户端编程(比如制作一些DHTML动态效果等),而且 JavaScript已被欧洲标准协会列为一门语言标准,将来的应用也会很广泛(例如Flash的脚本语言也采用了JavaScript);
总之,想从简单起步,可以看一些ASP+VBScript的书籍,
如果想学得更深入,应该学习ASP+JavaScript和PHP。
问题二:如何做好一个网站
笔者认为,一个网站更多时候不是“写”出来的,而是“设计”出来的,设计大体包括二方面内容:功能设计及界面设计。
功能设计依照网站面向的用户而定,建议多参考一些专业网站(而不是大众型网站,如网易,搜狐等)的功能设计,专业网站的特点是针对性强,功能设计与其专业性质有息息相关,能很好的显示功能设计。
界面设计即简单又不简单,简单的是界面设计只是在功能设计的基础上作一些美工设计;不简单的是,要设计既得好看,又与功能设计很贴切是很考究制作者的美术和平面设计功底的。对于不会设计的朋友,可以多参考一些专业设计网站,如蚁盟等,看一下专业设计师如何配色,排版,图片如何与文字和谐搭配等。
读者可参考一些专业设计书籍,如工业设计,平面设计,虽然与网页设计直接搭不上关系,但笔者认为学设计其实是学习设计理念,而设计的理念是可以触类旁通的。同时,多参考一些设计得比较好的网站对设计是很有益处的。
5.做网站的基本知识是什么
做网站是需要艺术细胞的,女孩子在这方面应该有天赋吧!
先在纸上画好网站的分布,就是包括的内容,然后就开始设计。
设计什么呢?LOGO(标题)背景 排版等等
(我想都是女孩子擅长的吧!)
一个网站不是一周两周就做好的,你可以先做个草稿,最后一些布局、颜色搭配的东西以后慢慢做。
当然,作网站的基础知识还是要的。这里就给你一个做网站的简单教程吧!希望能对你有帮助!
希望你能得到老板的肯定,祝你好运!
群体遗传学与重测序分析
分子层面对生物的研究,在个体水平上主要是看单个基因的变化以及全转录本的变化(RNA-seq);在对个体的研究的基础上,开始了群体水平的研究。如果说常规的遗传学主要的研究对象是个体或者个体家系的话,那么群体遗传学则是主要研究由不同个体组成的群体的遗传规律。
在测序技术大力发展之前,对群体主要是依靠表型进行研究,如加拉巴哥群岛的13中鸟雀有着不同的喙,达尔文认为这是自然选择造成的后果 。达尔文的进化论对应的观点可以简单概括为“物竞天择,适者生存”,这也是最为大众所接受的一种进化学说。直到1968年,日本遗传学家提出了中性进化理论[2],也叫中性演化理论。中性理论的提出很大程度上是基于分子生物化学的发展。可以这样理解中性理论:一群人抽奖,在没有内幕的情况下,每个人抽到一等奖的概率是相等的,这个可能性和参与抽奖的人的身高、年龄、爱好等因素都没有关系。中性理论常作为群体遗传研究中的假设理论(CK)来计算其他各种统计指标。
群体遗传学,研究的单位是群体,比如粳稻、籼稻、野生稻,就能够构成不同的群体;我们国内的各省份的水稻也可以作为一个个群体。 群体遗传学大概可以分为群体内的研究和群体间的研究。比如研究云南元阳的水稻的遗传多样性;如果研究是的云南元阳的水稻和东北的水稻,那就可以算成是群体间的研究。群体间和群体内的研究是相互的。
测序价格的急剧下降[3]使得大规模的群体测序得以实现。
常见的变异类型有SNP、IdDel、SV、CNV等。重测序中最关注的是SNP,其次是InDel。其他的几种结构变异的研究不是太多。
有参考基因组的物种的全基因组测序叫做重测序,没有参考基因组的物种的全基因组测序则需要从头组装。随着测序价格的降低,越来越多物种的参考基因组都已经测序组装完成。 plant genomes [4]网站实时显示全基因组测序已经完成的植物,其中2012年以后爆发式增长。在群体遗传学研究中更多的是有参考基因组的物种,尤其是模式物种,植物中常见的是拟南芥、水稻和玉米。
主要的分析流程见下图。现在的测序公司基本上都会帮客户完成整个的分析流程,因为主要耗费的资源是计算资源。我认为在整个分析的流程中最重要的是Linux目录的构建,混乱的目录会导致后续的分析频频出问题,重测序分析会生成很多的中间文件,良好的目录管理会使得项目分析流程井然有序。
该部分涉及到的软件的安装和基础的Linux基础知识就不详细说明了。
正选择似乎可以更好地用自然选择来解释。就是一个基因or位点能够使个体有着更强的生存力或者是育性,这样就会使得这个个体的后代更多,如此一来,这个基因or位点在群体中就越来越多。
正选择能够使有利的突变基因or位点在群体中得到传播,但是与此同时却降低了群体的多态性水平。也就是说原先该位点周围的核苷酸组成是多样性的,在经过正选择之后,这个位点周围核苷酸的多样性就渐渐的趋于同质化了。这就好比一块田,里面本来有水稻和稗草及其他杂草,由于稗草的适应性增强,稗草在逐渐增多,水稻慢慢变少,最后甚至是只剩下了稗草。
我们将这种选择之后多态性降低的情况叫做选择扫荡(Selective Sweep)。检测选择扫荡的软件有SweeD[7]。选择扫荡有可能是人工选择的结果,如2014年 Nature Genetics关于非洲栽培稻的文章就使用了SweeD来检测非洲栽培稻基因组上受人工选择的区域[8]。
负选择和正选择刚好是相反的。简单理解成群体中的某个个体出现了一个致命的突变,从而自己或者是后代从群体中被淘汰。这也导致群体中该位点的多态性的降低。就好比我有10株水稻,其中一株在成长过程中突然不见了,那么对我的这个小的水稻群体来说,这个消失的水稻的独有的位点在群体中就不见了,整体的多态性就降低了。
平衡选择指多个等位基因在一个群体的基因库中以高于遗传漂变预期的频率被保留,如杂合子优势。
平衡选择检测的算法有BetaScan2[10],这是个Python脚本,输入文件只需要过滤好的SNP数据即可。
计算公式为:
其中 是有效群体大小, 是每个位点的突变速率。 但是群体大小往往是无法精确知道的,需要对其进行估计。
分离位点数 是 的估计值,表示相关基因在多序列比对中表现出多态性的位置。计算公式为:
其中 为分离位点数量,比如SNP数量。
为个体数量的倒数和:
指的是核苷酸多样性,值越大说明核苷酸多样性越高。通常用于衡量群体内的核苷酸多样性,也可以用来推演进化关系[11]。计算公式为:
可以理解成现在群体内两两求 ,再计算群体的均值。计算的软件最常见的是 vcftools ,也有对应的R包 PopGenome 。通常是选定有一定的基因组区域,设定好窗口大小,然后滑动窗口进行计算。
3KRGP文章就计算了水稻不同亚群间4号染色体部分区域上的 值[12],能够看出控制水稻籽粒落粒性的基因 Sh4 位置多态性在所有的亚群中都降低了。说明这个基因在所有的亚群中都是受到选择的,这可能是人工选择的结果。
Tajima's D是日本学者Tajima Fumio 1989年提出的一种统计检验方法,用于检验DNA序列在演化过程中是否遵循中性演化模型[14]。计算公式为:
D值大小有如下三种生物学意义:
叫固定分化指数,用于估计亚群间平均多态性大小与整个种群平均多态性大小的差异,反映的是群体结构的变化。其简单估计的计算公式为:
的取值范围是[0,1]。当 时,表明亚群间有着明显的种群分化。
在中性进化条件下, 的大小主要取决于遗传漂变和迁移等因素的影响。假设种群中的某个等位基因因为对特定的生境的适应度较高而经历适应性选择,那该基因的频率在种群中会升高,种群的分化水平增大,使得种群有着较高的 值。
值可以和GWAS的结果一起进行分析, 超过一定阈值的区域往往和GWAS筛选到的位点是一致的,如2018年棉花重测序的文章[15]:
ROD可以基于野生群体和驯化群体间核苷酸多态性参数 的差异识别选择型号,也可以测量驯化群体和野生型群体相比损失的多态性。计算公式为:
和 一样,ROD也可以和GWAS结合起来:
群体结构分析可以简单理解成采样测序的这些个体可以分成几个小组,以及给每个个体之间的远近关系是怎么样的。群体结构分析三剑客, 分别是 进化树 、 PCA 和 群体结构图 。
进化树就是将个体按照远近关系分别连接起来的图。
常用的绘图软件是 Phylip 和 Snpphylo 。进化树修饰的软件有 MEGA , ggtree 等,推荐网页版工具 iTOL ,无比强大。
外群定根法:当群体的个体的差异很小时,可以引入其他物种作为根。如在对三叶草建树时可以引入水稻的序列作为根进行建树。
PCA是很常见的降维方法,如微生物研究中常用来检验样品分群情况。PCA计算的软件很多,plink可以直接用vcf文件计算PCA,R语言也可以进行PCA计算。
PCA图在群体重测序中有如下几种作用:
进化树和PCA能够看出来群体是不是分层的,但是无法知道群体分成几个群合适,也无法看出群体间的基因交流,更无法看出个体的混血程度。这时候就需要群体分层图了。
可以将进化树和群体分层图结合进行展示,如下图:
先了解下概念,此处借鉴基迪奥生物网站的解释[22]。
要理解 LD 衰减图,我们就必须先理解连锁不平衡(Linkage disequilibrium,LD)的概念。连锁不平衡是由两个名词构成,连锁 + 不平衡。前者,很容易让我们产生概念混淆;后者,让这个概念变得愈加晦涩。因此从一个类似的概念入手,大家可能更容易理解 LD 的概念,那就是基因的共表达。
基因的共表达,通常指的是两个基因的表达量呈现相关性。比较常见的例子就是:转录组因子和靶基因间的关系。因为转录因子对它的靶基因有正调控作用,所以转录因子的表达量提高会导致靶基因的表达量也上调,两者往往存在正相关关系。这个正相关关系,可以使用相关系数 来度量,这个数值在 - 1~1 之间。总而言之,相关性可以理解为两个元素共同变化,步调一致。
类似的,连锁不平衡(LD)就是度量两个分子标记的基因型变化是否步调一致,存在相关性的指标。如果两个 SNP 标记位置相邻,那么在群体中也会呈现基因型步调一致的情况。比如有两个基因座,分别对应 A/a 和 B/b 两种等位基因。如果两个基因座是相关的,我们将会看到某些基因型往往共同遗传,即某些单倍型的频率会高于期望值。
参照王荣焕等[23]的方法进行LD参数计算:
随着标记间的距离增加,平均的LD程度将降低,呈现出衰减状态,这种情况叫LD衰减。LD衰减分析的作用:
GWAS(genome-wide association study),全基因组关联分析,常用在医学和农学领域。简单理解成将SNP等遗传标记和表型数据进行关联分析,检测和表型相关的位点,然后再倒回去找到对应的基因,研究其对表型的影响。这些被研究的表型在医学上常常是疾病的表型;在农学上常常是受关注的农艺性状,比如水稻的株高、产量、穗粒数等。GWAS思想首次提出是在心肌梗塞的治疗上[24],首次应用是在2005年的文章上[25]。
目前使用最广泛的模型是混合线性模型[26]:
所有的参数软件(如Emmax)会自动完成计算。
GWAS结果文件通常只有两个图,一个是曼哈顿图,另外一个是Q-Q图。一般是先看Q-Q图,如果Q-Q正常,曼哈顿图的结果才有意义。
MSMC(multiple sequentially Markovian coalescent)[27],底层算法很复杂,类似于PSMC。MSMC的主要功能是推断有效群体大小和群体分离历史。
这样看起来更直观:
LAMP(Local Ancestry in Admixed Populations,混杂群体的局部族源推断),用于推断采用聚类的方法假设同时检测的位点间不存在重组情况,对每组相邻的 SNP 进行检测分析[28],在运算速度和推断准确度上都有了质的飞跃。
用于推断群体分离和混合[29]。图是这样的:
测序方案关系到后续的分析,不同的样本量对应不同的测序方法和分析方法。
[1]. 自然选择(维基百科)
[2]. Kimura, Motoo. "Evolutionary rate at the molecular level." Nature . 217.5129 (1968): 624-626 .
[3]. 测序价格变化趋势
[4]. plant genomes
[5]. DePristo, Mark A., et al. "A framework for variation discovery and genotyping using next-generation DNA sequencing data." Nature Genetics . 43.5 (2011): 491.
[6]. Biswas, Shameek, and Joshua M. Akey. "Genomic insights into positive selection." ** TRENDS in Genetics . 22.8 (2006): 437-446.
[7]. Pavlidis, Pavlos, et al. "Sweed: likelihood-based detection of selective sweeps in thousands of genomes." Molecular biology and evolution 30.9 (2013): 2224-2234.
[8]. Wang, Muhua, et al. "The genome sequence of African rice (Oryza glaberrima) and evidence for independent domestication." Nature Genetics 46.9 (2014): 982.
[9]. Bamshad, Michael, and Stephen P. Wooding. "Signatures of natural selection in the human genome." Nature Reviews Genetics 4.2 (2003): 99.
[10]. Siewert, Katherine M., and Benjamin F. Voight. "BetaScan2: Standardized statistics to detect balancing selection utilizing substitution data." BioRxiv (2018): 497255.
[11]. Yu, N.; Jensen-Seaman MI; Chemnick L; Ryder O; Li WH (March 2004). Genetics . 166 (3): 1375–83.
[12]. Wang, Wensheng, et al. "Genomic variation in 3,010 diverse accessions of Asian cultivated rice." Nature 557.7703 (2018): 43.
[13]. Li, C., Zhou, A. Sang, T. Rice domestication by reducing shattering. Science 311, 1936–1939 (2006).
[14]. Tajima, Fumio. "Statistical method for testing the neutral mutation hypothesis by DNA polymorphism." Genetics 123.3 (1989): 585-595.
[15]. Du, Xiongming, et al. "Resequencing of 243 diploid cotton accessions based on an updated A genome identifies the genetic basis of key agronomic traits." Nature Genetics 50.6 (2018): 796.
[16]. Lu, Kun, et al. "Whole-genome resequencing reveals Brassica napus origin and genetic loci involved in its improvement." Nature communications . 10.1 (2019): 1154.
[17]. Zhou, Z., Jiang, Y., Wang, Z. et al. Resequencing 302 wild and cultivated accessions identifies genes related to domestication and improvement in soybean. Nat Biotechnol 33, 408–414 (2015).
[18]. Liang, Z., Duan, S., Sheng, J. et al. Whole-genome resequencing of 472 Vitis accessions for grapevine diversity and demographic history analyses. Nat Commun 10, 1190 (2019).
[19]. Alexander, D.H., Lange, K. Enhancements to the ADMIXTURE algorithm for individual ancestry estimation. BMC Bioinformatics 12, 246 (2011).
[20]. Francis, Roy M. "pophelper: an R package and web app to analyse and visualize population structure." Molecular ecology resources 17.1 (2017): 27-32.
[21]. .
[22]. .
[23]. WANG Rong-Huan, WANG Tian-Yu, LI Yu. Linkage disequilibrium in plant genomes[J]. HEREDITAS , 2007, 29(11): 1317-1323.
[24]. Ozaki, K., Ohnishi, Y., Iida, A. et al. Functional SNPs in the lymphotoxin-α gene that are associated with susceptibility to myocardial infarction. Nat Genet 32, 650–654 (2002).
[25]. Klein, Robert J., et al. "Complement factor H polymorphism in age-related macular degeneration." Science 308.5720 (2005): 385-389.
[26]. Yu, Jianming, et al. "A unified mixed-model method for association mapping that accounts for multiple levels of relatedness." Nature genetics 38.2 (2006): 203.
[27]. Schiffels, Stephan, and Richard Durbin. "Inferring human population size and separation history from multiple genome sequences." Nature genetics 46.8 (2014): 919.
[28]. Sankararaman, Sriram, et al. "Estimating local ancestry in admixed populations." The American Journal of Human Genetics 82.2 (2008): 290-303.
[29]. Pickrell, Joseph K., and Jonathan K. Pritchard. "Inference of population splits and mixtures from genome-wide allele frequency data." PLoS genetics 8.11 (2012): e1002967.
[30]. Chen, Jia-hui, et al. "Genome-wide analysis of Cushion willow provides insights into alpine plant divergence in a biodiversity hotspot." Nature communications 10.1 (2019): 1-12.
[31]. 孙宽,侯一平。法医族源推断的分子生物学进展 [J]. 法医学杂志 ,2018,34 (03):286-293.
[32]. genek.tv