現代人類起源于非洲,相比于其它大陸,現代人類在非洲居住時間*長。并且在遷徙,融合和對環境適應性進化的過程中形成了超過3000個民族和2100種語言。目前非洲人群不僅具有世界上*豐富的遺傳多樣性和表型多樣性,并且現代人類近三分之一的語言都在非洲,是全世界語言*為多樣化的地區之一。但是目前的遺傳學和基因組學的研究中,只有不到3%的樣本來自非洲,存在嚴重的滯后性。
研究非洲人群遺傳多樣性不僅將加深我們對于現代人類起源、早期遺傳結構以及適應性進化的理解,并且也能為健康和診斷研究及開發提供豐富的新遺傳信息。
2023年3月2日,賓夕法尼亞大學Sarah A. Tishkoff團隊(共同一作為復旦大學樊少華青年研究員和斯坦福大學Jeffrey P. Spence)在Cell上發表了文章Whole-genome sequencing reveals a complex African population demographic history and signatures of local adaptation。研究中對**代表性的非洲12個群體180個個體進行全基因組測序分析。這些民族地理分布廣泛,以不同方式為生(包括農業,打獵收集和游牧),并且涵蓋了非洲四個主要的語系。
基于人類參考基因組,研究發現共發現三千兩百萬個單核苷酸多態性位點(single nucleotide polymorphism, SNP),其中大約五百三十個位點是在之前沒有發現的。這些新發現的突變廣泛的存在于增強子,啟動子以及轉錄因子結合位點等基因組功能區域。
研究發現這12個民族的平均SNP個數和遺傳多樣性均具有顯著的差異。以打獵和收集為生的桑人(Ju|’hoansi和!Xoo)和熱帶雨林小矮人(rainforest hunter-gatherther, RHG)的SNP數量和遺傳多態性*高,而Amhara,Fulani,Chabu以及Hadza等民族的遺傳多態性則*低。研究發現大量的非非洲人的基因滲入(Amhara和Fulani)以及嚴重的群體瓶頸 (Hadza和Chabu) 是造成遺傳多態性低的主要原因。例如,生活在坦桑尼亞的Hadza和埃塞俄比亞的Chabu群體的人口數量已經少于1000人。
利用鄰近距離法 (Neighbor-joining method) 對本研究中的12個民族,和來自千人基因組的歐洲人群(CEU),北方漢族(CHB),托斯卡納人群(TSI)以及西蒙斯基因組多態性研究計劃(Simons Genome Diversity Project,SGDP)中的巴布亞人群(Papuan)進行系統計劃分析發現,現代桑人(Ju|’hoansi 和!Xoo)的祖先是現代人類*早發生分歧的一支,隨后發生分歧的是熱帶雨林小矮人的祖先。其他民族在系統進化樹的聚類模式與他們目前所處的地理環境顯著相關,這說明地理環境是制約不同民族間基因交流的重要因素。
現代桑人和小矮人祖先的早期分歧的現象也被主成分分析(principal component analysis, PCA)和ADMIXTURE所支持。同時PCA和ADMIXTURE分析在目前坦桑尼亞說Kheosan語言的Hadza和Sandawe的基因組中也發現了桑人相關的祖源成分。
雖然僅有南部非洲的桑人以及東非坦桑尼亞的Hadza和Sandawe說Khoesan語言, 研究中利用PCA分析將之前發表的來自不同地區的55個古非洲人樣本投射到現代非洲人樣本中。研究發現大量的來自不同地區的古非洲人被投射在桑人和東非Hadza和Sandawe人群之間;但是這些地區目前卻沒有講Khoesan語言的民族。該結果提示Khoesan語系的地域分布曾經非常廣,遍及整個非洲, 但是可能受到班圖大遷徙的影響目前大都滅絕。
由于受到基因交流 (gene flow) 和遺傳重組(recombination)等因素的影響,鄰近距離法,主成分分析和ADMIXTURE無法用來構建現代人類早期遺傳結構。但當將這些因素納入到復雜模型中,發現現代桑人和小矮人的共同祖先,而不是現代桑人的祖先,是現代人類*早分歧的一支。并且研究推斷現代人類的分歧發生在28萬年前,這與之前的考古和基于古DNA推斷的時間一致。
研究中還結合正選擇分析的算法、功能基因組學手段和方法以及大規模全基因組關聯分析的結果,對12個非洲民族特異的適應性進化進行研究,**的繪制了一副非洲人群適應性進化的圖譜。
膚色多樣性是現代人類對于不同維度地區適應性進化的一個重要標志。桑人是非洲人群中膚色*淺的民族,但是研究對于桑人淺膚色的遺傳學基礎仍然缺乏了解。利用功能基因組學等方法,本研究發現一個位于PDPK1基因內部增強子的突變rs77665059-C,是影響桑人淺膚色的一個決定性的因素。該增強子僅在黑色素細胞中特異活躍,使用Crispri沉默該增強子會降低PDPK1基因的表達量和黑色素和合成。研究進一步發現rs77665059-C在桑人中尤其是!Xoo中頻率超過了80%;但是在其它非洲(平均頻率14%)和非非洲民族中(平均頻率3%)頻率卻顯著的低。研究發現rs77665059-C突變會導致PDPK1基因增強子在黑色素瘤細胞系中活性降低,降低PDPK1基因的表達,并且與桑人中的淺膚色表型顯著相關。為桑人的淺膚色進化的遺傳學研究提出了新的解釋。