“我們是誰?我們從哪裏來?”認識歷史,離不開考古學。

近年來,我國考古取得了豐碩的成果。如,中國科學院古脊椎動物與古人類研究所付巧妹團隊關於古基因組揭示近萬年來中國人羣的演化與遷徙歷史的研究成果,填補了東方尤其是中國地區史前人類遺傳、演化、適應的重要信息缺環;三星堆6座文化“祭祀坑”考古新發現是中華文明多元一體發展模式的重要實物例證,充分體現了古蜀文明、長江文化對中華文明的重要貢獻。

考古爲我們揭示了中華文明起源,重現中華文明的燦爛成就,展示中華文明對世界文明的重大貢獻,增強了民族自信。時值中國考古學誕生100週年,我們溯源歷史的腳步從未停止,探尋答案的途徑卻更加多樣。隨着科學技術的發展,考古學研究不斷深入,科技在考古研究中佔比大幅提升。浪潮攜手吉林大學古DNA實驗室,將智算應用到DNA考古中,解鎖古生物的生命奧祕,重現古老文明演變的軌跡,溯源人類文明。

將基因分析應用於考古學研究中,已經成爲國際考古研究中的前沿領域和熱點方向——分子考古學。古DNA是分子考古學的核心,我們知道,遺傳信息保存在DNA中,DNA考古就是利用現代分子生物學的手段提取和分析保存在遺骸中的DNA,同時依靠考古學以及其他學科交叉研究,研究古代生物種羣特徵及相互關係,這一方法,彌補了傳統考古無法觸達的精準,使得考古成果更精準、更科學以及更客觀。

1984年,科學家從早已滅絕的南非斑驢樣本中,找到了微量的DNA並進行了測序,古DNA研究就此誕生;1997年對尼安德特人的研究,證實了古DNA存在的可靠性;2012年,科學家通過對西伯利亞一個洞穴內發現的牙齒和指骨化石提取的DNA進行分析,證明了丹尼索瓦人的存在,被《科學》雜誌評爲2012年度十大科學突破之一;2020年,中國科學家從甘肅夏河縣白石崖溶洞(上圖)的土壤沉積物中提取出丹尼索瓦人的線粒體DNA,表明了丹尼索瓦人自倒數第二次冰期至末次冰期都生活在青藏高原。

吉林大學於1998年建立國內首個考古DNA實驗室,並利用考古學、人類學以及語言學等的跨學科交叉,爲我國北方地區和新疆地區的古人類DNA、古動植物DNA研究和古文明的溯源,做出了巨大的貢獻。2019年,吉大古DNA實驗室成功實現了世界首例古小麥全基因組的破譯,爲理解東西方文化交流及農業傳播,提供了跨時間維度的直接證據;2020年6月1日,吉林大學古DNA研究成果還原了新石器時代農業革命以來,中國北方地區的人羣互動,爲探討中華文明的起源、形成和發展提供了重要證據。

強大算力助力 解鎖藏在DNA裏的祕密

古DNA的提取並不是一件容易的事情。古DNA由於年代久遠、水解、氧化、微生物降解等原因很難完整保留下來,不僅可提取到的量很少,與現代DNA相比更短,科研人員需要對珍貴的古DNA進行更大規模的測序,以獲得更多的有效數據,測序帶來的海量DNA數據對計算力、計算效率都提出了很高的要求。

古DNA的研究中,研究人員先對骨骼樣本進行採集,用專業工具獲得骨骼粉末;採用特有的試劑盒對粉末進行DNA提取;隨後對提取液中的古DNA進行文庫的構建並測序。通過測序儀測得DNA片段的序列信息後,首先比對(Mapping)至所研究物種的參考基因組(References), 然後利用羣體遺傳學分析工具、系統發育軟件等對序列信息進行分析,並與現代或者其他古代人羣、動物等遺傳信息進行比對,從而追溯個體或羣體的來源、遷移以及融合過程等。

無論是比對(Mapping)、羣體遺傳學分析、還是系統發育分析,這些研究數據的處理都對背後的算力提出了要求。過去,科研人員通常使用臺式機和普通的服務器進行一系列數據分析,單次能分析的序列數量非常有限;隨着二代高通量測序技術平臺的開發應用對小片段古DNA分子捕獲能力的增強,科研人員實驗所得的DNA序列大幅提升,帶來了巨大的DNA數據處理需求,臺式機和普通的服務器已經遠遠無法滿足需求。

吉大考古學院與浪潮合作,創新性地開發了基於浪潮智算的基因測序加速應用方案,最大限度地提高了測序精準性、提升了古DNA使用效率,可以在9.64小時內完成全基因組分析,48分鐘完成全外顯子組分析,相比基於CPU的方案,基因數據處理速度提升39倍,加速了古DNA研究成果的誕生。

相關文章