當古生物遇到新科技
作者:鄧濤(中國科學院古脊椎動物與古人類研究所所長、研究員)
古生物學是一門古老的學科,已經(jīng)有兩百多年的歷史。歷史上如始祖鳥、北京猿人等關鍵化石的發(fā)現(xiàn)都填補了生命演化歷史的空白。如今,新的觀測分析手段,諸如高精度成像與解析技術、分子古生物學技術以及大數(shù)據(jù)和自動識別等,給古生物學這樣的傳統(tǒng)學科注入了新的活力,從原有的以及新發(fā)現(xiàn)的化石中挖掘出大量前所未知的全新信息,讓我們逐漸看清遠古時代。
高精度成像與解析:無損傷、高精度了解化石內(nèi)部結構
傳統(tǒng)上,古生物學家通過肉眼、放大鏡、光學顯微鏡、電子顯微鏡來觀察和研究生物化石外表的宏觀和微觀結構。但是,生物化石的很大一部分信息量包含在其內(nèi)部,需要古生物學家通過其他技術手段來揭示。如果化石樣本數(shù)量很多,可以考慮直接破壞化石,暴露其內(nèi)部結構。更為常規(guī)的手段是通過切片或磨片取得化石某一截面的二維結構信息,如果每個截面之間的距離相等,那么就有可能精確地還原化石內(nèi)部三維結構,這就是連續(xù)切片或磨片。中國科學院古脊椎動物與古人類研究所(以下簡稱“古脊椎所”)張彌曼院士就曾應用連續(xù)磨片技術對肉鰭魚類楊氏魚的頭部進行精細重建,揭示它沒有內(nèi)鼻孔,是原始的肺魚,從而對尋找登陸魚類的真正直接祖先作出了突出貢獻。不過,這項技術必須經(jīng)過磨片、素描、蠟片切割和堆疊成模等一系列極為費時而又對精確度要求極高的過程,因此其應用只能局限于數(shù)量很多、又非常重要的化石標本,但是這兩個要求很難同時滿足。
早在20世紀中葉,就有古生物學家嘗試用X光“透視”化石,但簡單地使用X光照射,只能取得照射方向上的一點模糊內(nèi)部結構信息,要重建各個方向上的全部三維結構信息,就必須使用斷層掃描技術,這有點像無損的磨片或切片。斷層掃描(CT)最初在醫(yī)學和制造業(yè)中發(fā)展起來,20世紀90年代開始,古生物學家嘗試將此技術應用到化石研究中。由于化石比生物體致密得多,且不同化石的物質(zhì)成分千差萬別,直接套用醫(yī)用CT機器往往很難達到理想的掃描效果,研發(fā)古生物研究專用CT就成為迫切需求。在這方面,我國走在了國際前列——2008年,古脊椎所與高能物理研究所和自動化所合作研制了全球首套專門應用于古生物化石研究的高精度CT,包括225kV顯微工業(yè)CT和450kV通用性工業(yè)CT,并于2011年投入使用。這使得古生物學家能夠方便、快速、高質(zhì)量地對不同大小的脊椎動物(含人類)化石及現(xiàn)生生物的內(nèi)部精細形態(tài)和顯微結構進行無損檢測和重建。應用這套設備,古生物學家迅速取得了一批重要成果,如古脊椎所朱敏團隊對早期有頜魚類內(nèi)部結構的重建,補充了“從魚到人”演化史上的關鍵環(huán)節(jié);劉武團隊對中國重要人類化石基于CT的研究,定量重建了遠古人類的顱內(nèi)模、內(nèi)耳骨迷路等精細內(nèi)部結構。
熱河生物群是世界級的化石寶庫,產(chǎn)出在演化史上極為重要的脊椎動物、植物和昆蟲化石,其中許多化石精細、完整地保存了生物體的軟組織,如鱗片、羽毛、毛發(fā)等的細微結構??上У氖菬岷由锶捍蠖鄶?shù)化石來自湖相沉積,保存為壓扁的板狀,其內(nèi)部結構信息往往互相疊壓,普通CT設備很難對其進行掃描和重建。在國家重大科學儀器設備開發(fā)專項支持下,我國研發(fā)了首臺高分辨板狀化石專用X射線顯微層析成像設備Micro-CL(Computed Laminography)。這是目前無損檢測大型板狀標本內(nèi)部結構的唯一手段,大大滿足了古生物學界的研究需求,推動并加快了對熱河生物群及其他類似保存狀態(tài)化石研究領域的工作。這一技術后來在工業(yè)領域也得到運用,產(chǎn)生了可觀的經(jīng)濟效益。
在此基礎上,針對制約成像技術在古生物學中大規(guī)模應用的若干難點,如耗時長、機時有限、重建所需的計算機配置高、軟件價格昂貴等,我國古生物學者正從多個角度繼續(xù)探索,攻堅克難。
在加強研發(fā)的同時,使用新一代適合古生物學研究的商業(yè)儀器,可以進一步快速獲取高解析度的化石三維結構包括超微結構信息。例如,最近古脊椎所引進的微納能譜CT,可以同時獲得化石內(nèi)部各成分及其空間分布信息,進一步推動了對化石內(nèi)部信息的挖掘,而且對于研究化石的形成條件和過程具有重要意義。古脊椎所研究人員還自主開發(fā)了免費的專門處理化石及生物體成像數(shù)據(jù)的渲染處理軟件,推動這項技術在學科領域的大規(guī)模普及。
能量更高、更集中的同步輻射光源是滿足成像技術精度和對比度高要求的唯一解決方案。以前古生物學家需要到國外如瑞士、澳大利亞等地的同步輻射光源線站進行掃描,國內(nèi)的上海光源也提供了一種選擇。值得一提的是,正在建設的北京光源(HEPS)突破了國際同類線站的局限性,是世界上最亮的第四代同步輻射光源之一,預計將在2025年底建成并投入使用。按照計劃,我國將在北京光源建設全球首個專門針對脊椎動物演化、人類起源與古人類遺存研究的同步輻射光源成像和測試平臺,可以實現(xiàn)高靈敏度、強穿透、低劑量、多尺度分辨、無損的3D化石成像。
與化石成像技術相伴的還有三維打印技術。隨著三維打印價格的下降,這項技術也逐漸得到普及。將數(shù)字重建所得的化石內(nèi)部結構模型三維打印出來,可以方便、直觀地對這些結構進行觀察研究,以任意放大縮小比例大量制作高精度的模型,用于科研、教學和科普展示。
分子古生物學:重建古生物演化歷史的重要工具
古代生物死亡后,不同的有機物組分保留的時間長短不一,提供的生物的信息不同,而承載生物體內(nèi)遺傳信息的脫氧核糖核酸(DNA),成為重建古生物演化歷史的重要工具。這一研究方法肇始于20世紀80年代,21世紀初期,受益于人類全基因組的發(fā)表和高通量測序技術的發(fā)展,古DNA領域開始蓬勃發(fā)展。斯萬特·帕博是這一領域的奠基人,開創(chuàng)性地解決了DNA污染問題,搭建了世界上第一個古DNA研究的超凈室,并設計出超凈室的工作規(guī)則。他帶領團隊重構出尼安德特人的基因組,發(fā)現(xiàn)了丹尼索瓦人——首個僅通過古分子證據(jù)而確認的已滅絕古人類。2022年的諾貝爾生理學或醫(yī)學獎也因此頒給了帕博。
古DNA提取物中常常包含大量污染DNA,使得測序的大部分DNA分子都是無用的信息,真正有用的常常不到測序數(shù)據(jù)的1%。對此,古脊椎所付巧妹研究員和邁耶研發(fā)應用了DNA捕獲技術——通過設計DNA或RNA探針,像釣魚一樣把目標古DNA從海量的污染DNA中“釣取”出來。這項技術廣泛應用于人類古基因組研究中,目前超過2/3的人類古基因組數(shù)據(jù)來自一個叫“1240k”的探針組的捕獲數(shù)據(jù)。DNA捕獲技術不僅使得對古DNA的測序效率大大提高,還能有效從一些棘手的樣本中得到足夠的數(shù)據(jù)。一個典型的例子是中國古南方人群的基因組研究。中國南方溫暖潮濕的環(huán)境和當?shù)氐乃嵝酝寥蓝疾焕诠臘NA的保存,使得這片區(qū)域的古DNA研究一度處于空白狀態(tài)。得益于該技術,廣西古南方人群的基因組研究揭示了在農(nóng)業(yè)傳播之前,東亞和東南亞人群已有大量交流。
沉積物DNA分析是一種新興的古DNA分析技術,可以不再依賴骨骼化石材料而從“土”中提取出古代生物的遺傳物質(zhì)。這種方法彌補了人類化石可遇而不可求的缺憾,極大地擴大了研究對象,打開了研究舊石器考古遺址人群演化的新窗口。2020年付巧妹團隊和蘭州大學合作,通過白石崖溶洞遺址沉積物,釣取35個樣品的242種哺乳動物和人類的線粒體DNA,并使遠古人類的DNA得以富集。這些古DNA與遺址的骨骼遺存相印證,證實了犀牛、鬣狗等動物的存在。還揭示白石崖洞的四個地層里有已滅絕的古人類——丹尼索瓦人的線粒體DNA。這是首次在丹尼索瓦洞穴之外的地方發(fā)現(xiàn)丹尼索瓦人,是支撐其曾分布廣泛的有力證據(jù)。利用這種方法,丹麥哥本哈根大學研究人員2022年12月報道了從格陵蘭島凍土中提取到約200萬年前的生物DNA,為迄今已知最古老DNA。該研究發(fā)現(xiàn)格陵蘭島曾生活著乳齒象、馴鹿、野兔和大雁等動物,不僅有如今還在當?shù)啬芤姷降奶μ\、灌木、樺樹等植物,還生長著白楊、杉樹等如今通常生長在緯度較低地區(qū)的樹木。
自2010年起,古脊椎所建立了國際一流水平的分子古生物學實驗室,以古DNA技術為核心,在主攻古人群基因組研究的同時,并行開展動物古基因組、共生微生物及病原微生物演化、古蛋白質(zhì)研究等衍生研究方向。2016年首次翔實地繪制出冰河時代歐亞人群的遺傳譜圖;2017年對田園洞人個體進行DNA測序,實現(xiàn)中國地區(qū)乃至整個東亞最古老人類的第一個全基因組測序;2018年從末次冰期前后迄今最古老的大熊貓化石成功提取到完整線粒體,揭示大熊貓新的線粒體譜系。2018年建立自動化實驗平臺后,實驗速度快、精確度高、產(chǎn)量高,產(chǎn)出了系列重磅成果,例如,揭示東亞早期現(xiàn)代人的遺傳多樣性及長時間尺度下動態(tài)演化圖譜;闡明華夏族群萬年來的遺傳連續(xù)性及不同文化人群的遷徙融合歷史;闡述東亞特有適應性基因的選擇機制;明確以臺灣島阿美族和泰雅族為代表的南島語族與福建內(nèi)陸古人群同源。這些研究更新、補充或修正國際學術界相關學術假說,為闡明華夏族群的形成過程及追溯南島語族源流等提供了重要科學依據(jù)。實驗室也在珍稀保護動物(如金絲猴、南方灰狼)演化研究上取得重大新發(fā)現(xiàn),并推廣至更多已滅絕動物及瀕危動物研究領域。
蛋白質(zhì)包含有豐富的生物遺傳進化信息,在化石中留存的時間要比DNA長得多,且可覆蓋古DNA目前所無法觸及的時間與地域盲區(qū),在人類及其伴生物種的演化研究領域具有廣闊的應用前景。例如,已有國際研究團隊從180萬年前的動物牙齒和超過650萬年前的蛋殼中獲取古蛋白質(zhì)。再比如,在炎熱潮濕地區(qū),古DNA難以保存,但有研究團隊在亞熱帶的早更新世甚至上新世化石中成功獲取古蛋白序列。這方面研究逐漸成為新興熱點,在2019-2020年,學術期刊連續(xù)發(fā)表的4篇重要成果,解決了夏河人、史蒂芬犀牛、步氏巨猿以及先驅人的系統(tǒng)發(fā)育問題,引發(fā)國際學界廣泛的關注。我國已經(jīng)加強這方面的布局,圍繞重點考古遺址的相關樣本開展研究,以期解決科學問題,助力產(chǎn)出重要原創(chuàng)性科研成果。
大數(shù)據(jù)及自動識別:有助于實現(xiàn)化石的自動鑒定
隨著研究的深入,古生物學從定性描述進入定量的計算,引進統(tǒng)計學模型。研究中越來越關注生物多樣性的變化、形態(tài)特征的宏演化。在古生物學中系統(tǒng)發(fā)育分析規(guī)模越來越大,涉及上百個物種,數(shù)千個性狀。這些研究都涉及大數(shù)據(jù),需要高性能計算機的協(xié)助。
為了建立古生代(約5.4億年-2.4億年)海洋生物多樣性,南京大學樊雋軒團隊遴選了3112個地層剖面、11268個海洋化石物種的26萬條化石數(shù)據(jù),團隊結合了模擬退火算法和遺傳算法,自主開發(fā)了基于并行計算的約束最優(yōu)化方法。利用“天河二號”超級計算機,經(jīng)過反復計算和驗證,獲得了全新的寒武紀-三疊紀海洋無脊椎動物的復合多樣性曲線。
近些年來貝葉斯方法在古生物學中廣泛運用,但是這種方法對于計算性能要求高,即使使用目前的高性能計算機一次運算也可能需要數(shù)周甚至上月的時間。不少古生物研究機構專門購置了高性能計算機,運行專門開發(fā)的分析軟件。比如,近些年古脊椎所發(fā)表的重要成果大多離不開高性能計算機的支撐。
近些年科研人員基于深度學習、卷積神經(jīng)網(wǎng)絡,圖像識別等等進行探索,以期實現(xiàn)化石的自動鑒定。在古生物學中微體化石的鑒定費時費力,而且很多是重復勞動,但是這一工作在油田鉆井、環(huán)境研究中卻必不可少。我們希望能夠實現(xiàn)牙形刺、筆石、孢粉等由人工鑒定轉向自動識別。這個領域剛剛興起,距離成果投入實際運用還有很長的距離。這一工作有廣泛的應用前景,建議有關部門以先期投入促進科研的開展;也需要專業(yè)的古生物學家建立鑒定準確的圖片庫以供機器學習,也需要人工智能等多學科交叉,以實現(xiàn)可靠的自動鑒定。
版權聲明:凡注明“來源:中國西藏網(wǎng)”或“中國西藏網(wǎng)文”的所有作品,版權歸高原(北京)文化傳播有限公司。任何媒體轉載、摘編、引用,須注明來源中國西藏網(wǎng)和署著作者名,否則將追究相關法律責任。