国产一级a片免费看高清,亚洲熟女中文字幕在线视频,黄三级高清在线播放,免费黄色视频在线看

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
數(shù)據(jù)驅(qū)動的生命科學(xué)

吳家睿 中國科學(xué)院生物化學(xué)與細胞生物學(xué)研究所

導(dǎo)讀

經(jīng)典的生命科學(xué)推崇假設(shè),追求機制。然而,人類基因組計劃催生了生命科學(xué)的新范式,即數(shù)據(jù)驅(qū)動的研究范式。這種新范式打破了傳統(tǒng)的決定論局限性,進而形成了開放式研究的認識論新體系。

充滿不確定性的生命科學(xué)

20世紀中葉誕生的分子生物學(xué)建立在還原論的基礎(chǔ)上,認為生命活動遵循著基本的物理學(xué)和化學(xué)規(guī)律;正如薛定諤在其名著《生命是什么》中所指出的:對生物體而言,在它內(nèi)部發(fā)生的事件必須遵循嚴格的物理學(xué)定律[1]。也就是說,在分子生物學(xué)家看來,生命是一部按照決定論規(guī)律運轉(zhuǎn)的機器;研究者的任務(wù)就是去認識和揭示這種規(guī)律,即生命科學(xué)中常常提到的機制mechanism)。基于還原論的生命科學(xué)決定論者往往有這樣一個潛在的信念,只要掌握的知識足夠充分、信息足夠精確,就可以認識和控制一切生命活動,就能夠消滅危害人類的所有疾病。現(xiàn)代生命科學(xué)那種研究核酸和蛋白質(zhì)等生物大分子三維空間結(jié)構(gòu)的熱情正是這種決定論觀點的突出體現(xiàn):人們試圖精確到原子水平去解釋生物大分子的功能或它們之間的相互作用,進而去發(fā)現(xiàn)生物體內(nèi)確定的分子作用機制。換句話說,分子生物學(xué)建立在這樣一個觀念上——結(jié)構(gòu)決定功能。

然而,生物體內(nèi)的生物大分子種類繁多、數(shù)量巨大,即使是大腸桿菌這樣簡單的單細胞原核生物所擁有的各種蛋白質(zhì)分子的總拷貝數(shù)就高達250萬個左右,其整個細胞容積的30%左右都被生物大分子占據(jù)。因此,這些生物大分子在細胞內(nèi)通常處于極端擁擠環(huán)境和無序排列狀態(tài)下。更重要的是,蛋白質(zhì)和核酸等各種生物大分子具有不可穿透性,不能像無機小分子那樣在溶液中自由擴散和運動,導(dǎo)致任何一個生物大分子的實際可及空間大大減少,被稱為排斥體積效應(yīng)。這種擁擠的細胞液態(tài)環(huán)境和排斥體積效應(yīng)導(dǎo)致生物大分子之間產(chǎn)生了相當復(fù)雜的相互作用,其中有一種相互作用被稱為相分離Phase separation)。生物體的相分離是指:特定的蛋白質(zhì)和RNA生物大分子可以在一定條件下組織起來,形成高濃度的特定分子聚集的液滴,就如同油滴從水中分離出來一樣[2]。不同于傳統(tǒng)意義上的蛋白質(zhì)相互作用,具有相分離能力的蛋白質(zhì)往往是依靠一類沒有確定三維結(jié)構(gòu)的內(nèi)部無序區(qū)域Intrinsic Disorder Region, IDR)之間的相互作用來實現(xiàn)相分離[2]。

生物大分子不僅具有結(jié)構(gòu)上的無序組織,而且在其合成的過程中也有許多隨機波動存在。這種生物大分子具有的隨機波動性通常被稱為生物學(xué)噪音(Biological noise),主要表現(xiàn)在基因轉(zhuǎn)錄和蛋白質(zhì)翻譯過程中,如基因轉(zhuǎn)錄過程中它的啟動子被激活和滅活時間響應(yīng)的快慢差異,或者蛋白質(zhì)合成反應(yīng)和降解反應(yīng)的速率差異等。研究者發(fā)現(xiàn),在原核細胞中,噪音對基因轉(zhuǎn)錄的影響不大,主要是影響蛋白質(zhì)的合成水平;而在真核細胞中,噪音不僅影響蛋白質(zhì)的合成,而且可以顯著地影響基因表達水平。

生物學(xué)噪音導(dǎo)致的一個重要生物學(xué)現(xiàn)象就是,基因表達水平與蛋白質(zhì)合成水平之間數(shù)量關(guān)系的相關(guān)性不高。過去人們認為基因與蛋白質(zhì)的豐度變化關(guān)系是線性的,即基因轉(zhuǎn)錄產(chǎn)生的mRNA拷貝數(shù)多,則相應(yīng)的蛋白質(zhì)數(shù)量就高;反之,前者少的時候后者也少。然而,在對酵母細胞和動物細胞等不同種類生物體的轉(zhuǎn)錄組和蛋白質(zhì)組的定量分析中,研究者都觀察到mRNA豐度和相應(yīng)的蛋白質(zhì)豐度之間并沒有很好的相關(guān)性。一項對大腸桿菌的單分子研究發(fā)現(xiàn),在生物學(xué)噪音的影響下,基因表達量和相應(yīng)的蛋白質(zhì)表達量之間呈現(xiàn)出隨機的關(guān)系;以至于研究者得出這樣一個結(jié)論:對任何一個給定的基因而言,在單個細胞內(nèi)的蛋白質(zhì)拷貝數(shù)和mRNA拷貝數(shù)之間沒有相關(guān)性 [3]。美國科學(xué)家最近用質(zhì)譜技術(shù)定量分析了32種人體組織中12千多個基因的蛋白質(zhì)表達情況,然后與轉(zhuǎn)錄組測序獲得的基因表達豐度數(shù)據(jù)進行了比較,其結(jié)果同樣證實了這二者的相關(guān)性并不高;研究者進一步指出組織特有的蛋白質(zhì)信息能夠解釋遺傳疾病的表型,而僅僅采用轉(zhuǎn)錄組信息則做不到這一點[4]。

人們通常把隨機性噪音視為對生命的負面影響,例如在基因轉(zhuǎn)錄和蛋白質(zhì)翻譯等重要的生命活動中存在的不確定性擾動;由此來看,噪音對生命沒有好處,應(yīng)該要被消除。但越來越多的研究表明,生命中的噪音不僅難以消除,而且對生命也有著積極的一面,常常具有許多重要的生物學(xué)功能。例如,生物學(xué)噪音在DNA復(fù)制過程中往往引發(fā)隨機突變的產(chǎn)生,為生命的演化提供原材料;而在細胞信號轉(zhuǎn)導(dǎo)過程中,生物學(xué)噪音可以利用細胞的正反饋機制來放大信號,從而幫助細胞做決定。此外,雖然生物學(xué)噪音可以由細胞間的差異產(chǎn)生,但生物學(xué)噪音同時可以用來維持和加強細胞的個體差異特征,影響個體的發(fā)育和生長。不久前一項基于單細胞RNA測序數(shù)據(jù)的分析表明,在小鼠骨髓調(diào)控血細胞發(fā)育的過程中,轉(zhuǎn)錄因子的基因表達噪音參與到細胞狀態(tài)的轉(zhuǎn)換,進而影響了這些細胞的命運[5]。

當前,對生物學(xué)噪音及其對生命活動影響的研究正在成為一個新的科學(xué)前沿,有研究者甚至稱之為噪音生物學(xué)Noise biology)。這類研究讓我們認識到,生物體作為一個開放的非線性復(fù)雜系統(tǒng),一方面自身具有各種內(nèi)在的隨機噪音,另一方面生存于充滿不確定性的外部環(huán)境之中。可以這樣說,地球上生命的演化過程就是由偶然性推動的,它的存在使得生命能夠從最簡單的原核細胞形式發(fā)展出如此復(fù)雜多樣的動植物。如果生物世界真的是由確定性所統(tǒng)治,那么今天地球上存在的生命很可能依然只是大腸桿菌一類簡單的單細胞生物。

數(shù)據(jù)驅(qū)動的生命科學(xué)

這種對生命的決定論世界之否定,使得我們有必要重新審視還原論者推崇的現(xiàn)代生命科學(xué)的假設(shè)驅(qū)動研究范式。對決定論者而言,一切事物的發(fā)生發(fā)展都是遵循著一定的規(guī)律,有因必有果;一項科學(xué)研究的主要目標通常就是去證實或證偽某種因果關(guān)系的假設(shè)?,F(xiàn)代生命科學(xué)也是如此。美國著名的腫瘤生物學(xué)家溫伯格(Weinberg R)在一篇題為假設(shè)優(yōu)先的文章中就開宗明義地指出:20世紀,生物學(xué)從傳統(tǒng)的描述性科學(xué)轉(zhuǎn)變成為一門假設(shè)驅(qū)動的實驗科學(xué)。與此緊密聯(lián)系的是還原論占據(jù)了統(tǒng)治地位,即對復(fù)雜生命系統(tǒng)的理解可以通過將其拆解為組成的零部件并逐個地拿出來進行研究[6]。

人類基因組計劃的實施催生了一種全新的研究范式——數(shù)據(jù)驅(qū)動的研究。一個人的基因組具有30億個以上的堿基對,即相當于3Gb以上的數(shù)據(jù)。隨著核酸測序技術(shù)的改進,個體全基因組測序的成本現(xiàn)已低于1000美元;目前國際上儲存的個體基因組序列的數(shù)據(jù)已達到百萬人級的規(guī)模。與此同時,基因組測序也成為了健康醫(yī)學(xué)研究的基本目標,如美國國立衛(wèi)生研究院在2006年牽頭啟動了國際癌癥基因組項目癌癥基因組圖集The Cancer Genome AtlasTCGA);到2017年底,該項目分析了32千多個患者的腫瘤樣本,覆蓋了60個組織/器官的38個癌種及其亞型,測到了311萬多個基因變異;產(chǎn)生了超過20PB1PB = 1015 Byte)的腫瘤基因組數(shù)據(jù)。此外,轉(zhuǎn)錄組、蛋白質(zhì)組和代謝組等各種生命組學(xué)數(shù)據(jù)也被大量產(chǎn)生。生物醫(yī)學(xué)大數(shù)據(jù)正在徹底改變著生命科學(xué)和醫(yī)學(xué)的研究范式。正如2011年美國首部關(guān)于精確醫(yī)學(xué)Precision medicine)的戰(zhàn)略報告所指出的:開展本項研究的動機在于,與人體有關(guān)的分子數(shù)據(jù)正在爆發(fā)性的增長,尤其是那些與患者個體相關(guān)的分子數(shù)據(jù);由此帶來了巨大的、尚未被開發(fā)的機會,即如何利用這些分子數(shù)據(jù)改善人類的健康狀況[7]。聯(lián)合國教科文組織在一份科學(xué)報告中也明確指出:到2030年,科學(xué)不僅基于數(shù)據(jù)來開展研究,任何科學(xué)發(fā)現(xiàn)的基本產(chǎn)出也是數(shù)據(jù)。換句話說,后基因組時代是一個大數(shù)據(jù)時代,大數(shù)據(jù)重塑了生命科學(xué)研究,研究者不僅繼續(xù)能夠在假設(shè)驅(qū)動下開展研究工作,也可以在全新的數(shù)據(jù)驅(qū)動的范式下進行研究。

數(shù)據(jù)驅(qū)動的研究范式與假設(shè)驅(qū)動的研究范式有著本質(zhì)的區(qū)別,首先是研究的“初心”不一樣,前者不需要假設(shè),不以解決具體的科學(xué)問題為己任,其主要研究目的是去獲取研究對象的相關(guān)信息。人類基因組計劃就是數(shù)據(jù)驅(qū)動型研究的典型代表;該計劃的初衷是要測定人類基因組擁有的全部核酸序列。在傳統(tǒng)的生命科學(xué)研究中,研究者往往是根據(jù)某種假設(shè)把研究目標鎖定到由一段核酸序列組成的一個基因之上,進而深入地研究其功能或者調(diào)控機制;對人類基因組計劃而言,研究者則是通過全基因組序列的測定去發(fā)現(xiàn)在這些序列中隱藏著的2萬多個基因。因此,數(shù)據(jù)驅(qū)動的研究通常又被稱之為發(fā)現(xiàn)的科學(xué)Discovery science)。

雖然假設(shè)驅(qū)動的研究范式在現(xiàn)代生命科學(xué)的產(chǎn)生和發(fā)展中扮演了重要的角色,并成為科學(xué)研究的主流,但是,這種研究范式也帶有一種先天缺陷。英國科學(xué)哲學(xué)家查爾默斯(Chalmers, AF)在其名著《科學(xué)究竟是什么?》中指出,基于假設(shè)驅(qū)動的研究范式之科學(xué)是從事實中推導(dǎo)出來的[8]。在他看來,關(guān)鍵是怎樣獲得事實,其中的一個困難在于,知覺經(jīng)驗在一定程度上受觀察者的背景和期望影響,因而,對一個人看來是可觀察的事實,對另一個人就未必如此。第二個困難源自于對觀察命題的真假的判斷在一定程度上依賴于已知或假設(shè)的是什么,這樣就使得可觀察事實像作為其基礎(chǔ)的前提一樣是可錯的。這兩種困難都暗示著,科學(xué)之可觀察的基礎(chǔ)可能并不像人們廣泛地和在傳統(tǒng)上認為的那樣直接和可靠[8]。

由于數(shù)據(jù)驅(qū)動的研究不依賴于假設(shè),因而可以避免這種對事實的主觀性選擇和判斷。美國生物學(xué)家戈盧伯(Golub, T)在一篇題為數(shù)據(jù)優(yōu)先的文章中明確指出:如果沒有獲得全面的腫瘤基因組數(shù)據(jù),將難以區(qū)分信號和噪音。盡管假設(shè)驅(qū)動的實驗科學(xué)依然處于研究領(lǐng)域的中心位置,但不帶偏好的腫瘤基因組測量將提供前所未有的機會去催生新的想法[9]。換句話說,數(shù)據(jù)驅(qū)動的研究范式不僅能夠避免研究者可能的主觀偏見,而且可以幫助其發(fā)現(xiàn)在假設(shè)或者現(xiàn)有理論范圍之外的全新知識。我們還可以進一步引伸一下——經(jīng)典的科學(xué)哲學(xué)認為,科學(xué)研究需要在由一系列假設(shè)和理論搭建的框架內(nèi)進行;這種指導(dǎo)研究的框架庫恩(Kuhn, T)稱為范式Paradigm),拉卡托斯(Lakatos, I)稱之為研究綱領(lǐng)Research program)。而數(shù)據(jù)驅(qū)動的研究范式的一個亮點就是:可以不受現(xiàn)存研究框架的制約。

數(shù)據(jù)驅(qū)動的與假設(shè)驅(qū)動的研究范式之間還有一個重要的區(qū)別,即研究策略不一樣,前者往往具有一個明顯的特征:即把研究目標分解為若干次要目標,然后開展相應(yīng)的研究工作,并在前期研究結(jié)果的基礎(chǔ)上反復(fù)地進行完善,通過多次研究逐漸逼近預(yù)定的總體目標;每一次重復(fù)研究的過程稱為一次迭代iterate)。這種迭代式研究策略意味著允許每一次研究工作是不完備的,可以接受局部的或非最優(yōu)的階段性研究成果。而假設(shè)驅(qū)動的研究則追求研究成果的完備性,盡可能通過一次性研究工作就可以完整地解答科學(xué)問題或證明科學(xué)假設(shè)。

后基因組時代的許多生命科學(xué)研究計劃明顯具有這種迭代特征,其中最具代表性的例子依然是人類基因組計劃。雖然人類基因組計劃的終極目標是揭示人類基因組的所有核酸序列,但20012月發(fā)表的人類基因組測序的里程碑成果不過只是覆蓋了基因組90%核酸序列的草圖20034月國際人類基因組測序聯(lián)合體才正式宣布人類基因組全圖繪制成功;且200410月在《自然》周刊上發(fā)表相應(yīng)的論文中,也只給出了常染色質(zhì)區(qū)域內(nèi)大約99%核酸序列的測定結(jié)果。因此,人類基因組序列中至今仍然存在許多高度重復(fù)序列區(qū)域(如中心粒)沒有被測定,20209月,研究者終于在《自然》周刊上發(fā)表了第一個完整的、沒有測序缺口的人類X染色體測序工作(還剩下22條染色體待研究者將來去進行補測)。不久前,研究者提出了一個比人類基因組計劃更為宏大的人類細胞圖譜Human Cell Atlas,HCA)研究計劃,其基本目標是,通過特定的分子表達譜來辨識和確定人體擁有的4060萬億個細胞中所有細胞類型;采用的主要研究策略也同樣具有迭代特征[10]。

數(shù)據(jù)驅(qū)動的研究范式之迭代模式既不屬于觀察-歸納-證實實證性研究,也不屬于問題-猜想-反駁證偽性研究其研究成果既不能被證實,也不能被證偽。在整個數(shù)據(jù)迭代的過程中,每一次研究獲得的成果都不是決定性的或完備的,如2004年發(fā)表的人類基因組全圖并不證實或否定2001年發(fā)表的草圖。更重要的是,數(shù)據(jù)驅(qū)動的研究范式作為一種超越理論框架的發(fā)現(xiàn)的科學(xué),并不采用傳統(tǒng)的歸納方法去追求事物之間的因果關(guān)系,而是通過算法和模型去探討數(shù)據(jù)之間的相關(guān)性??梢哉J為,數(shù)據(jù)驅(qū)動的研究范式克服了假設(shè)驅(qū)動的研究范式對決定論和因果關(guān)系的偏執(zhí),進而形成了開放式研究的認識論新體系。

[1]埃爾溫·薛定諤生命是什么羅來鷗,羅遼復(fù),譯湖南科學(xué)技術(shù)出版社,長沙:2003, P8.

[2]Shin Y, Brangwynne CP. Liquid phase condensation in cell physiology and disease. Science, 2018, 357,eaaf4382.

[3] Taniguchi Y, Choi PJ, Li GW, et al. Quantifying E. coli proteome and transcriptome with single-molecule sensitivity in single cells. Science, 2010, 329:533-538.

[4] Jiang L, Wang M, Lin S, et al. A quantitative proteome map of the human body. Cell, 2020, 183:1–15.

[5] Grün D. Revealing dynamics of gene expression variability in cell state space. Nature Methods, 2020, 17:45-49.

[6] Weinberg R. Point: Hypotheses first. Nature, 2010, 464:678.

[7] National Research Council. Toward precision medicine: building a knowledge network for biomedical research and a new taxonomy of disease.2011, http://www.nap.edu/catalog/13284/

[8] A. F. 查爾默斯. 科學(xué)究竟是什么?魯旭東. 商務(wù)印書館,北京. 2011, P31.

[9] Golub T. Counterpoint: data first. Nature, 2010,464:679.

[10] Regev A, Teichmann SA, Lander ES, et al. The Human Cell Atlas. eLife 2017; 6:e27041.

原題: 后基因組時代的科學(xué)觀

來源:吾家睿見 2020-12-26

本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊舉報。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
吳家睿:“多學(xué)科研究的三種形態(tài)”
深度!基礎(chǔ)研究的再認識
《管理世界》|| 郁建興 等:數(shù)字時代的公共管理研究范式革命
教育科學(xué)研究方法與基本寫作規(guī)范-教育研究技術(shù)-中國教育人博客
培養(yǎng)立體思維:從科學(xué)推理到范式轉(zhuǎn)移,再到世界觀的形成
科學(xué)網(wǎng)
更多類似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長圖 關(guān)注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點擊這里聯(lián)系客服!

聯(lián)系客服