PRODUCT CLASSIFICATION
產(chǎn)品分類*預(yù)測(cè)、高考預(yù)測(cè)、當(dāng)前哪種男性……這些大家所熟悉的分析都用到了大數(shù)據(jù),但是很少人知道,大數(shù)據(jù)早將“手”伸到了生物醫(yī)學(xué)領(lǐng)域,開(kāi)始了疾病預(yù)測(cè)。
歐美國(guó)家對(duì)生物領(lǐng)域發(fā)展大數(shù)據(jù)十分重視。今年3月,英國(guó)宣布,英國(guó)醫(yī)學(xué)研究理事會(huì)(MRC)將投資3200萬(wàn)英鎊資助*5大項(xiàng)目,來(lái)提高醫(yī)學(xué)生物信息學(xué)的能力、產(chǎn)能和核心基礎(chǔ)設(shè)施。這項(xiàng)“醫(yī)學(xué)生物信息學(xué)計(jì)劃”預(yù)計(jì)總投資5000萬(wàn)英鎊,將通過(guò)建立耦合復(fù)雜生物數(shù)據(jù)和健康記錄的新方法,來(lái)解決關(guān)鍵的醫(yī)學(xué)難題。
早在2012年3月,美國(guó)奧巴馬政府就宣布推出“大數(shù)據(jù)的研究和發(fā)展計(jì)劃”,將大數(shù)據(jù)提升到了國(guó)家戰(zhàn)略層面,承諾將投資兩億多美元。2014年,美國(guó)政府就如何充分利用生物醫(yī)學(xué)大數(shù)據(jù),又啟動(dòng)了Big Data to Knowledge計(jì)劃。
雖然我國(guó)企業(yè)也頻頻在大數(shù)據(jù)上有所動(dòng)作,但是上海生物信息技術(shù)研究中心主任、中科院上海生命科學(xué)研究院生物信息中心主任李亦學(xué)對(duì)《中國(guó)科學(xué)報(bào)》記者指出:“雖然國(guó)內(nèi)大數(shù)據(jù)在其他方向的發(fā)展遠(yuǎn)超國(guó)外,但是生物大數(shù)據(jù)與國(guó)外相比仍比較落后。”
沒(méi)有免費(fèi)的午餐
生物大數(shù)據(jù)發(fā)展相較國(guó)外落后,并不是因?yàn)闆](méi)有數(shù)據(jù)量產(chǎn)生。
據(jù)我國(guó)zui早從事理論生物學(xué)和生物信息學(xué)研究的科研人員之一、中國(guó)科學(xué)院院士陳潤(rùn)生介紹,以華大基因?yàn)榇淼幕驕y(cè)序機(jī)構(gòu)為生物大數(shù)據(jù)的產(chǎn)生作出重要貢獻(xiàn)。
華大基因當(dāng)前的測(cè)序量大約占據(jù)數(shù)據(jù)量的40%左右,而且隨著技術(shù)發(fā)展和測(cè)序手段成本的下降,幾乎所有的研究型大學(xué)和研究單位,無(wú)論是在農(nóng)業(yè)、林業(yè)還是醫(yī)學(xué),都對(duì)基因測(cè)序有所涉及。
“基因組層面的生物大數(shù)據(jù)的發(fā)展帶動(dòng)了蛋白質(zhì)組、代謝組、生物網(wǎng)絡(luò)等各個(gè)層級(jí)的相關(guān)生物大數(shù)據(jù)的海量產(chǎn)生,但是我國(guó)當(dāng)前還未能建立統(tǒng)一的生物數(shù)據(jù)信息中心。”陳潤(rùn)生指出。
李亦學(xué)也認(rèn)為,生物大數(shù)據(jù)滯后于國(guó)外的zui根本原因在于我國(guó)沒(méi)有大型的綜合生物大數(shù)據(jù)庫(kù),也沒(méi)有生物大數(shù)據(jù)中心平臺(tái)。
這意味著,我國(guó)開(kāi)展研究時(shí)只能向國(guó)外的大數(shù)據(jù)庫(kù)“求助”。雖然這些大數(shù)據(jù)庫(kù)都宣稱,只要遞交申請(qǐng)就可免費(fèi)共享數(shù)據(jù),但是,天下并沒(méi)有免費(fèi)的午餐。
記者了解到,一些大型生物學(xué)數(shù)據(jù)庫(kù)要求數(shù)據(jù)使用申請(qǐng)者提交詳細(xì)的數(shù)據(jù)使用說(shuō)明,即使數(shù)據(jù)庫(kù)中已存有我國(guó)科學(xué)家所提交的相當(dāng)規(guī)模的數(shù)據(jù),但想再取出使用卻絕非易事。
李亦學(xué)稱:“免費(fèi)共享數(shù)據(jù)僅是從理論上而言,實(shí)際核心數(shù)據(jù)不會(huì)及時(shí)交給申請(qǐng)者,內(nèi)行會(huì)發(fā)現(xiàn)獲得的數(shù)據(jù)都是非核心的或不完整的。研究醫(yī)學(xué)相關(guān)的大數(shù)據(jù)庫(kù)則有專門(mén)委員會(huì)來(lái)審核數(shù)據(jù)申請(qǐng)者,如果拒絕申請(qǐng),也不會(huì)給出理由。”
因此,為了具備拿數(shù)據(jù)的資格,我國(guó)科學(xué)家們常需反復(fù)準(zhǔn)備申請(qǐng)材料,卻往往再也沒(méi)有下文。“受制于人,非常惱火。”李亦學(xué)感嘆道。
建大平臺(tái)遇“難題”
*生物數(shù)據(jù)庫(kù)的建立,往往帶有公益色彩,需要有長(zhǎng)期穩(wěn)定的投入和專業(yè)的技術(shù)隊(duì)伍。據(jù)專家介紹,上世紀(jì)90年代,我國(guó)有關(guān)部門(mén)已考慮建立國(guó)家層面的數(shù)據(jù)中心,但直到現(xiàn)在,仍未討論出具體的實(shí)施方案。
那么,為何數(shù)據(jù)中心遲遲未能建立?
李亦學(xué)向記者算了一筆賬,英美國(guó)家對(duì)數(shù)據(jù)庫(kù)的建立投入了很多資金,引進(jìn)的人才大部分有博士學(xué)位,每年的費(fèi)用都由國(guó)會(huì)撥款支持,來(lái)源比較穩(wěn)定,一年約需投入1億美元。
“我國(guó)如果建立一個(gè)類似的生物大數(shù)據(jù)中心,應(yīng)該也要有數(shù)百人的編制和每年幾億元的長(zhǎng)期穩(wěn)定投入。這筆錢(qián)如果由政府支付,障礙仍然不小。”李亦學(xué)分析。
陳潤(rùn)生也指出,建立一個(gè)國(guó)家層級(jí)的數(shù)據(jù)平臺(tái)雖然在科學(xué)界是共識(shí),但是這個(gè)中心建立的地點(diǎn)、呈現(xiàn)的方式(實(shí)體還是虛擬)、囊括的內(nèi)容、涉及的權(quán)利范圍以及怎么管理、由誰(shuí)來(lái)管理都有很多不同的方案。
在這樣的形勢(shì)下,不能集中精力、統(tǒng)一調(diào)配全國(guó)的生物數(shù)據(jù)成了一道難題。
“用基因組數(shù)據(jù)得跟華大商量,用蛋白數(shù)據(jù)得跟其他人商量,小數(shù)據(jù)中心雖然有,但都是各自的,沒(méi)有統(tǒng)一的協(xié)調(diào)管理。沒(méi)有全國(guó)的生物數(shù)據(jù)中心,則無(wú)法統(tǒng)籌。”陳潤(rùn)生道出了難處。
同時(shí),我國(guó)生物數(shù)據(jù)雖然產(chǎn)出量大,但利用率遠(yuǎn)遠(yuǎn)不夠。盡管產(chǎn)生的數(shù)據(jù)提供了很好的信息,但是挖掘其全部?jī)r(jià)值還牽扯到很多方面。如數(shù)據(jù)量很大,能否在短時(shí)間內(nèi)分析和挖掘其價(jià)值是個(gè)問(wèn)題。
而且,大數(shù)據(jù)產(chǎn)生后需要相應(yīng)的理論、技術(shù)和方法來(lái)跟進(jìn),也需要新的工具和方法。業(yè)內(nèi)人士指出,國(guó)內(nèi)現(xiàn)有的生物大數(shù)據(jù)分析能力雖然與歐美相差不大,但是在數(shù)據(jù)分析構(gòu)架、軟件系統(tǒng)與*IT技術(shù)接軌上有待提升。
植根中國(guó)“土壤”
李亦學(xué)指出,生物大數(shù)據(jù)雖然面臨這些障礙,但是可以靠“抓目標(biāo)、強(qiáng)合作”追上的腳步。
他認(rèn)為,中國(guó)發(fā)展生物大數(shù)據(jù)的優(yōu)勢(shì)在于有海量樣本。
當(dāng)下應(yīng)該做的,就是保護(hù)國(guó)內(nèi)的生物數(shù)據(jù)資源并且尋找有價(jià)值的利用方向。
“一是要明確生物大數(shù)據(jù)發(fā)展的目標(biāo)和途徑,二是敞開(kāi)胸懷和國(guó)內(nèi)的研究單位合作,將生物大數(shù)據(jù)這項(xiàng)事業(yè)做好。”李亦學(xué)強(qiáng)調(diào)。
例如,我國(guó)目前實(shí)行的醫(yī)聯(lián)工程在上海地區(qū)已經(jīng)取得了一些成果。
*醫(yī)院和社區(qū)醫(yī)院把就診居民的就診記錄和健康檔案全部聯(lián)網(wǎng),建立了數(shù)據(jù)庫(kù)體系,包含了3400萬(wàn)份電子病歷和檔案。
李亦學(xué)表示,在征得樣本同意后調(diào)用健康檔案和檢查結(jié)果,既提高了看病效率,又不會(huì)妨礙隱私保護(hù),像小水珠一樣的數(shù)據(jù)zui終也能匯聚成*大海,有益于生物大數(shù)據(jù)這項(xiàng)國(guó)家戰(zhàn)略資源的保護(hù)與利用。
陳潤(rùn)生也指出,生物大數(shù)據(jù)發(fā)展應(yīng)該腳踏實(shí)地,植根于中國(guó)的“土壤”,挖掘自身特色。
“中國(guó)的物種自身具備多樣的特點(diǎn),*有可能形成有特色的生物大數(shù)據(jù)體系。在這樣的形勢(shì)下,瞅準(zhǔn)問(wèn)題,發(fā)展生物大數(shù)據(jù)的目的性更強(qiáng)一些,這才是我們要關(guān)注的。”陳潤(rùn)生說(shuō)。
郵箱:1170233632@qq.com
傳真:021-51870610
地址:上海市顧戴路2988號(hào)B幢7樓