生物樣本庫(kù)是轉(zhuǎn)化醫(yī)學(xué)研究的寶貴資源,隨著"十二五"國(guó)家科技計(jì)劃的推進(jìn),我國(guó)的生物樣本庫(kù)建設(shè)蓬勃發(fā)展。上海交通大學(xué)附屬新華醫(yī)院王偉業(yè)教授作為國(guó)外引進(jìn)的樣本庫(kù)信息化管理專家,主要從事生物樣本庫(kù)建設(shè)和信息化管理方面的工作,指導(dǎo)多家醫(yī)院生物樣本庫(kù)基本的建設(shè)工作。在2014生物樣本庫(kù)與臨床研究論壇上,生物谷特別采訪了王偉業(yè)教授,大家來看看他對(duì)中國(guó)生物樣本庫(kù)建設(shè)以及信息化管理方面的解讀。
樣本庫(kù)建設(shè)不能以大和多來衡量
生物谷:生物樣本庫(kù)建設(shè)國(guó)內(nèi)外的差別主要體現(xiàn)在哪些方面?
王偉業(yè)教授:我想從樣本資源的本身,管理以及信息化和共享三方面來說這個(gè)問題。建樣本庫(kù)的根本目的是建一個(gè)研究資源的平臺(tái),一是資源整合應(yīng)用,二是為不同學(xué)科的研究人員提供合作研究平臺(tái)。國(guó)內(nèi)外的區(qū)別可以從優(yōu)勢(shì)和差距兩個(gè)方面來講。
從樣本資源來說,中國(guó)最大的特點(diǎn)是樣本資源量大,資源種類多樣化。與歐美國(guó)家相比在較短時(shí)間內(nèi)能夠積累大量資源。在中國(guó)一個(gè)月的就診數(shù)量,在國(guó)外達(dá)到同樣的病例數(shù)可能要幾個(gè)月,如胸腺腫瘤類,據(jù)說整個(gè)歐洲的例數(shù)甚至少于中國(guó)的一家三甲?漆t(yī)院。單從研究性資源來看,這是有利的方面。而不好的方面是沒有考慮好應(yīng)用問題。比如一個(gè)產(chǎn)品需沒有做市場(chǎng)調(diào)查,沒有計(jì)劃應(yīng)用措施,就可能造成"儲(chǔ)存性"的資源浪費(fèi),這也是樣本庫(kù)資源管理方面存在的問題。
在中國(guó),很多人習(xí)慣以大和多來衡量事物的好壞。經(jīng)常會(huì)聽到有人用樣本量多少和空間大小來衡量一個(gè)樣本庫(kù)的發(fā)展?fàn)顩r,這是概念性問題,會(huì)直接影響到樣本庫(kù)的建設(shè)和管理等一系列問題。我認(rèn)為樣本庫(kù)不能以大和多來衡量其價(jià)值,那個(gè)時(shí)代已經(jīng)過去了。目前我國(guó)樣本庫(kù)建設(shè)需要的是:以做模板為主,然后去擴(kuò)充。簡(jiǎn)單來講,1和10只是大小的區(qū)別,但最難和最關(guān)鍵的是1要怎么去做,有了1,擴(kuò)增到10就很容易了。
第二個(gè)差別是樣本庫(kù)資源的進(jìn)口和出口。樣本庫(kù)建設(shè)可以簡(jiǎn)單描述為像計(jì)算機(jī)中的任何一個(gè)事件:打個(gè)字到鍵盤上,這是"進(jìn)口",計(jì)算機(jī)運(yùn)算或處理一下輸入的內(nèi)容,這是"操作",然后中屏幕上顯示;進(jìn)口"的結(jié)果,這是"出口"。目前在我國(guó)樣本庫(kù)建設(shè)中,由于資源豐富,且操作相對(duì)容易,所以"進(jìn)口"的速度很快。但具體"操作"跟國(guó)外相比還有不小的差異。當(dāng)然每個(gè)樣本庫(kù)都很重視這個(gè)方面。但是我認(rèn)為現(xiàn)在最大的問題可能是樣本庫(kù)資源的"出口"問題,即資源的應(yīng)用,F(xiàn)在中國(guó)做生物樣本庫(kù),一定要與傳統(tǒng)的,以單一課題的需求為目的的生物樣本儲(chǔ)存有本質(zhì)的區(qū)別:一是在管理的組織結(jié)構(gòu)上,二是作為系統(tǒng)化醫(yī)學(xué)研究的資源。而現(xiàn)在大多樣本庫(kù)建設(shè)還沒有發(fā)生本質(zhì)上的改變。
第三,理念上認(rèn)識(shí)的差距較大。我國(guó)每家醫(yī)院都在做樣本庫(kù)建設(shè),事實(shí)上有些沒有必要重復(fù)建,比如有些小的醫(yī)院。因?yàn)橐坏┮,從建設(shè)庫(kù)到人員培訓(xùn)等所有資源都會(huì)產(chǎn)生重復(fù)的花費(fèi),這方面主要問題是缺乏系統(tǒng)化的認(rèn)識(shí)和設(shè)計(jì)。而國(guó)外則目標(biāo)比較明確,很多樣本庫(kù)都是建設(shè)在大的醫(yī)藥公司,比如輝瑞,因?yàn)楦骷裔t(yī)院都跟他有研發(fā)方面的合作。而我們國(guó)內(nèi)許多建庫(kù)的目的還停留在提高科研、發(fā)文章上面,總強(qiáng)調(diào)發(fā)文章的SCI多少分。不管是管理層面,還是目的性方面的認(rèn)識(shí)問題,都存在理念的問題。
另外,國(guó)外還有個(gè)重要的特點(diǎn),就是團(tuán)體合作,協(xié)作性比較強(qiáng),比如美國(guó)NIH的NCI有關(guān)項(xiàng)目,以及加拿大的P3G項(xiàng)目。我國(guó)目前在這方面較薄弱。國(guó)外信息化發(fā)達(dá),在一些專病領(lǐng)域,他們都以團(tuán)隊(duì)或聯(lián)盟的性質(zhì)整合應(yīng)用資源如經(jīng)費(fèi),而我國(guó)總的來說還是單兵作戰(zhàn),雖有一些團(tuán)體,但是沒有改變實(shí)質(zhì)。這可能跟文化有關(guān)系。很多人一談到共享,會(huì)覺得拿了自己的東西。事實(shí)上,共享并非你拿我的,我拿你的這么簡(jiǎn)單。由于認(rèn)識(shí)上的問題,很多人會(huì)回避,而不是去解決共享機(jī)制的建設(shè)。簡(jiǎn)單來講,我們之間怎么共享,以何種機(jī)制來實(shí)現(xiàn),而不是把共享的方式簡(jiǎn)單認(rèn)為是一方拿另一方的東西,總是以"防守"和回避來解決問題。
資源整合也是同樣的問題:認(rèn)為資源整合就是把所有資源實(shí)體上放置在一起,因而就回避不整合,各自為陣。我現(xiàn)在和國(guó)外的合作項(xiàng)目,就是研發(fā)國(guó)際信息共享的機(jī)制:整合各自分析結(jié)果再次分析,但是原始信息各自嚴(yán)密自行保存,不涉及到任何共享。這就是面對(duì)大家都普遍存在的問題去尋求另外的機(jī)制來解決。他們共享的目的很清晰,也同樣受規(guī)定限制,但會(huì)想辦法用技術(shù)來解決這個(gè)問題,而不是回避。所以我認(rèn)為在這方面,我們還是存在理念認(rèn)識(shí)方面的差距。
生物樣本庫(kù)建設(shè)中的內(nèi)容和方法中國(guó)也可以成為國(guó)際規(guī)范
生物谷:國(guó)外在管理、操作規(guī)范方面,有哪些值得中國(guó)借鑒的地方?
王偉業(yè)教授:講到國(guó)際規(guī)范,通常是指歐美規(guī)范,其實(shí)我們沒有必要總是跟在后面走,國(guó)際規(guī)范本身也可以包括中國(guó)。有些研發(fā)工作,可以針對(duì)現(xiàn)實(shí)的問題動(dòng)手先做,沒必要一定符合"國(guó)際規(guī)范",我們做出來有價(jià)值的一定會(huì)被借鑒,也就會(huì)逐步發(fā)展為某種意義上的"國(guó)際規(guī)范",而不是框架性的認(rèn)為,國(guó)外還沒做,我們就不必要做。有次在會(huì)議上報(bào)告我們相關(guān)研發(fā)的資源交流項(xiàng)目的時(shí)候,就有不只一個(gè)聽眾提問,你們做的國(guó)際上有沒有先例,是否符合"國(guó)際規(guī)范"之類的問題。我當(dāng)時(shí)答復(fù)就是一是不知道,二是沒有考慮過。為什么一定要先了解有沒有國(guó)際先例再做呢?只要我們認(rèn)為是有價(jià)值的,能夠解決我們實(shí)際的問題,我們就是先例,也可以到一定時(shí)候成為某種意義上的"國(guó)際規(guī)范"。今年初,我在美國(guó)與國(guó)際樣本協(xié)會(huì)負(fù)責(zé)人討論提及我們的項(xiàng)目時(shí),發(fā)現(xiàn)他們也在做類似事情,所以只要是問題,大家都能夠想到。
當(dāng)然國(guó)際上在這方面發(fā)展比我們?cè),其中由許多我們可借鑒、可采用的建設(shè)發(fā)展理念,我們沒有必要自己再做一套。從國(guó)外樣本庫(kù)建設(shè)規(guī)范化來說,我們需要采用?傮w來講主要有兩個(gè)大規(guī)范:一是美國(guó)國(guó)立衛(wèi)生研究院NIH里面的NCI,即美國(guó)腫瘤研究所,他們給生物樣本庫(kù)專門設(shè)立一個(gè)辦公室叫OBBR,那里設(shè)了一套我們常說的標(biāo)準(zhǔn)規(guī)范,他們叫最佳實(shí)踐即英文的BestPractice。規(guī)范還不能稱為標(biāo)準(zhǔn),標(biāo)準(zhǔn)可能是必須服從的。但目前樣本庫(kù)建設(shè)方面國(guó)際上還沒有真正意義上的標(biāo)準(zhǔn),只能稱為最佳實(shí)踐。根據(jù)所有專家過去的操作,大家認(rèn)為最好的辦法,然后依據(jù)去做,是大家目前能力范圍認(rèn)為的最好或應(yīng)該采用的方法。而且這是不斷更新的過程,事情發(fā)展到一定階段,大家都這么做,就會(huì)通過某種機(jī)制或手段體現(xiàn)其價(jià)值標(biāo)準(zhǔn)而成為操作標(biāo)準(zhǔn)規(guī)范。
另外一個(gè)規(guī)范就是國(guó)際樣本庫(kù)協(xié)會(huì)ISBER(InternationalSocietyofBiologicalEnvironmentalRepository)采用的最佳實(shí)踐,其最新版本的是2012年做的。這兩個(gè)最大的區(qū)別就是ISBER考慮比較高層面的,沒有太詳細(xì),更多的是構(gòu)架一些理念,而美國(guó)NCI的OBBR做的比較細(xì),他們所有樣本資源最早都是從腫瘤樣本做起,從病理科開始發(fā)展。這是目前國(guó)際上存在的主要兩大規(guī)范。幾年前,中國(guó)也曾經(jīng)制定過樣本庫(kù)規(guī)范,如我國(guó)重大疾病樣本庫(kù)建設(shè)規(guī)范,是由中國(guó)生物醫(yī)藥協(xié)會(huì)組織樣本庫(kù)分會(huì)主任委員郜恒俊教授領(lǐng)導(dǎo)的團(tuán)隊(duì)在開展這方面的工作,近年來,他們主要是推動(dòng)以國(guó)際生物樣本庫(kù)協(xié)會(huì)ISBER的最佳實(shí)踐指南為主的規(guī)范化建設(shè)。
可借鑒的第三點(diǎn)是他們的信息化發(fā)展。這方面國(guó)際發(fā)展的的速度與我們差別較大,而且很多是由于理念認(rèn)識(shí)不同而導(dǎo)致信息化發(fā)展方面的阻礙。國(guó)外信息化發(fā)展比較早,在科研上,我們會(huì)有很多可借鑒的。目前生物樣本庫(kù)與傳統(tǒng)生物資源保存最根本的區(qū)別就是樣本的信息化問題。我在許多場(chǎng)合的報(bào)告都會(huì)提出一點(diǎn),就是樣本本身幾乎沒有什么價(jià)值,真正的價(jià)值在于其特有的信息,也就是生物樣本是唯一的生物實(shí)體,它既有豐富的臨床信息,又有詳細(xì)的實(shí)驗(yàn)室信息,這是其他實(shí)體無法做到的,動(dòng)物模型或細(xì)胞不能夠正確反映臨床信息。臨床和實(shí)驗(yàn)室信息的結(jié)合正是轉(zhuǎn)化醫(yī)學(xué)的起點(diǎn)。簡(jiǎn)單來說,現(xiàn)代建設(shè)生物樣本庫(kù)的目的就是如何能夠把生物樣本資源轉(zhuǎn)化或翻譯成為數(shù)據(jù)信息資源,如果樣本沒有信息的轉(zhuǎn)化,其作為轉(zhuǎn)化醫(yī)學(xué)和個(gè)體化醫(yī)學(xué)研究的寶貴資源也將成為一句空話,F(xiàn)在人們參觀某個(gè)生物樣本庫(kù),總是看有多大空間,多少冰箱,有什么儀器,有幾個(gè)人等等,但是真正能夠展示一個(gè)樣本庫(kù)價(jià)值的只有信息,一個(gè)有價(jià)值和管理規(guī)范的數(shù)據(jù)庫(kù),其核心點(diǎn)也不是發(fā)表過多少篇文章。我相信將來我們?cè)僬勆飿颖編?kù),重點(diǎn)也會(huì)轉(zhuǎn)移到相應(yīng)的信息化建設(shè)與發(fā)展。最近我申報(bào)一個(gè)新的項(xiàng)目,是與美國(guó)方面合作的,因?yàn)槲抑浪麄兡抢镒龅姆浅:,正是我們需要的。所以從信息化的角度,他們有很多方面值得我們借鑒。
生物谷:如何看待生物樣本庫(kù)信息化管理以及標(biāo)準(zhǔn)化?
王偉業(yè)教授:前面已經(jīng)簡(jiǎn)單提到生物樣本的信息化建設(shè)的必要和重要性。信息化不能單一解釋為管理,樣本信息化的核心簡(jiǎn)單地說就是如何以正確的方式描述樣本所包含的信息內(nèi)容并且讓這些信息能夠充分體現(xiàn)樣本的特性與特征。我前面提到想做的項(xiàng)目,其關(guān)鍵點(diǎn)就是如何特異性的描述樣本資源的特征。比如同樣是大腸癌樣本,不同的樣本庫(kù)描述特征可能不一樣,現(xiàn)代醫(yī)學(xué)越來越精細(xì)化,腫瘤樣本的特性會(huì)有基因分型,個(gè)體化治療更需要分型。單說是大腸癌樣本沒有多少價(jià)值,因?yàn)槊總(gè)人的大腸癌樣本內(nèi)涵不同。這就需要描述非常特征性的信息。在科研應(yīng)用上,樣本的特征性描述如果不全面,或不夠精細(xì),就要考慮這個(gè)樣本是否符合你的研究需要,所以信息化的重點(diǎn)就是如何特異性的描述樣本,即樣本的特性。
第二點(diǎn)是上述的樣本信息化方法要逐步走向規(guī)范化和標(biāo)準(zhǔn)化,比如大腸癌樣本在不同的樣本庫(kù)要以同樣的內(nèi)容和方法來描述,這樣經(jīng)過統(tǒng)一,規(guī)范化然后被接受后,才能逐步走向標(biāo)準(zhǔn)化。所以標(biāo)準(zhǔn)化是水到渠成的事情,把基底鋪好,一步步不斷朝前走,到一定時(shí)候才能實(shí)現(xiàn)標(biāo)準(zhǔn)化,而不是今天講標(biāo)準(zhǔn),很快就能做到標(biāo)準(zhǔn)。先找到正確的方向,建立一定的基礎(chǔ),然后自然會(huì)走到標(biāo)準(zhǔn)化。
生物谷:整體來講,挑戰(zhàn)還是比較多。國(guó)家政府層面對(duì)這個(gè)支持情況怎么樣?
王偉業(yè)教授:樣本庫(kù)建設(shè)的發(fā)展需要領(lǐng)導(dǎo)層面和政策的支持,政策決定樣本庫(kù)的發(fā)展方向和可行性。許多醫(yī)院領(lǐng)導(dǎo)在這方面意識(shí)很強(qiáng),能夠大力推動(dòng)樣本庫(kù)的發(fā)展。今年6月在北京將召開第六屆生物樣本庫(kù)標(biāo)準(zhǔn)化管理會(huì)議,其中專門設(shè)有一個(gè)醫(yī)院院長(zhǎng)高峰論壇,其目的很明確。中國(guó)的樣本庫(kù)建設(shè)之所以能夠在短時(shí)間內(nèi)發(fā)展迅速,是各醫(yī)院領(lǐng)導(dǎo)大力支持的結(jié)果。正因?yàn)槿绱,也說明領(lǐng)導(dǎo)的支持是非常關(guān)鍵的因素。
據(jù)我所知,樣本庫(kù)建設(shè)目前還沒有作為一個(gè)科研項(xiàng)目來申請(qǐng)資金項(xiàng)目。目前的資金,都只是來自當(dāng)?shù)卣闹С忠约搬t(yī)院自身投入。
轉(zhuǎn)化醫(yī)學(xué)是從臨床到實(shí)驗(yàn)室,再把實(shí)驗(yàn)室獲得的結(jié)果帶回到臨床應(yīng)用。這個(gè)過程需要研究對(duì)象,尤其涉及個(gè)體化治療。如果沒有生物樣本資源,一切都是空談。生物樣本的可貴之處是其既有臨床信息,又有實(shí)驗(yàn)室的研究信息,樣本資源在實(shí)驗(yàn)室研究和臨床信息之間搭建了一個(gè)通道,能夠起到實(shí)驗(yàn)室與臨床之間往來的橋梁作用。轉(zhuǎn)化醫(yī)學(xué)的多方面都涉及樣本庫(kù),所以資金支持對(duì)樣本庫(kù)建設(shè)不是大問題。也就是說,目前在建設(shè)樣本庫(kù)方面不會(huì)因資金短缺問題而做不好。
當(dāng)然資金處理方面也會(huì)存在一些問題。有些資金在沒有得到全面的規(guī)劃和設(shè)計(jì)之前就以分配的方式到了各個(gè)機(jī)構(gòu),就像把需要一個(gè)拳頭的力量來做的事情分成單個(gè)手指去單獨(dú)執(zhí)行。一個(gè)全面的自動(dòng)化特性平臺(tái)可以在保證質(zhì)量的前提下完成同樣的流程式操作,但資金分配后導(dǎo)致任何一家單位都承擔(dān)不起,即使購(gòu)買了設(shè)備,所需的試劑與耗材也會(huì)缺乏資金,或者有了設(shè)備,卻沒有單位有那么多需求,最終也不能夠真正應(yīng)用。因此資金需要在高層面設(shè)計(jì)合理后才能更好地整合協(xié)調(diào)。
第二是樣本庫(kù)的維持,大多醫(yī)院或單位對(duì)樣本庫(kù)建設(shè)的支持往往是大力支持硬件設(shè)施,如冰箱,房間,工作人員。其實(shí)消耗品也很重要,至少需要占5%,但這筆經(jīng)費(fèi)一般沒有來源,有設(shè)備卻無法開工。如何有機(jī)制地維護(hù)這種平臺(tái)是目前我們都能夠看到的一個(gè)挑戰(zhàn)性問題。比如,一家小醫(yī)院為了順應(yīng)發(fā)展趨勢(shì)而建個(gè)樣本庫(kù),由于科研平臺(tái)薄弱,加上缺乏共享應(yīng)用,之后的使用就會(huì)很少而沒有辦法維持,最后可能就類似于傳統(tǒng)上的一個(gè)實(shí)驗(yàn)室有幾個(gè)冰箱。這涉及到國(guó)際上探討的樣本庫(kù)經(jīng)濟(jì)學(xué)方面的思考(BiobankEconomics)。當(dāng)然這取決于管理人員在管理樣本庫(kù),使用樣本庫(kù)等很多方面的能力,因此將來能夠走下去的可能只有為數(shù)不多的生物樣本庫(kù)。
資金支持方面,目前國(guó)外NIH也可能沒有特別經(jīng)費(fèi)支持。比如NIH設(shè)有個(gè)專門資金來支持一些重大項(xiàng)目的申請(qǐng),但必須利用已經(jīng)存在的生物樣本資源,這可能是把資源最大化利用的一個(gè)正確案例。
生物樣本庫(kù)信息化管理,專職容易專業(yè)難
生物谷:如何看待國(guó)家生物樣本庫(kù)信息化管理方面人才問題?
王偉業(yè)教授:首先,在中國(guó),許多樣本庫(kù)通常是雇幾個(gè)專職工作人員,就稱樣本庫(kù)有專職人員負(fù)責(zé),當(dāng)然這沒有錯(cuò),但需要明白專職并不等于專業(yè)化。另外對(duì)于樣本庫(kù)中的"庫(kù)"字,在現(xiàn)實(shí)中可能造成理念上的誤解:庫(kù),很容易被認(rèn)為像倉(cāng)庫(kù)一樣,而倉(cāng)庫(kù)會(huì)讓人想到儲(chǔ)存。所以"樣本庫(kù)"不像一個(gè)與研究非常緊密的機(jī)構(gòu)。在英文里有些機(jī)構(gòu)會(huì)寫成BiospecimenResearch。事實(shí)上,儲(chǔ)存樣本只是生物樣本庫(kù)主要功能的一項(xiàng),其功能絕不僅限于儲(chǔ)存。如果一直停留在這個(gè)誤區(qū),會(huì)造成之后相應(yīng)的錯(cuò)誤,我認(rèn)為最主要的是資源的應(yīng)用或共享。目前,樣本資源的應(yīng)用與研究方面的結(jié)合、信息共享為前提的資源共享等一系列問題都沒有得到解決。所以,從專職到專業(yè)是個(gè)復(fù)雜的學(xué)習(xí)過程。由于樣本庫(kù)涉及的知識(shí)范圍很廣,如醫(yī)學(xué)、生物學(xué),分子生物學(xué)、冷凍保存技術(shù)、生物信息學(xué)和信息管理學(xué)等,現(xiàn)在已經(jīng)把其看作是一門新型的學(xué)科。所以我認(rèn)為應(yīng)該成立生物樣本中心,以反映其職能和功能特性。
樣本庫(kù)的信息化管理是樣本資源所必須的,信息化和生物信息是兩個(gè)方向,而生物信息學(xué)需要這兩個(gè)領(lǐng)域的交叉人才。人們?nèi)菀装焉镄畔⒗斫鉃镮T,但是IT人員只能夠滿足要求的計(jì)算機(jī)功能,卻不知道生物領(lǐng)域的邏輯。因此需要生物學(xué)和IT人員緊密配合才能夠達(dá)到需求。當(dāng)然,并不是要求樣本庫(kù)工作人員都必須懂得信息化的知識(shí),目前也辦不到,但是至少管理層的人一定要有相應(yīng)工作需要的基本知識(shí),負(fù)責(zé)項(xiàng)目的人要有能力在中間做協(xié)調(diào),這點(diǎn)很重要。樣本庫(kù)建設(shè)下一個(gè)階段的發(fā)展一定是以信息化為重點(diǎn)。從我的工作經(jīng)驗(yàn)來看,我的生物信息化知識(shí)加上我自己對(duì)計(jì)算機(jī)方面的的愛好,跨學(xué)科的知識(shí)與技能對(duì)我?guī)椭艽,我現(xiàn)在可以設(shè)計(jì)數(shù)據(jù)庫(kù)的邏輯方面需要。生物樣本庫(kù)是一個(gè)多學(xué)科的領(lǐng)域,需要一個(gè)從專職到專業(yè)化的轉(zhuǎn)變和更新的歷程。
生物谷:我國(guó)樣本庫(kù)信息化人才方面存在哪些問題?
王偉業(yè)教授:中國(guó)在生物信息化方面發(fā)展跟國(guó)外的差距相對(duì)比較大,也可以這么說,我國(guó)生物信息化的發(fā)展明顯滯后于醫(yī)學(xué)生物研究的發(fā)展。不少做分子生物研究領(lǐng)域的人,因?yàn)楣ぷ餍枰褂煤芏嘈畔⑾到y(tǒng),然后去鉆研信息相關(guān)方面的知識(shí)與技能,可能不需要知道詳細(xì)編程,但至少知道信息化的邏輯。從管理項(xiàng)目來講,需要掌握一些基本知識(shí)和一些邏輯過程。
另一方面,可能做生物的人對(duì)計(jì)算機(jī)認(rèn)識(shí)少,國(guó)內(nèi)對(duì)樣本庫(kù)信息化管理方面的認(rèn)識(shí)不足,很容易把一些問題歸納為計(jì)算機(jī)的問題。其實(shí)有不少需求或者問題不一定是計(jì)算機(jī)方面的,比如樣本庫(kù)的信息怎么去標(biāo)識(shí),怎么注解等相關(guān)問題,這不能夠只依賴IT的工作,而是需要樣本庫(kù)的工作人員去做的,因?yàn)檫@樣的工作需要醫(yī)學(xué)生物的專業(yè)知識(shí),F(xiàn)在生物醫(yī)學(xué)研究離不開數(shù)據(jù),離不開信息化,大數(shù)據(jù)處理、生物樣本信息處理,完全用Excel格式或手工記錄已經(jīng)不能滿足現(xiàn)代生物醫(yī)學(xué)研究所產(chǎn)生的數(shù)據(jù)量和復(fù)雜性方面的需求。
生物谷:針對(duì)這些問題,您個(gè)人是否有好的解決建議?
王偉業(yè)教授:首先我們需要培訓(xùn),目前,生物樣本庫(kù)建設(shè)缺少以進(jìn)修方式來達(dá)到掌握技能和管理的方式,而主要采取學(xué)習(xí)班的方式,這樣時(shí)間有限,而且不能實(shí)踐性的涉及到具體工作。樣本庫(kù)方面的工作主要還是應(yīng)用型的操作和管理技能,尤其是對(duì)信息管理系統(tǒng)的掌握,單靠課堂方式的培訓(xùn)是不夠的。在實(shí)際工作中如果遇到問題,學(xué)習(xí)正確的思考和解決問題的方法是最重要的。我提倡的是,通過做事,才能真正知道如何解決問題,才能把一套知識(shí)學(xué)會(huì)。目前在我的團(tuán)隊(duì),我對(duì)他們的要求就是以"進(jìn)修"的方式,直接參與到日常工作中去。
去年因項(xiàng)目進(jìn)展要求,我們走訪了一些樣本庫(kù),發(fā)現(xiàn)存在的問題主要在信息化管理方面:把樣本登記到樣本庫(kù)信息管理系統(tǒng)中是很容易辦到的事情,但信息內(nèi)容幾乎空白,這樣的樣本從信息系統(tǒng)本身而言是沒有辦法應(yīng)用的,因?yàn)檫B基本的搜索恐怕都做不到,F(xiàn)在我們的樣本庫(kù)信息以臨床診斷作為樣本的主要信息,比如某種腫瘤的臨床診斷名稱。而個(gè)體信息可能都沒有。再舉個(gè)傳統(tǒng)的簡(jiǎn)單例子,收集了群體的樣本后,只描述臨床診斷是某種型肺癌,如果研究者是想用此樣本來研究抽煙和肺癌發(fā)生的相關(guān)性,但是是樣本提供者是抽煙的,還是喝咖啡的等相關(guān)信息都沒有,研究人員就無法確定樣本資源是否是研究所需要的。
樣本庫(kù)的發(fā)展,首先要建立,然后才能統(tǒng)一也必須統(tǒng)一,最后才有可能發(fā)展為樣本資源網(wǎng)絡(luò),這是國(guó)際樣本庫(kù)發(fā)展趨勢(shì)中的三個(gè)里程碑。但是這里的"統(tǒng)一",并不是在實(shí)體上把樣本資源整合在一起,不是把資源放在一起整合儲(chǔ)存那么簡(jiǎn)單。整合應(yīng)該是相同的資源在應(yīng)用時(shí)具備相容性,可以用同一個(gè)標(biāo)準(zhǔn)來評(píng)價(jià)其質(zhì)量和特性等。有了相容性,需要時(shí)才可以真正的整合應(yīng)用,即使分開研究,由于信息規(guī)范統(tǒng)一,得到的結(jié)果也可以"整合"分析。所以"整合"可以分別理解為整合儲(chǔ)存,整合應(yīng)用和整合分析幾種方式。另外"網(wǎng)絡(luò)"并非計(jì)算機(jī)網(wǎng)絡(luò)那么簡(jiǎn)單,網(wǎng)絡(luò)代表共享,包括信息和樣本資源的共享。我認(rèn)為信息共享是樣本資源共享的前提:信息不能夠共享,就不能確定樣本資源是否有資質(zhì)共享。目前我們?cè)诮ㄔO(shè)的初期,信息化方面的問題很明顯。信息雖然很多,比如很多稱為電子病歷的病歷有可能僅僅是電子版的記錄,并不是真正意義上的電子病歷,真正的電子病歷是將所有病歷信息化的計(jì)算機(jī)可以應(yīng)用的病歷信息。
當(dāng)然,這些基本的理念可以通過培訓(xùn),通過提供一些進(jìn)修的平臺(tái),讓從業(yè)人員從實(shí)際上接觸并解決問題。現(xiàn)在承擔(dān)樣本庫(kù)工作的專職人員缺乏一些必要的專業(yè)技能和經(jīng)驗(yàn),需要通過專業(yè)化的學(xué)習(xí)從專職成為專業(yè)人員。樣本庫(kù)是設(shè)計(jì)面廣泛的應(yīng)用科學(xué)與研究,因?yàn)閷?shí)驗(yàn)室的研究結(jié)果與樣本庫(kù)的專業(yè)程度緊密相關(guān),尤其在研究中出現(xiàn)的問題,樣本庫(kù)工作人員需要直接思考并解決問題。所以談到職業(yè)方向,從業(yè)者如果一開始僅把建庫(kù)理解為做好儲(chǔ)存是沒有意義的。負(fù)責(zé)人應(yīng)該具有較高的專業(yè)化程度,不能把專職和專業(yè)等同起來,做專職易,做專業(yè)難!
王偉業(yè)教授2012年引進(jìn)回國(guó),之后開展了很多生物樣本庫(kù)信息化建設(shè)方面的工作。對(duì)于未來,他又有著怎樣的期待呢?
生物谷:請(qǐng)您介紹一下回國(guó)后這兩年在樣本庫(kù)資源共享方面的工作情況。
王偉業(yè)教授:前面談到過,資源共享的前提是信息共享,其條件是樣本資源必須在信息化建設(shè)方面有可比性和相容性,只有合格的樣本資源才能夠共享。另外,共享的實(shí)施也是通過信息化管理運(yùn)作來實(shí)現(xiàn)的。兩年來,除了領(lǐng)導(dǎo)研發(fā)合作團(tuán)隊(duì)研發(fā)信息化管理系統(tǒng),也作為技術(shù)負(fù)責(zé)人指導(dǎo)研發(fā)信息化共享平臺(tái)。我們走出的較關(guān)鍵性的一步就是統(tǒng)一信息管理系統(tǒng),這為不同樣本庫(kù)之間共享信息打好了基礎(chǔ)。統(tǒng)一的信息化管理系統(tǒng)可以解決不同信息管理系統(tǒng)因不同的邏輯和結(jié)構(gòu)設(shè)計(jì)而帶來的信息搜索方面的難題。
我的工作重心還有我負(fù)責(zé)申報(bào)的兩項(xiàng)信息化國(guó)際合作科研項(xiàng)目,已經(jīng)獲得上?莆瘒(guó)際合作項(xiàng)目和國(guó)家科技部國(guó)際科技合作專項(xiàng)的立項(xiàng)經(jīng)費(fèi)支持。項(xiàng)目的主要目的是探索應(yīng)用統(tǒng)一多方數(shù)據(jù)元素的方法和數(shù)據(jù)屏蔽技術(shù),建設(shè)信息共享機(jī)制和運(yùn)作模式,促進(jìn)國(guó)內(nèi)國(guó)際合作研究。這些技術(shù)和模式同時(shí)也是樣本資源共享建設(shè)發(fā)展的需求。
另外,為樣本庫(kù)建設(shè)下一階段的發(fā)展考慮,我正在負(fù)責(zé)國(guó)家科技部的研究項(xiàng)目,重點(diǎn)是研究樣本庫(kù)信息資源的語(yǔ)義化描述/注解、語(yǔ)義化索引以及樣本庫(kù)資源語(yǔ)義化檢索等方面的工作,為建設(shè)語(yǔ)義化的樣本庫(kù)(SemanticBiobank)。這也是生物資源和生物大數(shù)據(jù)共享的另一個(gè)需求模式。通過語(yǔ)義化注解,樣本資源可以通過一定的統(tǒng)計(jì)學(xué)分析來評(píng)估樣本信息質(zhì)量的可比性和相似性,為判斷資源共享的合理性提供一個(gè)可分析的方法。
樣本庫(kù)共享首先是樣本的信息共享。如果不知道樣本的信息,無從知道是否要共享。一些可能并不是你想要的樣本,并非簡(jiǎn)單講樣本的質(zhì)量好壞,凡不符合研究需要的樣本對(duì)你來說就是垃圾,當(dāng)然也可能對(duì)別人是寶藏。所以跟別人資源共享,一定要先了解別人的資源對(duì)你是否有用,這是信息共享的前提。是否愿意共享是目前的一個(gè)主要障礙,當(dāng)然也缺乏具體的應(yīng)用方式和機(jī)制。有時(shí)同國(guó)際方面合作時(shí),會(huì)有這種情況:愿意合作,但樣本不合格。
第四是信息化管理,我設(shè)計(jì)的信息化管理流程和邏輯,是與專業(yè)的IT團(tuán)隊(duì)合作完成的,這樣我具有的跨學(xué)科知識(shí)和經(jīng)驗(yàn)?zāi)軌蚱鸬揭欢ǖ囊龑?dǎo)作用。在系統(tǒng)設(shè)計(jì)方面,融入的要素一定是將來要用的模式,而不是只考慮眼前的應(yīng)用,有些方式和功能可能被認(rèn)為用不著,但是里面涵蓋著發(fā)展必須要有的。只滿足眼前,不考慮將來,這是信息數(shù)據(jù)管理方面要避免的。信息交流越先進(jìn)越好,最終理想是只有一種信息,可能這才是需要的標(biāo)準(zhǔn)。雖然在實(shí)際中可能很難,但至少不能鋪的太廣,比如一百個(gè)生物樣本庫(kù),用了幾十個(gè)不同的管理系統(tǒng),這樣會(huì)走向混亂。所以標(biāo)準(zhǔn)化必須打好基礎(chǔ),否則沒辦法實(shí)現(xiàn)標(biāo)準(zhǔn),即使提供一個(gè)標(biāo)準(zhǔn)也做不到。針對(duì)這個(gè)問題,不同樣本庫(kù)之間要互相做接口,互相征詢和改變,這樣大家才能逐步走向標(biāo)準(zhǔn)。
生物谷:最后,您對(duì)中國(guó)生物樣本庫(kù)建設(shè)以及自己之后的工作有什么期待?
王偉業(yè)教授:期待當(dāng)然有,我知道最近有關(guān)方面要討論建立國(guó)家層面的生物樣本庫(kù)。人類生物樣本資源庫(kù)主要有兩種,一種是正常人群的,一種是病人源性的。中國(guó)資源種類多,病人多,需要一個(gè)逐步發(fā)展完整的機(jī)制和政策以及手段來規(guī)范化,我認(rèn)為要采用先做模式,后擴(kuò)展的方式,如同企業(yè)要先做強(qiáng)后做大一樣,真正把樣本庫(kù)建設(shè)做成一個(gè)科學(xué)化的行業(yè)。
對(duì)于自己的工作期待,當(dāng)然也就是自己的研究項(xiàng)目,希望能夠引導(dǎo)樣本庫(kù)信息化發(fā)展,目前樣本庫(kù)信息還不能實(shí)現(xiàn)共享。單純講資源共享不可行,中間有斷層,這個(gè)領(lǐng)域內(nèi)的培訓(xùn)和專業(yè)化層面跟國(guó)際上有很多可交流借鑒的地方。所以我要利用我個(gè)人的一點(diǎn)的優(yōu)勢(shì)通過國(guó)際合作的方式,實(shí)事求是的合作,利用已經(jīng)有的技術(shù)平臺(tái)和一些理念。另外,我認(rèn)為國(guó)際合作并不是獲取一項(xiàng)技術(shù),單純的技術(shù)不是最重要的,因?yàn)榧夹g(shù)也可以花錢買來。所以單純有技術(shù)是不夠的,重要的是模式和平臺(tái)。我的研究項(xiàng)目很看重模式平臺(tái)。我們有時(shí)過于強(qiáng)調(diào)技術(shù),但是技術(shù)和平臺(tái)不是一回事,一個(gè)平臺(tái)的管理規(guī)章制度、流程、質(zhì)控質(zhì)檢以及所有的專業(yè)技術(shù)人員代表著能否做好這件事情。所以合作或者共享,尤其和國(guó)際上合作,最需要做的平臺(tái)就是信息交流平臺(tái)。