自去年年初中國的精準醫療計劃初見端倪以來,精準醫療即成為生物醫療行業裏的熱點話題,各類討論、爭論層出不窮,以至如何定義精準醫療都有很多不同意見。但有一點有著廣泛的共識,即生物標記物指導下的精準用藥(以下簡稱個性化治療),是精準醫療中公認的一個核心領域。其新標誌是新藥在FDA獲批時,以該藥的生物標記物開發的體外診斷伴隨試劑盒(CompanionDiagnostics)也同時獲批,因為有規範的臨床數據證明該藥隻有在生物標記物陽性的病人中有顯著療效。該藥上市後需用伴隨診斷來篩選適宜病人,從而達到精準治療的效果。
同樣的藥同樣的劑量,有些病人吃了有效,有些吃了無效或者還有副作用,這種由於病人間個體化差異導致對藥物的不同反應,這普遍存在於大多數藥物治療過程中,也是個性化治療領域發展的動因。
個性化治療最早的成功案例就是治療乳腺癌的單抗藥赫賽汀,基因泰克公司較早地確定了赫賽汀的藥物靶標HER2是其生物標記物,其臨床試驗針對性地選擇HER2過度表達乳腺癌病人,三期臨床隻用了二百多病人就證明了赫賽汀的療效,隨即獲得FDA的加速審批獲準上市。如果基因泰克當年沒有采用HER2作為生物標記物來篩選潛在的有效病人,由於隻有不到百分之三十的乳腺癌病人有HER2過度表達,隻有幾百人的臨床三期試驗結果很可能就會失敗。
赫賽汀自1998年上市以來,造福於廣大乳腺癌患者,同時迅速成為銷售過十億的重磅炸彈新藥,為原研藥廠帶來巨大回報。赫賽汀的成功也催生了個性化治療這個新型領域,讓業界見證了其巨大潛力,尤其是創新藥研發的成本越來越高、但失敗率高居不下,個性化治療被認為是解決這一難題的靈丹妙藥。
個性化治療的理念淺顯懂,加上赫賽汀治療及後來的治療有BCR-ABL融合基因慢性粒細胞白血病格力維等個性化新藥的優異療效並同時伴隨著商業上的巨大成功,很快就被新藥研發領域廣泛接受。在過去十餘年,新藥領域、尤其是腫瘤創新藥領域的國際大藥廠,已經普遍將生物標記物作為指導其創新藥的重點。FDA也對這一領域給予了高度的支持,對於有生物標記物指導的個性化新藥會給予加速審批,有時甚至有臨床二期的結果就可以批準上市,例如輝瑞治療肺癌的ALK抑製劑克唑替尼,FDA同時還及時出台了伴隨診斷的與新藥同步研發報批的指南。與此同時,精準醫療也成為生物醫藥領域裏越來越熱門的話題,直至去年已引起中美兩國政府的高度重視。
生物標記物成個性化治療瓶頸
綜上所述,可以看出個性化治療是一個跨行業的新興領域,將分子診斷同藥物研發有機地結合起來,從而到達精準用藥的目的。二者成功結合的最核心之處就是能否找到可預測藥物療效的生物標記物了。盡管十餘年來個性化治療已成生物醫藥領域的共識,很多藥廠也高度重視,有的機構甚至要求進入的項目都需要有生物標記物,但是在FDA批準上市的上百個新藥中,獲批作為伴隨診斷的生物標記物隻有十餘個,絕大多數創新藥都沒有真正的經過臨床雙盲試驗驗證的生物標記物。可見發現正確的生物標記物是非常不容易,實際上這已經成為個性化治療的瓶頸。
第一代生物標記物最直觀也最容易理解,即藥物靶標的過度表達就是生物標記物。因為靶點越多藥物越容易擊中目標,如果沒有靶點,自然打不中目標。譬如預測赫賽汀對HER2過度表達的乳腺癌有效,還有最近獲批的PD1單抗用於治療PD1陽性的肺癌。可是EGFR抑製劑易瑞沙的療效卻同EGRF的表達水平無關,後來發現其療效是同EGFR的基因突變相關。
隨著下代測序技術的興起,對於靶點突變作為生物標記物的研究越來越多。但是不是隻把寶押在藥物靶點上就萬無一失呢?
治療結腸癌的單抗藥Erbitux的靶點也是EGFR,但其療效同EFGR的表達和突變都沒有關聯,後來通過大量的回顧性試驗發現其生物標記物是出於EGFR信號傳導通路下遊的K-RAS基因突變。這類靶點以外的生物標記物可歸為第二代生物標記物,可想而知這類生物標記物要比第一類難找得多。
生物標記物在新藥研發裏的重要性、尤其是在腫瘤領域,已得到空前的重視。很多藥廠要求新藥進入臨床試驗時一定要有生物標記物,這當然是最理想的模式,前提是能在臨床前動物實驗時即可確定生物標記物,這通常發生在生物標記物即是藥物靶點或其突變本身時。比如PeterHirth領導的Plexxikon很早就針對B-Raf突變開發出B-Raf抑製劑維羅非尼,並很快在在臨床試驗中證明維羅非尼含有B-Raf突變的黑色素瘤有著非常顯著的療效。
對大多數新藥項目來說,將藥物靶標作為生物標記物是最常見的方式,有些還在在動物實驗或細胞株試驗中有不錯預測藥效的結果。但遺憾的是,由於生物信號傳導的複雜性及人體和動物或單一細胞株的巨大差異,很多情況這些結果未見得在人體臨床試驗中能夠重複,該新藥的生物標記物未見得是藥物靶標本身。例如輝瑞研發的cMet激酶抑製劑可銼替尼,針對cMet擴增的腫瘤未有很顯著的療效。不過幸運的是克唑替尼被發現在很少見的一些含有ALK融合基因的肺癌病人中療效異常顯著,輝瑞的科學家們很快改用ALK作為生物標記物指導可銼替尼治療這一小部分肺癌病人。由於其效果顯著,FDA在可銼替尼臨床二期試驗完成後即批準該藥上市。
兩大難點
從上麵的闡述可見,在創新藥研發過程中找到真正的臨床生物標記物並不容易,這也是為什麽這麽多年來上市新藥隻有很少數帶有伴隨診斷共同上市,而且這其中還有不少幸運的成分。發現生物標記物的難度如此之大是有多方麵的原因。
其一,在靶向藥物為主導的今天,藥物的作用機理大多是在細胞株和動物模型中建立完成的,但人體是一個多細胞多器官的高度複雜的生物體,很多疾病的治病機理涉及到多個生物信號傳導通路且不同器官會有不同的機理(對大多數疾病而言,現代科學了解的其致病機理的很小一部分),這是臨床前藥物研發所用的體外試驗體係很難模擬的。例如,B-Raf突變在黑色素瘤中是維羅非尼很好的生物標記物,但維羅非尼對於含有同樣B-Raf突變的結腸癌療效卻相差甚遠。因而不能簡單地根據一型腫瘤試驗裏的生物標記物的結果就貿然推斷其他腫瘤的療效,一定要有相應的臨床數據支持才能真正的成為生物標記物。另外靶向藥也常會作用於原始設計靶標以外的蛋白,尤其是激酶抑製劑,這個現象尤為明顯。例如克唑替尼會抑製Met及ALK,伊馬替尼抑製BCR-ABL,Kit,和PDGFR。
另外,生物信號傳導通路常涉及到靶標以外的多個基因,例如抑製EGFR的單抗藥Erbitux的生物標記物是EGFR下遊的K-RAS基因突變。這都使得常用的隻以單一原研藥物靶標為生物標記物有很大的局限性。
其二,是我們對人類基因組了解的局限,因為能否正確選擇生物標記物是基於對基因組功能的了解。盡管本世紀初,我們就完成了人類基因組的測序,獲得了全部三十億堿基對的序列。但直到今天,我們隻對人類基因組不到5%的基因編碼區有一定的了解,對於90%以上的基因組序列知之甚少。
個性化治療與基因組學即大數據
與精準醫療的熱度相似,大數據也成為一個熱點。大量的基因組學數據無疑會加速對解碼人類基因組及了解各基因區域位點同疾病藥物療效的關係,進而推進生物標記物的發掘,助力個性化治療的發展。
人類基因組測序也極大地推動了DNA芯片技術迅猛發展及應用,一塊小小的芯片可以檢測人類基因組中大部分乃至全部的基因,這類基於組學的微陣列芯片的普及突破了傳統的基於靶向基因或少量候選基因的局限,催生了新一代包含多個基因生物標記物群的出現,例如MammaPrint檢測試劑就是由從全基因組RNA微陣列芯片試驗中產生的數據中挑選出的70個基因組成,用以預測乳腺癌患者的預後,進而幫助患者和醫生確定是否采用化療來防止癌症複發。
隨著類似大量組學的試驗公開,形成了一個龐大的組學大數據,其中蘊藏了大量信息可供發掘,包括生物標記物。例如,密西根大學的ArulChinnaiyan小組從大量的微陣列芯片的數據中首次發現了前列腺癌的生物標記物TMPRSS2-ETS融合基因。
在RNA芯片的崛起後,基於全基因組的單核苷酸多態性(SNP)芯片也有了迅猛的發展,目前的全基因組芯片可以包囊上百萬個SNPs,這項技術催生了全基因組關聯研究的迅速普及,到目前為止已有上千個全基因組關聯研究公開發表,為了解危害人類健康主要疾病的致病遺傳因素取得了豐碩的成果,同時很多研究也使用這項技術來發掘新的生物標記物。
過去幾年,二代測序的迅猛發展把組學研究帶向一個新的水平,高通量測序的發展使得我們可以輕易地檢測人類基因組的所有外顯子及整個基因組的基因序列及其變異,其產生的海量數據會進一步加速生物標記物的開發。下代測序等一係列組學研究新技術是生物醫學領域裏不可或缺的重要工具,如能合理、有針對性地將這些工具及同包括臨床試驗等醫療大數據有效結合起來,將會對個性化治療領域有著不可估量的重大意義,並最終大幅提高新藥研發的成功率,我們有理由相信未來幾年將會是個性化治療迅猛發展的黃金時代。