【環球網科技綜合報道】1月7日消息,近日,分子之心創始人兼首席科學家許錦波,在接受採訪時表示,未來AI蛋白質設計有望能夠實現“按需設計”,這將對醫藥、環保、材料、食品、農業等衆多行業發展起到極大的推動作用,用AI開啓中國生物經濟新時代。
卡了60年的問題,解決了!
作爲一切生命活動的基礎物質,蛋白質在日常生活中也很常見,但大多數人對於蛋白質的功能、價值不甚瞭解。許錦波介紹說,如果將生命體比作城市,DNA就好比城市的設計藍圖,而蛋白質是城市建設的基礎材料、城市運行的基本單位。所以,如果能夠看清、測清蛋白質的三維結構,就如同拿到了破解生命奧祕的“密碼本”,這對於推動整個人類科學的發展都有重大意義,也是許錦波從2001年起就投身的研究。
當時,學界對於蛋白質結構的研究已有四十餘年,但是一直難有大的突破。彼時許錦波在加拿大滑鐵盧大學的博導、算法和現代信息論的頂級專家李明教授,也未曾涉足這一課題。許錦波剛剛從計算機科學系轉至計算生物學,對生物知識的瞭解還停留在高中水平。但當李明教授問道:“有一個很難的問題,研究蛋白質摺疊,想不想做?”許錦波沒有猶豫,一口答應。
談及當初的選擇,許錦波坦言,本意是好奇,“自己能不能把這個問題的邊界,向前推進一點點。”實則自己也卯足了勁,“我們選擇研究課題的時候,通常要選擇一些比較重要和困難的問題,如果問題不重要,就沒必要花時間研究;如果問題不難,幾年之內就被別人做出來,也沒有多大意義。”
正是秉承着“堅持做困難且重要的事情”的信念,許錦波深入蛋白質結構研究領域,並鍥而不捨地進行了15年的探索後,終於石破天驚。在2016年的全球蛋白質結構預測比賽(CASP)中,他的RaptorX-Contact方法,一舉把測分從此前預徘徊多年的30分左右,拔高到了60分,證明AI可以大幅提升蛋白質結構預測精度。
至此,蛋白質三維結構在人類面前,揭開了神祕的面紗。人類在蛋白質結構預測這一有六十多年曆史的世界難題上,做出了實質性的進展。
蛋白質也能“捏臉”了?
許錦波不僅在AI蛋白質結構預測上取得了從“0到1”的原創研究成果,他所發明的RaptorX-Contact方法還啓發了谷歌旗下DeepMind推出AlphaFold。甚至“2024年諾貝爾化學獎”得主之一的戴密斯·哈薩比斯(Demis Hassabis)和約翰·朱默帕(John Jumper)所發表的關於AlphaFold的論文《基於深度學習的改進的蛋白質結構預測》《使用AlphaFold進行的精準蛋白質結構預測》,以及朱默帕的博士論文,也都引用了許錦波的多篇論文。
國際計算生物學會會士、原斯坦福人工智能實驗室(Stanford AI Lab)教授塞拉菲姆-巴佐格洛(Serafim Batzoglou)更是公開發文表示,許錦波第一個開發出(精準預測蛋白結構)的深度學習算法,這一算法後來被複現和增強到最初版本的AlphaFold中,他應與哈薩比斯一起獲得諾獎。
但許錦波將這些成績看得很淡。從業至今,許錦波的遺憾在於“沒有更早地去了解產業需求” 。如果可以重來,他希望將這個“開啓”時間,提前到剛剛涉足蛋白質研究的讀博時期。“只有真實地瞭解產業,才能夠更好地驅動技術的發展,否則就有些閉門造車。”他以這樣的維度思考,也不輕易界定自己的“成功”,只是謙虛地認爲“沒有特別可驕傲的地方,如果有的話,就是在學術研究上略微做了一點貢獻”。
深耕行業24年,許錦波經歷過研究經費不足、CASP會場不足兩百人的“清冷”時刻,也經歷過業內外的科技、資本巨頭競相押注“AI for Science”的風口熱潮。面對行業的快速發展,他認同“當下的確是一個好時代”。但他也會理性看待,並表示:“進入到這個領域的人越來越多,某種程度上也能說明這個方向有前途,做的人越多,產出肯定也越多,產生重大發現的可能性也越高。科學發現具有偶然性,也許一個巧思,就能撬動一個行業。”許錦波總是高一維度地看待問題,在推動行業進步的同時,他更想將技術運用於產業,更切實地解決實際問題,因此他將視野轉向應用空間更大的AI蛋白質優化設計方向。
如果說“AI蛋白質結構預測”是“放大鏡和透視鏡”—— 幫助人們快速“看清”蛋白質的結構和功能;那麼“AI蛋白質設計”就堪比“捏臉”——它不僅可以對自然界中已經存在蛋白質進行調整改造,甚至還可以設計出一些自然界中從未存在過的蛋白質,這些人造蛋白質將會在醫藥、環保、材料、食品、農業等衆多領域發揮重要作用。
例如,在藥物研發領域,如果能夠設計出新穎的蛋白藥物,如蛋白疫苗、抗體藥等等,將會有更大的概率解決當前人類遇見的許多疑難雜症;在食品領域,如果能夠開發出更多優質安全的替代蛋白食品,就可以豐富人類的營養來源、緩解食品短缺問題;材料領域,可以通過優化蛋白質,開發出易降解且能循環使用的環保生物材料,促進社會可持續發展等。
在諸多應用領域中,許錦波更專注於醫藥和生物製造。這不僅是出於醫學本身對人類生命健康的重要性,更是結合了中國作爲製造業大國的背景和需求。從個人到國家,從微觀到宏觀,許錦波如是理解AI蛋白質設計對人類生產與生活帶來的價值與影響。
帶着這樣的願景,2021年底許錦波回國,並於次年創辦了公司分子之心(MoleculeMind)。
帶領“六邊形戰士”,解決最真實的問題!
篩選分子之心的團隊成員,許錦波有三大標準:專業技術過硬、學習能力突出、團隊配合度高。“我們在做的事情是交叉學科裏比較大的項目,既需要從‘0到1’研究和解決科學問題,也需要將技術落地於產業實踐,更需要高效的團隊配合。我們很多解決方案都是既需要懂計算、懂AI,也需要懂生物背景。”
團隊成員涉及的領域,包括生物、AI、藥物和臨牀等等,是一支兼具AI、生物交叉背景與深厚產業經驗的複合型人才團隊。團隊裏80%是研發人員,核心研發團隊裏九成以上是博士,其中還不乏他從世界各地挖來的“牆角”。團隊中的一位專家此前甚至已在業內TOP 5的外企工作了20年,來分子之心是他的第一次跳槽。
分子之心取名的由來也很有意思,許錦波先確定了英文“MoleculeMind”——Molecule意味着公司主要是研究分子,Mind釋義爲心智,故而“MoleculeMind”的中文名定爲分子之心。以分子爲名,爲分子發聲,也是科學家的頂級浪漫了。
在這樣積極的科學氛圍裏,許錦波帶領他的“六邊形戰士”,爲分子之心取得了諸多耀眼的成績。
2021年,分子之心推出了自主研發的全球首個功能完整的AI蛋白優化與設計平臺MoleculeOS,填補了世界範圍內尚沒有功能完整的AI蛋白質設計和優化平臺的空白。
在2023世界人工智能大會上,分子之心又推出了全球首個集成序列、結構、功能和進化的產業級AI蛋白質生成大模型——NewOrigin(中文名:達爾文),這也是面向生物經濟時代的基礎設施級底層大模型。
除了技術上的持續突破,分子之心也將先進的技術應用到生物製造、生物醫藥等多個產業領域,在大幅降低產品研發時間的同時,還提高了成功率,是名副其實的降本增效。這也是許錦波在對話中反覆提及的,“要了解真實且重要的問題,並去解決他們。”這樣的例子在分子之心更是不勝枚舉。
比如,曾經有一家中國合成生物學的龍頭企業拋給分子之心一個“超級產業難題”:他們的一個合成步驟裏的關鍵催化酶優化陷入了瓶頸。
這是一個極具商業價值又涉及行業瓶頸的跨膜蛋白,經過多年的持續優化,已經接近實驗方法優化的極限性能。用其他AI方法來優化也很難,它參與的反應過程異常複雜,且是動態反應,AlphaFold等AI工具的功能侷限於蛋白質靜態結構預測,也不能產生新的蛋白質序列,與真實的需求差異較大,難以滿足精準設計蛋白質的需求。
這項優化工作原定2~3年內完成,但分子之心綜合運用AI蛋白質技術和量子化學、分子動力學等科學計算方法,實現了蛋白質動態設計,只花了6個月,就設計出了一個活性和特異性更高的新酶。合作方的實驗數據顯示,相對於野生菌,AI設計的這個酶使菌種產率提高了5倍!
當然,不止降本增效,強大的AI能力甚至可以打造出有市場競爭力的高附加值新產品。
作爲全球人工智能和生命科學交叉領域的頂尖華人科學家之一,許錦波如今又是一名海歸創業家,拉起這支全是精兵強將的團隊,他對分子之心的期待,又是什麼?他笑說,自己“野心”不小。
“技術層面,希望AI蛋白質設計真的能做到‘按需設計’。近期的目標是,AI設計出的幾十個分子裏,能有1-2個達標的。長期目標是,AI每一個設計出來的分子,都能符合定製化要求。產業化方面,希望通過AI蛋白質技術,設計出真正、實用、有用的產品。”而對於“有用”的解讀,許錦波解釋得十分簡單、明瞭:“對現階段行業、產業發展有所改善,就是有用。”
如果要用爬山來做比喻,AI蛋白質設計纔剛剛到達“山腳下”。要真實瞭解產業需求,將技術真正落地、解決問題,還有很長一段路要走。許錦波卻並不畏懼,團隊優勢也是他的底氣。“我們團隊的綜合能力非常交叉互補,並且也是在腳踏實地的解決產業中實際的問題,而不是說只開發一些通用算法。”最終,他希望,“我們能打造出中國生物經濟時代的基礎設施。” (文智)