我國AI研究應(yīng)該在方向選擇上多費點心思早日擺脫困境

來源:中國科學報

2016年DeepMind公司的人工智能程序AlphaGo戰(zhàn)勝了人類圍棋冠軍,曾引起全世界的轟動。

2020年11月30日,DeepMind公司的另一個人工智能程序AlphaFold 2在蛋白質(zhì)結(jié)構(gòu)預(yù)測大賽CASP 14中,對大部分蛋白質(zhì)結(jié)構(gòu)的預(yù)測與真實結(jié)構(gòu)只差一個原子的寬度,達到了人類利用冷凍電子顯微鏡等復(fù)雜儀器觀察預(yù)測的水,這是蛋白質(zhì)結(jié)構(gòu)預(yù)測史無前例的巨大進步。這一重大成果雖然沒有引起媒體和廣大民眾的關(guān)注,但生物領(lǐng)域的科學家反應(yīng)強烈。

中國科學院院士施一公對媒體說:“依我之見,這是人工智能(AI)對科學領(lǐng)域最大的一次貢獻,也是人類在21世紀取得的最重要的科學突破之一,是人類在認識自然界的科學探索征程中一個非常了不起的歷史成就。”

蛋白質(zhì)是生命的基礎(chǔ),了解蛋白質(zhì)的折疊結(jié)構(gòu)和分子動力學是生物學界最棘手的問題之一,已經(jīng)困擾科學家50年之久。

目前已知氨基酸順序的蛋白質(zhì)分子有1.8億個,但三維結(jié)構(gòu)信息被徹底看清的還不到0.1%。最DeepMind公司在《自然》上宣布已將人類的98.5%的蛋白質(zhì)預(yù)測了一遍,計劃今年年底將預(yù)測數(shù)量增加到1.3億個,達到人類已知蛋白質(zhì)總數(shù)的一半,并且公開了AlphaFold 2的源代碼,免費開源有關(guān)數(shù)據(jù)集,供全世界科研人員使用。

被釋放的海量蛋白質(zhì)結(jié)構(gòu)信息蘊含著生命信息的密碼,將有力推動生命科學的發(fā)展,大大加速針對癌癥、病毒的抗生素、靶向藥和新效率的蛋白酶的研發(fā)。

在AlphaFold 2 問世以前,許多科學家做過用計算機預(yù)測蛋白質(zhì)三維折疊結(jié)構(gòu)的研究。中科院計算技術(shù)研究所的卜東波團隊去年在《自然》發(fā)表論文,他們在蛋白質(zhì)結(jié)構(gòu)預(yù)測方面做出了出色的成果。

DeepMind團隊采用的注意力機制也是計算機視覺和自然語言處理領(lǐng)域較成熟的技術(shù)。最華盛頓大學推出預(yù)測準確度與AlphaFold 2差不多的新算法,只需要一個GPU,10分鐘左右就能算出蛋白質(zhì)結(jié)構(gòu)。

蛋白質(zhì)折疊問題的解決是生物學界和人工智能界長期合作努力的結(jié)果,但AlphaFold 2的“臨門一腳”是取得勝利的標志突破,它用精確的預(yù)測結(jié)果顯示出人工智能技術(shù)在基礎(chǔ)科學研究上的巨大威力。AlphaFold 2的巨大成功給我們許多耐人尋味的啟示。

2017年國務(wù)院印發(fā)《新一代人工智能發(fā)展規(guī)劃》后,我國立即啟動了“新一代人工智能重大科技項目”,開展數(shù)據(jù)智能、跨媒體感知、群體智能、類腦智能、量子智能計算等基礎(chǔ)理論研究,統(tǒng)籌布局了人工智能創(chuàng)新臺和許多關(guān)鍵共技術(shù)研究。

三年,我國學者發(fā)表了大量人工智能論文,申請幾萬件專利,在北京冬奧會、城市大腦等應(yīng)用場景和抗擊新冠疫情中取得顯著成效,出現(xiàn)了一些人工智能獨角獸企業(yè),取得的成績可圈可點。但總的來講,我們的研究多數(shù)是技術(shù)驅(qū)動、論文導(dǎo)向的,目標導(dǎo)向和問題導(dǎo)向的研究較少。

AlphaFold 2的成功首先是因為10年前DeepMind團隊就開始關(guān)注“蛋白質(zhì)折疊”這個有重大價值的科學問題。幾年前用計算機預(yù)測復(fù)雜的蛋白質(zhì)折疊結(jié)構(gòu),正確率還不到40%,DeepMind團隊當時就有信心攻克這個世界難題。

我們與一流科學家的差距之一是選擇可突破的重大科學問題的眼光不夠敏銳,布局的科研項目要么是增量式的技術(shù)改進,要么是幾十年都難以突破的理想型目標,像蛋白質(zhì)折疊這樣的重要研究方向沒有列入新一代人工智能重大科技項目。

人工智能研究可能取得重大突破的目標不只是蛋白質(zhì)折疊,我認為,用機器學的方法全自動地做集成電路的前端和后端設(shè)計也有可能在十年左右取得突破,如果做到了,讓人焦心的集成電路設(shè)計人員缺口巨大的難題就會迎刃而解。這一類涉及經(jīng)濟發(fā)展的重大問題應(yīng)該是人工智能界關(guān)注的焦點。

為什么重大科學問題和國計民生問題沒有進入人工智能界許多學者的視野,這涉及對人工智能這門學科的認識。

最先提出“人工智能”這個術(shù)語的麥卡錫對這門學科的定義是:“人工智能就是要讓機器的行為看起來就像是人所表現(xiàn)出的智能行為一樣。”后來的人工智能學者大多盯住了“像人”這個“原則”,以“像不像人”作為目標。所謂衡量智能水的“圖靈測試”也是遵循這個原則。授予沙特阿拉伯公民身份的“索菲婭”和清華大學的“華智冰”機器人,都是朝著“像人”這個目標努力。

但硅基的計算機和碳基的人腦終究有本質(zhì)的區(qū)別,非要把電子線路構(gòu)成的機器做成與人一樣,既沒有必要也沒有可能。

現(xiàn)在用于機器學的人工神經(jīng)網(wǎng)絡(luò)與人的大腦有相似的地方,但也體現(xiàn)出與人的思維不同的機器“思維”方式。理的人工智能發(fā)展模式應(yīng)該承認人有人智、機有機“智”,要充分發(fā)揮機器“思維”的特長,做人不擅長做的事情。

AlphaFold 在蛋白質(zhì)結(jié)構(gòu)預(yù)測上體現(xiàn)出的才能不是“像人”,而是比人高明。人工智能是對人類的補充和增強,而非替代人類,我們并不需要復(fù)制人的智能,而是要建立一個新的智能系統(tǒng)。人工智能研究擺脫“模仿人”“替代人”的思想束縛后,會有更廣闊的發(fā)展空間。

AlphaFold的成功表明,疑難問題的解決不一定完全依賴于人類的先驗知識,這意味著在人工智能時代,人類獲取知識的邏輯將發(fā)生根本變革,對人類認知將產(chǎn)生巨大沖擊。

機器學是一種全新的、人類也無法真正理解、但能被實踐檢驗的認知方法論。我們是相信“實踐是檢驗真理的標準”,人機互補構(gòu)建命運共同體,還是堅持機器必須給人講明白演繹和歸納過程才是真理,人類將面臨新的選擇。

機器學可以正確預(yù)測蛋白質(zhì)結(jié)構(gòu),說明機器已掌握了一些人類還不明白的“暗知識”。過去我們把可以表達的知識叫作“明知識”或“顯知識”,不可表達但可以感受的知識叫作“潛知識”或“默知識”?,F(xiàn)在又多出了一類既不可表達又不可感受但機器能明白的知識,可稱為“暗知識”。知識維度的增加大大擴充了人類的視野。如果說“明知識”是冰山顯露出來的一角,“潛知識”是冰山海面下的部分,“暗知識”就如同大海。對人類而言,如何利用“暗知識”可能比弄明白“暗物質(zhì)”“暗能量”更重要、更緊迫。

蛋白質(zhì)結(jié)構(gòu)預(yù)測取得重大突破的另一個啟示是,科研范式已經(jīng)開始轉(zhuǎn)向。

AlphaFold團隊是一個典型的跨學科合作團隊,在《自然》發(fā)表此重大成果的論文作者有34位,其中19位并列第一作者,包括機器學、語音和計算機視覺、自然語言處理、分子動力學、生命科學、高能物理、量子化學等領(lǐng)域的知名學者。蛋白質(zhì)形成穩(wěn)定折疊結(jié)構(gòu)的原因是分子內(nèi)部的勢能會降到最低點,預(yù)測計算實際上是能量最小化的優(yōu)化。

深度學的人工神經(jīng)網(wǎng)絡(luò)在計算機視覺、自然語言處理和生物信息學等領(lǐng)域表現(xiàn)優(yōu)異,不僅僅源于算法和數(shù)學,背后還有深層次的物理原理。因此,理論物理學家的介入十分重要?;谧罨A(chǔ)科學原理的機器學需要人類多領(lǐng)域科學家的智慧和機器“智能”有機融合,不同于以發(fā)現(xiàn)相關(guān)為主要目標的科研第四范式——數(shù)據(jù)密集型科學發(fā)現(xiàn),我認為這是科研第五范式的雛形。

AlphaFold并沒有提出新的科學原理,而是研究已知原理的相互組合涌現(xiàn)出的大量新奇結(jié)構(gòu)、特和行為,把對結(jié)構(gòu)的認知抽象成各種模式的自動化識別和匹配,本質(zhì)上是一種集成式的工程科學技術(shù)。

過去生物學家只是把人工智能當成眾多的輔助工具之一,AlphaFold的成功改變了生物學家的看法。工程科學技術(shù)不只是工具,也不僅僅是基礎(chǔ)研究成果的應(yīng)用,而是在基礎(chǔ)研究中可以發(fā)揮巨大作用的重要組成部分。沒有像DeepMind團隊一樣強大的工程技術(shù)實現(xiàn)能力,基礎(chǔ)研究也難以做出重大成果。

目前我國大學和企業(yè)的人工智能實驗室大多遇到頂天頂不了、立地又落不下去的困境,希望人工智能界的學者認真總結(jié)經(jīng)驗教訓,在研究方向選擇上多費點心思,爭取獲得讓人眼睛一亮的重大成果。

標簽: AI研究 人工智能 生物領(lǐng)域 科學領(lǐng)域

推薦

財富更多》

動態(tài)更多》

熱點