圖片來源:外灘大會官方提供
時隔三年,2023Inclusion·外灘大會于9月7日在黃浦世博園召開,對AI的影響展開了探討。延續“金融+科技”的脈絡和國際化的特點,圍繞“科技·創造可持續未來”這一主題,大會第一天的主論壇圍繞技術、產業與未來三個篇章進行展開。其中,科技篇探討了科技是如何為全球經濟與產業注入新動能,同時令未來更加可持續。
(資料圖片)
去年底開始,硅谷創業公司OpenAI發布聊天機器人大模型ChatGPT,也直接開啟了從美國到全球的大模型熱潮。僅在中國,以百度文心一言、阿里通義千問、騰訊混元和其它科技公司為代表的大模型競賽,就正在如火如荼得進行當中。
在這個大模型涌現的時代,AI為技術和科研帶來了哪些改變和挑戰?我們又有哪些應對的辦法?
中國科學院院士、復旦大學副校長張人禾表示,科學智能已經成為人工智能發展的重點方向。
如今,科學智能通過多模態、大模型等人工智能新技術,實現了對多類別、高維度、跨尺度的海量數據進行建模、推理和分析,為復雜場景提供了研究新線索和科學新假設,從而發現了新物質、合成新材料、構建新機理。
具體來講,在基礎研究領域中,可以通過AI賦能規律的探析;在科學發展過程中,AI可以在從設計假設到實驗設計、數據收集到數據分析的過程中,起到增速的作用,進而重塑科學發現、推動科研成果涌現。
此外,從范式角度出發,Type1(數據驅動,強調科研中的直覺性思考)可以通過對實驗數據的分析,從經驗出發尋找科學規律并解決實際問題;Type2(機理驅動,強調科研中的推理性思考)則是基于第一性原理的研究方式,通過構建真實世界的數學模型試圖發現物理世界的基本規律。后者往往能夠很大程度上驅動物理學的發展,但卻在求解真實場景的復雜物理系統的過程中存在著計算量過大的問題。
AI For Science則為上述兩種科研范式的融合提供了路徑。據張人禾介紹,谷歌旗下的AI公司DeepMind開發的AI蛋白質結構預測ALphaFold2,就是Type1和Type2融合的典型案例。AlphaFold2基于大規模蛋白質結構數據庫PDB訓練,并將蛋白質結構的生物學知識和事實記憶通過多序列比對、三角形更新、IPA等技術嵌入深度學習算法模型中,能夠達到前所未有的預測準確度。
機器學習泰斗,美國科學院、美國工程院院士邁克爾·喬丹(Michael I.Jordan),同樣講述了科學智能之于科研的重要作用。
在分子生物學領域,AI系統AlphaFold可以通過對大量蛋白質結構和氨基酸數據的學習,預測最終的蛋白質結構,其預測的結構種類可以達到上億的數量級,對分子生物學的研究工作產生了巨大的推動作用。邁克爾·喬丹舉例,在2004年的一篇研究中,需要探究蛋白質的固有無序性與生物學功能的磷酸化之間的關聯,這就需要大量的蛋白質結構數據作為支撐。然而人們通過X射線衍射的方式得到的蛋白質結構數據庫只有一萬量級,AlphaFold的預測則可以達到兩億量級,盡管不是真實實驗的數據,但它的準確度并不低,由此推動了分子生物學、乃至更多領域的科研工作。
同時,邁克爾·喬丹還指出了AI現階段所面臨的問題:“如果你問ChatGPT,你剛剛寫的內容你確定嗎?你會發現,它完全無法回答這個問題。”這是現階段的人工智能正在面臨的一個問題。邁克爾·喬丹還強調,金融科技歸根到底是不確定的技術,那么對于正在金融科技領域發揮重要作用的人工智能,解決其不確定性以及對不確定性進行量化的問題成為了十分關鍵的一點。
人是多種多樣的,相對應的,AI的本質應該是集體,而不是個人。正是從這一觀點出發,邁克爾·喬丹指出,我們可以通過設計一個協作式的、去中心化的系統來實現集體智能,并通過這樣一個集體智能體,去解決不確定性。
除了不確定的問題,大模型時代還存在著顯著的安全問題。
中國科學院院士何積豐認為,大模型時代顯著的安全問題就在于隱私和“對齊(alignment)”。
對齊指的是AI系統的目標或者說產出要與人類的價值觀和設計者的期望相符合。“如果把人工智能看作西游記里的孫悟空,‘對齊’就是唐僧的緊箍咒。有了緊箍咒,就可以保證技術不會任意使用能力胡作非為。”
一方面,大模型能力的發展及其對于我們日常生活的滲透,對隱私保護提出了更高的要求。
另一方面,對齊技術在規范AI的同時也面臨著挑戰,人類的價值觀是多元且動態發展的;AI大模型的“有用性”與“無害性”之間的目標也并不是完全一致的,這些都對“對齊”技術提出了挑戰。
面臨上述挑戰,通過人工反饋保證輸出內容的質量,以及事先規定大模型應當遵循的原則,讓系統自動訓練模型對生成結果提供初始排序,或可成為一條解決問題的途徑,何積豐表示,“人類和機器將持續共同學習”。