大模型和生成式人工智能引領的全球新一輪人工智能(AI)科技新浪潮持續(xù)升溫,國內(nèi)外大模型技術的進步一浪高過一浪,產(chǎn)業(yè)競爭日趨激烈,落地應用不斷深化。進入2024年,我國人工智能發(fā)展表現(xiàn)出一系列新現(xiàn)象、新趨勢,值得我們重視和持續(xù)關注。
一、近期國內(nèi)人工智能發(fā)展的幾個新現(xiàn)象
我國大模型發(fā)展早期重心主要集中在基礎模型能力追趕,2024年以來產(chǎn)業(yè)化落地開始成為各界關注的新熱點,在垂類大模型、數(shù)字人、具身智能、AI for Science(人工智能驅(qū)動的科學研究)等方向上新進展新成效不斷涌現(xiàn),同時,更好地平衡發(fā)展與治理,推動人工智能治理落地也成為新時期的關注重點。
(一)垂類大模型應用呈現(xiàn)明顯加快趨勢
當前,大模型大規(guī)模商業(yè)化的難題在國內(nèi)外都還沒有得到完全破解。中國的大模型產(chǎn)業(yè)化之路與美國有很大不同,產(chǎn)業(yè)垂類模型的發(fā)展更快。2024年以來,眾多大模型研發(fā)團隊開始投入力量,利用與特定場景相關的專業(yè)知識通過對基礎模型進一步訓練或“微調(diào)”,提供針對特定業(yè)務場景的高質(zhì)量專業(yè)化解決方案,可以更好地完成特定任務。如華為和湘潭鋼鐵集團聯(lián)合開發(fā)的盤古鋼鐵大模型獲得國際電信聯(lián)盟(ITU)全球人工智能優(yōu)秀創(chuàng)新大獎,這個模型賦能寶武鋼鐵數(shù)字化轉(zhuǎn)型,實現(xiàn)降本增效,一年單煉鐵環(huán)節(jié)就能節(jié)省10億元。國家電網(wǎng)研發(fā)的配網(wǎng)視覺大模型已經(jīng)在無人機巡檢、通道可視化等幾十個配網(wǎng)場景應用,完成30萬公里巡檢,平均識別效率提升10%。除此之外,一大批工業(yè)大模型、礦山大模型、物流大模型、港口大模型,還有醫(yī)療大模型,已經(jīng)開始在各自領域不斷深化落地,發(fā)揮其領域縱深優(yōu)勢,將對中國的產(chǎn)業(yè)特別是制造業(yè)進步帶來重大影響。
(二)數(shù)字人初登舞臺發(fā)展迅速、涉及面廣,這是AI應用中的新事物
大模型推動數(shù)字內(nèi)容生成能力和圖像、語言、文本多模態(tài)處理能力加速成熟,數(shù)字人在人物形象、語音生成、動畫生成、音視頻合成顯示、人機交互等方面帶來了驚艷體驗,活躍在教育教學、看病就醫(yī)、金融服務、電商購物、線上直播、客服推銷等商業(yè)場景,也在名人紀念等大規(guī)模場景中應用。比如,2024年“6·18”京東啟動了超過18位品牌總裁數(shù)字人分身亮相直播間,螞蟻靈境數(shù)字人平臺助力央視財經(jīng)打造兩會AI主播,中國科學技術出版社研發(fā)醫(yī)學領域的數(shù)字人開展科普宣傳等?!?024年中國虛擬數(shù)字人產(chǎn)業(yè)發(fā)展白皮書》預計,到2025年我國“數(shù)字人”帶動的產(chǎn)業(yè)市場規(guī)模和核心市場規(guī)模將分別超過6 400億元、480億元,比2023年增長超過90%、130%。
(三)具身智能在人工智能發(fā)展進程中的地位明顯上升
2024年以來具身智能成為國內(nèi)各類重要論壇討論的熱點,成為各類研究機構布局的優(yōu)先考慮,成為人工智能相關企業(yè)和風投機構投入的重點。多模態(tài)大模型是具身智能發(fā)展的關鍵動力,實現(xiàn)與環(huán)境互動和交互式學習進化能力。在語言對話、數(shù)字內(nèi)容生成之后,進一步挖掘Transformer大模型在多任務學習和多模態(tài)方面的潛力,將多模態(tài)大模型、強化學習與機器人的感知、行動和環(huán)境交互等能力結合,實現(xiàn)與周邊環(huán)境進行自然交互并完成各種任務的具身智能,正在成為后大模型時代的人工智能新形態(tài),也被很多人認為是通向通用人工智能的必經(jīng)之路。國內(nèi)一批具身大模型快速涌現(xiàn),比如達闥科技率先推出的多模態(tài)具身大模型RobotGPT、有鹿機器人研發(fā)的第二代具身智能技術LPLM大模型,以及若愚科技推出的若愚·九天機器人大腦,均利用多模態(tài)大模型實現(xiàn)人類意圖理解、高頻人機交互和復雜任務規(guī)劃等功能。高級別自動駕駛、仿人機器人等都將受益于具身智能的突破而實現(xiàn)新的能力飛躍。
(四)人形機器人率先出現(xiàn)發(fā)力提速態(tài)勢
人形機器人是具身智能的典型產(chǎn)品概念,也是具身智能技術發(fā)展的載體,大模型的場景泛化能力以及具身智能技術的爆發(fā)對功能更加通用的人形機器人發(fā)展帶來巨大驅(qū)動力。盡管國內(nèi)外人形機器人都還處于低版本的具身智能狀態(tài),但技術迭代很快。人形機器人在大腦、小腦、空間智能、肢體與上游核心部件等熱點方向并行前進,機器人本體、核心零部件、軟件算法方面的國產(chǎn)廠商涌現(xiàn),正在不斷形成創(chuàng)新成果。比如宇樹科技的Unitree G1人形機器人采取具身智能路線擺脫了預先算法編程,增強與物理世界互動能力,斯坦福大學以宇樹科技的國產(chǎn)硬件平臺為基底研發(fā)了HumanPlus人形機器人;智元機器人“遠征”系列通用型具身智能機器人開啟了商用量產(chǎn),結合臨港集團等制造場景探索人形機器人商業(yè)化落地。清華大學、上海交通大學、浙江大學等一批研發(fā)團隊也在人形機器人領域快速跟進,形成一批前沿性技術成果。
(五)人工智能驅(qū)動的科學研究關注度快速提升
以大模型為代表的人工智能技術的復雜問題求解能力將突破傳統(tǒng)科學研究的瓶頸。近年來,采用人工智能解決科學研究問題受到越來越多的關注,人工智能驅(qū)動的科學研究(AI for Science)在基礎研究和醫(yī)療、材料、生物、化合物等領域的研發(fā)和應用在我國快速展開,科研人員沿多條路徑探索大模型在科學研究領域的落地應用,尤其是結合大模型技術潛力開展各領域科研知識增強和設計增強的進展引人注目。比如,鄂維南院士團隊研發(fā)了國際首個覆蓋元素周期表近90種元素的多體系統(tǒng)一高精度預訓練模型(DPA-2),北京深勢科技發(fā)布了通用三維分子表征預訓練模型Uni-Mol ,中國石化研發(fā)的“天樞”智研化工大模型可完成分子智能化學檢索、分子逆合成設計和反應條件推薦與優(yōu)化等場景研發(fā)任務。
(六)人工智能治理從倡議走向落地
新一輪人工智能浪潮推動人工智能新技術更快速地進入社會生活,巨大的能力也帶來潛在的風險,正在對倫理、安全、隱私、公平等各方面治理提出迫切需求。中國不斷發(fā)出呼聲倡議,明顯促進了國與國之間共識的形成,帶動了研究機構和學者交流的增強。如2024年3月在北京舉辦“北京AI安全國際對話”、5月中法兩國聯(lián)合發(fā)布《關于人工智能和全球治理的聯(lián)合聲明》、7月《人工智能全球治理上海宣言》在上海發(fā)表等。同時,政、產(chǎn)、學、研各界加快推動倡議落實,上海人工智能實驗室開拓治理落地新思路,實驗室主任周伯文提出探索人工智能45°平衡律,主張在推動AI技術性能提升時同步構建更強的安全技術體系;學術界提出多份人工智能立法建議方案,探索建立人工智能治理制度的中國路徑;人工智能領軍企業(yè)積極落實倡議要求,推動人工智能治理在產(chǎn)業(yè)實踐中落地。
二、對這些新現(xiàn)象的進一步思考
隨著大模型技術日新月異、迭代發(fā)展,人工智能技術和產(chǎn)業(yè)形態(tài)將加速演化,通用人工智能的路徑正在變得更加清晰,人工智能新場景新實踐將在我國大量涌現(xiàn),為新質(zhì)生產(chǎn)力發(fā)展注入強大動能,同時我國人工智能治理的對外影響力也將不斷提升。
(一)“基礎-垂類”協(xié)同并進、“大型-小型”融通適配、“中心-邊緣”梯次接續(xù)的模型體系正在形成
基礎大模型的通用泛化性與專用大模型的高度專業(yè)性各顯優(yōu)勢,融合互補將成為未來趨勢,“兩條腿走路”的方式已經(jīng)有了共識。下一步大模型將沿不同方向多元化發(fā)展。首先,領軍企業(yè)和研究機構繼續(xù)拓展基礎模型規(guī)模,提升數(shù)理、因果推理等高階能力,探尋Scaling Law的科學邊界,比如2024年9月OpenAI發(fā)布的o1-preview被認為再次推高了大模型規(guī)劃推理能力的天花板;其次,更多的企業(yè)會面向特定任務或場景打造垂直模型,在泛化性與專業(yè)性方面實現(xiàn)更好的平衡,加快大模型的產(chǎn)品化和落地;最后,2024年以來國內(nèi)外大模型“小型化”競爭已經(jīng)開啟,發(fā)揮效果、性能和成本綜合優(yōu)勢,小模型將開拓手機、PC、耳機、音箱以及其他可穿戴式終端等廣泛場景。中國大模型產(chǎn)業(yè)化已經(jīng)形成通用類大模型與專業(yè)類大模型并行發(fā)展的態(tài)勢,面壁智能、百度等陸續(xù)發(fā)布一批小模型并快速迭代成熟,下一步有望發(fā)掘豐富場景和專業(yè)領域數(shù)據(jù)潛力,在“基礎-垂類”協(xié)同并進、“大型-小型”融通適配、“中心-邊緣”梯次接續(xù)的模型體系方面走出優(yōu)勢,并率先催生實體經(jīng)濟領域代表性模型的落地應用。
(二)具身智能有望成為打通物理AI的突破口
人工智能對實體經(jīng)濟的深度賦能需要打通數(shù)字智能與物理智能的橋梁,應用到工廠、交通、通信、電網(wǎng)等各類物理設備和基礎設施,提升其自動化和智能化水平,連通數(shù)字世界與物理世界。未來五年內(nèi),自動駕駛將成為物理(具身)智能領域中最重要的應用之一,有望成為第一個通過“新圖靈測試”的具身智能系統(tǒng)。按照這個趨勢,自動駕駛汽車、人形機器人、低空智能運載工具,也可能成為未來5~10年自主智能領域的“新三樣”。從離身智能走向具身智能的過程中,高級認知能力也將逐步露出苗頭。人類智能、離身智能、具身智能協(xié)調(diào)發(fā)展是今后人工智能發(fā)展的主線,人工智能可控可信發(fā)展必須把人機協(xié)調(diào)貫穿于始終。這一方面需要不斷地研發(fā)和技術迭代,另一方面也需要政府、企業(yè)、社會保持良性溝通互動形成共識。發(fā)展具身智能體將成為我國新質(zhì)生產(chǎn)力建設的一個戰(zhàn)略通道。
(三)實現(xiàn)通用人工智能的路徑變得更加清晰明確
大模型技術改變了語音、視覺、自然語言處理等多個人工智能細分領域的研究范式,符號主義、連接主義、行為主義有望在大模型及具身智能體的框架下實現(xiàn)融合統(tǒng)一,對通用人工智能的能力走向及下一步發(fā)展路線的討論也正在成為學術界新的熱點話題。比如OpenAI提出了人工智能發(fā)展的五個級別:一是聊天機器人,即對應當前AI水平,可以與人類對話的人工智能;二是推理者,即像博士一樣解決問題,無需工具的人工智能;三是智能體,即可以代表用戶采取行動的人工智能代理;四是創(chuàng)新者,即可以創(chuàng)造新事物的人工智能;五是組織者,即可以完成整個組織工作的人工智能。其新發(fā)布的O1-preview正是OpenAI沿這一路徑研發(fā)的第二級產(chǎn)品。國內(nèi)姚期智、潘云鶴、張鈸等領軍科學家也對未來人工智能的研究和發(fā)展方向做出了判斷和預測,北京智源人工智能研究院理事長黃鐵軍提出新的通用人工智能水平和風險分級方法。盡管視角有所差異,但反映出業(yè)界對于通用人工智能的理解更加清晰明確,行業(yè)引領者也開始把長遠的雄心階段化、具象化甚至產(chǎn)品化,這將加速通用人工智能的實現(xiàn)。
(四)大模型場景創(chuàng)新將開創(chuàng)一批智能產(chǎn)業(yè)新機會
大模型技術進步加速了人工智能場景創(chuàng)新,深度改變行業(yè)生產(chǎn)力,有望激發(fā)新一輪人工智能產(chǎn)業(yè)化浪潮。大模型已經(jīng)率先在AIGC領域產(chǎn)生大規(guī)模產(chǎn)業(yè)應用,未來將影響金融、媒體、法律、市場研究、教育、客服等十余個行業(yè);Agent智能體將取代搜索網(wǎng)站、取代很多軟件和應用程序;網(wǎng)絡操作系統(tǒng)面臨一次大改造,智能操作系統(tǒng)會逐步孕育成形;人工智能向手機、平板和PC產(chǎn)品的滲透率將快速提升,穩(wěn)定多年的信息通信產(chǎn)業(yè)將面臨重構。人工智能驅(qū)動的科學研究(AI for Science)在生物、醫(yī)學、氣象、化學等基礎研究方面的巨大潛力已經(jīng)在學術界得到高度共識,隨著大模型等前沿技術與AI for Science場景的進一步融合,人工智能有望加速重大科學問題研究和知識發(fā)現(xiàn),在產(chǎn)業(yè)界技術創(chuàng)新和工程創(chuàng)新中釋放變革性價值,推動工業(yè)設計、流程優(yōu)化調(diào)度、智能工廠等形成新的能力突破,將大幅度提升我國制造、醫(yī)藥、材料、能源等眾多行業(yè)的創(chuàng)新效能和創(chuàng)新水平。
(五)人工智能發(fā)展還將迎來更強技術范式
當前大模型仍面臨一系列能力瓶頸,可重復性、幻覺等問題制約了大模型向具有更高穩(wěn)定性要求的場景拓展和商業(yè)化落地,探索更加可信可靠的技術形態(tài)將助力大模型下一步落地應用。盡管目前大模型規(guī)模效應依然奏效,推動大模型能力曲線持續(xù)攀升,但很多專家并不認為僅僅依靠當前架構就能夠?qū)崿F(xiàn)世界模型,如學者張亞勤提出未來五年內(nèi)會在AI技術架構上有大的突破,Transformer會被逐步重構。創(chuàng)新性神經(jīng)網(wǎng)絡和學習方法正不斷被科學界提出,有可能為通用人工智能發(fā)展提供新的理論范式。隨著大模型計算需求飛速增長,人們對量子計算等新型計算給予的期望越來越高,量子計算納入人工智能視野并得到重視,量子人工智能的新范式正在吸引國內(nèi)越來越多的研發(fā)力量,未來有望不斷取得新進展。光計算也在為人工智能發(fā)展開辟更多新路徑,戴瓊海院士課題組提出了新型光計算架構,提供了大規(guī)模神經(jīng)網(wǎng)絡精準、高效的光計算訓練方法,并推出了“太極-II”通用光訓練芯片。
(六)中國在人工智能治理合作中的引領角色將進一步提升
人工智能不僅是改變?nèi)祟惿畹男录夹g,更引領了一場前所未有的具有強大沖擊力的社會革命,深度影響人們的認知,深度改變新聞、科研、教育等領域的工作模式,需要新的治理理念、制度設計和治理規(guī)則引導和規(guī)范技術發(fā)展,而人工智能技術自身所獨有的自主性、涌現(xiàn)性等技術新特性,以及治理問題的多樣性、融合性使得人工智能監(jiān)管治理面臨諸多難題。有效化解人工智能治理安全風險、為人類帶來更大的福祉需要各國共同努力,形成更加公正、普惠、包容的全球人工智能治理秩序。中國人工智能治理倡議體現(xiàn)的中華文明創(chuàng)新性、包容性和和平性的獨特底色,以及下一步中國基于豐富的人工智能場景實踐積累的更加成熟的治理經(jīng)驗,必將為全球人工智能治理實踐賦予中國智慧,推動全球人工智能治理體系朝著更加公正合理的方向發(fā)展。
(七)誰將在人工智能的競賽中最終勝出?
在智能愿景逐步聚焦、智能形態(tài)日益具身化的共識下,AI競賽的勝負在兩個方面很關鍵:底座智能涌現(xiàn)能力與制造業(yè)整體能力。其一是大模型的智能涌現(xiàn)能力,誰家的大模型智能涌現(xiàn)能力強、幻覺少,同時能耗低,誰就更有技術優(yōu)勢,這方面決定勝負的關鍵更多在于人才;其二是具身智能體的制造能力,這方面決定勝負的關鍵是高效能低成本的制造體系。
從目前大模型產(chǎn)業(yè)競爭態(tài)勢來看,誰會率先突破高認知能力的基礎模型還有很大的不確定性,而硬件技術和成本將成為決定產(chǎn)品落地的重要因素。比如,人形機器人作為具身智能體的代表性產(chǎn)品,需要多項核心技術的綜合集成以實現(xiàn)機器人的感知、規(guī)劃、行動能力,能夠與周邊環(huán)境進行自然交互并完成各項任務。這就需要依靠基礎大模型的認知涌現(xiàn)實現(xiàn)跨場景下的邏輯推理,需要3D多模態(tài)感知能力實現(xiàn)與真實世界的交互理解,也需要高性能的軟硬件技術實現(xiàn)精準靈巧的運動操作。以中美兩國為例,在產(chǎn)業(yè)化的第一階段,中國企業(yè)將依靠更完備、更成熟的工業(yè)制造體系取得美國企業(yè)所不能及的優(yōu)勢。也就是說,能不能“具身”取決于大模型在與物理世界互動過程中能否鞏固已經(jīng)創(chuàng)造的智能和實現(xiàn)新智能涌現(xiàn)能力,而有沒有人形功能則取決于設計水平和制造能力,即能否實現(xiàn)高水平的控制、傳感、自由度、驅(qū)動、連接及材料可靠性等。因此,既不能是“思想上的巨人、行動上的矮子”,也不能“四肢發(fā)達、頭腦簡單”。頭腦和本體之間還要整體性、協(xié)調(diào)性好,協(xié)同好了作用才能發(fā)揮好。
這就是取勝的兩個關鍵因素。中美兩國企業(yè)在這兩個方面各有優(yōu)勢,底座智能涌現(xiàn)能力關鍵靠人才,智能體的制造能力關鍵看制造業(yè)水平,這是一個體系能力問題。美國拔尖人才優(yōu)勢非常明顯,在高端制造業(yè)上也有優(yōu)勢;中國具有完整的產(chǎn)業(yè)體系、龐大的市場規(guī)模,強大的制造體系和配套生產(chǎn)能力極具優(yōu)勢,中國人才隊伍特別是青年科學家和工程師隊伍也有一定優(yōu)勢。從最終落地的角度來講,誰的制造業(yè)體系能力強大誰最終勝出的幾率就大。能在實體經(jīng)濟領域廣泛深化應用的技術才會更有生命力,這也是過去80年來人工智能發(fā)展出現(xiàn)幾起幾落的一個因素。當然,大模型理論和技術在快速發(fā)展中,優(yōu)勢劣勢也處在快速變化與轉(zhuǎn)化之中,作為后發(fā)國家我們要樹立信心但絕不能掉以輕心。
在人工智能的競賽中,不能追求單方勝出,世界共贏才是正道。因為人工智能大國面臨著共同問題和責任,就是如何確保人工智能造福世界造福人民,防止出現(xiàn)脫離“智能向善”的軌道。想靠封鎖打壓、“小院高墻”之類限制一方發(fā)展不會有長時效果,在建設人類命運共同體的地球村里,人類探索未知的思想是鎖不住的,科學前沿之門決不會只對一家開放。
(作者為全國政協(xié)委員,中國可持續(xù)發(fā)展研究會理事長,科技部原副部長,國家外國專家局原局長)
來源:《科技中國》2024年第10期