12月11日,谷歌宣布發(fā)布最新大模型 Gemini 2.0,并推出基于此模型的AI智能體 Mariner。該智能體能夠?yàn)g覽電子表格、購(gòu)物網(wǎng)站等,甚至在用戶(hù)監(jiān)督下代表用戶(hù)采取行動(dòng)。這一創(chuàng)新進(jìn)一步推動(dòng)了人工智能技術(shù)的實(shí)際應(yīng)用。
Gemini 2.0:支持多模態(tài)輸入與高級(jí)推理
Gemini 2.0 是谷歌最新推出的大語(yǔ)言模型,其首個(gè)實(shí)驗(yàn)版本 Gemini 2.0 Flash 支持多模態(tài)輸入與輸出,能夠直接生成圖文混合內(nèi)容,以及通過(guò)多語(yǔ)言文本轉(zhuǎn)語(yǔ)音(TTS)功能生成音頻。新模型的強(qiáng)大功能還包括調(diào)用谷歌搜索、代碼執(zhí)行,以及運(yùn)行用戶(hù)定義的第三方函數(shù)。
谷歌CEO桑達(dá)爾·皮查伊(Sundar Pichai)表示:“Gemini 2.0 的高級(jí)推理能力使得解決復(fù)雜問(wèn)題成為可能,例如高等數(shù)學(xué)方程、多模態(tài)查詢(xún)和編程問(wèn)題。這一技術(shù)的突破將加速通用人工智能助手的構(gòu)建?!?
AI智能體Mariner:Chrome瀏覽器中的行動(dòng)助手
基于 Gemini 2.0,谷歌專(zhuān)門(mén)為 Chrome 瀏覽器開(kāi)發(fā)了 AI 智能體 Mariner。Mariner 的核心功能是幫助用戶(hù)瀏覽網(wǎng)頁(yè)并在需要時(shí)采取行動(dòng)。例如,用戶(hù)可以讓 Mariner 瀏覽購(gòu)物網(wǎng)站,將商品加入虛擬購(gòu)物車(chē),隨后由用戶(hù)確認(rèn)和完成購(gòu)買(mǎi)。
谷歌項(xiàng)目經(jīng)理杰克琳·孔澤爾曼(Jaclyn Konzelmann)解釋?zhuān)琈ariner 的設(shè)計(jì)是“在用戶(hù)參與的情況下”使用,以確保用戶(hù)對(duì)最終決策有控制權(quán)。她補(bǔ)充道,雖然 Mariner 能夠簡(jiǎn)化任務(wù)流程,但它仍處于實(shí)驗(yàn)階段,并且可能犯錯(cuò)?!傲奶鞕C(jī)器人在生成文本時(shí)的錯(cuò)誤可能被忽略,但當(dāng)它試圖操作網(wǎng)站并采取其他行動(dòng)時(shí),錯(cuò)誤的影響將更加明顯?!?
目前,谷歌正與外部少數(shù)測(cè)試人員分享 Mariner,但尚未公布何時(shí)向公眾發(fā)布。
谷歌的AI戰(zhàn)略與挑戰(zhàn)
除了 Mariner,谷歌還展示了新版數(shù)字助手 Project Astra,其功能包括對(duì)圖像、文本和語(yǔ)音命令做出反應(yīng)。這表明,谷歌正在通過(guò)一系列技術(shù)探索和產(chǎn)品,試圖在未來(lái)的人工智能市場(chǎng)中占據(jù)主導(dǎo)地位。
然而,谷歌的戰(zhàn)略也面臨阻力。美國(guó)司法部要求聯(lián)邦法官迫使谷歌出售或分拆 Chrome 瀏覽器,稱(chēng)其涉嫌非法壟斷。作為谷歌 AI 戰(zhàn)略的重要平臺(tái),Chrome 的未來(lái)發(fā)展可能對(duì)公司整體計(jì)劃產(chǎn)生重大影響。
技術(shù)的潛力與限制
盡管 Gemini 2.0 和 Mariner 展現(xiàn)了人工智能技術(shù)的巨大潛力,但谷歌也承認(rèn)這些工具尚未完全成熟。Mariner 的應(yīng)用仍需用戶(hù)監(jiān)督,而類(lèi)似技術(shù)在操作網(wǎng)站時(shí)的潛在錯(cuò)誤需要進(jìn)一步解決。
目前,AI 技術(shù)正在以驚人的速度發(fā)展,谷歌的最新嘗試為未來(lái)智能化瀏覽器和通用AI助手的實(shí)現(xiàn)鋪平了道路。隨著技術(shù)的不斷迭代,Mariner 和類(lèi)似的AI工具可能成為日常生活中不可或缺的助手。