首頁 -> 國際

谷歌發佈開源AI大模型Gemma 稱其性能在同等規模中最爲先進

分享到:
2024-02-22 16:20 | 稿件來源:香港新聞網

【字號:

香港新聞網2月22日電 當地時間2月21日,谷歌宣布正式推出全新的開源大語言模型(LLM)“Gemma”, 旨在幫助開發人員和研究人員負責任地構建人工智能。

谷歌開源AI大模型Gemma。圖自谷歌AI官網

據澎湃新聞報道,Gemma大模型與谷歌規模最大、能力最強的人工智能模型Gemini共享技術和基礎架構,“受到 Gemini的啟發,Google DeepMind和Google其他團隊合作開發了Gemma,并用拉丁語中意為‘寶石’的gemma為其命名。”

不過相比Gemini,Gemma更加輕量化。同時,Gemma依舊保持免費使用,其模型權重也一并開源,并且允許商用。

谷歌共發佈了兩種不同權重規模的模型,分別為Gemma 2B(20億參數)和Gemma 7B(70億參數)。每種規模都有預訓練和指令微調版本,允許所有組織(無論規模大小)負責任地進行商用和分發。

谷歌發佈Gemma的同日,風頭正盛的芯片製造商英偉達也宣布,已與谷歌達成合作,確保Gemma模型在其芯片上順利運行。英偉達還表示,旗下聊天機器人軟件Chat With RTX也將馬上支持Gemma。

值得注意的是,谷歌還強調,Gemma能在關鍵基準上越級碾壓更大的模型。更為令人印象深刻的是,谷歌Gemma可以在筆記本電腦上運行。

谷歌方面表示,Gemini是我們當今廣泛使用的最大、功能最強大的AI模型。與其他開放模型相比,Gemma 2B和7B能够在其範圍內實現同類最佳的性能。Gemma模型能够直接在開發人員筆記本電腦或台式計算機上運行,“值得注意的是,Gemma在關鍵基準上超越了更大的模型,同時遵守我們安全和負責任的輸出的嚴格標準。”

在開源模型的同時,谷歌還公佈了有關Gemma的性能、數據集組成和建模方法的詳細信息的技術報告。有研究人員在技術報告中發現,Gemma支持的詞彙表大小達到了256K,這意味著它對英語之外的其他語言能够提供更好、更快的支持。

Gemma也第一時間在知名開源模型庫HuggingFace和HuggingChat上線。上線不久之後,在HuggingFace的“大語言模型榜單”上,Gemma 2B和7B模型已經雙雙登頂。

AI行業專家、深度學習框架Keras的作者François Chollet更是對此表示,最強開源大模型的位置現在易主了。

Gemma的競爭對手Llama 3也發佈在即。1月19日,Meta聯合創始人兼首席執行官扎克伯格宣布,Meta正在訓練Llama 3并且將以負責任地方式繼續開源。

【編輯:梅婉潼】

視頻

更 多
落馬洲河套區再添“新成員” 粵港澳大灣區國際臨床試驗所開幕
專訪香港廉政專員胡英明:打擊貪污對於國家安全非常重要
讓沙特企業來港上市 只需做一件事!港交所前行政總裁李小加提出建議
美國要搞“中國特色的美國資本主義”?李小加:大浪來時美國這艘船會先顛覆
50年廉署咖啡的新內涵 香港廉政專員親身上陣煮咖啡
國際問題專家:特朗普上台後對華制裁恐持續 但中美關係的未來不完全由美國決定
葉劉淑儀:外界要求“釋放黎智英”是對香港司法制度的粗暴干預