阿里通義千問發布最新推理模型股價大漲 | 內地 - 香港中通社

2025年03月13日星期四繁简

首頁 -> 內地

阿里通義千問發布最新推理模型股價大漲

分享到：

分享到微信

分享到微博

分享到Twitter

分享到Facebook

分享到QQ

2025-03-06 18:25 | 稿件來源：香港中通社

【字號：大中小】

香港中通社3月6日電中國阿里巴巴集團旗下通義千問大模型團隊6日宣布，正式推出最新的推理模型QwQ-32B。據通義千問大模型團隊介紹，這是一款擁有320億參數的模型，其性能可與具備6710億參數（其中370億被激活）的DeepSeek-R1媲美。

圖為阿里巴巴集團總部——杭州西溪園區內一角。新華網資料圖

在數學推理、編程能力和通用能力的一系列基準測試中，通義千問大模型團隊將QwQ-32B與美國科企OpenAI的o1-mini以及中國科企DeepSeek滿血版及蒸餾版進行了比較，結果顯示，在測試數學能力的AIME24評測集上，以及評估代碼能力的LiveCodeBench中，QwQ-32B表現與DeepSeek-R1相當，遠勝於o1-mini及相同尺寸的R1蒸餾模型。

至於為何能夠實現這一點，奧秘仍在於大規模強化學習的方法。據介紹，在冷啟動基礎上，阿里通義團隊針對數學和編程任務、通用能力分別進行了兩輪大規模強化學習。在初始階段，特別針對數學和編程任務進行了強化學習訓練。與依賴傳統的獎勵模型不同，通義千問大模型團隊通過校驗生成答案的正確性來為數學問題提供反饋，並通過代碼執行服務器評估生成的代碼是否成功通過測試用例來提供代碼的反饋。

目前，阿里已採用寬鬆的Apache2.0協議，將QwQ-32B模型向全球開源。

QwQ-32B面世後，6日，阿里巴巴港股股價升逾8%。

2月底，阿里剛宣布全面開源旗下視頻生成模型萬相2.1模型。1月底，阿里通義千問宣布開源兩款大模型Qwen2.5-VL和Qwen2.5-1M。（完）

【編輯：馬華】

相關新聞

Manus橫空出世！台輿論：對普通人更適用，說明大陸不止DeepSeek

中國AI開源模型推動全球共享智能紅利

DeepSeek-R1多芯片版本開源

AI競爭愈發激烈：馬斯克剛發佈Grok 3，DeepSeek跟著發重磅論文

性能超過Deepseek！蘋果選擇阿里巴巴合作開發AI功能

DeepSeek到底什麼水平？

專訪AI專家：資金是香港“DeepSeek級”大模型的東風

華為騰訊阿里百度等上線DeepSeek大模型

DeepSeek異軍突起　中國AI大爆發

中國DeepSeek橫空出世，外媒讚其“震動硅谷”

DeepSeek震撼美國　特朗普表態

中國新AI大模型DeepSeek登頂美國APP排行榜

視頻

更多

"台積電"砸1000億投資美國恐變"美積電"　國台辦：民進黨“賣台”無底線

（2025中國兩會）來看看代表委員們的“兩會”社交圈

國台辦發言人答中通社記者問：一個偉大的國家　值得台灣同胞作為一份子並為之榮耀

（2025中國兩會）頻被外媒點贊的中國高校教育　做對了哪幾步？

（2025中國兩會）中美AI戰　中國能贏嗎？

（2025中國兩會）中央對港澳特別提出的這一新要求該如何解讀？

在中國兩會尋找答案｜經濟增速5%，中國能做到嗎？

來論

更多

論壇

更多

圖集

更多

國台辦舉行例行新聞發布會

專家：香港發展AI關鍵在於“集中力量幹大事”

國泰冀今年底前最多增聘4000名員工

閱讀排行

友情鏈接

關於我們

Copyright © 2009-2023 All Rights Reserved 香港中國通訊社有限公司版權所有

承印人：香港中國通訊社有限公司

承印地址: 香港南區黃竹坑道21號環匯廣場30樓

Tel: (+852) 28561919 Fax: (+852) 25647453