神武八荒一颗小说,盗墓笔记有声小说

DeepSeek最強(qiáng)對(duì)手來了！阿里巴巴QwQ

來源：千龍網(wǎng) 作者：內(nèi)蒙古時(shí)間：2025-03-16 04:37:55

3月6日消息，最強(qiáng)自DeepSeek火爆全球之后，對(duì)手國產(chǎn)開源大模型的阿里開發(fā)熱潮一浪高過一浪。如今，巴巴DeepSeek誕生以來最強(qiáng)的最強(qiáng)對(duì)手，它來了！對(duì)手

今日凌晨3點(diǎn)30，阿里阿里巴巴放出一枚重磅炸彈——通義千問最新開源模型QwQ-32B正式發(fā)布，巴巴比DeepSeek更小的最強(qiáng)尺寸，性能比肩全球最強(qiáng)開源推理模型。對(duì)手

據(jù)了解，阿里通過大規(guī)模強(qiáng)化學(xué)習(xí)，巴巴千問QwQ-32B在數(shù)學(xué)、最強(qiáng)代碼及通用能力上實(shí)現(xiàn)質(zhì)的對(duì)手飛躍，整體性能比肩DeepSeek-R1。阿里

而且在保持強(qiáng)勁性能的同時(shí)，千問QwQ-32B還大幅降低了部署使用成本，在消費(fèi)級(jí)顯卡上也能實(shí)現(xiàn)本地部署。

目前，阿里已采用寬松的Apache2.0協(xié)議，將千問QwQ-32B模型向全球開源，所有人都可免費(fèi)下載及商用。

打開chat.qwen.ai，左上角選擇QwQ-32B-Preview

同時(shí)，用戶也將可通過通義APP免費(fèi)體驗(yàn)最新的千問QwQ-32B模型。目前，QwQ-32B-Preview已經(jīng)在（chat.qwen.ai）官網(wǎng)上線。

據(jù)通義千問Qwen團(tuán)隊(duì)介紹，近期的研究表明，強(qiáng)化學(xué)習(xí)可以顯著提高模型的推理能力。例如，DeepSeek-R1通過整合冷啟動(dòng)數(shù)據(jù)和多階段訓(xùn)練，實(shí)現(xiàn)了最先進(jìn)的性能，使其能夠進(jìn)行深度思考和復(fù)雜推理。

而QwQ-32B就是大規(guī)模強(qiáng)化學(xué)習(xí)（RL）對(duì)大語言模型的智能的提升作用的最好研究例證。

規(guī)模上，QwQ-32B是一款僅有320億參數(shù)的模型，其性能卻可與具備6710 億參數(shù)（其中370億被激活）的DeepSeek-R1媲美。

另外，Qwen團(tuán)隊(duì)還在推理模型中集成了與Agent相關(guān)的能力，使其能夠在使用工具的同時(shí)進(jìn)行批判性思考，并根據(jù)環(huán)境反饋調(diào)整推理過程。

測(cè)試結(jié)果顯示，在測(cè)試數(shù)學(xué)能力的AIME24評(píng)測(cè)集上，以及評(píng)估代碼能力的 LiveCodeBench中，千問QwQ-32B表現(xiàn)與DeepSeek-R1相當(dāng)，遠(yuǎn)勝于o1-mini及相同尺寸的R1 蒸餾模型。

在由Meta首席科學(xué)家楊立昆領(lǐng)銜的“最難LLMs評(píng)測(cè)榜” LiveBench、谷歌等提出的指令遵循能力IFEval評(píng)測(cè)集、由加州大學(xué)伯克利分校等提出的評(píng)估準(zhǔn)確調(diào)用函數(shù)或工具方面的BFCL測(cè)試中，千問QwQ-32B的得分均超越了DeepSeek-R1。

此外，Qwen團(tuán)隊(duì)還通過展示了一段簡(jiǎn)短的示例代碼，說明如何通過API使用 QwQ-32B。

Qwen團(tuán)隊(duì)表示，我們希望我們的一點(diǎn)努力能夠證明強(qiáng)大的基礎(chǔ)模型疊加大規(guī)模強(qiáng)化學(xué)習(xí)也許是一條通往通用人工智能的可行之路。

受此消息影響，阿里巴巴港股大漲6.7%，截稿前報(bào)138.6港元，總市值2.63萬億港元。