12月1日,阿里云舉辦通義千問發(fā)布會,開源通義千問720億參數(shù)模型Qwen-72B。Qwen-72B在10個權威基準測評創(chuàng)下開源模型最優(yōu)成績,成為業(yè)界最強開源大模型,性能超越開源標桿Llama 2-70B和大部分商用閉源模型。未來,企業(yè)級、科研級的高性能應用,也有了開源大模型這一選項。
通義千問還開源了18億參數(shù)模型Qwen-1.8B和音頻大模型Qwen-Audio。至此,通義千問共開源18億、70億、140億、720億參數(shù)的4款大語言模型,以及視覺理解、音頻理解兩款多模態(tài)大模型,實現(xiàn)“全尺寸、全模態(tài)”開源。力度之大,業(yè)界無出其右。
業(yè)界最強開源模型,填補中國LLM開源領域空白
Qwen-72B基于3T tokens高質量數(shù)據(jù)訓練,延續(xù)通義千問預訓練模型一貫以來的強勢表現(xiàn),在10個權威基準測評中奪得開源模型最優(yōu)成績,在部分測評中超越閉源的GPT-3.5和GPT-4。
英語任務上,Qwen-72B在MMLU基準測試取得開源模型最高分;中文任務上,Qwen-72B霸榜C-Eval、CMMLU、GaokaoBench等基準,得分超越GPT-4;數(shù)學推理方面,Qwen-72B在GSM8K、MATH測評中斷層式領先其他開源模型;代碼理解方面,Qwen-72B在HumanEval、MBPP等測評中的表現(xiàn)大幅提升,代碼能力有了質的飛躍。
在10大權威測評中,通義千問720億參數(shù)模型獲得開源模型最優(yōu)成績
通義千問720億開源模型部分成績超越閉源的GPT-3.5和GPT-4
Qwen-72B可以處理最多32k的長文本輸入,在長文本理解測試集LEval上取得了超越ChatGPT-3.5-16k的效果。研發(fā)團隊優(yōu)化了Qwen-72B的指令遵循、工具使用等技能,使之能更好地被下游應用集成。比如,Qwen-72B搭載了強大的系統(tǒng)指令(System Prompt)能力,用戶只用一句提示詞就可定制AI助手,要求大模型扮演某個角色或者執(zhí)行特定的回復任務。
用戶僅用一句提示詞就可創(chuàng)建自己的AI助手
此前,中國大模型市場還沒出現(xiàn)足以對標Llama 2-70B的優(yōu)質開源模型。Qwen-72B填補了國內空白,以高性能、高可控、高性價比的優(yōu)勢,提供不亞于商業(yè)閉源大模型的選擇?;赒wen-72B,大中型企業(yè)可開發(fā)商業(yè)應用,高校、科研院所可開展AI for Science等科研工作。
從1.8B到72B, 通義千問 率先實現(xiàn)全尺寸開源
如果說Qwen-72B“向上摸高”,抬升了開源大模型的尺寸和性能天花板;發(fā)布會上的另一開源模型Qwen-1.8B則“向下探底”,成為尺寸最小的中國開源大模型,推理2K長度文本內容僅需3G顯存,可在消費級終端部署。
從18億、70億、140億到720億參數(shù)規(guī)模,通義千問成為業(yè)界首個“全尺寸開源”的大模型。用戶可在魔搭社區(qū)直接體驗Qwen系列模型效果,也可通過阿里云靈積平臺調用模型API,或基于阿里云百煉平臺定制大模型應用。阿里云人工智能平臺PAI針對通義千問全系列模型進行深度適配,推出了輕量級微調、全參數(shù)微調、分布式訓練、離線推理驗證、在線服務部署等服務。
阿里云是國內最早開源自研大模型的科技企業(yè),8月以來開源了Qwen-7B、Qwen-14B和視覺理解模型Qwen-VL。幾款模型先后沖上HuggingFace、Github大模型榜單,得到中小企業(yè)和個人開發(fā)者的青睞,累計下載量超過150萬,催生出150多款新模型、新應用。發(fā)布會現(xiàn)場,多位開發(fā)者伙伴現(xiàn)身說法,分享了他們用Qwen開發(fā)專屬模型和特定應用的實踐。
阿里云CTO周靖人表示,開源生態(tài)對促進中國大模型的技術進步與應用落地至關重要,通義千問將持續(xù)投入開源,希望成為“AI時代最開放的大模型”,與伙伴們共同促進大模型生態(tài)建設。
通義千問基座模型持續(xù)進化,多模態(tài)探索業(yè)界領先
通義千問在多模態(tài)大模型領域的探索也領先業(yè)界一步,當天,阿里云首次開源音頻理解大模型Qwen-Audio。
Qwen-Audio能夠感知和理解人聲、自然聲、動物聲、音樂聲等各類語音信號。用戶可以輸入一段音頻,要求模型給出對音頻的理解,甚至基于音頻進行文學創(chuàng)作、邏輯推理、故事續(xù)寫等等。音頻理解能夠賦予大模型接近人類的聽覺能力。
通義大模型能“聽”也能“看”。通義千問8月開源出視覺理解大模型Qwen-VL,迅速成為國際開源社區(qū)最佳實踐之一。本次發(fā)布會又宣布了Qwen-VL的重大更新,大幅提升通用OCR、視覺推理、中文文本理解基礎能力,還能處理各種分辨率和規(guī)格的圖像,甚至能“看圖做題”。不論從權威測評成績還是真人體驗的效果看,Qwen-VL的中文文本理解能力都大幅超越了GPT-4V。
通義千問閉源模型也在持續(xù)進化,一個月前發(fā)布的通義千問2.0版閉源模型,最近已進階至2.1版,上下文窗口長度擴展到32k,代碼理解生成能力、數(shù)學推理能力、中英文百科知識、幻覺誘導抵抗能力分別提升30%、10%、近5%和14%。用戶可以在通義千問APP免費體驗最新版本的閉源模型。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!
12月1日,首屆“通義千問AI挑戰(zhàn)賽”開賽,參賽者可免費暢玩通義開源模型家族,包括剛剛發(fā)布的720億參數(shù)模型Qwen-72B。主辦方為參賽者提供價值50萬元的免費云上算力和豐厚獎金。賽事分為算法和Agent兩大賽道,前者聚焦通義千問大模型的微調訓練,希望通過高質量的數(shù)據(jù)探索開源模型的代碼能力上限,后
12月1日通義千問發(fā)布會,阿里云開源通義千問720億參數(shù)模型Qwen-72B。Qwen-72B在10個權威基準測評創(chuàng)下開源模型最優(yōu)成績,成為業(yè)界最強開源大模型,性能超越開源標桿Llama2-70B和大部分商用閉源模型,可適配企業(yè)級、科研級的高性能應用。通義千問當天還開源了18億參數(shù)模型Qwen-1.
這年頭,安卓廠商沒個大模型,都不敢開手機發(fā)布會了。前腳OPPO剛用大模型升級了語音助手,后腳vivo就官宣自研手機AI大模型;小米發(fā)布會則直接將大模型當場塞進手機系統(tǒng)……其競爭激烈程度,不亞于搶芯片首發(fā)。到底是怎么回事?究其原因,還是智能終端已經成為了各類AIGC應用的落地“新灘頭”。先是圖像生成大
基于容聯(lián)云自主研發(fā)的赤兔大模型能力,容聯(lián)云容犀機器人真正將大模型強大的理解能力、知識學習能力、總結能力、挖掘能力、推理能力融入于實際落地應用中。開創(chuàng)性的打造生成式場景化智能問答、生成式智能輔助、AI運營話術庫,幫助企業(yè)洞悉更精準的客戶真實需求,提升一線客服人員的專業(yè)服務能力,并代替人工完成大量低價值
文:向善財經關于百度,最近發(fā)生了這么兩件事兒。一個是華爾街分析師重申了對百度股票的買入評級和目標價,但在該公司11月21日公布第三季度收益之前下調了第三季度收入預期。分析師給出的理由是,線下廣告支出走軟,以及2G資金減少之后,給智能交通帶來挑戰(zhàn)。另外一個是最近文心一言正式上線了專業(yè)版,并且開始收費,
6月17日,阿里巴巴旗下智能信息平臺夸克App正式推出全新學習產品“夸克老師”——一款集講題、批作業(yè)、出題、找試卷于一體的AI家教。該功能依托通義千問大模型,通過指令微調、強化學習等前沿技術,首次實現(xiàn)“因材施教”的個性化輔導,標志著AI在教育領域的應用邁入新階段。技術突破:AI模擬真人教學,推理能力
2025年6月17日,字節(jié)跳動旗下智能助手豆包正式在電腦版及網頁端全量上線“AI播客”功能,用戶只需上傳PDF文檔或網頁鏈接,即可一鍵生成由兩位AI主播演繹的對話式播客節(jié)目。這一創(chuàng)新功能憑借高度擬人化的語音效果和秒級轉化效率,迅速引發(fā)內容創(chuàng)作者、學生群體及職場人士的關注。技術突破:真人級語音交互,秒
我不是危言聳聽,現(xiàn)在全球的AI巨頭都在做MCP,毫不夸張的說:誰能把MCP做起來,誰就擁有AI生態(tài)控制權,誰就是AI圈的老大。你們有沒有發(fā)現(xiàn),MCP在2025年初開始特別火爆,互聯(lián)網技術大廠都在強推MCP。(1)阿里云百煉搞了個MCP平臺,提供50+預置MCP服務。不過大都只面向阿里系產品。(2)騰
2025國際人工智能程序設計精英挑戰(zhàn)賽(IAEPC)在香港中文大學成功舉辦。作為主辦方之一,歐美同學基金會理事長李軍接受了大賽主持人艾誠采訪。在采訪中,李軍認為IAEPC不僅是一場“冠軍中的冠軍”對決,更是一次全球AI人才的線下交流盛會。大賽“史無前例”的吸引了全球青年科技精英匯聚香港,更加推動和普
2025國際人工智能程序設計精英挑戰(zhàn)賽(IAEPC)在香港中文大學成功舉辦。作為大賽發(fā)起人方之一及裁判委員會負責人,施韓原與杜瑜皓接受了大賽主持人艾誠采訪。裁判委員會主席施韓原分享了此次大賽的亮點,IAEPC首次引入創(chuàng)新賽道,探索選手如何與AI合作進行答題。裁判委員會副主席杜瑜皓認為,選手最終目標并
2025國際人工智能程序設計精英挑戰(zhàn)賽(IAEPC)在香港中文大學成功舉辦。來自深圳的學生吳林林作為主辦方記者團成員,采訪了大賽冠軍選手之一。在吳林林的采訪中,選手認為與來自全球的參賽者交流是自己學到的最重要的一課。在科技與AI之前,選手們可以平等、開放、友好的交流。以下是采訪實錄(有刪節(jié)):吳林林
2025國際人工智能程序設計精英挑戰(zhàn)賽(IAEPC)在香港中文大學成功舉辦。來自深圳的學生吳林林作為主辦方記者團成員,采訪了大會嘉賓:全國政協(xié)委員、香港特別行政區(qū)立法會議員、香港中文大學工程學院副院長、IAEPC聯(lián)合發(fā)起人黃錦輝先生。在吳林林的采訪中,黃錦輝教授勉勵年輕人要像懂中文和英語一樣懂AI,
昨天新出了一個AI,據(jù)說比DeepSeek還牛,而截止到今早,已經有10萬人在排隊申請Manus邀請碼了,而且它邀請碼已經炒到10萬了。這是北京的一家人工智能公司蝴蝶科技,創(chuàng)始人是一名來自華中科技大學的90后畢業(yè)生肖弘,突然向全球宣布:世界上第一款真正的人工智能、通用智能體產品出現(xiàn)了,名叫Manus
謠言肆虐,擦亮眼睛