婷婷久久综合九色综合,欧美成色婷婷在线观看视频,偷窥视频一区,欧美日本一道道一区二区

<tt id="bu9ss"></tt>
  • <span id="bu9ss"></span>
  • <pre id="bu9ss"><tt id="bu9ss"></tt></pre>
    <label id="bu9ss"></label>
    1. 創(chuàng)業(yè)頭條
    2. 前沿領(lǐng)域
    3. AI智能
    4. 正文

    晉升業(yè)內(nèi)新寵兒,MoE模型給了AI行業(yè)兩條關(guān)鍵出路

     2024-07-15 09:51  來源:A5專欄  我來投稿 撤稿糾錯(cuò)

      阿里云優(yōu)惠券 先領(lǐng)券再下單

    文 | 智能相對(duì)論

    作者 | 陳泊丞

    今年以來,MoE模型成了AI行業(yè)的新寵兒。

    一方面,越來越多的廠商在自家的閉源模型上采用了MoE架構(gòu)。在海外,OpenAI的GPT-4、谷歌的Gemini、Mistral AI的Mistral、xAI的Grok-1等主流大模型都采用了MoE架構(gòu)。

    而在國內(nèi),昆侖萬維推出的天工3.0、浪潮信息發(fā)布的源2.0-M32、通義千問團(tuán)隊(duì)發(fā)布的Qwen1.5-MoE-A2.7B、MiniMax全量發(fā)布的abab6、幻方量化旗下的DeepSeek發(fā)布的DeepSeek-MoE 16B等等也都屬于MoE模型。

    另一方面,在MoE模型被廣泛應(yīng)用的同時(shí),也有部分廠商爭(zhēng)先開源了自家的MoE模型。前不久,昆侖萬維宣布開源2千億參數(shù)的Skywork-MoE。而在此之前,浪潮信息的源2.0-M32、DeepSeek的DeepSeek-MoE 16B等,也都紛紛開源。

    為什么MoE模型如此火爆,備受各大廠商的青睞?在開源的背后,MoE模型又是以什么樣的優(yōu)勢(shì)使各大主流廠商成為其擁躉,試圖作為改變AI行業(yè)的利器?

    MoE模型火爆的背后: 全新的AI解題思路

    客觀來說,MoE模型的具體工作原理更接近中國的一句古語“術(shù)業(yè)有專攻”,通過把任務(wù)分門別類,然后分給多個(gè)特定的“專家”進(jìn)行解決。

    它的工作流程大致如此,首先數(shù)據(jù)會(huì)被分割為多個(gè)區(qū)塊(token),然后通過門控網(wǎng)絡(luò)技術(shù)(Gating Network)再把每組數(shù)據(jù)分配到特定的專家模型(Experts)進(jìn)行處理,也就是讓專業(yè)的人處理專業(yè)的事,最終匯總所有專家的處理結(jié)果,根據(jù)關(guān)聯(lián)性加權(quán)輸出答案。

    當(dāng)然,這只是一個(gè)大致的思路,關(guān)于門控網(wǎng)絡(luò)的位置、模型、專家數(shù)量、以及MoE與Transformer架構(gòu)的具體結(jié)合方案,各家方案都不盡相同,也逐漸成為各家競(jìng)爭(zhēng)的方向——誰的算法更優(yōu),便能在這個(gè)流程上拉開MoE模型之間的差距。

    像浪潮信息就提出了基于注意力機(jī)制的門控網(wǎng)絡(luò)(Attention Router),這種算法結(jié)構(gòu)的亮點(diǎn)在于可以通過局部過濾增強(qiáng)的注意力機(jī)制(LFA, Localized Filtering-based Attention),率先學(xué)習(xí)相鄰詞之間的關(guān)聯(lián)性,然后再計(jì)算全局關(guān)聯(lián)性的方法,能夠更好地學(xué)習(xí)到自然語言的局部和全局的語言特征,對(duì)于自然語言的關(guān)聯(lián)語義理解更準(zhǔn)確,從而更好地匹配專家模型,保證了專家之間協(xié)同處理數(shù)據(jù)的水平,促使模型精度得以提升。

    基于注意力機(jī)制的門控網(wǎng)絡(luò)(Attention Router)

    拋開目前各家廠商在算法結(jié)構(gòu)上的創(chuàng)新與優(yōu)化不談,MoE模型這種工作思路本身所帶來的性能提升就非常顯著——通過細(xì)粒度的數(shù)據(jù)分割和專家匹配,從而實(shí)現(xiàn)了更高的專家專業(yè)化和知識(shí)覆蓋。

    這使得MoE模型在處理處理復(fù)雜任務(wù)時(shí)能夠更準(zhǔn)確地捕捉和利用相關(guān)知識(shí),提高了模型的性能和適用范圍。因此,「智能相對(duì)論」嘗試了去體驗(yàn)天工3.0加持的AI搜索,就發(fā)現(xiàn)對(duì)于用戶較為籠統(tǒng)的問題,AI居然可以快速的完成拆解,并給出多個(gè)項(xiàng)目參數(shù)的詳細(xì)對(duì)比,屬實(shí)是強(qiáng)大。

    天工AI搜索提問“對(duì)比一下小米su7和特斯拉model3”所得出的結(jié)果

    由此我們可以看到,AI在對(duì)比兩款車型的過程中,巧妙地將這一問題拆解成了續(xù)航里程、動(dòng)力性能、外觀設(shè)計(jì)、內(nèi)飾設(shè)計(jì)、智能化與自動(dòng)駕駛、市場(chǎng)表現(xiàn)與用戶口碑、價(jià)格等多個(gè)項(xiàng)目,分別處理得出較為完整且專業(yè)的答案。

    這便是“術(shù)業(yè)有專攻”的優(yōu)勢(shì)——MoE模型之所以受到越來越多廠商的關(guān)注,首要的關(guān)鍵就在于其所帶來的全新解決問題的思路促使模型的性能得到了較為顯著的提高。特別是伴隨著行業(yè)復(fù)雜問題的涌現(xiàn),這一優(yōu)勢(shì)將使得MoE模型得到更廣泛的應(yīng)用。

    各大廠商爭(zhēng)先開源MoE模型: 解決AI算力荒的另一條路徑

    開源的意義在于讓MoE模型更好的普及。那么,對(duì)于市場(chǎng)而言,為什么要選擇MoE模型?

    拋開性能來說,MoE模型更突出的一點(diǎn)優(yōu)勢(shì)則在于算力效率的提升。

    DeepSeek-MoE 16B在保持與7B參數(shù)規(guī)模模型相當(dāng)?shù)男阅艿耐瑫r(shí),只需要大約40%的計(jì)算量。而37億參數(shù)的源2.0-M32在取得與700億參數(shù)LLaMA3相當(dāng)性能水平的同時(shí),所消耗的算力也僅為LLaMA3的1/19。

    也就意味著,同樣的智能水平,MoE模型可以用更少的計(jì)算量和內(nèi)存需求來實(shí)現(xiàn)。這得益于MoE模型在應(yīng)用中并非要完全激活所有專家網(wǎng)絡(luò),而只需要激活部分專家網(wǎng)絡(luò)就可以解決相關(guān)問題,很好避免了過去“殺雞用牛刀”的尷尬局面。

    舉個(gè)例子,盡管DeepSeek-MoE 16B的總參數(shù)量為16.4B,但每次推理只激活約2.8B的參數(shù)。與此同時(shí),它的部署成本較低,可以在單卡40G GPU上進(jìn)行部署,這使得它在實(shí)際應(yīng)用中更加輕量化、靈活且經(jīng)濟(jì)。

    在當(dāng)前算力資源越來越緊張的“算力荒”局面下,MoE模型的出現(xiàn)和應(yīng)用可以說為行業(yè)提供了一個(gè)較為現(xiàn)實(shí)且理想的解決方案。

    更值得一提的是,MoE模型還可以輕松擴(kuò)展到成百上千個(gè)專家,使得模型容量極大增加,同時(shí)也允許在大型分布式系統(tǒng)上進(jìn)行并行計(jì)算。由于各個(gè)專家只負(fù)責(zé)一部分?jǐn)?shù)據(jù)處理,因此在保持模型性能的同時(shí),又能顯著降低了單個(gè)節(jié)點(diǎn)的內(nèi)存和計(jì)算需求。

    如此一來,AI能力的普惠便有了非??尚械穆窂健_@樣的特性再加上廠商開源,將促使更多中小企業(yè)不需要重復(fù)投入大模型研發(fā)以及花費(fèi)過多算力資源的情況下便能接入AI大模型,獲取相關(guān)的AI能力,促進(jìn)技術(shù)普及和行業(yè)創(chuàng)新。

    當(dāng)然,在這個(gè)過程中,MoE模型廠商們?cè)跒槭袌?chǎng)提供開源技術(shù)的同時(shí),也有機(jī)會(huì)吸引更多企業(yè)轉(zhuǎn)化成為付費(fèi)用戶,進(jìn)而走通商業(yè)化路徑。畢竟,MoE模型的優(yōu)勢(shì)擺在眼前,接下來或許將有更多的企業(yè)斗都會(huì)嘗試新的架構(gòu)來拓展AI能力,越早開源越能吸引更多市場(chǎng)主體接觸并參與其中。

    但是,開源最關(guān)鍵的優(yōu)勢(shì)還是在于MoE模型對(duì)當(dāng)前算力問題的解決?;蛟S,隨著MoE模型被越來越多的企業(yè)所接受并應(yīng)用,行業(yè)在獲得相應(yīng)AI能力的同時(shí)也不必困頓于算力資源緊張的問題了。

    寫在最后

    MoE大模型作為當(dāng)前人工智能領(lǐng)域的技術(shù)熱點(diǎn),其獨(dú)特的架構(gòu)和卓越的性能為人工智能的發(fā)展帶來了新的機(jī)遇。不管是應(yīng)用還是開源,隨著技術(shù)的不斷進(jìn)步和應(yīng)用場(chǎng)景的不斷拓展,MoE大模型有望在更多領(lǐng)域發(fā)揮巨大的潛力。

    MoE模型的本質(zhì)在于為AI行業(yè)的發(fā)展提供了兩條思路,一是解決應(yīng)用上的性能問題,讓AI有了更強(qiáng)大的解題思路。二是解決算力上的欠缺問題,讓AI有了更全面的發(fā)展空間。由此來看MoE模型能成為行業(yè)各大廠商的寵兒,也是水到渠成的事情。

    *本文圖片均來源于網(wǎng)絡(luò)

    此內(nèi)容為【智能相對(duì)論】原創(chuàng),

    僅代表個(gè)人觀點(diǎn),未經(jīng)授權(quán),任何人不得以任何方式使用,包括轉(zhuǎn)載、摘編、復(fù)制或建立鏡像。

    部分圖片來自網(wǎng)絡(luò),且未核實(shí)版權(quán)歸屬,不作為商業(yè)用途,如有侵犯,請(qǐng)作者與我們聯(lián)系。

    •AI產(chǎn)業(yè)新媒體;

    •澎湃新聞科技榜單月度top5;

    •文章長期“霸占”鈦媒體熱門文章排行榜TOP10;

    •著有《人工智能 十萬個(gè)為什么》

    •【重點(diǎn)關(guān)注領(lǐng)域】智能家電(含白電、黑電、智能手機(jī)、無人機(jī)等AIoT設(shè)備)、智能駕駛、AI+醫(yī)療、機(jī)器人、物聯(lián)網(wǎng)、AI+金融、AI+教育、AR/VR、云計(jì)算、開發(fā)者以及背后的芯片、算法等。

    申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

    相關(guān)標(biāo)簽
    ai智能

    相關(guān)文章

    • 從“+AI”到“AI+”,時(shí)代進(jìn)入“Next Level”

      “創(chuàng)新的速度比創(chuàng)新本身更重要?!卑B ゑR斯克曾這樣說到。近日,由馬斯克所掌舵的特斯拉,在2024年世界人工智能大會(huì)上正式推出了第二代Optimus(擎天柱)人形機(jī)器人,距離第一代面世,僅過去9個(gè)月。加速升級(jí)的人形機(jī)器人不負(fù)所望,成了今年WAIC大會(huì)(世界人工智能大會(huì))的一大看點(diǎn)。除此以外,今年的WA

      標(biāo)簽:
      ai智能
    • OpenAI這個(gè)盤,阿里云們能接得住嗎?

      降價(jià),搶客……國產(chǎn)大模型跑起來了

      標(biāo)簽:
      阿里云
      ai智能
    • OpenAI斷供,國產(chǎn)大模型百億市場(chǎng)紛爭(zhēng)再起

      北京時(shí)間6月25日凌晨,多個(gè)地區(qū)的OpenAI用戶收到了一封來自官方的郵件。郵件顯示:“您所使用的APl流量來自O(shè)penAl目前不支持的地區(qū)。我們將從7月9日開始采取額外措施,阻止來自不在我們支持的國家和地區(qū)列表中的地區(qū)的APl接口。”所謂的API,就是應(yīng)用程序編程接口。開發(fā)者通過使用OpenAI的

      標(biāo)簽:
      ai智能
      大模型
    • 如何加速AI原生應(yīng)用進(jìn)程?華為云開天aPaaS提出新范式

      每一次新舊代際轉(zhuǎn)換時(shí),都會(huì)上演這樣的一幕:“暢想很多,落地很少”,AI原生應(yīng)用似乎也不例外。關(guān)于AI原生應(yīng)用的呼聲已經(jīng)持續(xù)一段時(shí)間,但普通用戶對(duì)“AI原生”依然陌生。除了新業(yè)態(tài)普及的周期性,AI原生應(yīng)用的爆發(fā)與否還涉及另一個(gè)議題,即怎么降低AI原生應(yīng)用開發(fā)的難度和門檻。剛剛結(jié)束的華為開發(fā)者大會(huì)202

      標(biāo)簽:
      ai智能
    • 搞AI?中小企業(yè)拿什么和大廠拼?

      近期,蘋果發(fā)布M4芯片,號(hào)稱“比當(dāng)今任何AIPC的任何神經(jīng)引擎都強(qiáng)!”緊隨其后微軟攜“Copilot+PCs”的概念加入AIPC激戰(zhàn)。截至目前,包括聯(lián)想、惠普、華為等多家主流PC廠商在內(nèi),已經(jīng)至少推出了超50款A(yù)IPC產(chǎn)品。AI重塑行業(yè)的機(jī)遇,誰都不想錯(cuò)過。對(duì)于企業(yè)來說,能否積極擁抱AIPC十分關(guān)鍵

      標(biāo)簽:
      ai智能
    • 夸克App上線“夸克老師”:AI實(shí)現(xiàn)個(gè)性化輔導(dǎo),精準(zhǔn)攻克學(xué)習(xí)難題

      6月17日,阿里巴巴旗下智能信息平臺(tái)夸克App正式推出全新學(xué)習(xí)產(chǎn)品“夸克老師”——一款集講題、批作業(yè)、出題、找試卷于一體的AI家教。該功能依托通義千問大模型,通過指令微調(diào)、強(qiáng)化學(xué)習(xí)等前沿技術(shù),首次實(shí)現(xiàn)“因材施教”的個(gè)性化輔導(dǎo),標(biāo)志著AI在教育領(lǐng)域的應(yīng)用邁入新階段。技術(shù)突破:AI模擬真人教學(xué),推理能力

      標(biāo)簽:
      夸克
    • 字節(jié)旗下AI工具豆包電腦版與網(wǎng)頁版上線“AI播客”功能,用戶可一鍵生成雙人對(duì)話播客

      2025年6月17日,字節(jié)跳動(dòng)旗下智能助手豆包正式在電腦版及網(wǎng)頁端全量上線“AI播客”功能,用戶只需上傳PDF文檔或網(wǎng)頁鏈接,即可一鍵生成由兩位AI主播演繹的對(duì)話式播客節(jié)目。這一創(chuàng)新功能憑借高度擬人化的語音效果和秒級(jí)轉(zhuǎn)化效率,迅速引發(fā)內(nèi)容創(chuàng)作者、學(xué)生群體及職場(chǎng)人士的關(guān)注。技術(shù)突破:真人級(jí)語音交互,秒

      標(biāo)簽:
      豆包ai
    • DeepSeek越強(qiáng),Kimi越慌?

      AI的生死競(jìng)賽

      標(biāo)簽:
      deepseek
    • 全球AI巨頭正在賭:誰搞定MCP,誰就是未來老大

      我不是危言聳聽,現(xiàn)在全球的AI巨頭都在做MCP,毫不夸張的說:誰能把MCP做起來,誰就擁有AI生態(tài)控制權(quán),誰就是AI圈的老大。你們有沒有發(fā)現(xiàn),MCP在2025年初開始特別火爆,互聯(lián)網(wǎng)技術(shù)大廠都在強(qiáng)推MCP。(1)阿里云百煉搞了個(gè)MCP平臺(tái),提供50+預(yù)置MCP服務(wù)。不過大都只面向阿里系產(chǎn)品。(2)騰

      標(biāo)簽:
      ai智能
    • 對(duì)話李軍:人工智能是“第五范式革命”

      2025國際人工智能程序設(shè)計(jì)精英挑戰(zhàn)賽(IAEPC)在香港中文大學(xué)成功舉辦。作為主辦方之一,歐美同學(xué)基金會(huì)理事長李軍接受了大賽主持人艾誠采訪。在采訪中,李軍認(rèn)為IAEPC不僅是一場(chǎng)“冠軍中的冠軍”對(duì)決,更是一次全球AI人才的線下交流盛會(huì)。大賽“史無前例”的吸引了全球青年科技精英匯聚香港,更加推動(dòng)和普

    • 對(duì)話施韓原與杜瑜皓:與參賽選手一起改變世界

      2025國際人工智能程序設(shè)計(jì)精英挑戰(zhàn)賽(IAEPC)在香港中文大學(xué)成功舉辦。作為大賽發(fā)起人方之一及裁判委員會(huì)負(fù)責(zé)人,施韓原與杜瑜皓接受了大賽主持人艾誠采訪。裁判委員會(huì)主席施韓原分享了此次大賽的亮點(diǎn),IAEPC首次引入創(chuàng)新賽道,探索選手如何與AI合作進(jìn)行答題。裁判委員會(huì)副主席杜瑜皓認(rèn)為,選手最終目標(biāo)并

    • 吳林林專訪IAEPC冠軍:與全球參賽者交流是最重要的一課

      2025國際人工智能程序設(shè)計(jì)精英挑戰(zhàn)賽(IAEPC)在香港中文大學(xué)成功舉辦。來自深圳的學(xué)生吳林林作為主辦方記者團(tuán)成員,采訪了大賽冠軍選手之一。在吳林林的采訪中,選手認(rèn)為與來自全球的參賽者交流是自己學(xué)到的最重要的一課。在科技與AI之前,選手們可以平等、開放、友好的交流。以下是采訪實(shí)錄(有刪節(jié)):吳林林

    • 吳林林專訪黃錦輝:年輕人要像懂中文一樣懂A

      2025國際人工智能程序設(shè)計(jì)精英挑戰(zhàn)賽(IAEPC)在香港中文大學(xué)成功舉辦。來自深圳的學(xué)生吳林林作為主辦方記者團(tuán)成員,采訪了大會(huì)嘉賓:全國政協(xié)委員、香港特別行政區(qū)立法會(huì)議員、香港中文大學(xué)工程學(xué)院副院長、IAEPC聯(lián)合發(fā)起人黃錦輝先生。在吳林林的采訪中,黃錦輝教授勉勵(lì)年輕人要像懂中文和英語一樣懂AI,

    • 本以為DeepSeek天下無敵了,沒想到Manus更猛

      昨天新出了一個(gè)AI,據(jù)說比DeepSeek還牛,而截止到今早,已經(jīng)有10萬人在排隊(duì)申請(qǐng)Manus邀請(qǐng)碼了,而且它邀請(qǐng)碼已經(jīng)炒到10萬了。這是北京的一家人工智能公司蝴蝶科技,創(chuàng)始人是一名來自華中科技大學(xué)的90后畢業(yè)生肖弘,突然向全球宣布:世界上第一款真正的人工智能、通用智能體產(chǎn)品出現(xiàn)了,名叫Manus

      標(biāo)簽:
      ai智能
    • 別讓DeepSeek成了造謠者的“白手套”

      謠言肆虐,擦亮眼睛

    編輯推薦