近日,在剛剛落幕的IWSLT(International Workshop on Spoken Language Translation)國際頂級(jí)口語機(jī)器翻譯評(píng)測(cè)大賽上,搜狗擊敗訊飛、阿里巴巴, APPTEK(美國應(yīng)用科技公司)、AFRL(美國空軍研究實(shí)驗(yàn)室)以及KIT(德國卡爾斯魯厄理工學(xué)院)等國際國內(nèi)多個(gè)強(qiáng)勁對(duì)手,一舉奪得了2018年IWSLT大賽Baseline Model(基線模型)賽道冠軍,代表中國向世界彰顯了AI領(lǐng)域的技術(shù)硬實(shí)力!
表1 IWSLT大賽Baseline Model賽道最終結(jié)果
--取自IWSLT官方公布結(jié):https://workshop2018.iwslt.org/downloads/Proceedings_IWSLT_2018.pdf
這是搜狗繼WMT 2017機(jī)器翻譯頂級(jí)評(píng)測(cè)大賽奪冠之后,所摘得的又一翻譯領(lǐng)域的技術(shù)桂冠。短期內(nèi)連續(xù)登頂世界第一的位置,充分證明了搜狗在翻譯行業(yè)特別是口語翻譯領(lǐng)域已位居領(lǐng)先地位。
IWSLT是什么比賽?
IWSLT是國際最具影響力的口語機(jī)器翻譯評(píng)測(cè)比賽,從2004年開始已經(jīng)舉辦了15屆。每屆比賽都吸引了世界各地機(jī)器翻譯領(lǐng)域的知名企業(yè)和研究機(jī)構(gòu)參與,本屆比賽吸引了訊飛、阿里巴巴等國內(nèi)公司,愛爾蘭ADAPT中心,美國約翰霍普金斯大學(xué),德國卡爾斯魯厄理工學(xué)院,芬蘭赫爾辛基大學(xué),英國愛丁堡大學(xué),美國AppTek公司等多家國際知名大學(xué)、研究機(jī)構(gòu)和公司參加。
表2 IWSLT2018大賽參賽情況
--取自IWSLT官方公布結(jié)果:
:https://workshop2018.iwslt.org/downloads/Proceedings_IWSLT_2018.pdf
本屆IWSLT 2018的口語機(jī)器翻譯任務(wù)主要評(píng)測(cè)基于指定數(shù)據(jù)集從英語到德語的語音翻譯能力,共分為Baseline Model(基線模型賽道)和End-to-End(端到端賽道)兩個(gè)賽道,其中Baseline Model賽道主要評(píng)測(cè)語音翻譯的流水線方案,輸入語音先通過語音識(shí)別系統(tǒng)得到語音識(shí)別結(jié)果,之后將結(jié)果送入機(jī)器翻譯系統(tǒng)獲得譯文,這也是業(yè)內(nèi)最主流、效果最好的語音翻譯解決方案,市場(chǎng)上商用機(jī)器同傳、翻譯機(jī)等語音翻譯類產(chǎn)品幾乎都采用了類似的方法;End-to-End則是本次評(píng)測(cè)新增設(shè)的賽道,主要鼓勵(lì)參賽方探索基于神經(jīng)網(wǎng)絡(luò)的端到端語音翻譯解決方案,希望能夠輸入語音,基于深度神經(jīng)網(wǎng)絡(luò)模型直接輸出譯文,這種方法目前仍處于早期研究階段,受制于語音-文本平行語料難以大規(guī)模采集、算法研究不成熟等因素的限制,距離商用仍存在較大距離。本次評(píng)測(cè)中,在訓(xùn)練集、測(cè)試集相同的情況下,Baseline Model賽道最好的系統(tǒng)取得了28.09的BLEU(機(jī)器翻譯質(zhì)量評(píng)價(jià)指標(biāo),值越大代表翻譯質(zhì)量越好),而End-to-End賽道最好的系統(tǒng)僅取得了19.4的BLEU,較Baseline Model賽道相差8.69個(gè)BLEU,差距非常明顯,也證明了Baseline Model賽道評(píng)測(cè)的算法仍是目前最可行和實(shí)用的解決方案。
搜狗本次參加的是Baseline Model賽道的評(píng)測(cè),并取得了第一名的好成績(jī)。評(píng)測(cè)任務(wù)面向TED演講和大會(huì)學(xué)術(shù)報(bào)告場(chǎng)景,測(cè)試集包括來自英國、歐洲、印度等各個(gè)國家的英語演講者,存在噪聲、口音、自由表達(dá)等復(fù)雜語音現(xiàn)象,同時(shí)語言中存在大量領(lǐng)域?qū)S忻~和口語化的表達(dá)(如:大量語氣詞、錯(cuò)誤語法表達(dá)等),具有極強(qiáng)的實(shí)戰(zhàn)意義和挑戰(zhàn)性。最終,搜狗提交的系統(tǒng)BLEU值達(dá)到28.09,領(lǐng)先排名第二的科大訊飛1.6個(gè)BLEU,證明了搜狗在口語機(jī)器翻譯領(lǐng)域強(qiáng)大的實(shí)力。
AI賽道中持續(xù)發(fā)力,搜狗領(lǐng)跑語音翻譯行業(yè)
搜狗的AI戰(zhàn)略藍(lán)圖之中,語言是最核心的重頭戲。一直以來,搜狗都堅(jiān)持著“自然交互+知識(shí)計(jì)算”的人工智能核心方向,并持續(xù)深耕技術(shù),推動(dòng)技術(shù)向產(chǎn)品的快速轉(zhuǎn)化,2016年,搜狗發(fā)布了自有人機(jī)交互解決方案-知音引擎。擁有充足真實(shí)語料數(shù)據(jù)優(yōu)勢(shì)的搜狗,將語音識(shí)別與機(jī)器翻譯技術(shù)相結(jié)合,并在2016年推出了全球首款商用AI同傳系統(tǒng)-搜狗同傳,引領(lǐng)了語音翻譯技術(shù)的普及與應(yīng)用。通過數(shù)百場(chǎng)的國際會(huì)議“實(shí)戰(zhàn)”,搜狗同傳獲得了無數(shù)媒體和觀眾的好評(píng),成為當(dāng)下炙手可熱的“AI字幕君”。
與此同時(shí),搜狗也推出了一系列的智能硬件,將語音翻譯技術(shù)應(yīng)用到了更廣闊的場(chǎng)景之中,幫助用戶打破了跨國交流時(shí)的語言困境。2018年3月,搜狗推出了搜狗旅行翻譯寶,具備離線翻譯功能與拍照翻譯功能,讓馬化騰都為之心動(dòng),在朋友圈里大打廣告。作為首款智能翻譯硬件,它支持42種語言對(duì)話翻譯,解決了旅游場(chǎng)景中用戶聽不懂、看不懂、不會(huì)說等真實(shí)痛點(diǎn)。該項(xiàng)產(chǎn)品在京東平臺(tái)首發(fā)當(dāng)日即告售罄,首日銷售額破千萬。與此同時(shí),搜狗還推出了錄音翻譯筆,提供錄音轉(zhuǎn)寫、對(duì)話翻譯、同聲傳譯等功能,把AI同傳落地到了消費(fèi)級(jí)產(chǎn)品之中,開拓了語音翻譯的新航道。
眾所周知,人工智能是未來科技的風(fēng)向標(biāo)。通過這次在IWSLT比賽中的優(yōu)秀成績(jī),可以看到以搜狗為代表的國產(chǎn)科技巨頭企業(yè),已表現(xiàn)出了引領(lǐng)行業(yè)的技術(shù)硬實(shí)力。
申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!
2023年7月6日,第六屆世界人工智能大會(huì)(WAIC2023)在上海開幕,“人工智能大模型”是本屆大會(huì)的備受矚目的話題,據(jù)悉,在昇騰AI大模型的創(chuàng)新研發(fā)中,華為聯(lián)手26家行業(yè)領(lǐng)軍企業(yè),組建了一支協(xié)同創(chuàng)新的“AI明星隊(duì)”,云天勵(lì)飛作為中國人工智能企業(yè)的杰出代表,和互聯(lián)網(wǎng)大廠、運(yùn)營(yíng)商、科研院所等優(yōu)秀團(tuán)隊(duì)
這幾個(gè)月來,以ChatGPT為代表的生成式AI展現(xiàn)出的能力令世界驚嘆。自從2016年AlphaGo戰(zhàn)勝李世石掀起了一波AI浪潮后,AI仿佛已經(jīng)沉寂了很久,ChatGPT的橫空出世就如同一束耀眼的光芒,讓AI這個(gè)名詞重回C位。過去在AI1.0時(shí)代,主要通過訓(xùn)練模型來實(shí)現(xiàn)圖像識(shí)別、聲音識(shí)別、語言處理等特
文:互聯(lián)網(wǎng)江湖作者:志剛2023年的IoT需要一個(gè)新故事。6月29日,涂鴉智能在開發(fā)者大會(huì)上,發(fā)布了企業(yè)級(jí)戰(zhàn)略PaaS2.0,希望通過一個(gè)平臺(tái)+四大開發(fā)服務(wù),建立起IoT生態(tài)。對(duì)于這場(chǎng)發(fā)布會(huì),市場(chǎng)的態(tài)度是積極的。美東時(shí)間6月29日收盤,涂鴉智能美股股價(jià)上漲5.6%,來到1.87美元/股。近日股價(jià)穩(wěn)定
美團(tuán)曾經(jīng)的二號(hào)人物王慧文對(duì)標(biāo)OpenAI的創(chuàng)業(yè)項(xiàng)目光年之外,以20億賣給美團(tuán),再度引發(fā)市場(chǎng)對(duì)大模型的熱議。
2020年底,王慧文在朋友圈寫下這句話時(shí),外界本以為這位伴隨中國互聯(lián)網(wǎng)發(fā)展而持續(xù)創(chuàng)業(yè)20年的人物即將告別創(chuàng)業(yè)舞臺(tái)。但是,一個(gè)曾經(jīng)多次創(chuàng)業(yè),正值壯年的互聯(lián)網(wǎng)老將心中的創(chuàng)業(yè)熱情是難以熄滅的。
6月17日,阿里巴巴旗下智能信息平臺(tái)夸克App正式推出全新學(xué)習(xí)產(chǎn)品“夸克老師”——一款集講題、批作業(yè)、出題、找試卷于一體的AI家教。該功能依托通義千問大模型,通過指令微調(diào)、強(qiáng)化學(xué)習(xí)等前沿技術(shù),首次實(shí)現(xiàn)“因材施教”的個(gè)性化輔導(dǎo),標(biāo)志著AI在教育領(lǐng)域的應(yīng)用邁入新階段。技術(shù)突破:AI模擬真人教學(xué),推理能力
2025年6月17日,字節(jié)跳動(dòng)旗下智能助手豆包正式在電腦版及網(wǎng)頁端全量上線“AI播客”功能,用戶只需上傳PDF文檔或網(wǎng)頁鏈接,即可一鍵生成由兩位AI主播演繹的對(duì)話式播客節(jié)目。這一創(chuàng)新功能憑借高度擬人化的語音效果和秒級(jí)轉(zhuǎn)化效率,迅速引發(fā)內(nèi)容創(chuàng)作者、學(xué)生群體及職場(chǎng)人士的關(guān)注。技術(shù)突破:真人級(jí)語音交互,秒
我不是危言聳聽,現(xiàn)在全球的AI巨頭都在做MCP,毫不夸張的說:誰能把MCP做起來,誰就擁有AI生態(tài)控制權(quán),誰就是AI圈的老大。你們有沒有發(fā)現(xiàn),MCP在2025年初開始特別火爆,互聯(lián)網(wǎng)技術(shù)大廠都在強(qiáng)推MCP。(1)阿里云百煉搞了個(gè)MCP平臺(tái),提供50+預(yù)置MCP服務(wù)。不過大都只面向阿里系產(chǎn)品。(2)騰
2025國際人工智能程序設(shè)計(jì)精英挑戰(zhàn)賽(IAEPC)在香港中文大學(xué)成功舉辦。作為主辦方之一,歐美同學(xué)基金會(huì)理事長(zhǎng)李軍接受了大賽主持人艾誠采訪。在采訪中,李軍認(rèn)為IAEPC不僅是一場(chǎng)“冠軍中的冠軍”對(duì)決,更是一次全球AI人才的線下交流盛會(huì)。大賽“史無前例”的吸引了全球青年科技精英匯聚香港,更加推動(dòng)和普
2025國際人工智能程序設(shè)計(jì)精英挑戰(zhàn)賽(IAEPC)在香港中文大學(xué)成功舉辦。作為大賽發(fā)起人方之一及裁判委員會(huì)負(fù)責(zé)人,施韓原與杜瑜皓接受了大賽主持人艾誠采訪。裁判委員會(huì)主席施韓原分享了此次大賽的亮點(diǎn),IAEPC首次引入創(chuàng)新賽道,探索選手如何與AI合作進(jìn)行答題。裁判委員會(huì)副主席杜瑜皓認(rèn)為,選手最終目標(biāo)并
2025國際人工智能程序設(shè)計(jì)精英挑戰(zhàn)賽(IAEPC)在香港中文大學(xué)成功舉辦。來自深圳的學(xué)生吳林林作為主辦方記者團(tuán)成員,采訪了大賽冠軍選手之一。在吳林林的采訪中,選手認(rèn)為與來自全球的參賽者交流是自己學(xué)到的最重要的一課。在科技與AI之前,選手們可以平等、開放、友好的交流。以下是采訪實(shí)錄(有刪節(jié)):吳林林
2025國際人工智能程序設(shè)計(jì)精英挑戰(zhàn)賽(IAEPC)在香港中文大學(xué)成功舉辦。來自深圳的學(xué)生吳林林作為主辦方記者團(tuán)成員,采訪了大會(huì)嘉賓:全國政協(xié)委員、香港特別行政區(qū)立法會(huì)議員、香港中文大學(xué)工程學(xué)院副院長(zhǎng)、IAEPC聯(lián)合發(fā)起人黃錦輝先生。在吳林林的采訪中,黃錦輝教授勉勵(lì)年輕人要像懂中文和英語一樣懂AI,
昨天新出了一個(gè)AI,據(jù)說比DeepSeek還牛,而截止到今早,已經(jīng)有10萬人在排隊(duì)申請(qǐng)Manus邀請(qǐng)碼了,而且它邀請(qǐng)碼已經(jīng)炒到10萬了。這是北京的一家人工智能公司蝴蝶科技,創(chuàng)始人是一名來自華中科技大學(xué)的90后畢業(yè)生肖弘,突然向全球宣布:世界上第一款真正的人工智能、通用智能體產(chǎn)品出現(xiàn)了,名叫Manus
謠言肆虐,擦亮眼睛