每日經(jīng)濟(jì)新聞 2025-09-19 09:27:18
每經(jīng)AI快訊,據(jù)Xiaomi MiMo微信公眾號(hào)消息,9月19日,小米正式開(kāi)源首個(gè)原生端到端語(yǔ)音模型——Xiaomi-MiMo-Audio,它基于創(chuàng)新預(yù)訓(xùn)練架構(gòu)和上億小時(shí)訓(xùn)練數(shù)據(jù),首次在語(yǔ)音領(lǐng)域?qū)崿F(xiàn)基于ICL的少樣本泛化,并在預(yù)訓(xùn)練觀察到明顯的“涌現(xiàn)”行為。據(jù)介紹,在通用語(yǔ)音理解及對(duì)話(huà)等多項(xiàng)標(biāo)準(zhǔn)評(píng)測(cè)基準(zhǔn)中,MiMo-Audio大幅超越了同參數(shù)量的開(kāi)源模型,取得7B最佳性能;在音頻理解基準(zhǔn)MMAU的標(biāo)準(zhǔn)測(cè)試集上,MiMo-Audio超過(guò)Google閉源語(yǔ)音模型Gemini-2.5-Flash;在面向音頻復(fù)雜推理的基準(zhǔn)Big Bench Audio S2T任務(wù)中,MiMo-Audio同樣超越了OpenAI閉源的語(yǔ)音模型GPT-4o-Audio-Preview。
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線(xiàn):4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP