<delect id="qw2ji"></delect>

<dl id="qw2ji"></dl>

首發(fā)快訊

每經(jīng)網(wǎng)首頁(yè) > 首發(fā)快訊 > 正文

小米開(kāi)源首個(gè)原生端到端語(yǔ)音大模型

每日經(jīng)濟(jì)新聞 2025-09-19 09:27:18

每經(jīng)AI快訊，據(jù)Xiaomi MiMo微信公眾號(hào)消息，9月19日，小米正式開(kāi)源首個(gè)原生端到端語(yǔ)音模型——Xiaomi-MiMo-Audio，它基于創(chuàng)新預(yù)訓(xùn)練架構(gòu)和上億小時(shí)訓(xùn)練數(shù)據(jù)，首次在語(yǔ)音領(lǐng)域?qū)崿F(xiàn)基于ICL的少樣本泛化，并在預(yù)訓(xùn)練觀察到明顯的“涌現(xiàn)”行為。據(jù)介紹，在通用語(yǔ)音理解及對(duì)話(huà)等多項(xiàng)標(biāo)準(zhǔn)評(píng)測(cè)基準(zhǔn)中，MiMo-Audio大幅超越了同參數(shù)量的開(kāi)源模型，取得7B最佳性能；在音頻理解基準(zhǔn)MMAU的標(biāo)準(zhǔn)測(cè)試集上，MiMo-Audio超過(guò)Google閉源語(yǔ)音模型Gemini-2.5-Flash；在面向音頻復(fù)雜推理的基準(zhǔn)Big Bench Audio S2T任務(wù)中，MiMo-Audio同樣超越了OpenAI閉源的語(yǔ)音模型GPT-4o-Audio-Preview。

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán)，嚴(yán)禁轉(zhuǎn)載或鏡像，違者必究。

讀者熱線(xiàn)：4008890008

特別提醒：如果我們使用了您的圖片，請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

模型開(kāi)源小米大模型

上一篇文章

9月19日A股三大指數(shù)開(kāi)盤(pán)漲跌不一，上證指數(shù)開(kāi)盤(pán)下跌0.03%，創(chuàng)業(yè)板指上漲0.08%

返回每經(jīng)網(wǎng)首頁(yè)

下一篇文章

云南臨滄市耿馬縣發(fā)生3.6級(jí)地震震源深度10千米

相關(guān)文章