AI快訊蘇曉 2026-04-24 10:24:01 來(lái)源:中房網(wǎng)
??中房網(wǎng)訊 4月24日,小米正式發(fā)布MiMo-V2.5-TTS Series與MiMo-V2.5-ASR 語(yǔ)音大模型。這是 一套面向Agent時(shí)代的全鏈路語(yǔ)音模型系列,覆蓋識(shí)別與合成兩大核心能力,讓語(yǔ)音的輸入與輸出都可以被語(yǔ)言自由調(diào)度。
??其中,TTS系列包含三款模型,均支持通過(guò)自然語(yǔ)言指令精細(xì)調(diào)度聲音表現(xiàn)。MiMo-V2.5-TTS:內(nèi)置多款精品音色,開(kāi)箱即用,支持語(yǔ)速、情緒控制。MiMo-V2.5-TTS-VoiceDesign:支持一句話從零生成全新音色,無(wú)需參考音頻。MiMo-V2.5-TTS-VoiceClone:數(shù)秒?yún)⒖家纛l即可高保真復(fù)刻目標(biāo)音色,并保留原有風(fēng)格指令控制能力。官方演示顯示,模型能遵循“尖銳刻薄、狐假虎威”等復(fù)雜指令,并支持在文本中插入音頻標(biāo)簽進(jìn)行精細(xì)化控制。
??作為聽(tīng)覺(jué)基座,MiMo-V2.5-ASR也正式開(kāi)源(包括模型權(quán)重與代碼)。該模型面向復(fù)雜真實(shí)場(chǎng)景,支持吳語(yǔ)、粵語(yǔ)等中文方言,以及中英文混說(shuō)、強(qiáng)噪音、多人對(duì)話等場(chǎng)景,并原生輸出標(biāo)點(diǎn)符號(hào),轉(zhuǎn)寫結(jié)果即拿即用。
- 09:34
- 09:29
- 09:15
- 09:12
- 09:10
索菲亞2025年業(yè)績(jī)跳水,現(xiàn)金流首現(xiàn)負(fù)值,多地頻發(fā)質(zhì)量問(wèn)題
- 09:08
- 08:37
農(nóng)業(yè)農(nóng)村部:探索閑置農(nóng)戶住房通過(guò)出租、入股、合作等方式盤活利用的有效實(shí)現(xiàn)形式
- 08:36
- 08:30
- 2026-04-23 18:25:51
深耕產(chǎn)業(yè)鏈?zhǔn)遢d 中房?jī)?yōu)采憑120余項(xiàng)專業(yè)成果構(gòu)筑房建供應(yīng)鏈“專業(yè)縱深”
- 2026-04-23 11:24:38
- 2026-04-23 10:24:54
中國(guó)城市住房?jī)r(jià)格288指數(shù)
(2023-02)1571.9點(diǎn)
- 0.13%

- -0.91%

| 日期 | 指數(shù) | 環(huán)比 | 同比 |
|---|---|---|---|
| 2023.01 | 1569.9 | -0.97% | -0.14% |
| 2022.12 | 1572.1 | -0.92% | -0.11% |
| 2022.11 | 1573.9 | -0.12% | -1.08% |
| 2022.10 | 1575.8 | -0.20% | -1.01% |
| 2022.09 | 1579.0 | -0.02% | -0.87% |
| 2022.08 | 1579.3 | -0.04% | -0.62% |
- 1消息稱OpenAI擬15億美元投資一合資企業(yè)
- 2谷歌發(fā)布Gemini 3.1 Pro深度研究智能體
- 3DeepSeek API更新百萬(wàn)Token上下文
- 4內(nèi)蒙古實(shí)施“人工智能+”行動(dòng)
- 5福布斯發(fā)布2026年AI 50榜單
- 6OpenAI發(fā)布ChatGPT Images 2.0生圖工具
- 7英國(guó)議會(huì)調(diào)查低能耗計(jì)算能否遏制AI電力需求激增
- 8亞馬遜與Anthropic深化合作,投至多250億美元鎖定千億美元算力采購(gòu)
- 9OpenAI Codex推出Chronicle功能
- 10英偉達(dá)黃仁勛:AI普及速度創(chuàng)歷史之最