AI快訊蘇曉 2026-05-08 11:12:54 來(lái)源:中房網(wǎng)
??中房網(wǎng)訊 5月5日,谷歌發(fā)布博文表示,為Gemma 4系列AI模型推出多Token預(yù)測(cè)(MTP)起草器,利用推測(cè)解碼架構(gòu),推理速度最高可提升3倍。
??據(jù)悉,谷歌曾表示,目前標(biāo)準(zhǔn)大語(yǔ)言模型推理通常受限于內(nèi)存帶寬,導(dǎo)致嚴(yán)重的延遲瓶頸。處理器需耗費(fèi)大量時(shí)間將數(shù)十億參數(shù)從顯存?zhèn)鬏斨劣?jì)算單元,造成了計(jì)算資源的利用率不足。而為了解決這個(gè)核心痛點(diǎn),谷歌為Gemma 4系列大模型引入推測(cè)解碼技術(shù),配對(duì)重型目標(biāo)模型(如 Gemma 4 31B)與輕量級(jí)起草器(MTP 模型)。
??起草器利用閑置算力,在短時(shí)間內(nèi)預(yù)測(cè)多個(gè)未來(lái) Token,目標(biāo)模型隨后并行驗(yàn)證這些令牌。若預(yù)測(cè)通過(guò),模型可在單次前向傳遞中確認(rèn)整個(gè)序列,大幅縮短生成時(shí)間。
2026-05-08
更多
- 10:43
- 10:28
- 10:18
- 10:15
- 10:12
- 09:56
- 09:46
- 09:10
- 08:56
- 08:55
- 08:54
- 08:52
- 08:51
- 08:49
- 08:46
- 08:01
- 07:58
- 07:10
- 07:05
- 07:00
- 2026-05-07 11:54:31
中國(guó)城市住房?jī)r(jià)格288指數(shù)
(2023-02)1571.9點(diǎn)
- 0.13%

- -0.91%

| 日期 | 指數(shù) | 環(huán)比 | 同比 |
|---|---|---|---|
| 2023.01 | 1569.9 | -0.97% | -0.14% |
| 2022.12 | 1572.1 | -0.92% | -0.11% |
| 2022.11 | 1573.9 | -0.12% | -1.08% |
| 2022.10 | 1575.8 | -0.20% | -1.01% |
| 2022.09 | 1579.0 | -0.02% | -0.87% |
| 2022.08 | 1579.3 | -0.04% | -0.62% |
- 1谷歌正內(nèi)測(cè)全新AI智能體“Remy”
- 2Anthropic承諾5年內(nèi)斥資2000億美元購(gòu)買谷歌云服務(wù)和芯片
- 3工信部:研究制定寵物用家電、特殊人群用服務(wù)機(jī)器人等新產(chǎn)品標(biāo)準(zhǔn)
- 4為贏下 AI“供電競(jìng)賽”,微軟或?qū)R置2030年清潔能源承諾
- 5美國(guó)考慮對(duì)新型AI模型實(shí)施更嚴(yán)格監(jiān)管
- 6物理AI初創(chuàng)企業(yè)ARI被Meta收購(gòu)
- 7AI芯片企業(yè)Cerebras計(jì)劃IPO,預(yù)估至少籌集32.2億美元
- 8消息稱Anthropic看上英國(guó)企業(yè)Fractile推理芯片
- 9OpenAI總裁稱今年算力支出預(yù)計(jì)達(dá)500億美元
- 102025年我國(guó)用于人工智能訓(xùn)練和推理的數(shù)據(jù)總量同比增長(zhǎng)逾四成