谁在闷头做中国的Mythos 速度暴涨4倍

2026-06-21 01:08:38 agent.csdn.net/6a30b91b662f9a5鼎古号11

核心提示：别再只盯着“AO”两家的新模型大战了！谷歌刚刚发布了一款名为DiffusionGemma的新模型，这款模型将生成图片的扩散模型应用到了文字生成上，并实现了4倍加速

别再只盯着“AO”两家的新模型大战了！谷歌刚刚发布了一款名为DiffusionGemma的新模型，这款模型将生成图片的扩散模型应用到了文字生成上，并实现了4倍加速。

DiffusionGemma抛弃了传统的自回归模式，即逐个token生成的方式，而是采用类似“印刷机”的工作方式。它一次铺开256个token的“画布”，从随机噪声出发，通过多轮去噪，使整段文字同时浮现。这种新模式在生成速度方面表现出色：单块H100上每秒可生成1000多个tokens，在消费级RTX 5090上也能达到700多个tokens，比同规格自回归模型快了4倍。此外，这个26B参数的MoE模型在推理时只需激活3.8B参数，量化后仅需18GB显存即可运行，一张4090显卡就能本地跑。

目前，DiffusionGemma采用了允许商用的Apache 2.0开源协议，权重可在Hugging Face直接下载。

DiffusionGemma的最大优势在于其生成速度。在同一块H100上（fp8，batch size=1），DiffusionGemma的速度达到了1000+ tokens/s，而标准自回归的Gemma 4 26B A4B加上MTP加速也只有300+ tokens/s，速度差距近4倍。

免责声明：以上所展示的信息由网友自行发布，内容的真实性、准确性和合法性由发布者负责。鼎古号对此不承担任何保证责任, 鼎古号仅提供信息存储空间服务。任何单位或个人如对以上内容有权利主张（包括但不限于侵犯著作权、商业信誉等），请与我们联系并出示相关证据，我们将按国家相关法规即时移除。

本文地址:http://www.wlchinahz.com/news/x109647.html

点赞 0收藏 0打赏 0

更多>同类资讯

狼人泉水
加关注0
~~没有留下签名~~~~

推荐图文

张展硕全国游泳冠军赛	地核反射地震波触发板
四大名著里的端午风情	侯明昊打败窦靖童杨坤

推荐资讯

点击排行

免责声明：本站所有信息均来自互联网搜集，产品相关信息的真实性准确性均由发布单位及个人负责，请大家仔细辨认！并不代表本站观点,鼎古号网对此不承担任何相关法律责任！如有信息侵犯了您的权益，请告知，本站将立刻删除。
友情提示：买产品需谨慎
网站处理与建议：wfmyw@qq.com

• 各地龙舟竞渡火热进行安全措施全面升级	• 韩国队末轮“打平即出线” 小组第二稳了
• “楚超”首位外籍主教练亮相塞尔维亚名帅首秀	• 马斯克获得3.04亿股特斯拉股票账面收益超千亿
• 郑州发布雷暴大风黄色预警阵风7级伴强降水	• 吃粽子也有最佳时间中午吃、趁热吃
• 张颂文见义勇为获表彰善举温暖人心	• 《玩具总动员5》票房破8000万上映两天佳绩
• 男童被推进鳄鱼池老板娘跳水施救英勇行为挽救	• 向司机退费1.2亿教训的不只是货拉拉平台整改树
• 南充小孩骑车划伤宝马追2条街认错诚实担当获车	• “赛考斯”受邀到驻美使馆过端午感恩中国再续
• 高校20万预算录取通知书项目终止政策调整导致	• 苏超端午开赛前上演非遗民俗秀各地文旅齐发力
• 民警履行承诺护送女孩中考还送包子温暖守护考	• C罗20年世界杯生涯有哪些变化从青涩少年到传奇
• 离岸人民币能在境内交易释放何信号推动外汇市	• 吴磊手持算盘亮相金爵奖颁奖典礼红毯戏中重要