8月21日消息,百度蒸汽机(MuseSteamer)音视频一体化模型今日完成2.0版本升级,在行业内首次实现多人有声视频一体化生成。
其Turbo版、Lite版、Pro版及全系有声版现已全面开放,用户可通过百度搜索“百度蒸汽机”或登录“绘想”平台体验,企业用户可在千帆平台享受高性能视频生成服务。
从官方获悉,2.0版本基于多模态时空规划、中文场景深度优化以及音视端到端建模等领先的技术能力,实现多人音视频一体化生成、复杂运镜、电影级的人物细腻表演、丰富镜头表现和流畅画质等。
而在8月19日,百度发布声明称,近期海外出现大量关于视频生成模型——百度蒸汽机(MuseSteamer)的虚假网站,紧急提示用户注意甄别,谨防受骗。
上一篇: OpenAI头号叛徒,竟然是自学的AI?
下一篇: 最后一页
2025-08-13
Migician:清华大学等团队出的解决复杂场景下的多图像目标定位问题的多模态模型
2025-03-11
MILS:Meta发布的无需训练就能让LLM获得多模态能力的方法
2025-03-28
2025-04-14
Gemini 2.5 Pro与Gemini 2.5相比较,有哪些提升?
2025-04-29
Google最出圈的 AI 产品,把OpenAI CEO也惊艳了
2025-07-14
AI又一突破,谷歌推出“咳嗽模型”HeAR,一声咳嗽,告知你的身体健康
2025-07-19
AI重塑:微软宣布为Edge浏览器引入Copilot模式,实现自动化搜索、预测、整合
2025-08-02
2025-08-25
2025-02-24