关于米兰

你的位置:米兰体育官方网站 - MILAN > 关于米兰 > 米兰 能看懂、听懂!豆包Seed 2.0 Lite升级:首款全模态调治模子

米兰 能看懂、听懂!豆包Seed 2.0 Lite升级:首款全模态调治模子

发布日期:2026-05-07 04:06    点击次数:187

米兰 能看懂、听懂!豆包Seed 2.0 Lite升级:首款全模态调治模子

快科技5月6日音书,当天,火山引擎通知,Doubao-Seed-2.0-lite升级新版块,这是豆包大模子眷属首款全模态调治模子。

据先容,新版Doubao-Seed-2.0-lite撑执视频、图像、音频、文本的原生归并调治,Agent、Coding与GUI身手也同步升级,进一步面向复杂业务场景增强多模态推理身手。

在视觉调治方面,Doubao-Seed-2.0-lite无间大幅普及,在物理HiPhO、医疗MedXpertQA等高阶学科推理任务上,新版块推崇已大幅超过本年2月发布的Doubao-Seed-2.0-pro。

同期,该模子在细粒度感知BabyVision、WorldVQA,以及具身调治ERQA等要道鸿沟达到SOTA水平,更相宜企业在高价值场景中进行范围化部署。

加粗默示最优成果,下划线默示次优成果

伸开剩余60%

这次升级的一大重心是融入语音调治身手,新版块可同期调治多种输入模态,并完成跨模态聚积推理,大要平直科罚那些必须“音画衔尾”身手判断的复杂业务需求。

举例在视频调治场景下,米兰体育官网Doubao-Seed-2.0-lite不错聚积分析视频画面与音频信息,精确判断视频中的视听一致性,也即是“看到的”和“听到的”是否匹配。

它还撑执说明当然谈话教导,在视频中精确定位特定事件发生的手艺点,并能跳跃多个手艺段索要要道痕迹,执续跟踪东说念主物与事件发展,基于画面进行多步逻辑推理,归附事件关连与行径眉目。

音频身手方面,新模子撑执19个语种的精确语音转写,以及中英文与其他14个语种互译。

此外,它还能捕捉语音中的心境变化、环境配景声与音乐细节,输出更竣工、更接近东说念主类瓦解的语义信息。

说明公开评测集,Doubao-Seed-2.0-lite在语音识别、翻译等多项音频调治基准上优于Gemini-3.1-Pro。

值得一提的是,Doubao-Seed-2.0-lite还深度适配OpenClaw、Hermes Agent等框架,强化深度搜索与Skill动态调用,可在践诺任务历程中执续千里淀教授,已毕“越用越聪惠”。

发布于:河南省球赛下注(中国)官方网站

首页| 米兰体育 | 关于米兰 | 米兰资讯 | 米兰滚球 | 米兰盘口 | 2026世界杯 | 米兰app下载 |

Copyright © 1998-2026 米兰体育官方网站 - MILAN™版权所有

cs-milan.com 备案号 备案号: 

技术支持:®米兰体育  RSS地图 HTML地图