你的位置:米兰体育官方网站 - MILAN > 关于米兰 > 米兰 能看懂、听懂!豆包Seed 2.0 Lite升级:首款全模态调治模子
发布日期:2026-05-07 04:06 点击次数:187

快科技5月6日音书,当天,火山引擎通知,Doubao-Seed-2.0-lite升级新版块,这是豆包大模子眷属首款全模态调治模子。
据先容,新版Doubao-Seed-2.0-lite撑执视频、图像、音频、文本的原生归并调治,Agent、Coding与GUI身手也同步升级,进一步面向复杂业务场景增强多模态推理身手。
在视觉调治方面,Doubao-Seed-2.0-lite无间大幅普及,在物理HiPhO、医疗MedXpertQA等高阶学科推理任务上,新版块推崇已大幅超过本年2月发布的Doubao-Seed-2.0-pro。
同期,该模子在细粒度感知BabyVision、WorldVQA,以及具身调治ERQA等要道鸿沟达到SOTA水平,更相宜企业在高价值场景中进行范围化部署。
加粗默示最优成果,下划线默示次优成果
伸开剩余60%这次升级的一大重心是融入语音调治身手,新版块可同期调治多种输入模态,并完成跨模态聚积推理,大要平直科罚那些必须“音画衔尾”身手判断的复杂业务需求。
举例在视频调治场景下,米兰体育官网Doubao-Seed-2.0-lite不错聚积分析视频画面与音频信息,精确判断视频中的视听一致性,也即是“看到的”和“听到的”是否匹配。
它还撑执说明当然谈话教导,在视频中精确定位特定事件发生的手艺点,并能跳跃多个手艺段索要要道痕迹,执续跟踪东说念主物与事件发展,基于画面进行多步逻辑推理,归附事件关连与行径眉目。
音频身手方面,新模子撑执19个语种的精确语音转写,以及中英文与其他14个语种互译。
此外,它还能捕捉语音中的心境变化、环境配景声与音乐细节,输出更竣工、更接近东说念主类瓦解的语义信息。
说明公开评测集,Doubao-Seed-2.0-lite在语音识别、翻译等多项音频调治基准上优于Gemini-3.1-Pro。
值得一提的是,Doubao-Seed-2.0-lite还深度适配OpenClaw、Hermes Agent等框架,强化深度搜索与Skill动态调用,可在践诺任务历程中执续千里淀教授,已毕“越用越聪惠”。
发布于:河南省球赛下注(中国)官方网站上一篇:米兰体育官网 5月6个星座直面情债纠葛,偿还完因缘当然隔离烂情烂东谈主
下一篇:没有了