唠唠资讯2025年10月01日 22:49消息,豆包大模型1.6-vision发布,首个支持调用工具的视觉深度思考模型,开启AI新纪元。
10月1日获悉,火山引擎昨日正式发布豆包大模型1.6-vision,这是豆包大模型系列中首款具备工具调用功能的视觉深度思考模型。该模型在通用多模态理解和推理能力方面表现更优,并支持ResponsesAPI,以更高的性价比更好地满足用户在视觉理解精度方面的进阶需求。
据官方介绍,豆包大模型1.6-vision通过其独特的工具调用能力,将图像信息融入其思维链中,实现对图片的定位、裁剪、选择、绘制线条、缩放和旋转等精细化操作。同时,它模拟人类“从整体观察到局部分析”的视觉推理过程,在提升推理过程可解释性的同时,能够高效且准确地完成各类图像处理任务。
与上一代Doubao-1.5-thinking-vision-pro相比,豆包大模型1.6-vision的综合成本下降了约50%。在用户最常使用的32K输入输出场景下,成本由原来的5.25元降至2.6元。
注意到,今年6月,火山引擎推出了豆包大模型1.6版本,该版本通过增强多模态思考能力,进一步提升了对复杂场景的理解与处理能力。这一技术升级表明,企业在人工智能领域的持续投入正在转化为更强大的实际应用能力,尤其在多模态数据处理方面展现出明显进步。随着技术的不断演进,类似的产品有望在更多行业场景中发挥关键作用,推动智能化进程。