豆包发布会亮点一览:豆包视觉理解模型正式发布,比行业价格低85%
发布日期:2024-12-19 点击次数:136
12月18日在火山引擎FORCE大会上,字节跳动正式发布豆包视觉推理大模型,并宣布进入“厘时代”,价格降至0.003元/千token,比行业价格低85%,一块钱能够处理284张图片。
豆包大模型日均tokens使用量超过4万亿,发布7个月以来增长超过33倍。
豆包还发布全新图片生成模型,首次实现了准确的中文文字生成。更强模型推动企业AI升级,赛力斯的豆包模型使用量提升1400倍。
豆包视觉推理大模型,比行业价格低85%火山引擎总裁谭待表示,豆包视觉推理大模型进入“厘时代”,价格降至0.003元/千token,比行业价格低85%,一块钱能够处理284张图片。
豆包大模型使用量7个月增长33倍豆包大模型日均tokens使用量超过4万亿,发布7个月以来增长超过33倍,在多个应用场景加速渗透。
据火山引擎总裁谭待介绍,豆包视觉理解模型不仅能精准识别视觉内容,还具备出色的理解和推理能力,可根据图像信息进行复杂的逻辑计算,完成分析图表、处理代码、解答学科问题等任务。此外,该模型有着细腻的视觉描述和创作能力。
此前,豆包视觉理解模型已经接入豆包App和PC端产品。豆包战略研究负责人周昊表示:“豆包一直在努力,让用户的输入更快更方便”。为此,豆包产品非常注重多模态的输入和打磨,包括语音、视觉等能力,这些模型都已通过火山引擎开放给企业客户。
豆包发布全新图片生成模型,首次实现准确的中文文字生成即梦AI产品经理李超发布了全新的图片生成模型,他现场示范了海报生成功能,只需要一句话,就可以生成海报,并且首次实现了准确的中文文字生成。
不仅提高了效率,还能让创作出设计师水准的海报,更全面的描述,更精美的画面与排版,同时,还可以让海报动起来,tp钱包实现动态效果。
更长视频生成能力的大模型将于明年春季推出大会还正式宣告,2025年春季将推出具备更长视频生成能力的豆包视频生成模型1.5版,豆包端到端实时语音模型也将很快上线,从而解锁多角色演绎、方言转换等新能力。
谭待表示,豆包大模型虽然发布较晚,但一直在快速迭代进化,目前已成为国内最全面、技术最领先的大模型之一。
豆包大模型多款产品也迎来重要更新:豆包通用模型pro已全面对齐GPT-4o,使用价格仅为后者的1/8;音乐模型从生成60秒的简单结构,升级到生成3分钟的完整作品。
豆包3D生成模型首次亮相。该模型与火山引擎数字孪生平台veOmniverse结合使用,可以高效完成智能训练、数据合成和数字资产制作,成为一套支持 AIGC 创作的物理世界仿真模拟器。
大模型应用加速落地 赛力斯的豆包模型调用量提升1400倍据悉,豆包大模型已经与八成主流汽车品牌合作,并接入到多家手机、PC等智能终端,覆盖终端设备约3亿台,来自智能终端的豆包大模型调用量在半年时间内增长100倍,其中赛力斯汽车的模型调用量提升1400倍。
与企业生产力相关的场景,豆包大模型也获得了众多企业客户青睐:最近3个月,豆包大模型在信息处理场景的调用量增长了39倍,客服与销售场景增长16倍,硬件终端场景增长13倍,AI工具场景增长9倍,学习教育等场景也有大幅增长。
谭待认为,豆包大模型市场份额的爆发,得益于火山引擎“更强模型、更低成本、更易落地”的发展理念,让AI成为每一家企业都能用得起、用得好的普惠科技。
在公布豆包视觉理解模型超低定价的同时,火山引擎升级了火山方舟、扣子和 HiAgent 三款平台产品,帮助企业构建好自身的 AI 能力中心,高效开发 AI 应用。其中,火山方舟发布了大模型记忆方案,并推出 prefix cache 和 session cache API,降低延迟和成本。火山方舟还带来全域 AI 搜索,具备场景化搜索推荐一体化、企业私域信息整合等服务。
豆包大模型记忆方案升级升级后的豆包大模型能够实现超大规模亿级记忆片段,具备更快的相应速度和更低的使用成本。
风险提示及免责条款 市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。