火山发动机部队会议现场。
搜狐科技出品
作者|张莹
编辑|杨进
继大型语言模型的价格以分计算后,视觉理解模型也宣告进入了“分时代”。
在12月18日举行的火山引擎大会上,字节跳动正式发布了豆宝视觉理解模型。
同时,火山引擎总裁谭岱在会上透露了豆宝视觉理解模型的定价——一千个代币的投入价格仅为3%,1元可以处理284 720P图片。
与claude 3.5 Sonnet的0.021元/千代币、qwen-vl-max的0.02元/千代币、GPT-4o的0.0175元/千代币相比,豆宝视觉理解模型比行业价格便宜85%。
谭代介绍,豆宝视觉理解模型不仅能够准确识别视觉内容,而且具有出色的理解和推理能力。它可以根据图像信息进行复杂的逻辑计算,完成分析图表、处理代码、回答学科问题等任务。此外,该模型还具有详细的视觉描述和创意能力。
5月,字节跳动豆宝大模型正式发布。其主力型号在企业市场定价为0.0008元/千Token。能以0.8分钱处理1500多个汉字,比业界便宜99.3%。大型型号的价格从几美分到几美分不等。
随后,阿里云也宣布阿里云旗下9款商用和开源系列机型宣布降价。百度智能云宣布,文信模型旗下两款主力模型ENIRE Speed和ENIRE Lite完全免费。 2024年云栖大会期间,阿里云宣布统一千文三款主力机型再次降价,最高降幅达到90%。
谭代曾在9月接受采访时提到,“我认为这不是价格战,而是当每个人都想构建应用程序时,成本必须是一个合理的价格。现在每个人都做到了。”
在本次大会上,豆袋3D生成模型首次亮相。豆宝大模型产品也获得重要更新:豆宝通用模型pro已全面对接GPT-4o,价格仅为后者的1/8;音乐模型从60秒生成简单结构升级为生成3分钟结构。完整的作品;文胜图模型2.1版本在业界率先实现了精准生成汉字和一句话P图的产品化能力。该模型已接入极萌AI、豆宝App。
数据显示,截至12月中旬,豆宝通用模型日均代币使用量已超过4万亿,较7个月前首次发布时增长了33倍。
本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://mjgaz.cn/fenxiang/273497.html