2024年12月31日10点起,阿里云宣布对其通义千问视觉理解(Vision-Language, VL)大模型的部分规格进行新一轮的价格调整。这是阿里云大模型本年度的第三轮降价,旨在进一步降低用户使用成本,推动AI技术的广泛应用。此次降价中,通义千问视觉理解模型全线降价超过80%,特别是Qwen-VL-Plus和Qwen-VL-Max两款高性能模型,降价幅度尤为显著。
降价详情
- Qwen-VL-Plus:
- 原价:未公布具体原价
- 现价:每千tokens输入价格为0.0015元
- 降幅:81%
- 性价比:按照最新价格,1元可处理约600张720P图片或1700张480P图片,创下全网最低价格记录。
- Qwen-VL-Max:
- 原价:未公布具体原价
- 现价:每千tokens输入价格为0.003元
- 降幅:85%
- 性能优势:相比Qwen-VL-Plus,Qwen-VL-Max提供了更高的性能,适合对图像处理有更高要求的应用场景。
旗舰模型
旗舰模型 | 通义千问-Max适合复杂任务,推理能力最强 | 通义千问-Plus效果、速度、成本均衡 | 通义千问-Turbo 适合简单任务,速度快、成本低 | Qwen-Long 支持长达千万字文档,成本低 |
API调用模型名(稳定版本) | qwen-max | qwen-plus | qwen-turbo | qwen-long |
最大上下文长度(Token数) | 32,768 | 131,072 | 1,000,000 | 10,000,000 |
最低输入价格(每千Token) | 0.02元 | 0.0008元 | 0.0003元 | 0.0005元 |
最低输出价格(每千Token) | 0.06元 | 0.002元 | 0.0006元 | 0.002元 |
降价意义
此次降价不仅大幅降低了用户的使用成本,还使得更多企业和开发者能够负担得起高性能的视觉理解模型,从而加速AI技术在各个行业的应用。特别是对于中小企业和初创公司来说,更低的成本意味着更多的创新机会和更快的产品迭代。
应用场景
通义千问VL大模型广泛应用于多个领域,包括但不限于:
- 图像识别与分类:快速准确地识别和分类图像内容,适用于安防监控、医疗影像分析等场景。
- 视觉问答:结合自然语言处理技术,实现基于图像的问答系统,提升用户体验。
- 图像生成与编辑:通过AI生成高质量的图像或对现有图像进行智能编辑,满足创意设计和广告营销的需求。
- 多模态对话:支持文本和图像的多模态交互,提升智能客服和虚拟助手的能力。
用户反馈
阿里云表示,此次降价是基于用户反馈和技术进步的结果。通过不断优化模型性能和降低成本,阿里云希望为用户提供更加优质和经济的服务。未来,阿里云将继续致力于AI技术的研发和推广,推动行业的发展和创新。