手机浏览器扫描二维码访问
近日,阿里云宣布推出通义千问GPT-4级主力模型Qwen-Long,其API输入价格从0.02元千tokens降至0.0005元千tokens,直降97%。这意味着,1块钱可以买200万tokens,相当于5本《新华字典》的文字量。此消息一出,立即引发了业界的广泛关注和热议。
值得一提的是,本月智谱AI、字节跳动的大模型也都纷纷宣布降价。其中,字节的豆包主力模型的定价为0.0008元千Tokens,即0.8厘千tokens,被认为带动大模型定价进入了“厘时代”。
此轮大模型降价潮,是各家厂商希望进一步抢占市场,从而加速AI应用的商业化落地。
9款商业化及开源系列模型降价
Qwen-Long是通义千问的长文本增强版模型,性能对标GPT-4,上下文长度最高1千万。除了输入价格降至0.0005元千tokens,Qwen-Long输出价格也降90%至0.002元千tokens。相比之下,国内外厂商GPT-4、Gemini1.5Pro、Claude3Sonnet及Ernie-4.0每千tokens输入价格分别为0.22元、0.025元、0.022元及0.12元。
通义千问本次降价共覆盖9款商业化及开源系列模型。不久前发布的通义千问旗舰款大模型Qwen-Max,API输入价格降至0.04元千tokens,降幅为67%。
智谱AI、字节跳动旗下火山引擎也纷纷宣布了降价
5月11日,智谱AI大模型的新注册用户获得额度从500万tokens提升至2500万tokens,个人版GLM-3Turbo模型产品的调用价格从5元百万tokens降低至1元百万tokens。GLM-3TurboBatch批处理API也便宜了50%,价格为1元200万tokens。
15日,火山引擎宣布豆包Pro32k模型定价是0.8厘千tokens。此外,豆包Pro128k模型定价是5厘钱千tokens。
大模型已经开始从“卷大模型技术”向“卷大模型应用”转变
对于此轮降价潮,不少业内分析指出,大模型已经开始从“卷大模型技术”向“卷大模型应用”转变,但推理成本过高依然是制约大模型规模化应用的关键因素。
在武汉AI智领者峰会现场,阿里云智能集团资深副总裁、公共云事业部总裁刘伟光称:“阿里云这次大幅降低大模型推理价格,就是希望加速AI应用的爆发。我们预计2024年大模型API的日调用次数有望突破100亿。”
刘伟光判断,不管是开源模型还是商业化模型,公共云+API将成为企业使用大模型的主流方式。云上调用成本远对于私有云部署。在追求更大尺寸的模型时,企业要面对GPU采购、软件部署、网络费用、电费、人力成本等等。随着大模型的规模变大,对于私有化部署的成本和复杂性会越来越高。去年还有不少企业考虑购买上百台GPU服务器,来搭建计算网络集群。但今年很多公司已经放弃了自建百台集群的大模型研发。
百度创始人李彦宏也在业绩会表示,模型推理是最重要的长期机会之一,这将成为云业务的关键驱动力。4月,文心大模型API日调用量为2亿次。去年12月时,该数据为5000万次。
谁能抢抓模型推理的市场机遇?
谈及通义千问的这次降价幅度,多名大模型行业专家在接受《科创板日报》记者采访时评价,“力度很大”、“很便宜了”。
不过,实际作用还是要看“疗效”。市面上大模型太多了。疗效好,多少都不贵;如果疗效不好,多少都是贵。
目前头部企业都会选择多家模型接入,在不同应用场景选择更合适的模型,这意味大模型厂商之间的竞争十分激烈。
魂穿平行时空的八十年代,意外成为一名隐居深山的少年修士!为探寻修行之玄妙,混迹世俗历练红尘,以见证者的眼光,亲历者的心态,普通人的身份,一步步践行着‘小隐于野中隐于市大隐于朝’,最后成为逍遥人间的真隐士!...
榊原乐,家住东京新宿区神田川居民区。拥有一个声优妹妹,一个系统。然而身为家中长子的他,早已在年幼时父亲跑路的情况下,练就了人生永远只能靠自己的思想钢印。现在,系统居然要自己靠好吃懒做的妹妹过活嗟来之食!(关键字恋爱日常东京双子系统)...
恭喜你激活了游戏。在这个游戏中,身为仙子云养道侣的你,只要仙子在游戏中对你各种云养,又或者对你有什么要求,你都会获得相对应的能力,修为,天材地宝等等,请尽情的享受你的乐趣吧。修仙家族大小姐正在考虑是否云养你。穿越后的林默,看着面前的游戏光幕陷入了沉思。在林默陷入沉思的时候,另外一边,修仙界的...
开局穿越到鬼怪横行的世界?...
陆天是鲨鱼直播平台的一名小主播。在这一年多的直播时长中积累了小百名老粉丝。这天直播间被老水友要求帮忙登录csgo开箱后,第二天他的脑中传来一阵电子语音。叮检测到宿主叮检测到宿主职业是主播叮幸运直播系统绑定成功!叮幸运直播系统可大幅度提升宿主在游戏中的抽奖概率叮观众们的打赏金额同步作为积分...
重回过去,姚远一心一意只想浪啊呸,只想冲浪!...