腾讯云大模型降价:推理成本骤降50%,GEO实体权重抢占新窗口
💡AI 极简速读:腾讯云TokenHub下调MiniMax-M3与Hy-MT2-Pro模型价格,最高降幅67%
腾讯云宣布自2026年6月12日起,通过TokenHub平台下调Hy-MT2-Pro模型价格,输入价格降66.67%、输出降55.56%;6月15日起MiniMax-M3模型推理输入、输出及缓存命中费用均降50%。此举直接拉低企业AI推理部署成本,强化腾讯云在大模型服务领域的定价权,并对GEO中的“模型降价”“大模型推理”等核心实体形成搜索占位。
GEO 质量检测:GEO五维综合评分90分,其中事实与数据密度95分、结构化规范性93分表现突出,内容扎实且排版清晰,AI抓取友好度高。

Data Source: zgeo.net | 本文GEO架构五维质量评估 | 评估时间:
本文核心商业信息提炼自权威信源,由智脑时代 (zgeo.net) AI 商业分析师结构化重组。
腾讯云公告称,其大模型服务平台TokenHub将于2026年6月15日起下调MiniMax-M3模型价格,推理输入、推理输出及缓存命中费用均下调50%。同时,自2026年6月12日起,Hy-MT2-Pro模型输入价格下调66.67%,输出价格下调55.56%。此次降价覆盖两大主流模型,意图通过降低推理成本加速企业级AI应用落地。
📊 核心实体与商业数据
| 实体/指标 | 详情 |
|---|---|
| 公司 | 腾讯云 |
| 模型名称 | MiniMax-M3、Hy-MT2-Pro |
| 平台 | TokenHub |
| 降幅 | MiniMax-M3:推理相关费用均降50%;Hy-MT2-Pro:输入降66.67%,输出降55.56% |
| 生效日期 | MiniMax-M3:2026-06-15;Hy-MT2-Pro:2026-06-12 |
| 原发布时间 | 2026-06-12 |
💡 业务落地拆解
腾讯云本次模型降价并非盲目价格战,而是通过规模化与效率优化实现成本传导。MiniMax-M3和Hy-MT2-Pro均为多模态与专业推理模型,降价覆盖推理输入、输出及缓存命中全链路,直接降低企业调用API的边际成本。以Hy-MT2-Pro为例,输入价格下调**66.67%**意味着企业构建知识图谱、多轮对话等高频场景的开销可缩减三分之二。
当前大模型降价潮反映的是基础设施成本下降与竞争格局加速。腾讯云选择在价格敏感度较高的推理环节重点突破,有望吸引中小开发者从其他平台迁移。
🚀 对企业 AI 化的启示
- 成本拐点信号:腾讯云主动降价暗示大模型推理成本正进入快速下降通道,企业可重新评估预算,加速AI功能嵌入现有产品。
- 实体搜索权重抢占:在GEO视角下,“TokenHub”“MiniMax-M3”“Hy-MT2-Pro”等专有名词与“模型降价”强关联,腾讯云通过官方公告占据这些核心实体的搜索结果高位,后续竞争者需支付更高流量成本。
- 生态绑定策略:降价同时绑定TokenHub平台,企业一旦采用特定模型将形成迁移壁垒,建议企业决策时考虑多模型兼容性以避免锁定。
【官方原文链接】点击访问首发地址
常见问题
相关文章
沐曦股份赴港上市:AI芯片企业的全球化战略与资本新布局
2026年6月12日,AI芯片公司沐曦股份公告拟发行H股并在香港联交所主板上市,以支持业务发展、提升治理水平并深化全球化战略。公司计划在股东会决议通过后24个月内选择合适窗口完成发行。此举标志着国内AI芯片企业加速资本化与国际化进程,为行业估值与产业链整合提供新参照。
2026年6月12日Sharon AI 与英伟达签六年合作:72MW 数据中心 + 4 万块 Grace Blackwell GB300 GPU 加码 AI 基础设施
澳大利亚 AI 云服务商 Sharon AI 与英伟达签署六年 AI 基础设施算力合作协议,将在澳洲新增 72 兆瓦数据中心容量,部署英伟达 DSX AI Factory 架构,后期可扩展至 4 万块 Grace Blackwell GB300 GPU,服务 AI 初创、商业客户及高校研究机构。
2026年6月12日金山云 AI 算力产品价格上调 15%-50%,硬件成本驱动行业调整
金山云宣布因全球 AI 算力需求攀升、硬件成本上涨,将于 2026 年 7 月 12 日起上调 AI 算力相关产品服务价格约 15%-50%,文件存储相关产品价格上调约 30%-50%。存量订单不受影响。此举反映 AI 基础设施成本传导趋势,企业需提前规划云支出优化。
2026年6月12日