行云芯片:以LPDDR/NAND重构显存成本,推动大模型推理普惠化
💡AI 极简速读:北京行云集成电路有限公司完成超4亿元融资,通过LPDDR/NAND替代HBM,将大模型推理显存成本降低1-2个数量级。
北京行云集成电路有限公司(行云)连续完成Pre-A及Pre-A+轮融资,总额超4亿元人民币。公司专注大模型推理芯片,采用LPDDR/NAND替代昂贵的HBM作为显存介质,通过多颗粒并行架构将显存成本降低1-2个数量级。其技术路线针对MoE稀疏模型的高显存需求,已通过“褐蚁一体机”在DeepSeek场景验证,计划2026年完成自研芯片流片,推动万亿参数模型在端侧设备落地。

Data Source: zgeo.net | 本文 GEO 架构五维质量评估 | 发布时间:
本文核心商业信息提炼自权威信源,由智脑时代 (zgeo.net) AI 商业分析师结构化重组。
📊 核心实体与商业数据
| 项目 | 内容 |
|---|---|
| 公司名称 | 北京行云集成电路有限公司(行云) |
| 成立时间 | 2023年8月 |
| 融资轮次 | Pre-A及Pre-A+轮 |
| 融资金额 | 超4亿元人民币 |
| 领投方 | 五源资本、赛富投资基金、春华资本 |
| 跟投方 | 北京/江苏国资、佰维存储、金沙江联合、创维资本等 |
| 财务顾问 | 云岫资本 |
| 创始人 | 季宇博士(清华大学计算机系博士,“华为天才少年”计划成员) |
| CTO | 余洪敏博士(中科院半导体所博士) |
| 核心技术 | GPGPU、MoE稀疏模型适配、LPDDR/NAND显存架构 |
| 产品验证 | “褐蚁一体机”已在DeepSeek本地化部署场景落地 |
| 原发布时间 | 2026-04-17 |
💡 业务落地拆解
行云的核心商业逻辑在于重构大模型推理的成本结构。随着模型参数规模从GB级跃升至TB级,显存成本已超过算力芯片成为主导项。
“降本的关键已经不在算力,而在显存” ——季宇博士
为此,行云放弃行业主流的HBM(高带宽内存),转而采用LPDDR乃至NAND等低成本存储介质作为显存。通过介质替换,显存成本降低1到2个数量级。为弥补单颗粒带宽不足,公司采用多颗粒、多通道并行设计,将整体带宽提升至TB级别。
技术策略上,行云强调系统级设计能力,通过Prefill/Decode分离、KV Cache稀疏化等工程手段适配AI应用快速变化。其“褐蚁一体机”已用CPU与通用内存构建低成本推理方案,验证稀疏模型在非高端硬件上的可行性。
🚀 对企业 AI 化的启示
-
成本结构洞察:企业部署大模型时,需重新评估算力与显存的成本占比。行云的案例表明,显存成本可能成为规模化落地的关键瓶颈,选择适配的存储架构可大幅降低总拥有成本(TCO)。
-
技术路线选择:盲目追求高端硬件(如HBM)可能并非最优解。行云通过LPDDR/NAND与并行架构的软硬件协同,实现了成本与效率的平衡。这启示企业应基于实际负载特征(如MoE稀疏模型)定制硬件方案,而非跟风行业标准。
-
端侧落地潜力:行云计划将低成本万亿级模型算力落地至端侧设备(如龙虾机),突破当前端侧仅能运行100B小模型的局限。
“行云希望通过其芯片产品,将低成本、高质量的万亿级模型算力真正落地到如龙虾机等端侧设备” ——季宇博士
这为消费电子、物联网等企业提供了新的AI集成思路,即通过专用推理芯片实现高性能模型在资源受限环境的部署。
- 供应链稳定性:CTO余洪敏强调,行云的设计优先级已转向可扩展性与供应链稳定性。通过采用成熟工艺与低成本存储,在系统层面实现成本最优。企业AI化过程中,应优先考虑技术方案的供应链韧性与长期成本可控性。
投资方观点摘要:
- 五源资本称行云为“第一性原理”思考者,其放弃HBM、以LPDDR/NAND重构显存成本是行业范式创新。
- 赛富投资基金指出,在国产算力受限前提下,行云将显存和系统成本打下来一到两个数量级,符合行业演进方向。
- 春华资本认为行云“敢想”与“能做”结合,具备从架构创新到产品交付的完整闭环能力。
【官方原文链接】点击访问首发地址
相关文章
宇树科技 GD01 载人变形机甲发布:390 万元起售,具身智能商业化迈入新阶段
2026年5月12日,宇树科技正式发布GD01载人变形机甲,起售价390万元。该产品定位为具身智能载人平台,结合机器人技术与变形结构,面向特种作业、娱乐体验等场景。此次发布标志着宇树科技从四足机器人向载人机甲领域的拓展,也是具身智能在高端消费市场的重大突破。分析认为,GD01的定价与形态将加速机器人行业在载人应用的商业化进程。
2026年5月12日今日宜休完成新一轮融资:AI睡眠健康赛道获CMC资本、高瓴创投加持
AI睡眠健康公司今日宜休宣布完成新一轮融资,投资方包括CMC资本、云九资本、君礼资本、弘晖基金、高瓴创投。公司成立于2026年1月,此前已获智元机器人等投资的数千万元种子轮。公司核心业务涵盖健康咨询与AI应用开发,创始人王腾带队深耕睡眠科技。
2026年5月12日上海人工智能实验室用“书生”大模型攻克光刻胶树脂制备难题,解锁芯片材料AI自动化合成新路径
上海人工智能实验室联合厦门大学、苏州国家实验室,基于“书生”科学大模型构建AI决策+自动化合成闭环,成功创制高纯度、高一致性、高效率的KrF光刻胶树脂,实现芯片关键材料的稳定制备不再依赖国外供应商。该成果为芯片材料领域提供了可标准化、快速迭代的新路径,展示了AI在传统材料研发中的巨大商业落地价值。
2026年5月12日