清华90后创业者季宇发布“褐蚁”一体机,挑战AI算力市场

2025-05-01 12:30:20来源:ITbear编辑:时寒峰

扫一扫

分享文章到微信

扫一扫

关注鹿财经网微信公众号

  原标题:清华90后创业者季宇发布“褐蚁”一体机,挑战AI算力市场

  近日,北京行云集成电路有限公司(简称“行云集成电路”)在AI领域引发了广泛关注。这家由清华90后创立的公司,宣布推出了一款名为“褐蚁”的全新一体机产品,旨在以最高15万元的价格,提供满血版DeepSeek R1/V3大模型的运行能力,同时实现了20token/s的对话速度。

  行云集成电路的创始人兼CEO季宇,在接受采访时透露,“褐蚁”一体机已经成功支持了阿里最新发布的Qwen3系列开源大模型,包括其顶配版Qwen3-235B-A22B。季宇本人是清华大学物理系本科及计算机体系结构方向博士,并曾荣获“华为天才少年”称号,拥有丰富的AI芯片研发经验。

  “褐蚁”一体机提供了三款不同配置,其中最高性价比的“超大杯”版本HY90,搭载了双路AMD EPYC 9355服务器、24条48G 6400M内存和NV 5090D计算卡。在FP8数据精度下,它能够以21token/s的速度运行满血版DS,而在INT4精度下则能达到28token/s,并支持最高128K的上下文处理,售价仅为14.9万元。行云集成电路还计划推出“大杯”HY70和“中杯”HY50两个配置版本。

  季宇团队通过独家优化推理引擎,显著提升了推理效率,使得“褐蚁”成为国内首个在10万元价位提供满血FP8精度模型、速率超过20tps的一体机产品。该产品还支持配置各类调用大模型API的应用,为用户提供了极大的便利。

  行云集成电路成立于2023年8月,其核心团队汇集了来自清华大学及全球顶尖芯片公司的精英。公司致力于研发下一代针对大模型推理场景的高效能GPU芯片,以推动AI技术的进一步发展。除了季宇外,公司CTO余洪敏也是核心团队的重要成员。

  季宇在华为期间曾负责多个昇腾编译器项目,并在AI编译器领域和处理器微架构领域取得了诸多突破性成果。他的加入无疑为行云集成电路注入了强大的技术实力。2024年11月,行云集成电路宣布完成了总额数亿元的天使轮及天使+轮融资,吸引了多家知名投资机构的参与。

  随着AI技术的快速发展,一体机产品在市场上逐渐崭露头角。相比复杂的云计算解决方案,一体机具有部署简单、项目落地周期快、私有化安全性高、价格更具性价比等优势。然而,一体机也面临着持续维护、升级以及大规模数据调度等挑战。随着大模型的快速演进,一体机的硬件和技术能力也需要不断更新和升级。

  尽管面临诸多挑战,季宇对“褐蚁”一体机的未来充满信心。他表示,该产品目前仍能支持超大杯的MoE模型和30b当量的dense模型,后续模型迭代并不会对其造成太大影响。相比其他一体机产品,“褐蚁”在显存、KTransformers等层面拥有更多的技术研发能力。

  展望未来,行云集成电路计划自研GPU卡,以进一步降低成本并提高tps体验。同时,公司还将实施由30台“褐蚁”一体机组成的“蚁群”方案,以发挥分布式系统优化能力,支持500-1000的有效并发数,并将价格降至300万-400万元之间,低于英伟达HGX H200集群的整体硬件成本。

  随着国内AI算力行业的快速发展,越来越多的人投身于一体机、AI Infra以及GPU服务器等算力“卖水人”的工作。然而,随着推理模型技术的迅猛进步,大规模算力投入也引发了诸多质疑。未来,国内AI算力行业是否会经历大浪淘沙,最终仅剩下大厂及头部的几家企业,还是会有更多人继续“卷”性价比,这仍然是一个值得观察的问题。

     投稿邮箱:lukejiwang@163.com   详情访问鹿财经网:http://www.lucaijing.com.cn

相关推荐
苹果AI滞后之谜:2023年内部决策引发争议 苹果AI滞后之谜:2023年内部决策引发争议

原标题:苹果AI滞后之谜:2023年内部决策引发争议 近期,《纽约时报》发表了

科技说2025-04-13

苹果AI落后原因曝光!2023年关键决策失误 苹果AI落后原因曝光!2023年关键决策失误

原标题:苹果AI落后原因曝光!2023年关键决策失误 4月12日消息,据媒体报道,

科技说2025-04-12

谷歌DeepMind付薪留才:AI员工离职后一年不得为竞 谷歌DeepMind付薪留才:AI员工离职后一年不得为竞

原标题:谷歌DeepMind付薪留才:AI员工离职后一年不得为竞品工作? 在人工智能

科技说2025-04-08

嫦娥七号预计2026年前后发射!第一台月球打砖机 嫦娥七号预计2026年前后发射!第一台月球打砖机

原标题:嫦娥七号预计2026年前后发射!第一台月球打砖机器正研制中 4月1日消

科技说2025-04-01

华为清华联手发布语言模型推理专利,助力AI精准 华为清华联手发布语言模型推理专利,助力AI精准

原标题:华为清华联手发布语言模型推理专利,助力AI精准避雷预设内容 近期,

科技说2025-03-25

DeepSeek“服务器繁忙,请稍后再试”解决了! DeepSeek“服务器繁忙,请稍后再试”解决了!

原标题:DeepSeek服务器繁忙,请稍后再试解决了! 2月24日消息,大家有没有发现

科技说2025-02-24

iPhone16e亮相:苹果廉价机背后的市场扩张与自研 iPhone16e亮相:苹果廉价机背后的市场扩张与自研

原标题:iPhone16e亮相:苹果廉价机背后的市场扩张与自研芯片野心 苹果公司在

科技说2025-02-21

马斯克:Grok 3进入最后开发阶段 表现优于所知任 马斯克:Grok 3进入最后开发阶段 表现优于所知任

原标题:马斯克:Grok 3进入最后开发阶段 表现优于所知任何产品 2月13日消息,

科技说2025-02-13

空客推迟氢动力商用飞机研发计划:技术发展比 空客推迟氢动力商用飞机研发计划:技术发展比

原标题:空客推迟氢动力商用飞机研发计划:技术发展比目标落后5到10年 2月

科技说2025-02-09

华为之后第二家!荣耀手机接入DeepSeek-R1:升级系 华为之后第二家!荣耀手机接入DeepSeek-R1:升级系

原标题:华为之后第二家!荣耀手机接入DeepSeek-R1:升级系统即可体验 2月8日消

科技说2025-02-08