<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
    <channel>
        <title>AI芯片 on KnightLi的博客</title>
        <link>https://knightli.com/tags/ai%E8%8A%AF%E7%89%87/</link>
        <description>Recent content in AI芯片 on KnightLi的博客</description>
        <generator>Hugo -- gohugo.io</generator>
        <language>zh-cn</language>
        <lastBuildDate>Mon, 18 May 2026 00:19:51 +0800</lastBuildDate><atom:link href="https://knightli.com/tags/ai%E8%8A%AF%E7%89%87/index.xml" rel="self" type="application/rss+xml" /><item>
        <title>Cerebras IPO 大涨背后：晶圆级 AI 芯片能挑战英伟达吗</title>
        <link>https://knightli.com/2026/05/18/cerebras-ipo-wafer-scale-ai-chip/</link>
        <pubDate>Mon, 18 May 2026 00:19:51 +0800</pubDate>
        
        <guid>https://knightli.com/2026/05/18/cerebras-ipo-wafer-scale-ai-chip/</guid>
        <description>&lt;p&gt;Cerebras Systems 终于登上了公开市场。&lt;/p&gt;
&lt;p&gt;这家以“晶圆级 AI 芯片”闻名的公司，于 2026 年 5 月 14 日在纳斯达克挂牌交易，股票代码为 &lt;code&gt;CBRS&lt;/code&gt;。根据 Cerebras 官方公告，其 IPO 发行价为每股 185 美元，公开发行 3450 万股 Class A 普通股，其中包括承销商全额行使的 450 万股超额配售权。&lt;/p&gt;
&lt;p&gt;上市首日，Cerebras 股价大幅高开，一度接近 386 美元。按发行价计算，公司融资规模超过 55 亿美元，是 2026 年以来美国市场最受关注的 AI 硬件 IPO 之一。&lt;/p&gt;
&lt;p&gt;这也是为什么它会被很多媒体称为“英伟达挑战者”。不过，把 Cerebras 简单理解成“下一个英伟达”并不准确。它真正特殊的地方，是选择了一条和传统 GPU 完全不同的技术路线。&lt;/p&gt;
&lt;h2 id=&#34;cerebras-做的不是普通-gpu&#34;&gt;Cerebras 做的不是普通 GPU
&lt;/h2&gt;&lt;p&gt;Cerebras 的核心产品是 WSE，完整名称是 Wafer-Scale Engine，中文通常可以理解为“晶圆级引擎”。&lt;/p&gt;
&lt;p&gt;传统芯片制造会把一整片晶圆切割成许多小芯片，再进行封装、测试和出货。Cerebras 反过来做：它尽可能把整片晶圆直接做成一颗超大芯片。&lt;/p&gt;
&lt;p&gt;这条路线的好处很直观：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;芯片面积更大。&lt;/li&gt;
&lt;li&gt;片上计算单元更多。&lt;/li&gt;
&lt;li&gt;片上 SRAM 更接近计算核心。&lt;/li&gt;
&lt;li&gt;数据在芯片内部移动距离更短。&lt;/li&gt;
&lt;li&gt;更适合特定 AI 推理和训练负载。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;在 AI 计算里，数据搬运往往比单纯计算更难优化。Cerebras 的思路是尽量把计算和存储留在同一片硅上，减少数据频繁离开芯片带来的延迟和能耗。&lt;/p&gt;
&lt;p&gt;这也是 WSE 路线最吸引人的地方：它不是沿着 GPU 的老路继续堆规模，而是试图用更大的单颗芯片，换取更高的片上带宽和更低的数据移动成本。&lt;/p&gt;
&lt;h2 id=&#34;为什么市场会兴奋&#34;&gt;为什么市场会兴奋
&lt;/h2&gt;&lt;p&gt;AI 芯片市场目前高度依赖英伟达。无论是训练大模型、部署推理服务，还是建设 AI 数据中心，英伟达 GPU 都是最主流的选择。&lt;/p&gt;
&lt;p&gt;这让市场天然会关注两类公司：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;能否降低对英伟达供应链依赖。&lt;/li&gt;
&lt;li&gt;能否在某些 AI 工作负载上提供更高性能或更低成本。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;Cerebras 正好踩中了这两个叙事。&lt;/p&gt;
&lt;p&gt;它不是做通用 CPU，也不是做普通加速卡，而是直接围绕 AI 训练和推理设计系统。公司也一直强调，其晶圆级芯片和云端推理平台在某些模型推理场景中可以提供极高吞吐。&lt;/p&gt;
&lt;p&gt;这类故事在 2026 年非常容易被市场放大。AI 基础设施仍在扩张，企业、云厂商和模型公司都在寻找更多算力来源。只要一家芯片公司能证明自己在某些场景里不是“又一个小 GPU”，市场就会愿意给它很高关注度。&lt;/p&gt;
&lt;h2 id=&#34;openai-合作让想象空间变大&#34;&gt;OpenAI 合作让想象空间变大
&lt;/h2&gt;&lt;p&gt;Cerebras 被关注的另一个原因，是它和 OpenAI 的关系。&lt;/p&gt;
&lt;p&gt;据媒体报道，Cerebras 与 OpenAI 签订了金额超过 200 亿美元的合作协议。搜狐原文提到，截至 2025 年底，这一协议带来的剩余履约义务达到 246 亿美元。&lt;/p&gt;
&lt;p&gt;对一家刚上市的 AI 硬件公司来说，这类长期协议非常重要。它意味着公司不只是有技术故事，还有大客户需求作为支撑。&lt;/p&gt;
&lt;p&gt;不过，长期订单和最终收入之间并不能直接画等号。AI 数据中心建设还受制于制造产能、封装、供电、交付节奏、客户预算和模型路线变化。尤其是芯片公司，拿到订单只是第一步，能否按期交付、能否稳定扩产、能否把毛利率做出来，才是更难的部分。&lt;/p&gt;
&lt;h2 id=&#34;客户集中仍然是最大风险之一&#34;&gt;客户集中仍然是最大风险之一
&lt;/h2&gt;&lt;p&gt;Cerebras 的风险也很明显：客户集中度高。&lt;/p&gt;
&lt;p&gt;搜狐原文提到，G42 曾在 2024 年贡献 Cerebras 85% 的收入，2025 年降至 24%；阿联酋穆罕默德·本·扎耶德人工智能大学则在 2025 年贡献了 62% 的收入。这意味着，即便 G42 占比下降，公司收入仍然高度依赖少数大客户。&lt;/p&gt;
&lt;p&gt;对 AI 基础设施公司来说，客户集中有两面性。&lt;/p&gt;
&lt;p&gt;好处是：大客户能带来快速增长、长期合同和订单可见性。&lt;/p&gt;
&lt;p&gt;风险是：如果客户削减预算、改变技术路线、延后数据中心建设，或者监管环境发生变化，公司收入波动会非常大。&lt;/p&gt;
&lt;p&gt;这也是市场看 Cerebras 时不能只看 IPO 涨幅的原因。上市首日股价反映的是热度和预期，长期估值最终还是要看收入结构、交付能力、利润率和客户多元化。&lt;/p&gt;
&lt;h2 id=&#34;技术路线的短板内存容量&#34;&gt;技术路线的短板：内存容量
&lt;/h2&gt;&lt;p&gt;WSE 的优势很突出，但短板也同样清楚。&lt;/p&gt;
&lt;p&gt;搜狐原文提到，WSE-3 芯片配备 44GB SRAM，而英伟达 B200 配备 192GB 内存。Cerebras 的设计把大量计算和 SRAM 放在同一片晶圆上，这能减少数据移动，但也限制了可用内存容量。&lt;/p&gt;
&lt;p&gt;对大模型来说，内存容量直接影响上下文长度、批处理规模和模型部署方式。上下文窗口越来越长，旗舰模型已经普遍朝百万级 token 上下文发展。在这种趋势下，片上 SRAM 的容量限制会成为现实约束。&lt;/p&gt;
&lt;p&gt;传统 GPU 可以通过 HBM 堆叠、封装扩展和多卡互联继续增加内存容量。Cerebras 的晶圆级路线则更难简单扩内存，因为整片晶圆面积已经被计算单元和 SRAM 占用。想增加 SRAM，就可能牺牲计算面积。&lt;/p&gt;
&lt;p&gt;这不代表 Cerebras 技术路线失败，而是说明它更像一种面向特定工作负载的架构选择。它可能在某些推理场景非常强，但未必能覆盖所有 AI 训练和推理需求。&lt;/p&gt;
&lt;h2 id=&#34;它会取代英伟达吗&#34;&gt;它会取代英伟达吗
&lt;/h2&gt;&lt;p&gt;短期内，Cerebras 不太可能取代英伟达。&lt;/p&gt;
&lt;p&gt;英伟达的优势不只是 GPU 性能，还包括 CUDA 生态、开发者工具、系统集成、网络互联、整机方案、云厂商支持和客户迁移成本。AI 公司选择英伟达，很多时候不是因为单颗芯片某个指标最好，而是因为整套生态最稳。&lt;/p&gt;
&lt;p&gt;Cerebras 更现实的机会，是在特定 AI 负载上成为补充方案：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;高吞吐推理。&lt;/li&gt;
&lt;li&gt;特定大模型服务。&lt;/li&gt;
&lt;li&gt;对延迟和片上带宽敏感的任务。&lt;/li&gt;
&lt;li&gt;想降低单一 GPU 供应链依赖的客户。&lt;/li&gt;
&lt;li&gt;愿意为性能试用新架构的大模型公司。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;也就是说，它不是“英伟达杀手”，更像是 AI 算力市场里一条激进的替代路线。&lt;/p&gt;
&lt;h2 id=&#34;小结&#34;&gt;小结
&lt;/h2&gt;&lt;p&gt;Cerebras IPO 大涨，说明资本市场仍然愿意为 AI 基础设施故事付出高溢价。&lt;/p&gt;
&lt;p&gt;它的晶圆级芯片路线确实有独特性，也让它和普通 AI 加速卡公司区分开来。再加上 OpenAI 等大客户合作，Cerebras 有了足够强的市场想象空间。&lt;/p&gt;
&lt;p&gt;但风险同样不能忽视：客户集中、交付压力、内存容量限制、生态壁垒，以及和英伟达竞争时的系统级差距，都会决定它能走多远。&lt;/p&gt;
&lt;p&gt;对普通读者来说，Cerebras 最值得关注的不是股价涨了多少，而是它证明了一件事：AI 算力竞争不会只有 GPU 一条路。未来的大模型基础设施，可能会同时容纳 GPU、晶圆级芯片、自研加速器和云端专用推理平台。&lt;/p&gt;
&lt;h2 id=&#34;参考资料&#34;&gt;参考资料
&lt;/h2&gt;&lt;ul&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://m.sohu.com/a/1023919457_163726?scm=10001.325_13-325_13.0.0-0-0-0-0.5_1334&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;搜狐：英伟达挑战者！AI芯片“黑马”Cerebras上市大涨51%&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://www.cerebras.ai/press-release/cerebras-systems-announces-closing-of-initial-public-offering&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;Cerebras Systems Announces Closing of Initial Public Offering&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://techcrunch.com/2026/05/14/cerebras-raises-5-5b-kicking-off-2026s-ipo-season-with-a-bang/&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;TechCrunch: Cerebras raises $5.5B in IPO&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://www.nasdaq.com/newsroom/cerebras-ipo-ushering-new-era-ai-hardware&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;Nasdaq: Cerebras IPO&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
</description>
        </item>
        <item>
        <title>美国放行英伟达 H200：10 家中国企业获批，但交付仍有变数</title>
        <link>https://knightli.com/2026/05/16/nvidia-h200-china-export-license-approved/</link>
        <pubDate>Sat, 16 May 2026 17:12:09 +0800</pubDate>
        
        <guid>https://knightli.com/2026/05/16/nvidia-h200-china-export-license-approved/</guid>
        <description>&lt;p&gt;美国对英伟达 H200 的对华出口许可终于出现实质进展。&lt;/p&gt;
&lt;p&gt;据路透社相关报道，美国商务部已批准约 10 家中国企业购买英伟达 H200 AI 芯片。获批名单覆盖互联网大厂和供应链企业，包括阿里巴巴、腾讯、字节跳动、京东、联想、富士康等。不过截至 2026 年 5 月 14 日，H200 仍未在中国市场完成实际交付。&lt;/p&gt;
&lt;p&gt;这件事需要分开看：美国侧已经给出部分许可，但这不等于芯片已经到货，也不等于中国企业马上可以大规模部署。&lt;/p&gt;
&lt;h2 id=&#34;这次批准了什么&#34;&gt;这次批准了什么
&lt;/h2&gt;&lt;p&gt;这次许可的核心信息有三点。&lt;/p&gt;
&lt;p&gt;第一，美国商务部批准约 10 家中国企业购买 H200。按报道说法，获批客户既可以直接向英伟达采购，也可以通过授权中间商或分销商购买。&lt;/p&gt;
&lt;p&gt;第二，每家获批客户最多可购买约 7.5 万颗 H200。这个数量如果全部落地，对大型云厂商和大模型公司来说，会明显改善高端 GPU 供给。&lt;/p&gt;
&lt;p&gt;第三，联想已确认自己是获得英伟达出口许可、获准在中国销售 H200 的几家公司之一。联想和富士康这类企业的角色，不只是采购方，也可能承担服务器整机、机架系统、集成和分销环节。&lt;/p&gt;
&lt;p&gt;但最关键的一点是：许可不等于交付。公开报道强调，目前尚未有 H200 完成对华交付。&lt;/p&gt;
&lt;h2 id=&#34;h200-为什么重要&#34;&gt;H200 为什么重要
&lt;/h2&gt;&lt;p&gt;H200 属于英伟达 Hopper 世代加速卡，定位高于此前面向中国市场的 H20。H20 是为了适配早期出口限制而降规格的产品，H200 则拥有更强的算力和显存能力。&lt;/p&gt;
&lt;p&gt;从公开资料看，H200 配备 141GB HBM3e 显存，在大模型训练、推理、长上下文服务、企业级 AI 部署等场景中都有明显价值。它不是英伟达最新的 Blackwell 世代产品，但对中国云厂商和 AI 公司来说，依然是高端算力资源。&lt;/p&gt;
&lt;p&gt;这也是为什么 H200 一直处在中美 AI 芯片管制的敏感位置。美国希望限制中国获得最先进 AI 算力，同时又不想让英伟达彻底失去中国市场；中国则希望降低对美国 GPU 的依赖，把算力投资更多导向国产芯片和本土生态。&lt;/p&gt;
&lt;h2 id=&#34;还没有真正落地&#34;&gt;还没有真正落地
&lt;/h2&gt;&lt;p&gt;这次消息最容易被误读的地方，是把“获批购买”理解成“已经放开供应”。&lt;/p&gt;
&lt;p&gt;从目前公开信息看，至少还有几层变量：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;美国许可只是第一步，具体订单、审核、出货和合规流程仍要继续走。&lt;/li&gt;
&lt;li&gt;中国侧是否允许企业实际进口和部署，仍需要政策层面的明确指导。&lt;/li&gt;
&lt;li&gt;获批企业是否会立刻下单，也取决于价格、交期、国产替代方案和长期政策风险。&lt;/li&gt;
&lt;li&gt;英伟达 H200 产能需要重新协调，因为公司原本已经把重心转向 Blackwell 和后续产品。&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;这意味着 H200 对华销售现在更像是“许可窗口打开”，而不是“货已经开始大规模进入中国机房”。&lt;/p&gt;
&lt;h2 id=&#34;对英伟达意味着什么&#34;&gt;对英伟达意味着什么
&lt;/h2&gt;&lt;p&gt;对英伟达来说，中国市场仍然太重要。&lt;/p&gt;
&lt;p&gt;在出口限制收紧后，英伟达在中国高端 AI 加速卡市场的份额已经明显受损。黄仁勋此前多次强调，不应轻易放弃中国市场，因为这既会影响英伟达收入，也可能削弱美国技术生态在全球 AI 开发者中的影响力。&lt;/p&gt;
&lt;p&gt;如果 H200 最终可以交付，英伟达至少能部分恢复中国客户订单，也能让 CUDA 生态继续留在中国大模型和云计算工作流里。&lt;/p&gt;
&lt;p&gt;但这笔生意不会回到过去那种无障碍状态。许可、配额、收入分成、第三方验证、再出口限制、客户身份审查，都可能成为长期成本。对英伟达来说，H200 不是简单卖货，而是在政策夹缝中维持市场存在感。&lt;/p&gt;
&lt;h2 id=&#34;对中国企业意味着什么&#34;&gt;对中国企业意味着什么
&lt;/h2&gt;&lt;p&gt;对中国企业来说，H200 是短期算力补给，但不是长期确定性答案。&lt;/p&gt;
&lt;p&gt;如果获批企业能够实际拿到 H200，大模型训练、推理服务、AI 云、智能体平台、企业私有化部署都会受益。尤其是已经深度依赖 CUDA 工具链的团队，使用 H200 的迁移成本远低于切换到全新硬件生态。&lt;/p&gt;
&lt;p&gt;但政策不确定性会让企业更谨慎。今天能买 H200，不代表明年还能稳定采购；能买一批，不代表能形成长期扩容路径。大厂即使购买，也会继续推进国产 GPU、异构算力、推理优化和模型压缩，避免再次被单一供应链卡住。&lt;/p&gt;
&lt;p&gt;所以 H200 对中国 AI 企业更像是缓冲垫，而不是彻底解决方案。&lt;/p&gt;
&lt;h2 id=&#34;国产芯片压力不会消失&#34;&gt;国产芯片压力不会消失
&lt;/h2&gt;&lt;p&gt;美国放行 H200，并不意味着国产 AI 芯片压力变小。相反，这可能让竞争更直接。&lt;/p&gt;
&lt;p&gt;如果 H200 真正进入中国市场，国产芯片厂商会面对更强的性能和生态参照。客户会把训练稳定性、推理吞吐、显存容量、软件工具链、集群通信、运维成本拿来对比。&lt;/p&gt;
&lt;p&gt;但国产芯片也有自己的机会。只要高端 GPU 进口仍受政策影响，企业就不会把长期算力底座完全押在英伟达身上。国产方案只要能在特定场景中做到成本可控、供应稳定、软件可用，就仍有空间。&lt;/p&gt;
&lt;p&gt;更现实的格局可能是：高端训练和关键推理继续争取 H200 这类英伟达资源，规模化推理、政企项目和可控供应链场景更多转向国产或混合算力。&lt;/p&gt;
&lt;h2 id=&#34;这件事应该怎么看&#34;&gt;这件事应该怎么看
&lt;/h2&gt;&lt;p&gt;这次 H200 获批，最准确的理解是：中美 AI 芯片博弈出现阶段性松动，但远没有回到完全开放。&lt;/p&gt;
&lt;p&gt;美国给了许可，是为了在管制和商业利益之间重新找平衡。英伟达想借 H200 重返中国高端 AI 芯片市场。中国企业想获得更强算力，但也必须评估进口不确定性和国产替代战略。&lt;/p&gt;
&lt;p&gt;真正值得关注的不是“美国放不放行”这一个动作，而是后续三件事：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;第一批 H200 是否能实际交付到中国客户手里。&lt;/li&gt;
&lt;li&gt;获批企业是否会公开采购规模和部署场景。&lt;/li&gt;
&lt;li&gt;中国侧是否会给出更明确的进口、采购和使用指引。&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;在这些问题落地前，H200 对中国市场仍然是一个被打开的窗口，而不是一条已经恢复畅通的供应链。&lt;/p&gt;
&lt;h2 id=&#34;参考资料&#34;&gt;参考资料
&lt;/h2&gt;&lt;ul&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://finance.sina.com.cn/roll/2026-05-14/doc-inhxwktz9953925.shtml&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;新浪财经：美国批准约10家中企采购英伟达H200&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://www.pcgamer.com/hardware/the-us-has-approved-the-sale-of-nvidia-h200-chips-to-10-chinese-firms-but-sources-say-theyre-still-waiting-for-the-go-ahead-from-china-itself/&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;PC Gamer: The US has approved the sale of Nvidia H200 chips to 10 Chinese firms&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://www.tomshardware.com/tech-industry/nvidia-has-received-pos-from-chinese-customers&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;Tom&amp;rsquo;s Hardware: Jensen says Nvidia has received orders from Chinese customers for H200 GPUs&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://www.axios.com/2026/03/17/nvidia-huang-china-h200&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;Axios: Nvidia restarting production for H200 chips for sales in China&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
</description>
        </item>
        
    </channel>
</rss>
