产业地图 · Industry Map
AI 近内存计算
MEMORY-CENTRIC AI INFERENCE
HBCPIM / PNM3DIMCCUDA MOAT
参考系 · The Frame
把 AI 近内存计算摊成一张技术地层图,你才看得见:真正卡住的是内存带宽与封装产能,短期把钱收走的却仍是 GPU+CUDA 生态。卡点在底层,利润池在既有平台,二者并不重合。
地图 · The Map
这张图最要命的错位:内存与封装层卡住了 token 产能,但钱短期仍沉在 GPU+CUDA 这个成熟平台里。HBC / 3DIMC 真正要打的,不是某颗芯片,而是这段距离。
基准率 · Base Rates
HBM 供给卡口
3 家
这意味着内存墙不是抽象问题,而是被 SK hynix、Samsung、Micron 三家供给节奏卡住。
HBC Gen1 公开基线
133TB/s
这意味着 Qualcomm 把赌注押在带宽/瓦,而不是峰值算力;但 2027 前仍是采样窗口。
CUDA 生态惯性
4M+
这意味着硬件赢 benchmark 不够,还要让开发者和模型服务栈愿意迁移。
三个大问题 · Three Big Questions
①
HBC / 3DIMC 能不能把 memory-wall 从 HBM 供给问题,改写成 near-memory 量产问题?
②
利润会不会从 GPU+CUDA 平台,迁到更低 tokens/watt 的推理专用机架,还是继续被 CUDA 生态锁住?
③
LLM 架构会继续被 decode bandwidth 主导,还是被新模型结构带回 compute-bound,让这条路线优势缩水?
印李继刚