探讨背景:随着多模态、代码助手、各类Agent等AI技术发展,长序列上下文带来KVCache/记忆/知识容量剧增,HBM+DRAM的模式已经不足以支撑。业界通过引入SSD进行KVCache卸载,提升容量以提升命中率,极大地降低了TTFT,减少XPU开销,同时可支撑更长上下文。NVIDIA在2026年1月发布ICMS及BF4,引入DPU直通盘框+SSD盘作为G3.5层KVCache。华为存储将持续投入AI推理降本增效的研究,通过此调研,希望了解大家在AI场景存储的使用方式及痛点,打造性能强劲、生态兼容、易用的DPU直通盘框产品及最具性价比的KVCache方案。奖项设置:一等奖(1名):HUAWEI WATCH GT 6(14880智豆)二等奖(2名):HUAWEI FreeBuds 7i 贝母白(5990智豆)三等奖(3名):JDC周边电脑包(中号)(1290智豆)价值奖(20名):200-500智豆(200-500智豆)活动规则:1、为了保护各位的观点信息,所有回复均被设为仅自己可见。2、禁止小号参与活动,否则取消活动资格。3、回帖提交要求:重复帖、抄袭、AI作答帖、灌水帖及非研讨范围内的帖子无效。4、本次评奖规则由华为专家评审团进行评审。5、本次活动解释权归华为JDC社区所有。6、同意由管理员摘取回帖内容匿名共享在本社区,供社区用户学习。7、回复内容请勿涉及第三方非公开的信息。