微软自研AI三件套落地 豪言到2027年自主打造大型尖端模型(转载)财联社4月3日讯(编辑 史正丞)美国科技公司微软周四宣布,3款内部开发的AI模型正式推出广泛商用,展示该公司试图摆脱依赖长期合作伙伴OpenAI的努力。具体来说,微软AI超级智能团队开发的MAI-Transcribe-1、MAI-Voice-1和MAI-Image-2三款模型,涵盖了企业AI中最具商业价值的3项能力——语音转录、语音生成和图像创建。(微软首席执行官纳德拉宣布这项更新,来源:X)微软表示,MAI-Transcribe-1是市面上最常用转录模型中准确率最高的。在涵盖所有语言的测试中,其平均错误率为3.9%。而OpenAI的GPT-Transcribe错误率为4.2%,Gemini 3.1 Flash为4.9%。MAI-Voice-1语音生成模型据称可以在“单块GPU”上实现不到一秒内生成60秒音频,并能在长内容生成中保持语音的一致性。MAI-Image-2最早发布于3月19日,周四也跟着另外两款模型一同实现广泛商用。目前该模型在“大模型竞技场”的文生图排名中位居第三,仅次于谷歌爆品Nano Banana 2和OpenAI的GPT-Image 1.5。横向对比价格,MAI-Image-2的文本输入起步价格为每100万词元(tokens)5美元,图像输出为每100万词元33美元起。谷歌的Gemini 3 Pro图像生成模型为每100万词元120美元,Gemini 3.1 Flash图像为每100万词元60美元。目标:自主开发世界前沿大模型微软的最新举措源自于去年10月,当时公司与OpenAI重组了合作关系,允许微软单独或与第三方合作伙伴一起追求通用人工智能的权利。此前的协议虽然允许微软使用OpenAI知识产权,但同时也禁止其开发竞争性的人工智能系统。微软AI首席执行官穆斯塔法·苏莱曼公开表示,该团队到2027年的目标是“能够真正达到最先进水平”,涵盖能够响应或生成文本、图像和音频的模型。苏莱曼介绍称,公司正在构建训练模型所需的算力,并从去年10月开始部署英伟达GB200芯片。他说:“从那时开始,我们将在接下来的大约12到18个月内逐步提升,达到前沿规模的计算能力。”作为谷歌DeepMind的联合创始人,苏莱曼于2024年加入微软,负责将人工智能融入其消费产品。去年10月微软与OpenAI敲定协议后,苏莱曼于去年11月全职接手领导微软AI超级智能团队。在上个月的内部重组中,苏莱曼的职责被缩小为模型开发,前Snap高管雅各布·安德里欧接手微软面向企业和个人用户的Copilot助手产品。苏莱曼对媒体表示:“我们想强调的是,在未来三到五年推进自身最先进AI能力、实现长期自主这一战略使命的重要性。”他同时补充称,公司也会继续托管其他公司开发的模型。从长期角度来看,微软对OpenAI的知识产权的深度访问权限将在2032年到期,因此发展自研大模型也是重要的风险对冲。刚刚起步的微软自研模型业务也存在相当多的短板,足以见得苏莱曼的团队未来一年会有很多工作需要完成。举例而言,MAI-Image-2目前仅支持1:1纵横比,不提供横向或竖向选项,其他AI应用中常见的图像到图像编辑、参考图像支持均不存在。MAI-Transcribe-1无法区分对话中的不同发言者,也不支持上下文偏置和流式传输,微软表示这三项功能都在开发中。来源https://tech.ifeng.com/c/8s0UpfnPMExhyperCDP与CDP的区别HyperCDP是基于高密度快照的准连续保护技术,对性能影响较小,提供秒级恢复点。 CDP是基于日志的连续数据保护技术,可实现任意时间点恢复,但对系统性能有一定开销。 并非全系列存储都支持HyperCDP。NAS核心应用场景及选择存储有奖探讨探讨背景:目前随着技术发展,不同行业NAS核心场景各不相同,业务发展越来越多,对于运NAS存储的要求越来越迫切,我们期望通过本次探讨了解您的看法,请畅所欲言,不吝赐教。奖项设置:一等奖(1名):HUAWEI WATCH GT 6(14880智豆)二等奖(2名):HUAWEI FreeBuds 7i 贝母白(5990智豆)三等奖(3名):JDC周边电脑包(中号)(1290智豆)价值奖(20名):200-500智豆(200-500智豆)活动时间:活动时间:2026年03月18日至2026年04月01日活动规则:1、为了保护各位的观点信息,所有回复均被设为仅自己可见。2、禁止小号参与活动,否则取消活动资格。3、回帖提交要求:重复帖、抄袭、AI作答帖、灌水帖及非研讨范围内的帖子无效。4、本次评奖规则由华为专家评审团进行评审。5、本次活动解释权归华为JDC社区所有。6、同意由管理员摘取回帖内容匿名共享在本社区,供社区用户学习。7、回复内容请勿涉及第三方非公开的信息。入门级存储新场景和新需求有奖探讨探讨背景:作为企业数据中心核心基础设施的企业存储至关重要。本次探讨希望了解:您关注入门级存储的哪些能力?您对入门级存储未来的演进方向有哪些建议?有什么新兴场景?业界有什么先进经验可以学习?奖项设置:一等奖(1名):HUAWEI WATCH GT 6(14880智豆)二等奖(2名):HUAWEI FreeBuds 7i 贝母白(5990智豆)三等奖(3名):JDC周边电脑包(中号)(1290智豆)价值奖(20名):200-500智豆(200-500智豆)活动时间:活动时间:2026年03月16日至2026年03月30日活动规则:1、为了保护各位的观点信息,所有回复均被设为仅自己可见。2、禁止小号参与活动,否则取消活动资格。3、回帖提交要求:重复帖、抄袭、AI作答帖、灌水帖及非研讨范围内的帖子无效。4、本次评奖规则由华为专家评审团进行评审。5、本次活动解释权归华为JDC社区所有。6、同意由管理员摘取回帖内容匿名共享在本社区,供社区用户学习。7、回复内容请勿涉及第三方非公开的信息。 本帖最后由user_3315577于2026-03-16 09:31:57编辑企业内虚拟化场景SDN能力使用情况有奖探讨探讨背景:随着互联网技术的快速发展,网络规模和复杂性不断增加,传统网络架构已难以满足日益增长的业务需求。软件定义网络(Software-Defined Networking,简称SDN)作为一种新兴的网络架构,通过将网络设备的控制面与数据面分离,实现了网络的集中控制和灵活配置,为网络管理带来了革命性的变化。目前,SDN技术在数据中心、云计算、物联网等领域已得到广泛应用,但其在实际部署过程中仍面临诸多挑战,如性能瓶颈、安全性问题、标准化进程等。此外,随着5G、边缘计算等新兴技术的崛起,SDN技术也需要不断演进以适应新的应用场景。奖项设置:一等奖(1名):HUAWEI WATCH GT 6(14880智豆)二等奖(2名):HUAWEI FreeBuds 7i 贝母白(5990智豆)三等奖(3名):JDC周边电脑包(中号)(1290智豆)价值奖(20名):200-500智豆(200-500智豆)活动时间:活动时间:2026年03月12日至2026年03月26日活动规则:1、为了保护各位的观点信息,所有回复均被设为仅自己可见。2、禁止小号参与活动,否则取消活动资格。3、回帖提交要求:重复帖、抄袭、AI作答帖、灌水帖及非研讨范围内的帖子无效。4、本次评奖规则由华为专家评审团进行评审。5、本次活动解释权归华为JDC社区所有。6、同意由管理员摘取回帖内容匿名共享在本社区,供社区用户学习。7、回复内容请勿涉及第三方非公开的信息。顶级模型得分低于1%:ARC-AGI-3全新人机较量,揭开智能体真实水平顶级模型得分低于1%:ARC-AGI-3全新人机较量,揭开智能体真实水平人工智能可以编写复杂的代码,顺利通过各类高难度考试,给人带来一种机器智慧已经比肩人类的错觉。ARC-AGI-3正式推出,把当前最聪明的智能体扔进一个没有任何说明书的简单像素游戏里,得分连1%都不到。ARC-AGI-3通过剥离语言和外部记忆,把行动效率作为唯一标尺,无比清晰地揭开了当前机器智能与真正人类适应力之间的巨大鸿沟。揭开智能的底色回溯到2019年,人工智能专家François Chollet提出抽象与推理语料库,也就是最初的ARC-AGI-1版本。该论文主张用获取新技能的效率来衡量通用智能,彻底抛弃单纯比拼特定任务准确率的旧路。早期的测试采用静态网格任务,解题者只看少量输入输出示例,必须在脑海中推导出一套全新的转换规则。测试题目最多包含30乘30的网格,使用了10种独特颜色,完全基于客体性或基础几何等核心知识先验。没有任何外部常识,抑或死记硬背的经验,能够帮上智能体的忙。早期版本的基准有效抵御了让机器在围棋等领域称霸的记忆检索捷径。每道题独一无二,少量示例彻底杜绝了海量数据训练带来的统计模式匹配。2020年举办的Kaggle挑战赛吸引了913支队伍,冠军方案在私有测试集上拿到20%的准确率,主要依靠暴力程序搜索手工制作的基元库。在2022年和2023年,Lab42接连举办两场相关赛事,奖金达到100000美元,进一步扩大了国际参与度。到了2024年,新一届比赛奖金池高达1000000美元,吸引了1430支队伍参与,深度学习方案初露锋芒,测试时训练技术实现突破,得分达到了53.5%。2025年3月推出的第二代基准增加了多步推理要求,英伟达团队利用合成数据和40亿参数模型拿下24%的胜率,高达85%的大奖门槛依然无人触及。伴随2017年Transformer架构的问世,预训练规模扩展成为主流研究范式。纯粹依靠堆砌数据和算力,基础大语言模型的能力不断攀升。2022年出现的思维链提示技术改善了模型的推理表现,顺势开启了测试时适应的新范式,大型推理模型逐渐走入大众视野。OpenAI推出的o1和o3系统率先在旧版测试中展现出流体智力,让公众见证了前沿AI推理能力的萌芽。大模型依然存在明显的局限。现代大型推理模型能在代码等特定领域大显身手,前提是基础模型包含充足的相关领域知识储备,并且环境能提供精准的正确性反馈。人类的推理能力根本不受领域知识束缚。大模型表现出的能力更像是被局限在特定逻辑链条上的机械运作。收集领域数据和构建验证器成本高昂,2025年底有学者利用自动化系统在量子物理领域发现了新成果,单纯依靠机器实现高效适应并产出颠覆性创新的愿景,依旧相去甚远。过拟合与记忆捷径同样是不容忽视的隐患。传统模型在训练时学得太多,死记硬背特定特征,导致部署后难以泛化。前沿模型如今面对看似独立的数据集,依然有办法走捷径。公开训练集和私有测试集分布过于相似时,模型可以通过自动生成数百万个相似任务,用极高的数据密度覆盖目标领域,强行消除对测试时适应能力的依赖。Gemini 3深度思考版本在验证过程中,推理链条里竟然直接输出了洋红色和绿色等字眼。官方提示词中从没提过颜色映射,模型却能熟练运用,充分暴露了底层模型早已把此类数据的结构特征背得滚瓜烂熟。未来的评测基准必须完全脱离公开数据的分布,也就是走向分布外测试,方能检验真实的泛化能力。打造纯粹的试炼场为准确测量现有人工智能与人类通用智能之间的残余差距,ARC-AGI-3应运而生。新版本将考核重点转向代理智能,采用一套交互式回合制环境,重点考察智能体的四项核心能力。其一是探索,真实世界里的信息极少主动呈现,智能体必须与环境互动来获取情报。其二是建模,把原始观察转化为能预测未来状态的通用世界模型。其三是目标设定,在没有明确指令的环境下,凭借内在驱动和环境线索弄清楚该干什么。其四是规划与执行,准确制定从当前状态到目标的行动路线,并根据意外反馈灵活调整。测试全程不交代任务目标,也不提供任何说明书。智能体必须自主摸索环境机制和获胜条件。每个环境分为多个关卡,达到获胜条件才会结束。回合制界面专门为离线推理设计,有意避开了对实时反应速度的考察。智能体每次收到一帧,或者一系列过渡动画,采取一个行动进入下一帧,环境状态绝不会在智能体未操作时自行改变。视野是一个64乘64的网格,每个单元格有16种可选颜色。操作空间十分精简,仅包含5个方向或功能键,外加1个撤销键,以及1个点击网格单元格的坐标选择动作。简化的操作排除了控制难度,把核心挑战牢牢锁定在环境逻辑上。一次行动被严格定义为向环境发送指令,并成功改变状态的回合。模型内部的工具调用或重试不计入行动次数。为了批量打造高质量环境,研发团队搭建了内部游戏工作室,采取流水线作业。开发人员写出概念说明,团队共同审查,接着制作原型并进行内部试玩,随后引入外部人员测试,达标后才算定稿。最初团队尝试用Unity引擎开发,发现其过于笨重,迭代速度太慢,最终改用Python自行编写了定制环境引擎,确保最低性能达到每秒1000帧。所有环境强制遵循核心知识先验原则,绝不使用数字,字母,红绿灯或花朵等文化符号,确保只测试先天的推理能力。客体性,基础几何形态,拓扑关系,重力,动量以及意图识别,成为仅有的环境规则来源。环境设计必须新颖,既要区别于现有电子游戏,也不能跟题库里的其他题目撞车。难度递进依靠概念组合,后期关卡需要融合前期学到的多种机制。每个环境至少包含6个关卡,首关通常是极易上手的教程关。研发团队坚决抵制仅靠单一机制,单纯放大规模来增加难度的做法。自动验证环节为环境质量把关。首轮随机运行50000步,排查意外通关的漏洞。次轮扩展到1000000步,确保非教程关卡在随机瞎按的情况下绝对无法通关。系统还会构建有向图来探索状态空间,把重复的模拟转化为紧凑的图结构,精确计算获胜概率,要求随机策略通关的概率必须低于10000分之1。完整数据集依据公开程度,被严谨地切分为三个功能各异的子集。与前代版本10比1的公私比例截然不同,新基准完全以私有集作为评估核心。公共集转变为单纯的演示窗口,极大地降低了针对性优化的风险。效率是真正的标尺在新版本基准的理念里,智能从根本上等同于效率。高智能系统不仅能解决问题,还能把资源消耗降到最低。无论探索数据,计算时间还是承担风险,最终统统被折算成一个标量化指标,即行动效率。通过计算初次接触新环境并通关所消耗的回合数,直接衡量探索与执行的综合表现。盲目试错会被严厉扣分,行动越少,暴露在环境危险中的几率就越低,正好也方便拿来跟人类的行动基准直接对比。计分系统采用相对人类行动效率指标。具体规则十分严谨,计算公式会比较AI耗费的行动数和人类基准。人类基准被定义为所有参与测试的人类中,行动数第二少的成绩,排除了极个别天才的异常值。假设第二快的人类用了10步,AI用了100步,比值就是10除以100。系统采用幂律计分法则,将该比值平方,最终此关卡AI得分为1%。大幅拉开低效方案和接近人类水平方案的分数差距,严厉惩罚低效表现。分数的汇总按关卡独立进行,防止单关成绩被过长关卡淹没。为避免AI利用单个关卡的机制漏洞刷出超高分,单关效率得分设置了1.0倍人类基准的上限。另外配有关卡权重机制,难度更高的后期关卡得分占比更大。以5关环境为例,第一关占总分的15分之1,第五关占15分之5。各关卡加权平均得出环境得分,所有环境得分汇总求平均值,最终得出0%到100%的总分。此种计分方式深受机器人导航领域中路径长度加权成功率指标的启发。官方排行榜的设计极度警惕过拟合。任何针对公共环境特制的程序外壳或硬编码策略,都有可能在公共集上拿满分,完全无法反映系统在未知领域的真实智能水平。排行榜严格剔除经过专门准备的系统,只评估通过通用API接入的基础模型。官方仅提供一段简单的提示词,告诉模型它在玩一个游戏,目标是获胜,并要求回复具体动作。考虑到高推理前沿模型单次运行的API成本高昂,系统强制设定了上限,达到人类平均步数的5倍后就会被切断。最新测试中,前沿模型的表现令人遗憾。在半私有排行榜上,表现最好的模型依然难以突破1%。为了鼓励社区进行任务自动化创新,官方同时维护了一个基于自述成绩的社区排行榜。虽说特定定制的程序外壳不足以代表通用智能的进步,那些优秀的上下文管理和任务编排思路,未来极有可能被直接整合进下一代基础模型内部。真实的较量为了确立人类基准,研发团队在旧金山的专门测试中心开展了高频次的线下评估。能够纳入基准库的环境,必须保证至少有两名完全没受过特殊训练的普通人能独立通关。参与者每人可获得115至140美元的出场费,每通关一个环境还能额外拿到5美元奖励。总计486名背景各异的参与者完成了2893次环境挑战,累计耗时427.9小时。每次挑战时长通常限制在30分钟以内。成功通关的玩家耗时中位数为8.1分钟,失败尝试的耗时中位数为5.9分钟。大量真实的影像回放和按关卡统计的完成率数据,帮助团队反复剔除那些机制含糊或难度飙升的不合理设计。人类效率的衡量包含三个参照点,分别是最优解估算值,单关最佳表现组合,以及作为计分标准的人类基准。在正式发布前,官方通过代理预览赛收集了早期反馈。2025年8月的比赛中,Tufa实验室的方案拿下12.58%的成绩位居榜首,采用卷积神经网络结合强化学习,分析64乘64像素帧的变动。排名第二的盲松鼠方案拿到6.71%的分数,依靠观察帧构建有向状态图。前列方案普遍采用启发式搜索,尽可能多地试探动作空间,以期碰上正确组合。学术界也贡献了精彩的探索。杜克大学团队敏锐察觉到上下文管理的瓶颈,64乘64的像素网格极耗上下文额度,便编写程序让大模型选择性提取历史动作状态,在三个公共环境里跑出了媲美人类的出色效率。Symbolica AI团队采用协调器加子代理架构,顶层协调器不直接接触环境,依靠专业子代理返回压缩后的文本摘要,巧妙规避了上下文超限的问题。新一届ARC挑战赛将于2026年继续在Kaggle平台展开,公开悬赏总奖金池高达2000000美元。前路漫漫,挑战依然艰巨。在有限的时间和步数内,人类总能凭借直觉和适应力拨开迷雾,现有的AI系统却在假设修正,不确定性规划和高效探索上接连碰壁。作为少有的未被攻克的智能体测试基准,该项人机较量才刚刚拉开帷幕。行业全闪场景和需求有奖探讨探讨背景:为更好地了解您对企业全闪化转型的现状与需求,我们特此展开此探讨,本探讨旨在收集各行业在全闪化应用场景、存储容量、数据缩减、关键需求等方面的信息。奖项设置:一等奖(1名):HUAWEI WATCH GT 6(14880智豆)二等奖(2名):HUAWEI FreeBuds 7i 贝母白(5990智豆)三等奖(3名):JDC周边电脑包(中号)(1290智豆)价值奖(20名):200-500智豆(200-500智豆)活动规则:1、为了保护各位的观点信息,所有回复均被设为仅自己可见。2、禁止小号参与活动,否则取消活动资格。3、回帖提交要求:重复帖、抄袭、AI作答帖、灌水帖及非研讨范围内的帖子无效。4、本次评奖规则由华为专家评审团进行评审。5、本次活动解释权归华为JDC社区所有。6、同意由管理员摘取回帖内容匿名共享在本社区,供社区用户学习。7、回复内容请勿涉及第三方非公开的信息。互联网行业AI推理场景存储使用情况及痛点有奖探讨探讨背景:随着多模态、代码助手、各类Agent等AI技术发展,长序列上下文带来KVCache/记忆/知识容量剧增,HBM+DRAM的模式已经不足以支撑。业界通过引入SSD进行KVCache卸载,提升容量以提升命中率,极大地降低了TTFT,减少XPU开销,同时可支撑更长上下文。NVIDIA在2026年1月发布ICMS及BF4,引入DPU直通盘框+SSD盘作为G3.5层KVCache。华为存储将持续投入AI推理降本增效的研究,通过此调研,希望了解大家在AI场景存储的使用方式及痛点,打造性能强劲、生态兼容、易用的DPU直通盘框产品及最具性价比的KVCache方案。奖项设置:一等奖(1名):HUAWEI WATCH GT 6(14880智豆)二等奖(2名):HUAWEI FreeBuds 7i 贝母白(5990智豆)三等奖(3名):JDC周边电脑包(中号)(1290智豆)价值奖(20名):200-500智豆(200-500智豆)活动规则:1、为了保护各位的观点信息,所有回复均被设为仅自己可见。2、禁止小号参与活动,否则取消活动资格。3、回帖提交要求:重复帖、抄袭、AI作答帖、灌水帖及非研讨范围内的帖子无效。4、本次评奖规则由华为专家评审团进行评审。5、本次活动解释权归华为JDC社区所有。6、同意由管理员摘取回帖内容匿名共享在本社区,供社区用户学习。7、回复内容请勿涉及第三方非公开的信息。数据归档市场空间和需求有奖探讨探讨背景:在政府、金融、医疗、教育、司法和运营商行业,数据安全要求提升,数据保存周期长达10多年,伴随着AI等新兴技术兴起,数据快速膨胀,并且AI激活海量数据的二次价值挖掘,传统的归档走向在线归档。我们想了解您对归档市场空间的需求,请您畅所欲言。感谢回复。奖项设置:一等奖(1名): HUAWEI WATCH GT 6(14880智豆)二等奖(2名): HUAWEI FreeBuds 7i 贝母白(5990智豆)三等奖(3名): JDC周边电脑包(中号)(1290智豆)价值奖(20名): 200-500智豆( 200-500智豆)活动时间:活动时间:2026年02月27日至2026年03月31日活动规则:1、为了保护各位的观点信息,所有回复均被设为仅自己可见。2、禁止小号参与活动,否则取消活动资格。3、回帖提交要求:重复帖、抄袭、AI作答帖、灌水帖及非研讨范围内的帖子无效。4、本次评奖规则由华为专家评审团进行评审。5、本次活动解释权归华为JDC社区所有。6、同意由管理员摘取回帖内容匿名共享在本社区,供社区用户学习。7、回复内容请勿涉及第三方非公开的信息。企业AI Agent落地现状与挑战有奖探讨探讨背景:随着大模型技术的飞速发展,越来越多的企业开始将其融入核心业务流程,探索打造智能化的AI Agent(如智能助手、自动化决策代理、数据查询与分析代理等),以提升效率、优化决策。为了深入了解企业在落地AI Agent过程中的实际场景、应用进展及面临的核心挑战,我们邀请您参与本次探讨。您的反馈将帮助我们准确把握企业需求,为优化技术产品、提供更具针对性的解决方案提供关键输入。奖项设置:一等奖(1名):HUAWEI WATCH GT 6(14880智豆)二等奖(2名):HUAWEI FreeBuds 7i 贝母白(5990智豆)三等奖(3名):JDC周边电脑包(中号)(1290智豆)价值奖(20名):200-500智豆(200-500智豆)活动规则:1、为了保护各位的观点信息,所有回复均被设为仅自己可见。2、禁止小号参与活动,否则取消活动资格。3、回帖提交要求:重复帖、抄袭、AI作答帖、灌水帖及非研讨范围内的帖子无效。4、本次评奖规则由华为专家评审团进行评审。5、本次活动解释权归华为JDC社区所有。6、同意由管理员摘取回帖内容匿名共享在本社区,供社区用户学习。7、回复内容请勿涉及第三方非公开的信息。AI超融合一体机需求有奖探讨探讨背景:本问卷围绕AI推理场景下的行业诉求,聚焦推理场景的行业应用、核心需求、生态适配、价值体现及落地痛点,恳请结合行业/企业实际情况作答,所提内容将为AI超融合解决方案的设计提供核心参考,感谢支持!奖项设置:一等奖(1名):HUAWEI WATCH GT 6(14880智豆)二等奖(2名):HUAWEI FreeBuds 7i 贝母白(5990智豆)三等奖(3名):JDC周边电脑包(中号)(1290智豆)价值奖(20名):200-500智豆(200-500智豆)活动规则:1、为了保护各位的观点信息,所有回复均被设为仅自己可见。2、禁止小号参与活动,否则取消活动资格。3、回帖提交要求:重复帖、抄袭、AI作答帖、灌水帖及非研讨范围内的帖子无效。4、本次评奖规则由华为专家评审团进行评审。5、本次活动解释权归华为JDC社区所有。6、同意由管理员摘取回帖内容匿名共享在本社区,供社区用户学习。7、回复内容请勿涉及第三方非公开的信息。中国存储市场的未来:技术创新与政策引领下的产业繁荣2024中国算力大会期间,以“加速先进数据存力应用,共促新质生产力发展”为主题的先进数据存力论坛同期举办,先进数据存力实践成果展示与趋势发展的探讨也成为了时下的焦点。 政策助力存储市场崛起 在全球数字化浪潮的推动下,数据已成为新型的生产资料,而存储作为数据的基础设施,其重要性日益凸显。近期,随着一系列行业大会和政策的发布,中国存储市场的发展现状和未来走向引起了广泛关注。 据IDC、Gartner等第三方咨询机构预测,中国存储产业规模到2025年将大幅增长,上游产业链产值预计超过2600亿元人民币,中下游产值则超过8000亿元。这一数据表明,中国存储市场正处于高速增长期,具备巨大的发展潜力。 在政策层面,国家对存储技术的重视程度不断提高。工业和信息化部等六部门联合发布的《算力基础设施高质量发展行动计划》明确提出,到2025年我国存储总量要达到1800EB,先进存储容量占比达到30%以上。这一政策导向不仅为存储市场的发展提供了明确目标,也促进了上下游产业链的协同发展;在技术创新方面,中国企业已在全球存储领域崭露头角。越来越多创新技术的加入为先进数据存力提供支持,也让更多行业为此受益。 数字化浪潮的存储新角色 提到存力,就先要提到算力,算力与存力作为数据中心的两大核心要素,密不可分且相辅相成。算力代表计算能力,即处理数据的能力;而存力则代表存储能力,即保存和管理数据的能力。两者共同构成了数据中心的基石,缺一不可。为何存力越来越受到重视?因为不论大模型演进还是算力中心发展,都离不开海量的数据基础,和数据息息相关的存储。 中国工程院院士沈昌祥强调了在数字经济时代,安全可信是智能存储系统发展的关键。他指出,数据安全面临巨大挑战,需要构建安全可信的智能存储系统来保障国家网络和数据安全。沈昌祥呼吁要从计算模式、系统安全设计等多个方面入手,打造具备自主安全可控能力的存储系统,以应对日益复杂的安全威胁。 中国信通院云大所总工程师郭亮在论坛中表示,中国数据存储产业已步入快速发展轨道,中国数据存储产业在近年来取得了显著发展,不仅规模持续扩大,技术创新也日益活跃。他指出,随着国家政策的明确支持和市场需求的不断增长,数据存储产业正逐步成为推动数字经济高质量发展的关键力量。郭亮强调了全闪存存储已成为主流趋势,新型AI存储技术也实现了在世界上的认同。同时,他也提到中国东部地区的存力发展水平较高,但中西部地区仍有较大发展空间。针对未来,郭亮也建议应继续加强顶层产业设计和战略规划,推动先进存储技术的研发投入,构建开放协同的产业生态,并注重人才培养和引进,以全面提升中国数据存储产业的国际竞争力。 他也表示:“随着AI、大数据等新兴技术的广泛应用,存储需求日益多样化、复杂化。未来,我们将见证存储容量与性能的双重飞跃,以及存储技术在安全可靠、绿色低碳等方面的显著进步。” 结合行业专家的观点,存储技术的发展或将围绕几个关键点展开:首先是大容量与高性能:面对海量数据的存储需求,提升存储容量和读写性能成为首要任务。这要求存储设备在硬件架构、介质选择和技术优化上不断创新;其次,安全可靠方面,数据安全是存储技术的生命线。这包括数据加密、防勒索攻击、容灾备份等多方面的措施;同时要实现绿色低碳:在追求高性能的同时,降低能耗、实现绿色存储也是未来发展的重要方向。这要求存储设备在硬件设计、软件算法等方面进行优化创新以降低功耗;最后是开放生态:构建开放的存储生态体系有助于推动技术创新和产业协同发展。通过支持多云、多协议的数据互通和共享机制可以提升存储资源的利用率和管理效率。 存算网一体化的未来趋势 华为新品助力行业发展 华为公司副总裁、数据存储产品线总裁周跃峰在主论坛上谈到,中国数字化应用进程发展很快,存、算、网要协同发展,为中国提供可持续供应的算力基础设施,为世界提供更好选择。华为作为中国存储市场的代表企业,全球Top100银行中有53家选择其数据存储产品,显示了其强大的市场竞争力和技术实力。 论坛上,华为数据存储产品线副总裁肖德刚也表示,数据已成为AI时代关键生产力,先进存力则是数智时代的创新动力。随着数据量爆炸性增长,对存储的需求急剧上升,需要专业存储提升算力利用率和模型推理效率。肖德刚谈到,华为保持研发投入和技术创新,最新发布的OceanStor A800以长记忆内存新范式,增强AI训练和推理能力,将AI集群可用度提升了30%,真正实现了“以存强算”。 存储技术的星辰大海 http://www.xinhuanet.com/tech/20240930/6418aa63131b4edd9ffbf2aac277e079/c.html2024中国算力大会上《中国存力发展报告(2024)》正式发布,书中总结了当前数据要素与人工智能时代下的先进存力新特征,并从顶层产业链建设、存储技术突破、先进存力应用、专业人才培养等方面提出发展建议。 在华为全联接大会2024期间,华为联合罗兰贝格发布的《先进数据存力白皮书》中也指出,先进数据存力为社会经济高质量发展的“数字基石”与加速智能经济涌现的“高性能引擎”,具备全域泛在、原生智能、集约架构与开放生态等新特性。 众多数据报告的发布也预示着数据存储在当下所面临的新挑战和新要求,加快先进存力的建设应用,推动存储技术的底层创新和发展将成为行业主流。 中国信息通信研究院院长余晓晖指出,在人工智能和全球数字化转型的背景下,数据存储产业迎来了前所未有的发展机遇。他表示,数据存储不仅是算力的关键组成部分,更是释放数据要素潜力、推动数字经济高质量发展的核心要素。余晓晖提出了进一步激发产业创新活力、深化存力应用场景、开拓合作共赢局面等建议,旨在推动数据存储产业实现更高质量的发展。他呼吁产业界加强合作,共同把握人工智能等新技术带来的历史机遇,推动我国在全球存储领域的影响力不断提升。 展望未来,中国存储市场将迎来更加广阔的发展空间。在政策引导、技术创新和市场需求的共同推动下,存储技术将不断向大容量、高性能、安全可靠和绿色低碳的方向发展。同时,随着AI技术的普及和应用场景的拓展,存储与算力的融合将更加紧密。通过存算网协同优化资源配置和提升整体效能将成为未来发展的重要趋势。 当下,中国存储市场正处于高速发展的黄金时期。面对前所未有的机遇和挑战,整个行业应以创新为驱动、以需求为导向、以政策为引领,推动存储技术的不断进步和产业的持续繁荣。通过加强国际合作与交流、提升自主创新能力、完善产业链布局等措施,产业各界可共同开创中国存储市场更加辉煌的未来。AI重新定义计算需求,存储市场“周期论”失效?2025年7月左右开始,存储行业从业者李明进入了密集会见客户的阶段,至今仍未停歇。这也是几乎所有行业内人士的共同经历:持续面见客户,拉通行业价格和需求信息,以期更好应对本轮存储持续涨价和紧俏行情——恐高是真,货总得拿。看起来当前正进入存储行业一轮新的大周期,但似乎又有所不同。过去几十年来,存储芯片市场在“需求增加-扩产-供过于求-缩产”的周期间上下波动,这通常被定义为2~3年一个周期。一些存储厂商更是通过逆周期扩张的方式,成为今天的存储巨头。但如今,扑面而来的AI浪潮,似乎正在把这个传统定义下的周期循环打破。一方面,提供存储颗粒的上游原厂并没有兴奋地面对本轮AI浪潮需求积极扩产,而是采用审慎的评估态度;另一方面,当前AI技术仍处在发展初期,市场普遍预计2027年仍难解决紧缺问题,本轮存储大周期似乎在可见的阶段,不会那么快走向结束。于是,一种声音出现:存储行业已经告别传统周期。AI技术仍在迭代,存储市场的热门选手从早期HBM(高带宽内存)蔓延到SSD(固态硬盘),下一个热门选手是谁?存储紧缺会要多久?这是存储行业一直在探讨的问题,大家都期待一个确定性答案。随着AI技术和GPU芯片的设计路线持续演进,存储芯片市场从最初DRAM内存需求紧俏,开始转变到DRAM内存和NAND闪存均成为紧俏资源。铠侠(Kioxia)SSD应用首席技术执行官福田浩一在MemoryS2026峰会上指出,生成式AI正从训练阶段转向推理模型,存储成为关键瓶颈。数据中心存储需求显著增长,其中AI推理成为核心增长引擎。在接受21世纪经济报道等媒体采访时,他进一步分析道,尤其在AI推理阶段,其工作流已经不仅限于单一次数的问答,而是涉及多轮提问,在此过程中会令KV Cache(键值缓存)呈现指数级增加。举例来说,大模型在回答第一个问题后,依然在后台运转,为后续回答做准备。那么在此过程中,相关数据就需要被及时存储起来,等待下一轮问答时直接调用,而不用重复回到GPU进行计算。尤其随着当前长上下文的快速发展,对数据存储需求将进一步增加。而传统将数据存储在内存DRAM或HBM的路径已经不太适合这种计算链路,导致NAND闪存的需求量持续增加。“从去年开始,英伟达Rubin架构出来后,很清晰显示出对NAND Flash闪存芯片的需求。那么无论HBM还是LPDDR5x,这些主要前沿品类都是需求所在。这意味着主流存储芯片在今明年甚至未来,需求都非常强劲。景气度和繁荣度都很好。”一名存储芯片行业高管如此分析道。在过去移动互联网时期,存储行业的荣枯多与手机市场的供需环境密切相关。但进入AI时代,AI服务器开始取代智能手机,成为存储芯片最大下游应用市场。不同于以往的是,这个新兴的高端应用市场,其参与者普遍对成本不太敏感,这也被认为是一个新增的优质需求市场。包括Open AI、谷歌、微软、亚马逊、Meta在内的云服务厂商,为了争夺基础算力资源,纷纷与存储供应商签订长期合约。而前不久刚经历过一轮惨痛低迷周期的存储供应商们,受够了连续亏损的年月。于是,在产能有限的前提下,大量存储资源被选择流向这些高价值用户。“我们认为,这一轮存储行情是前所未有的结构性行情。”前述高管分析道,本轮AI浪潮刺激出的是一个新生市场,技术仍在演变的条件下,意味着行业繁荣期或许比以往周期更持久。在AI浪潮下,从宏观层面的NAND发展路线看,福田浩一指出,既往很多人更关注堆叠层数的增加,但铠侠还进一步考虑到bit密度的增加,同时兼顾CMOS技术和节能。将这些技术融合在产品开发过程中。在技术演进角度,福田浩一分析道,SSD呈现四大方向:KV Cache扩展、NVIDIA Storage-Next、高容量QLC方案,以及SSD替代HDD以优化TCO。面向AI时代大容量、高堆叠和高密度的存储需求,将产能更多转向前沿技术也成为当前趋势。当然,这可能会进一步造成存储市场的结构性供需变化。近期,铠侠就宣布停产部分旧制程产品,其中小容量TSOP封装产品、部分传统浮栅式(Floating Gate)2D NAND以及第三代BiCS FLASH产品将逐步退出市场。对此,铠侠中国区董事长兼总裁岡本成之回应道,这是基于新旧技术更替的考虑,也是行业普遍现象。TSOP封装主要用于低容量MLC NAND Flash存储器,有观点认为,此次铠侠宣布停产,意味着其或将退出低容量MLC NAND Flash市场。不止铠侠,此前三星、SK海力士和美光,也陆续宣布,MLC相关产品或产线进入生命周期终结或不再扩产。根据第三方机构TrendForce集邦咨询统计,随着国际主要NAND Flash制造商退出或减少MLC NAND Flash生产,预估2026年全球MLC NAND Flash产能将年减41.7%,供需失衡情况加剧。面对当前全球存储芯片严重供不应求的行情,上游存储颗粒供应商开始推进扩产动作,但看起来动作有限,显示出相对审慎的姿态。那么上游厂商是否在担忧,短期内会出现存储行情大逆转?对此,岡本成之对21世纪经济报道记者表示,随着人工智能技术快速发展,当前存储市场正经历需求的快速增长。在可预见的未来,这种供需环境仍将持续,因此对存储芯片的需求不会骤然下降。他告诉记者,铠侠目前已经在针对两个晶圆厂考虑增加设备投资,分别是日本北上市的K2工厂和四日市的Y7工厂。“包括我们在内的多家存储原厂,都着眼于在2027年增加产能,以满足AI带来的存储需求快速提升,预计这种存储供需环境不会有显著改变。”岡本成之则对记者指出,铠侠在供应策略方面,不会将重点放在某个单一应用上,而是在生产和销售产品时考虑到(如消费类和企业级存储市场的)整体平衡,关注每种应用的需求趋势进行具体供应。“特别在消费端,随着边缘AI需求迅速增加,我们也会跟消费电子领域的客户保持良好沟通。”这背后暗含行业对本轮存储周期的定义和走向研判。存储是否已经摒弃传统“周期论”成为核心议题。前述会议上,CFM闪存市场总经理邰炜就分析,人工智能的爆发式发展重构了数据生成逻辑,存储不再是数据生产链条中的被动“仓库”,而是支撑大模型迭代与推理的关键基础设施,推动存储半导体从周期性波动产品转变为数据经济的核心生产力。存储不再是周期性产本文基于SK海力士北美区总裁于2026年3月24日在硅谷K ASIC研讨会上发表的演讲,并反映了作者的个人观点。本文并非任何股票的买卖建议。鉴于作者身处存储器行业,其观点可能偏向于看好存储器市场。“这不是记忆体超级周期”人们在描述当今的内存市场时经常会提到“超级周期”这个词。需求强劲,价格上涨,而且人们对HBM的热情高涨,因此这个标签自然而然地被贴上了。但我在这次研讨会上听到的却是对这种说法的直接挑战。“超级周期”这个术语源于人们过去看待内存的方式,而现在的论点是,我们已经进入了一个这种框架无法解释的领域。传统的存储器行业遵循着教科书式的周期性规律。供应略微过剩就会导致价格暴跌。价格下跌后,企业最终会削减投资。供应收紧后,价格反弹。价格上涨后,所有人都会争相再次扩大产能。这种循环往复——供应过剩、价格暴跌、投资缩减、供应短缺、价格回升——以多年为周期反复上演。存储器行业也因此赢得了“周期性行业”的美誉。但三大巨头如今的行事方式已截然不同。强劲的需求不再像过去那样自动触发激进的产能扩张。原因很简单:他们都为此付出了代价。在经济周期上行阶段,他们曾大举扩张,结果却遭遇了供应过剩和价格暴跌,损失惨重。这段经历给他们留下了深刻的烙印。如今,他们的首要任务已从追求销量来扩大市场份额,转向盈利能力、资本效率和客户结构。对于HBM这类产品,这种趋势更为明显,因为其供应本身就受到限制,而且客户需求也十分复杂。存储器制造商不能随意将有限的产能分配给任何有需求的地方。决定将产能分配给哪个客户,以及分配期限的长短,都与利润率直接相关。在这种情况下,长期供应协议不仅仅是锁定销量。它们表明存储器公司在供应管理方面比以往更加注重战略。如今,在这个行业里,任何公司都不能再像以前那样,在价格上涨时随意增产增销了。这也正是长期合同意义发生转变之处。在传统的存储器市场中,现货价格和短期交易主导着市场周期。而如今,随着人工智能基础设施的建设和对高价值存储器(如HBM)需求的激增,确保稳定的供应对客户而言至关重要。对于存储器公司而言,由于前期投入巨大,工艺转型和封装资源分配等问题也需要关注,因此需求的可视性至关重要。双方都能从中受益。长期合同正逐渐成为降低不确定性、稳定供应链的机制,而不仅仅是销售工具。这些层层叠加的结构性转变,正使记忆金属的价格进一步偏离其经典的周期性模式。但这并不意味着价格波动会消失。记忆金属的价格仍然受供求关系的影响,并将继续随市场状况波动。但如今这种波动的性质已截然不同。过去那种良好的上涨周期会引发整个行业的过度投资,最终导致整个行业崩溃的局面,如今发生的可能性已大大降低。这位区域总裁的观点很明确。存储器行业并非处于一个会突然爆发又重置的超级周期之中,而是正在转型成为一个能够持续获得更高结构性价值的行业。用他的话说,存储器行业正从单纯依靠宏观经济波动的大宗商品行业,向结构性增长型行业迈进。他半开玩笑地说,存储器投资的回报未来有可能超过指数回报。如今存储器市场的关键问题不在于周期何时达到顶峰,而在于行业本身的性质已经发生了改变。如果仍然用过去的周期来看待它,就会忽略正在发生的事情。存储器行业不再能通过周期来分析,而是需要通过理解结构性变化来解读。购买HBM的三个要求如今,HBM并非随随便便就能买到的东西。据我所知,如果您想从SK海力士购买HBM,您需要同时具备以下三个条件。首先,可以利用台积电先进的封装产能。其次,数据中心需要具备大规模运行这些芯片的能力。第三,需要资金来支付所有这些费用。这三者单独来看都很难。真正的问题在于,你需要同时做到这三点。获得HBM并非终点。你仍然需要构建GPU或AI加速器,进行封装,将其集成到服务器和机架中,并在大型数据中心运行。HBM并非一个独立的内存市场。它是一个封装、系统、基础设施和资金紧密相连的市场。这就是为什么HBM的实际买家群体实际上已经缩小到超大规模数据中心及其同级别企业,例如NVIDIA、微软、谷歌、亚马逊和Meta。这不仅是因为它们对人工智能的需求巨大,还因为它们能够实际获取台积电的封装资源,吸收数十亿美元的基础设施投资,并确保最终可能达到GW级的电力容量。HBM市场固然是一个技术市场,但它同样也是一个关乎供应链控制、基础设施建设和财务实力的市场。这也解释了为什么英伟达能占据如此重要的地位。英伟达的统治地位不仅仅体现在GPU性能上。英伟达是需求最集中的来源,是生态系统运营最强大的企业,也是HBM内存最确定的最终归宿。从内存公司的角度来看,英伟达不仅仅是芯片的买家。它是能够以最快的速度、最大的规模、最高的确定性将HBM内存分配转化为系统收入的参与者。换句话说,它是单位供应量所能产生最大影响的客户。相比之下,人工智能芯片初创公司则面临着结构性劣势。无论芯片设计多么出色,HBM内存不足都使得构建具有竞争力的系统几乎不可能。即使芯片流片完成,台积电封装产能的不足也会延误产品出货。此外,还需要克服大规模客户认证和实际数据中心电力限制等问题。这意味着意义重大。在人工智能半导体市场,“好的技术等于好的投资”这一简单公式已不再适用。技术是必要条件,而非充分条件。更重要的是,谁能确保稳定的HBM供应,谁能掌控封装产能,以及谁能调动资源和资金将其转化为实际收益。这才是HBM绝对优势在实践中的体现。cHBM:存储走向晶圆厂读过我之前文章的人应该都知道,包括SK海力士在内的内存公司正在与超大规模数据中心积极开展cHBM协同设计方面的讨论。原因很简单。在人工智能系统中,瓶颈不再仅仅是计算性能。数据传输、能效、封装面积、散热管理以及系统级优化都变得至关重要。仅仅生产大量优质内存已经远远不够了。如今,内存需要根据每个客户的系统架构的实际需求进行深度定制。从这里开始,存储器行业的性质开始发生转变。在传统的以产品为导向的存储器中,降低成本和提高良率是核心竞争。谁能生产更多、更便宜、更可靠的产品才是关键。而 cHBM 改变了这种格局。基础芯片承担了更多逻辑功能,定制设计工作量增加,封装复杂性上升,验证范围扩大。这自然推高了开发成本和非经常性工程费用,并提高了客户和供应商之间协同设计工作的比例。存储器不再仅仅关注制造逻辑,而是开始将设计服务、先进封装和系统优化融入到业务的核心部分。这就是为什么我不认为 cHBM 仅仅是“HBM 变得更加复杂”。这表明存储器行业正在从商品化业务向解决方案业务转型。除此之外,这也意味着在某些领域,存储器公司开始像晶圆代工厂一样运作。存储,真的变了人们有时会反驳说:“好吧,HBM 我理解。但 DRAM 仍然是一种大宗商品,而且从结构上看,存储器行业仍然是一个周期性行业,不是吗?”从历史上看,确实如此。DRAM 是典型的商品市场周期规律:供应增加,价格暴跌;价格暴跌,资本支出减少;供应收紧,价格回升;价格回升,产能再次大幅扩张。正因如此,许多人仍然认为,即使 HBM 是个例外,包括 DRAM 在内的整个内存市场最终也会回归到以往的周期性模式。请允许我问一个问题:你认为建造一个1GW的数据中心需要多少片DRAM晶圆?据我今天在研讨会上听到的消息,大约需要 35 万片晶圆。更令人震惊的是,这35万片晶圆仅仅是DRAM部分。数据中心并非仅靠DRAM运行。它还需要GPU、HBM、封装、网络、SSD、电力基础设施和冷却系统,所有这些都必须同时运行。构建一个1GW的数据中心并非只是增加几台服务器那么简单。它意味着要同时迁移整个半导体供应链和整个电力基础设施。这是关键所在。【电话交流用户招募】运营商数据中心IT基础架构运维工程师看过来~报名要求:运营商用户,做数据中心L2(IT基础架构)运维管理相关工作数据中心层次结构L0:盖楼:指土建、机房楼宇部分,说白了就是盖楼。L1:基础设施:机房配套,指机房装修、供电、制冷消防等。L2:IT基础架构:机房基础设施层,包括服务器、存储设备、网络设备等硬件设施。(可报名)L3:应用平台。L4:业务,各种服务。