【课程预约】智算中心基础设施演进趋势(公开课第44期)JDC第44期公开课来啦!这次我们请到了广东浩云长盛网络股份有限公司 智算中心基础设施架构师——凛冬将至分享《智算中心基础设施演进趋势》时间是2025年12月9日(周二) 19:00,JDC视频号线上直播,不容错过!JDC公开课,知识积累的宝库,思维的火花碰撞的地方!参与有礼1、扫描下方海报上的二维码,预约直播2、提问有礼:在评论区加上自己想提问的问题,问题若在直播间被选中答复,将获得JDC独家定制礼品3、邀请朋友预约有礼:识别下方推广二维码,生成自己的专属推广二维码图片,将图片转发至微信朋友圈,配文"借力鸿蒙开发和华为云,实现项目创新和自我成长”,扫描二维码预约,一起进步”,将发送的朋友圈截图发送至本帖的评论区,即可获得10智豆。😆邀请人数最多的TOP 5兔粉将分别额外获得800、600、400、200、100的智豆奖励,最低邀请人数需分别>20、>15、>10、>8、>5, JDC将会在活动结束后公示TOP 5邀请数据🥰生成专属推广二维码流程如图🥰【课程预约】县域医院HIS&PACS全闪存升级解决方案JDC第43期公开课来啦!这次我们请到了广州明创网络科技有限公司 解决方案师——情倾摩天轮老师分享《县域医院HIS&PACS全闪存升级解决方案》时间是2025年11月25日(周二) 19:00,JDC视频号线上直播,不容错过!JDC公开课,知识积累的宝库,思维的火花碰撞的地方!参与有礼1、扫描下方海报上的二维码,预约直播2、提问有礼:在评论区加上自己想提问的问题,问题若在直播间被选中答复,将获得JDC独家定制礼品3、邀请朋友预约有礼:识别下方推广二维码,生成自己的专属推广二维码图片,将图片转发至微信朋友圈,配文"借力鸿蒙开发和华为云,实现项目创新和自我成长”,扫描二维码预约,一起进步”,将发送的朋友圈截图发送至本帖的评论区,即可获得10智豆。😆邀请人数最多的TOP 5兔粉将分别额外获得800、600、400、200、100的智豆奖励,最低邀请人数需分别>20、>15、>10、>8、>5, JDC将会在活动结束后公示TOP 5邀请数据🥰生成专属推广二维码流程如图🥰JDC官方认证的“躺赚智豆”姿势,了解一下?已结束——【课程预约】算力的尽头是电力JDC公开课来啦!这次我们请到了能源行业高级销售工程师——q1uguohao分享《算力的尽头是电力》时间是2025年10月28日(周二) 19:00,JDC视频号线上直播,不容错过!JDC公开课,知识积累的宝库,思维的火花碰撞的地方!主讲人简介●资深系统架构师参与有礼1、扫描下方海报上的二维码,预约直播2、提问有礼:在评论区加上自己想提问的问题,问题若在直播间被选中答复,将获得JDC独家定制礼品3、邀请朋友预约有礼:识别下方推广二维码,生成自己的专属推广二维码图片,将图片转发至微信朋友圈,扫描二维码预约,一起进步,将发送的朋友圈截图发送至本帖的评论区,即可获得10智豆。😆邀请人数最多的TOP 5兔粉将分别额外获得800、600、400、200、100的智豆奖励,最低邀请人数需分别>20、>15、>10、>8、>5, JDC将会在活动结束后公示TOP 5邀请数据,数据统计截止日期:本次直播结束后🥰生成专属推广二维码流程如图🥰已结束——【课程预约】基于LLM的核心系统智能调优探索JDC公开课来啦!这次我们请到了核心系统架构师——Kevin_jun分享《基于LLM的核心系统智能调优探索》时间是2025年11月11日(周二) 19:30,JDC视频号线上直播,不容错过!JDC公开课,知识积累的宝库,思维的火花碰撞的地方!主讲人简介●核心系统架构师参与有礼1、扫描下方海报上的二维码,预约直播2、提问有礼:在评论区加上自己想提问的问题,问题若在直播间被选中答复,将获得JDC独家定制礼品3、邀请朋友预约有礼:识别下方推广二维码,生成自己的专属推广二维码图片,将图片转发至微信朋友圈,配文“基于LLM的核心系统智能调优探索”,扫描二维码预约,一起进步”,将发送的朋友圈截图发送至本帖的评论区,即可获得10智豆。😆邀请人数最多的TOP 5兔粉将分别额外获得800、600、400、200、100的智豆奖励,最低邀请人数需分别>20、>15、>10、>8、>5, JDC将会在活动结束后公示TOP 5邀请数据,数据统计截止日期:本次直播结束后🥰生成专属推广二维码流程如图🥰已结束——【课程预约】大模型推理通识技术介绍JDC第39期公开课来啦!这次我们请到了高级算法工程师——小子wjyao 老师,分享《大模型推理通识技术介绍》时间是2025年9月25日(周四) 19:00,JDC视频号线上直播,不容错过!JDC公开课,知识积累的宝库,思维的火花碰撞的地方!参与有礼1、扫描下方海报上的二维码,预约直播2、提问有礼:在评论区加上自己想提问的问题,问题若在直播间被选中答复,将获得JDC独家定制礼品3、邀请朋友预约有礼:识别下方推广二维码,生成自己的专属推广二维码图片,将图片转发至微信朋友圈,配文"借力鸿蒙开发和华为云,实现项目创新和自我成长”,扫描二维码预约,一起进步”,将发送的朋友圈截图发送至本帖的评论区,即可获得10智豆。😆邀请人数最多的TOP 5兔粉将分别额外获得800、600、400、200、100的智豆奖励,最低邀请人数需分别>20、>15、>10、>8、>5, JDC将会在活动结束后公示TOP 5邀请数据🥰生成专属推广二维码流程如图🥰已结束——【课程预约】医疗影像智能标注一体机实战分享JDC公开课来啦!这次我们请到了资深系统架构师——zhangjbn分享《医疗影像智能标注一体机实战分享》时间是2025年10月14日(周二) 19:00,JDC视频号线上直播,不容错过!JDC公开课,知识积累的宝库,思维的火花碰撞的地方!主讲人简介●资深系统架构师参与有礼1、扫描下方海报上的二维码,预约直播2、提问有礼:在评论区加上自己想提问的问题,问题若在直播间被选中答复,将获得JDC独家定制礼品3、邀请朋友预约有礼:识别下方推广二维码,生成自己的专属推广二维码图片,将图片转发至微信朋友圈,配文“医疗影像智能标注一体机实战分享”,扫描二维码预约,一起进步”,将发送的朋友圈截图发送至本帖的评论区,即可获得10智豆。😆邀请人数最多的TOP 5兔粉将分别额外获得800、600、400、200、100的智豆奖励,最低邀请人数需分别>20、>15、>10、>8、>5, JDC将会在活动结束后公示TOP 5邀请数据,数据统计截止日期:本次直播结束后🥰生成专属推广二维码流程如图🥰【干货分享】大模型推理技术分享报告大家好,很荣幸受JDC的邀请,为大家做一次分享。本次分享将围绕大模型推理的相关技术展开,涉及内容以通识性介绍为主,深度有限。群内有许多大模型领域的专家,欢迎大家在分享后多多交流。我今天的分享主要包含四个部分:一是大模型结构介绍;二是大模型推理中的并行优化算法及推理加速技术;三是当前热门的MOE场景下的加速技术;四是今年备受关注的强化学习后训练场景下高效推理采样的实现方式。最后,会对相关内容进行总结与展望。一、大模型结构介绍关注本次直播的观众,不少可能从事深度学习相关工作。在2023年大模型兴起之前,大家所研究的多为传统小模型。传统小模型与大模型存在显著区别:传统小模型算子数量多、种类丰富,网络结构复杂;而大模型基于Transformer结构,结构简洁清晰,涉及的算子仅十几个,优化点相对较少,但模型尺寸远大于传统小模型,通常相差数个数量级。因此,大模型与小模型的推理优化思路截然不同。 目前常见的大模型主要分为两类:密集型(Dense)模型和混合专家系统(MOE)模型。MOE模型自去年底至今年初逐渐受到广泛关注,而此前大家更多研究的是Dense模型。Dense模型与MOE模型的核心区别在于Transformer结构中的前馈网络(FFN)层:Dense模型中,所有token共享一个大矩阵进行矩阵乘法运算;MOE模型中,不同的token会激活不同的专家,相当于将原来的大矩阵拆分成多个细粒度的小专家,不同token通过不同专家进行计算和推理。这样做的好处是单个token的计算量大幅下降,例如某600B参数量的MOE模型,每个token激活的参数量可能仅为30B。Dense模型采用全连接结构,简单通用,适用于各类标准推理任务,通常可单机或单卡部署;MOE模型作为混合专家系统,结构相对复杂,推理部署时配置更为繁琐,常见的有大专家并行方式,也可采用多机混合分布式部署,在推理资源调配与架构统一方面比Dense模型复杂。关于MOE架构,存在一些常见误区。例如,常说的300B参数量、激活30B参数量的MOE模型,大家可能认为其性能与30B参数量的dense模型相当,但实际上要达到这一效果,需要在工程上进行大量优化。第一个误区是认为300B参数量的MOE模型,激活30B参数量就等同于30B参数量的模型。事实并非如此,MOE模型推理的主要难点在于:当单个token激活30B参数量的专家时,若输入包含大量token(如在预处理阶段输入大量文字),每个token激活的专家不同。模拟结果显示,当输入token达到125个左右时,300B参数量基本会被全部激活,这会给显存带宽带来极大压力。虽然单个token的计算量降至30B参数量水平,但权重从全局内存加载至计算内存时,带宽难以支撑如此大的参数量,此时其激活量相当于300B参数量的dense模型。不过,MOE模型也有优势,即在计算过程中,随着输入token数量或批次大小的增加,计算量不会显著增加,而Dense模型的计算量基本呈线性或超线性增长。因此,在训练中采用MOE结构可大幅节省时间,在推理中采用大专家并行方式也能降低推理时间。二、推理中的并行优化算法及加速技术1. 张量并行(TP):大模型尺寸庞大,单张GPU的显存往往无法容纳。例如,70B参数量的模型不做量化时需140GB显存,即使进行INT8或IP8量化,也需70GB显存,而部分GPU(如910B)的可用显存仅64GB,无法容纳。为解决这一问题,可将权重切分成多块,分别部署在不同显卡上进行计算,计算后通过通信汇总结果(如进行归约或收集操作)。TP的优势在于能让模型在显存较小的显卡上运行,且可通过并行计算实现加速,但会增加额外通信,在dense模型中,通信占比约30%,因此通信优化是重点。2. 数据并行(DP):DP在训练中应用广泛,目前在推理中也开始采用,尤其在MOE大专家并行时。对于不同的DP域,输入不同数据,可提高整机吞吐量。3. 专家并行(EP):类似于TP,EP将大矩阵拆分成多个专家,将不同专家部署在不同显卡上。这样不仅能实现计算加速,还能整合多张显卡的显存带宽(如单卡1.6T带宽,两张卡可达3.2T),进一步提升性能。4. 序列并行(SP):针对长文本输入场景(如智能体或长上下文对话),单张GPU计算难以满足首字响应时间(TTFT)或每token响应时间(TPOT)要求。SP将单个用户的输入按序列切分,由不同显卡计算,可缩短响应延迟,提高效率。5. 流水线并行(PP):PP在训练中应用较多,目前在推理优化中也逐渐受到重视,尤其适用于后训练场景。后训练更关注整机吞吐量,对延迟要求较低。PP将模型按层横向切分成多段,部署在不同显卡上,通信量小(仅传输激活值),结合流水技术隐藏通信耗时,可显著提升整机吞吐量。6. 预处理器与解码器分离(PD分离):大模型推理中,编码器(encoder)和解码器(decoder)对资源的需求不同:编码器属于计算密集型,解码器属于访存密集型,而目前没有兼顾高算力和高访存带宽的显卡。因此,可将预处理器(P)部署在算力强的显卡上,解码器(D)部署在带宽高但算力相对较低的显卡上,以实现降本目标。此外,PD分离还能提升用户体验。在非PD分离模式下,一台机器需服务多个用户,不同用户请求时间不同。若某用户正在进行解码器计算时,新用户的预处理器请求进入,为保证新用户的首响时间,可能会暂停原有解码器计算或使其与新请求并行计算,导致原有用户的响应时间被拉长,出现卡顿。而PD分离后,机器仅部署解码器,可保证响应的流畅性。目前业界PD分离方案主要有两种:一是PD直连,通过提前建立连接实现点对点直传,传输延迟低,但部署复杂度高,全互联配置及扩容、故障处理均较麻烦;二是基于KV存储(KV store),预处理器计算结果存入KV store,解码器从其中获取数据,实现解耦,部署灵活,但中间存储会增加约20-30ms的首响延迟,仍在可接受范围内。7. 页注意力(Page Attention):该技术可有效节省显存。传统注意力机制中,需为每个用户分配固定大小的窗口(如4K、8K,甚至32K、64K)存储键值对(KV),造成显存浪费。Page Attention借鉴操作系统的分页机制,将KV显存划分为多个块(如128个token/块),按需分配,用完回收再分配给其他用户,可提高显存利用率,增加并发路数。在实际实现中,若某一时刻所有用户均需长窗口(如64K)导致页不足,可暂停相关任务,将其已计算的页卸载至CPU,回收显存页分配给其他任务,待其他任务完成释放页后,再唤醒暂停的任务继续计算,保证程序正常运行。8. 缓存命中(Cache Hit):在多轮对话或长上下文场景中,“以查代算”的缓存技术应用广泛。例如,用户的问题Q1及回答A1会被存入KV存储缓存,当用户基于历史对话提出Q2时,可直接从缓存中获取Q1和A1的计算结果,仅需计算Q2并生成A2,再将Q2和A2存入缓存。采用显存、内存、磁盘三级缓存架构:热数据存于显存,加载速度快;显存不足时,将冷数据写入内存;内存不足时,写入磁盘。结合外部服务,当用户再次访问时,可从磁盘加载历史数据,保证对话连贯性,提高缓存利用率、降低计算量、提升整机吞吐量。 9. 模型量化:随着芯片技术发展,大模型量化技术不断进步。以往多采用INT8量化,现在如英伟达的部分显卡及华为下一代950显卡均支持IP8量化,其表示范围更大,量化损失更小。目前四比特(4-bit)量化在大模型上的效果下降也较少,具备可用性。量化的优势在于:一是降低显存占用,使模型可在单机或单卡部署,减少通信开销;二是提高访存带宽,如从FP16或BF16量化至INT8或IP8,带宽压力可降低一倍,对带宽受限的算子,相当于加速一倍;三是提升计算速度,多数硬件上INT8计算的算力是FP16或BF16的一倍。当前业界常用的量化方案如SmoothQuant量化,其核心思路是:大模型权重分布平缓,无明显奇异值(训练正常的情况下),但输入激活值不可控,可能存在大量奇异值(如99%的值在±1内,1%的值为100以上)。传统Min-Max量化会导致有效数据被量化为零,精度损失大。SmoothQuant量化将奇异值转移至权重,利用权重的平缓特性分摊压力,使INT8量化的效果损失控制在1个点以内甚至无损。三、MOE场景下的加速技术MOE模型的主要问题是权重庞大,虽单个token激活的专家有限,但当输入预处理数据量大或批次尺寸大时,可能激活所有专家,导致带宽压力骤增。对此,可将专家分配到多张GPU上(如256个专家,每2个部署在一张GPU上,共需128张GPU)。对于被频繁激活的“热专家”,可单独部署并进行冗余备份,以降低其计算压力,避免因热专家计算缓慢拖慢整体进程(因所有token需与专家计算完成后进行全局通信)。MOE模型结构复杂,需采用多种混合并行方式优化:注意力(Attention)层可采用TP并行(可能结合SP并行)加速;输入部分采用DP并行;MOE层(FFN层)采用EP并行。过程中涉及大量通信和数据交换,且需多机多卡分布式部署,复杂度高于dense模型。针对DP域的加速技术包括“分块预处理(Chunk Prefill)”:DP域中不同输入的长度可能差异较大(如A输入长、B输入短),导致不同显卡的计算时间不均衡,通信需等待所有显卡完成计算,造成部分显卡空闲。采用Trunk Prefill,将长输入按固定长度(如1024)切分,分轮计算,使各显卡计算时间均衡,减少空闲时间,提高整机吞吐量。计算通信隐藏技术也可提升MOE性能:一是利用共享专家,在共享专家计算时进行其他专家的分发(dispatch),隐藏分发时间;二是采用多流(Multi-stream)技术,将输入分成多组,交替进行注意力计算和合并(combine)操作,实现计算与通信并行,虽对单用户端到端延迟影响不大,但可显著提升整机吞吐量。负载均衡对MOE至关重要:未做负载均衡时,部分专家(热专家)被频繁访问,负载过高,而部分专家(冷专家)很少被访问,资源浪费。通过为热专家分配更多显卡、将冷专家集中部署,可使各显卡的token计算量均衡(如优化后差异从2-3倍降至基本均衡),减少空闲时间,提高整机吞吐量。MOE的投机解码(MTP)技术:在Dense模型中,投机解码采用小模型配合大模型,小模型生成多个token(如10个),大模型校验并接受正确的部分,加速生成过程。MOE的MTP技术则新增一个与标准层相同的Transformer块,该块生成结果需校验,成功则接受,失败则重新生成。当接收率达80%以上时,可带来20%以上的提速。注意力与前馈网络分离(AF分离):借鉴PD分离思想,将模型中的注意力(Attention)和前馈网络(FFN)拆开部署。在解码阶段,随着解码长度增加,注意力的资源需求呈平方级增长,而FFN的资源需求基本恒定(输入为B×1)。将两者分别部署在不同机器上,可根据需求灵活扩容注意力机器,满足整体吞吐量需求,收益可观。四、强化学习后训练场景下的高效推理采样当前强化学习后训练(如PO、POG、SPU等算法)备受关注,我们采用“训推共卡”方式:训练与推理共享计算卡,训练完成后模型更新至推理引擎,推理采样的数据再用于训练,形成迭代。过程中需解决训练与推理的切换、模型更新及推理加速等问题。针对后训练场景的方案包括:一是模型卸载,训练时将推理引擎的模型及KV缓存卸载至CPU或丢弃,复用显存;二是推理引擎热启动与模型快速更新,训练得到的新模型可快速更新至推理引擎,使其继续推理采样;三是优化推理以提升吞吐量,后训练场景对延迟不敏感,因此可极致压榨显存,提高并发路数(高路数下解码效率更高)。总结与展望大模型推理虽模型结构较传统小模型简单,但优化工作复杂,涉及多机多卡分布式推理、KV缓存、注意力优化、量化(需保证效果,多采用后量化)、服务化技术(如LoRA、PD分离、AF分离、重新解码等)及底层算子融合与效率优化等。未来展望:1. 低比特量化:目前8比特量化较普遍,4比特量化因效果损失小,有望成为今年的主流,2比特量化也值得进一步探索。2. 分布式系统优化:随着模型尺寸增大,超级集群的可靠性、易用性、部署维护及容灾能力需重点考虑。大规模集群中,单卡故障可能影响上千用户,需完善容灾机制。3. 精细化显存管理:长上下文导致KV缓存占用显存剧增,需通过异步下发、显存与CPU间数据拷贝及备份等方式,在有限显存中运行更多路数,提高利用率。4. 自动调优:相较于手写算子,Triton等工具在常规算子性能上已不逊色,华为的相关工具也在算子融合调优方面发挥作用。未来需探索更高效的算子开发与调优方式,加速推理开发。以上就是本次分享的全部内容,感谢大家的聆听。已结束——【课程预约】F5G全光设计指导及部署建议JDC公开课来啦!这次我们请到了社区的用户情倾摩天轮时间是2025年7月1日(周二) 19:00,JDC视频号线上直播,不容错过!JDC公开课,知识积累的宝库,思维的火花碰撞的地方!主讲人简介●广州明创网络科技有限公司 光网络解决方案专家● JDC白银发言人● 多次获得JDC有奖探讨奖项参与有礼2、提问有礼:在评论区加上自己想提问的问题,问题若在直播间被选中答复,将获得JDC独家定制礼品3、邀请朋友预约有礼:识别下方推广二维码,生成自己的专属推广二维码图片,将图片转发至微信朋友圈,配文“智慧引领:未来医院建设与规划”,扫描二维码预约,一起进步”,将发送的朋友圈截图发送至本帖的评论区,即可获得10智豆。😆邀请人数最多的TOP 5兔粉将分别额外获得800、600、400、200、100的智豆奖励,最低邀请人数需分别>20、>15、>10、>8、>5, JDC将会在活动结束后公示TOP 5邀请数据,数据统计截止日期:本次直播结束后🥰生成专属推广二维码流程如图🥰【干货分享】医学智能影像标注一体机实战分享一、分享主题今天借助JDC平台分享我们在医学影像、智能标注方面的一些产品研发及场景推广实战经验,及与华为合作的智能标注一体机产品,并对未来软硬协同的一体机产品合作做一些展望。二、产业背景介绍2019年以来数据驱动医疗行业科研发展已经成为一种明显的趋势,相关的论文、研发实战都充分证明了这一点。其中以数据驱动、科学研究和影像标注,这已经是一个行业的一个发展的一个趋势,也是解决医疗行业基于影像数据做行业科研的必要基础技术支撑底座。 而我们国家的在医疗数据应用场景化实战方向也走在了世界前列,尤其是很多医学和数字化技术的结合方面,其同质化服务的能力和效率,也适合我们国家面向公众服务的普适医疗的理念。通过提供最佳的一些临床实践的一些场景,来帮助我们用数字化的技术、工程化的技术来驱动医学的精准高效和同质化的公共医疗服务,服务”健康中国“的宏大目标。 人工智能技术有大量的行业落地需求,推动AI算力向边缘侧迁移。同时,边缘AI技术已经从边缘的机器视觉逐步进展到大语言模型、生成式AI、多模态大模型等新一代的AI技术方向。另外大家可以看到,我们国家现在的医学的智能化重点发展方向,区别于美国的集中化的医疗服务模式(如facebook或谷歌大平台模式),更多应用场景在边缘测的诊疗服务。因为大部分医疗专业数据是在医院端的私域数据,做专业病种医疗科研,采用以20%的互联网和公开的数据做大厂基础模型平台为底座,以专有高质量数据集做专病模型知识库或微调,这种训练出来的模型才能更精准的、更准确的医疗专业病种诊疗服务实战,服务于我们的广大的患者。所以在医疗行。行业边缘的智能市场是一个很大的市场。大家可以看到下图的一些数据,我国的边缘智能设备增长很高,医疗行业是其中的关键产业热点方向。中国人工智能边缘计算在政策与技术融合驱动下快速发展,医疗领域成核心场景。医疗边缘智能一体机凭低延迟、隐私保护优势,支撑实时诊断、远程监测等应用。全球 AI 医疗边缘系统 2031 年将达 46.2 亿美元,年增 12.1%,中国因基层需求与老龄化,市场空间广阔,前景向好。 数据驱动临床医学科研也面临诸多挑战,医生日常诊疗任务繁重,科研任务数据管理主要困难有:全量全周期数据集成治理难:跨系统、跨业务、多模态、 多学科长周期、连续性、院内外 完整性、标准化、一致性、 整合对齐数据检索纳排难:非结构化数据检索匹配难复杂检索和时间约束还依赖 SQL 语句编写查询后结果实验验证效果不佳, 且需反复调整数据加工处理难:影像标注、文本标注费时费力 数据预处理工作繁琐特征提取和选择需要技术、经 验和大量实验数据分析建模门槛高:学算法、学编程、搭环境碎片化工具使学习成本倍增、 科研效率倍减技术门槛高、人才稀缺、跨学 科合作难因此行业需要一个一体化的医疗科研解决方案,融合医学和数字科技,实现医疗数据要素价值化,赋能数据驱动的科研创新,规模化实现成果转化。平台需要提供医疗科研多模态数据采集、治理、智能化标注、团队协作科研管理、专病库建设、医疗知识服务、医疗科研成果输出(论文、数据集、应用等)及产业功能服务平台等全面功能组件。 在国家大力推动数字经济与人工智能发展的时代背景下,数据标注产业正经历着迅猛发展。2023 年我国数据标注产业规模达800亿元左右 ,到 2027 年,其产业规模将大幅跃升,年均复合增长率超过 20%。数据标注正在向自动驾驶、医疗影像、 语音识别和自然语言处理等全领域扩展,占比分别达到 35%、 25%、20%和 15%。各项国家地方相关政策为数据标注发展创造条件,为医疗AI发展提供机遇。2025年1月:国家发展改革委、国家数据局等多部委发布《关于促进数据标注产业高质量发展的实施意见》发展目标:到2027年,数据标注产业专业化、智能化及科技创新能力显著提升,产业规模年均复合增长率超过20%。推动公共数据标注需求,编制公共数据标注目录,深化人工智能在政务服务、城市治理等领域的应用。2024年5月: 《国家数据标注基地试点建设相关文件》公布7个试点城市(成都、沈阳、合肥、长沙、海口、保定、大同等),推动数据标注基地先行先试。基地需结合地方优势,优化能源与算力资源配置,融入“东数西算”工程布局。2024 年,国家数据局等部门印发《“数据要素×”三年行动计划(2024—2026 年)》、国家发改委等部门印发《国家数据标准体系建设指南》和《关于促进数据产业高质量发展的指导意见》强调数据标注在低空经济、自动驾驶、智慧医疗等领域的应用潜力。提出通过数据标注驱动场景创新。医学影像数据标注作为产业重点发展方向,面临的更大问题与挑战:专业性:医学影像数据标注专业性要求极高,标注量极大,迫切需求智能化标注平台。 卡脖子:由于技术封锁,国内医学影像标注严重依赖于国外单机版标注产品。三、医学影像智能标注产品设计--飞标医学影像标注一体机 核心价值:解决多模态医学影像标注效率、质量问题并保证数据安全产品概述:通过医学影像分割大模型及多种AI技术,提供150余种可扩展的预标注算法,灵活支撑不同规模的数据标注团队高效完成医学影像协同标注工作,支持自动标注、半自动标注、手工标注、三维标注、形态学测量,提高放射学影像的标注效率和质量;基于Web云原生的服务模式,通过医疗数据集中管理,满足医疗数据不出院的要求。关键功能:1、基于大模型、AI智能辅助标注,复杂标注只需一键就完成基于 AI 智能辅助标注技术,医学影像分割大模型支持一键完成复杂组织的精准标注,高效处理海量数据,显著提升标注效率与精准度。2、150种医学影像预标注算法,降低标注门槛提高准确性飞标平台的预标注算法库已经内置了150种医学影像预标注算法,用于解剖结构和病灶的自动化标注 3、多模态医学影像支持,一个工具全搞定,相同的操作方式,学习成本更低,效率更高。模态类型: CT、MR、DR、PAT、DSA、超声、钼靶、内窥镜、眼底、皮肤镜、病理数据格式:DCM、ZIP、JPEG、PNG、GIF、BMP、WBMP、TIFF、MHA、MHD、NIA、NII、NRRD、MP4、MOV、FLV 4、多人、多团队、多中心协同医学影像标注支持单人标注、多人协同标注、专家审核流程等多种协作标注流程。提供多人、多团队、多中心协同工作的组织、分配和管理,通过及时收集反馈意见,进行标注结果审核和优化,不断提升标注质量。 5、电影级高级可视化赋能,让细节展现更清晰通过流畅顺滑的实时渲染,清晰展示医学影像的细节和结构,准确理解图像内容并正确定位感兴趣的结构或病变区域,有助于更清晰地了解病灶与周围组织的空间关系,拓宽医学影像数据的应用场景。 6、数据脱敏与匿名化,实现隐私与价值的平衡数据脱敏与匿名化运用替换、加密等技术处理敏感信息,切断数据与个人身份联系,保障患者隐私。经脱敏和匿名化处理的数据可用于科研、医疗服务优化等,实现了隐私保护与数据价值释放的平衡。隐私合规:满足法规要求。数据可用性:保持数据价值,支持分析与共享。安全平衡:权衡隐私强度与业务需求提供技术。 飞标平台特点与特色1、AI智能辅助标注大模型交互标注更高效这一特性,显著提升了标注的速度和质量。涵盖广泛的分割模型,并且可以在新的医学影像上即开即用,无需额外的训练,做到零样本迁移2、智能预标注技术通过自动病灶检测、自动预标注结果加载等自动化预处理方式,降低IT技术与人工智能应用门槛,提高了标注效率和质量。3、协作标注支持多人在线协作标注标注,标注人员可以在不同的地点通过网络进行实时协作。提供任务分配、进度跟踪等功能,方便团队协作管理。4、高级可视化丰富的高级可视化功能能够将标注结果以更加直观、清晰的方式呈现给用户。通过不同的颜色、透明度、三维模型展示等手段,标注人员和其他医学专业人员可以更清晰地分辨不同的标注区域及其特征。5、多租户与数据安全飞标平台能够服务于多个不同的组织、团队或用户群体,每个租户可以在平台上独立管理自己的标注项目、数据和用户权限。保证数据的隔离和安全,提高了平台资源的利用率。四、应用场景与案例产品主要客户群是医院\医疗科研机构\大专院校,针对科研管理,科研团队和科研工作者、医疗教育工作者,分别提供不同层级的功能组件,满足不同应用场景的精致化需求定制。典型应用场景有:应用场景1:医学影像标注支持多人、多团队、多中心协同工作的医学影像标注平台,解决医学影像标注的关键需求:标得准、标得快、隐私安全等 应用场景2:手术规划支持手术评估、策划、方案尝试、术中参考、术后康复等全流程持续改进的服务功能。 应用场景3:医学影像教学通过精确的图像分析和可视化工具,帮助医学生和专业人员更好地理解复杂的解剖结构和病灶变化,从而提高诊断能力和临床决策的准确性 实战案例分享:智能标注,提高标注效率2-30倍 五、东软-华为”添翼“医疗健康智能化一体机合作实战在2025年2月的DeepSeek热潮中,医疗行业成为部署行业DeepSeek应用的急先锋,全国已经陆续部署超过余个医疗行业DeepSeek应用场景,也给软硬结合的智能化一体机产品提供了高速发展的契机。在8月浪潮之后的行业冷静期,客户逐渐理性,价值驱动占领高地,节奏放缓,市场仍存在大量算力缺口,有特定应用场景价值的智能化医疗行业一体机市场依旧在高速增长。东软添翼医疗健康智能化解决方案2.0,以业务与数据为基石,依托东软医疗数据价值化与“融智”智能化双框架,构建覆盖数据治理、知识萃取到模型构建的全链路医疗数智体系。添翼2.0聚焦于智慧医疗、智慧服务、智慧管理、智慧基层、智慧卫健及城市级健康医疗数据空间六大核心场景,实现医疗赋能体集群(“N”个赋能体)。东软添翼2.0是融合AI、数据、流程、组织于一体的医疗智能化方案,实现数据基座、赋能平台、价值扩展“三维”突破,全面满足用户对数据深度治理、科学能力转化、海量知识萃取、场景模型构建、全场景赋能的迫切需求,为医疗体系的智能化升级提供核心动力。 东软和华为在这个过程中紧密配合,发挥各自优势,讲国产化尖端智能计算平台和医疗行业场景成熟智能化应用相结合,高效率适配国产化软硬件环境,推出了系列东软-华为”添翼“医疗健康智能化一体机合作产品。产品名称功能简介适用销售客户推荐硬件配置医事服务一体机智能写作、智能问答、智能通讯、智能结果速查、病情讨论等。电子病历客户,5.0以上版本NPU:8张Ascend 910(昇腾Atlas推理卡,64GB缓存)病历质控一体机病历辅助生成、病历内涵质控、智能病历点评。电子病历客户,6.0以上版本NPU:8张Ascend 910(昇腾Atlas推理卡,64GB缓存)患者服务一体机智能客服、智能导诊、智能预问诊、智能病历解读。互联网医院客户NPU:8张Ascend 910(昇腾Atlas推理卡,64GB缓存)卫健管理服务一体机数据采集、数据治理、管理服务、基层辅诊、居民健康管理。卫健管理客户NPU:8张Ascend 910(昇腾Atlas推理卡,32GB缓存)医疗影像标注一体机多模态数据管理、智能标注、隐私保护、团队科研、可视化展现医疗科研机构、医院专业科室NPU:8张Ascend 910(昇腾Atlas推理卡,32GB缓存) 六、软硬件一体机合作展望在软硬件之呢个一体机合作过程中,也对未来更深入的合作有了更多的期待和展望:1. 期待更全面合作场景在医疗科研、患者服务、辅助诊断、病理核查、医保服务等众多方向,扩展医疗智能一体机应用合作场景。2. 期待更符合行业应用特点更丰富定制化一体机在功能、性能、制冷方式、样式、空间、噪声控制等方面灵活配置,更能适应医院科室前端工作环境,支持灵活配置软硬件基础能力。尤其医疗行业前端部署的低噪音、液冷、医疗设备眼样式一体机需求迫切。3. 原厂商更深入服务支持从基础硬件支持,到软件框架配置、多基础模型支持、智能运维服务、人才培养、托管服务等多场景提供更深入服务能力。 张静波(JDC@zhangjbn)2025年10月14日已结束——【课程预约】沙特2030愿景对能源行业的影响JDC公开课来啦!这次我们请到了老朋友能源企业高级主管——Catherine老师分享《沙特2030愿景对能源行业的影响》时间是2025年8月26日(周二) 19:00,JDC视频号线上直播,不容错过!JDC公开课,知识积累的宝库,思维的火花碰撞的地方!主讲人简介●能源企业高级主管参与有礼1、扫描下方海报上的二维码,预约直播2、提问有礼:在评论区加上自己想提问的问题,问题若在直播间被选中答复,将获得JDC独家定制礼品3、邀请朋友预约有礼:识别下方推广二维码,生成自己的专属推广二维码图片,将图片转发至微信朋友圈,配文“调频三步走:电力行业电网调频应用分享”,扫描二维码预约,一起进步”,将发送的朋友圈截图发送至本帖的评论区,即可获得10智豆。😆邀请人数最多的TOP 5兔粉将分别额外获得800、600、400、200、100的智豆奖励,最低邀请人数需分别>20、>15、>10、>8、>5, JDC将会在活动结束后公示TOP 5邀请数据,数据统计截止日期:本次直播结束后🥰生成专属推广二维码流程如图🥰已结束——【课程预约】向量数据库的原理与大模型适配应用JDC公开课来啦!这次我们请到了老朋友资深开发工程师——pandas分享《向量数据库的原理与大模型适配应用》时间是2025年9月9日(周二) 19:00,JDC视频号线上直播,不容错过!JDC公开课,知识积累的宝库,思维的火花碰撞的地方!主讲人简介●资深开发工程师参与有礼1、扫描下方海报上的二维码,预约直播2、提问有礼:在评论区加上自己想提问的问题,问题若在直播间被选中答复,将获得JDC独家定制礼品3、邀请朋友预约有礼:识别下方推广二维码,生成自己的专属推广二维码图片,将图片转发至微信朋友圈,配文“向量数据库的原理与大模型适配应用”,扫描二维码预约,一起进步”,将发送的朋友圈截图发送至本帖的评论区,即可获得10智豆。😆邀请人数最多的TOP 5兔粉将分别额外获得800、600、400、200、100的智豆奖励,最低邀请人数需分别>20、>15、>10、>8、>5, JDC将会在活动结束后公示TOP 5邀请数据,数据统计截止日期:本次直播结束后🥰生成专属推广二维码流程如图🥰【干货分享】SD-WAN广域互联项目分享 一、分享主题本文以实际项目为基础从规划、建设、运维、优化几个维度对整个项目的技术方案以及端到端交付流程做下概述性的介绍,旨在为客户构建一套高效、灵活可以快速部署的广域互联解决方案,帮助提升企业网络的可靠性、效率和安全性,降低网络成本。二、项目介绍随着无线、物联化、云化的发展趋势,客户已经有很多应用采用云的方式进行连接了,当然也包括设备上云。客户分支布于全国各地,且位置相对分散,导致运维工作较为复杂繁琐。传统组网方式中,客用网与专网存在重复建设问题,导致建设成本高且建设周期长。通过引入LAN/WAN融合(SD-WAN)解决方案,为客户构建一条高效、灵活可以快速部署的广域互联解决方案,此方案基于的网络设备主要是AR系列路由器,它是通过EVPN动态建立隧道的技术,为客户构建了分支与数据中心、云之间随需互联的能力,优化了业务体验并降低了运维成本。经过前期端到端的业务测试,满足了客户的业务需求,并辅助售前POC测试,提供了必要的测试交付件。针对客户的特定需求,结合原厂专家与ASP技术专家,从架构设计和后续扩展性方面制定了详尽的技术方案,为项目的实际交付奠定了坚实基础。此外,利用原厂提供的专业技术服务,进行了建设了样板点,为大规模门店的后续交付提供了可复制的实施模板,从而确保了交付质量的一致性和高效性。三、规划设计方案整个方案的设计逻辑:首先,控制器主要采用的是公有云形态的控制器NCE-Campus,主要用于业务的呈现和配置的下发。中心站点(HQ)部署了多套高性能AR路由器CPE终端设备提供海量分支门店的汇聚接入,分支门店部署的设备主要有AR系列路由器、S系列交换机,3-4个新一代WIFI6 AP提供有线无线接入服务。为了保障整个方案的可靠性,以及高安全性,我们通过一系列的设计来确保整个SD-WAN网络是高可靠,高安全的。在可靠性方面设计主要包括中心站点,分支站点部署双CPE,实现设备及可靠性。通过WAN侧、LAN侧部署多条冗余链路提升链路级可靠性,分支部署4G逃生链路,交换机堆叠组网等设计,来尽可能保障我们的业务不中断。在安全性方面设计,整个SD-WAN解决方案是以VPN的方式在SD-WAN组网里构建一条属于VPN的业务隧道,业务都是跑在VPN实例里面的,VPN实例都是经过IPsec加密的。同时通过NETCONF/SSH以及DTLS协议来确保管理通道、控制通道的安全性。在分支门店组网设计中,业务层面主要划分为两个VRF,用于承载不同的业务,VPN1用于承载生产业务,VPN2用于承载访客业务,两者彼此之间相互隔离,禁止互访,访客只能访问互联网。分支门店采用双CPE部署,通过互联网及4G LTE逃生链路提供网络接入服务,下挂L2交换机结合新一代WIFI 6为门店提供有线无线接入服务。通过云AP的容器化技术部署任子行审计插件,不仅满足了公共场所82号令的合规性要求,还避免了额外部署硬件审计设备的需要,从而显著降低了成本。SD-WAN路由总体方案与流程:整个路由设计主要分为以下几个部分:1、Overlay LAN侧路由:为了使各站点的CPE设备和LAN侧网络互通,需要配置Overlay LAN侧路由。中心站点LAN侧路由主要通过OSFP将LAN侧流量引入Overlay隧道,门店主要是静态路由。2、内联隧道路由:使用OSPF,用于Overlay网络的VPN与Underlay网络互联,该路由在用户开启站点上网或与传统站点互联时,通过系统自动编排和配置,无需手工配置。3、互联链路路由:使用的是OSPF路由协议,站点双CPE时,用于两CPE之间交换路由,通过系统自动编排和配置,无需手工配置。4、Overlay WAN侧路由:为了使SD-WAN网络中的各个站点在Overlay组网上可以互通,需要配置Overlay WAN侧路由。根据Overlay组网的不同拓扑模式,SD-WAN控制器会自动完成Overlay WAN侧路由编排,无线手工配置。5、Underlay WAN侧路由:站点CPE每个WAN口对应一个underlay VRF,本方案中心站点和分支站点主要通过静态路由的方式学习到underlay WAN侧路由。四、落地交付实施和交付管理本次复杂项目的顺利交付,得益于各方在规划设计、设备安装、样板店打造、门店批量部署直至后续运维转移等关键环节中的相互协作、紧密配合。客户职责:要负责提供设计图纸、IP地址范围、分支门店改建规划,并协助完成验收等工作。弱电施工方:负责全国分支站点设备安装、连线及协助工程师(远程方式)业务上线工作,并参与协助项目验收等工作。厂家:前期高阶方案设计、安装指导手册输出、样板店建设、远程技术支持、后续提供备品备件,针对重大问题或变更进行现场支持等...资质服务商:整合原厂样板店交付能力,进行后续大规模门店交付的前期准备,实施批量门店的高效交付与业务上线,并负责后续平台运维中的故障处理及运维交接工作。从调研&网络规划设计、中心站点调测、样板点建设截止到今天已经完成了数千家站点的业务上线。在项目交付过程中输出了各类交付件,包括不限于:详细方案设计以及LLD设计、工程师的分支站点预配置手册、预安装中心的操作指导手册、上站人员的门店操作指导手册,以支撑项目的顺利实施与交付。在项目交付流程中,增加了很多确认环节,以确保每个阶段都有明确的输出,从而保障整个项目的交付质量与原厂商标准一致。同时在交付过程中,将识别到的风险会进行统计并分析,以确定风险问题可能产生的概率,并制定相应的风险响应计划,同时明确责任人,以便提前采取措施进行风险规避。单站点交付流程涵盖以下步骤:从交店计划的制定起始,接着进行预配置计划的规划与实施,包括预配置的执行与检查,随后进入业务开局阶段,最终完成门店的上线验收并转入维护阶段。其中预配置执行到预配置检查这一部分花费时间较长,因为所有设备SDN去命令行化后,所有配置都需要在控制器图形化去完成,相比以前传统命令行的方式虽然在易用性方面大大增强了,但是因为分支门店业务量比较大,比如有大量的VLANIF以及ACL策略,图形化去部署反而效率不如传统脚本命令行的方式,效率完全跟不上,导致可能会影响整个项目的进度。为了解决在交付阶段预配置效率慢、容易出错的问题,我们引用了自动化工具的能力。通过调用控制器API的方式,可以配置开局通用模板,仅需修改站点差异化数据(如地址段、站点名称等),便可批量完成站点配置下发,从而保障了SD-WAN项目的大规模上线。同时,这个自动化工具也应用在了后续的运维阶段。对于几千家门店的配置变更,传统方式需要一个个站点去修改,而通过自动化工具则可以批量完成上千家站点的自动化配置变更(如修改SSID、VLAN切换、中继变更、网络密码变更等)。同时,自动化脚本工具已从V1.0迭代更新至V2.0(SD-Branch),该版本将自动化能力无缝集成至控制器,作为控制器的一项核心功能。这样不仅避免了控制器升级时的重新适配的问题,在易用性方面也得到了进一步提升。————【直播间互动】————1、与第三方厂商兼容性的和方案的安全性问题如何考虑的? 答 <emoji emojiname="01_add.gif"></emoji>:关于厂商兼容性的和安全性,个人理解是。因为以前的SD-WAN方案,WAN侧是WAN侧的控制器、LAN侧是LAN侧的控制器,需要部署2套控制器。这次的方案它是把这WAN侧和LAN侧控制器融合到一起,如果你需要端到端自动化编排能力,实现WAN侧、LAN侧统一编排以及自动化业务发放,这个时候你就需要统一品牌。这个时候对第三方厂家的适配度就没那么高了,你中心站点LAN侧可以用其他厂家的设备组网,但是如果你分支站点WAN侧、LAN侧都要实现SDN自动化编排的能力、WAN侧和LAN侧通过一套控制器都管起来话,那么分支站点的WAN侧设备和LAN侧设备需要统一品牌、统一厂商。还有比如有的厂家用的是NETCONF作为管理通道协议,另外的场景可能采用别的协议,所以一般情况下SD-WAN组网尤其要实现端到端业务部署与编排的,都需要统一品牌、统一厂商。安全性方面,也是通过一系列的设计在确保整个SD-WAN解决方案的安全性。包括NETCONF/SSH来确保整个管理通道的安全、DTLS协议来确保整个控制通道的安全、IPSec加密来确保整个数据通道的安全。同时CPE设备也集成了IPS、AV防火墙的功能,来确保整个数据交互的安全无忧。2、传统网络如何无缝迁移到SD-WAN网络?答:迁移过程中肯定不是无缝的,无缝迁移是相对的,所以迁移过程中它是有个窗口期的。在迁移过程中通过加持一些自动化的能力,来确保窗口期内快速完成传统网络到SD-WAN网络的改造,确保整个业务快速上线。通过引入一些自动化的能力,来使我们的业务部署变得更高效、便捷。3、升级过程中对哪些业务会有影响?答 <emoji emojiname="01_add.gif"></emoji>:SD-WAN升级基本上分为控制器升级、网元升级两大部分。控制器升级业务现有互访是不会有影响的,但是如果你比如认证用了控制器作为认证服务器,这个时候控制升级对你比如无线Portal认证会有影响,当然通过设置一些逃生策略可以确保已经认证上线的用户不受影响,新认证的用户会有影响,控制器升级完毕后,业务会恢复。此外,关于网元升级,由于采用双机部署策略,一般会在选定的窗口期逐一进行升级,从而确保业务受影响的范围与时间均处于可控状态。同时,同时并非所有分支站点都是24小时有生产业务,所以无论是控制器还是网元的升级,对整体业务的影响都相对较小。不过在升级过程中,还是需要制定严格的升级方案及回退预案,以保障业务的持续稳定运行。4、SD-WAN方案采用本地部署还是购买SaaS服务?答 <emoji emojiname="01_add.gif"></emoji>:SD-WAN方案部署的方式一般有以下几种:本地部署:客户购买软件license部署在本地硬件服务器上,这种部署方式一般设计组网比较大的客户,客户倾向于自己建设自己维护,有一定自有的维护能力的场景,前期预算比较足。所有软硬件归属都属于客户自有,一次性买断。公有云买盒子+云服务的场景:这种控制器一般是租用厂家的,控制器的形态是云化形态,硬件盒子如CPE、交换机、AP这个自己购买,资产归属于客户自身。控制器根据网元数量按1、3、5购买年费的形式。这种投资前期成本比较低,不需要自己部署控制器,但是这种投资模式每年都是等额的,比如一台设备云管理是100块钱,那么每年都是100块钱。但是因为不需要自己部署厚重的控制器平台、加上控制器也是由厂家运营维护,一定程度上还是比较节省成本的,海量分支站点接入一般都推荐采用这种部署模式。也就是采用买盒子+云服务的方式。 因此,在选择部署方式时,应综合考虑应用场景、前期投资预算等多个因素,以确保选出最合适的方案。5、SD-WAN如何保证业务质量以及端到端QOS的?答 <emoji emojiname="01_add.gif"></emoji>:SD-WAN解决方案可以保证端到端业务质量,因为分支与中心站点上了SD-WAN控制器后可以支持端到端编排,那么就可以保证端到端的业务质量是一致的可以定义端到端的QoS。例如利用A-FEC自适应前向纠错这一广域网加速技术,系统能够根据网络丢包状况动态生成冗余数据包。接收端设备随后对这些数据包进行校验与重组,从而确保音视频传输的流畅性。实际测试显示,即便在音视频业务中遭遇10%至20%的丢包率,业务依然能够正常运行。这些能力一般各个SD-WAN厂家都是支持的。当然,对于追求极低延迟和高可靠性的业务,专线仍然是不可或缺的。这里需要澄清一个误区:采用SD-WAN并不意味着要完全取代专线。实际上,当部署了SD-WAN并具备多条WAN链路时,SD-WAN能够最大化这些链路的带宽利用率,从而提升整体链路的效率。从另一个角度来看,通过SD-WAN方案的精细化选路策略,原本可能需要10M带宽的专线业务,可能仅需5M的专线就能满足需求,这在一定程度上能够有效降低专线的成本。JDC公开课系列活动主讲人正在火热招募中,快来分享你的专业,与JDC一起成为数字化传播大使,还能赢取丰厚智豆奖励,快点击链接报名吧!【干货分享】从PC到AI,一个工程师的进化论前言:大家好,我是蓝色空间。今天我要讲的主题就是“从PC到AI,一个工程师的进化论”。那么为什么要讲这个主题呢?因为我之前在咱们论坛已经讲过了一次公开课。分享了我20年的工作经历。而讲这次公开课的目的,是我看到了身边有很多工程师,无论是年轻的工程师,还是年纪大的工程师,他们在工作中往往都会有各种各样的困惑。尤其是现在AI系统在不断发展,AI替代逐渐深入,再加上经济下行,造成了很多工作岗位的消失和裁减,进而造成我们所有人的压力都很大。那么在压力增加的时间段,就会有更多的人会产生迷茫。无论年纪多大都会有。而我工作了也有20多年了,积累了一定的经验,也走出了一条属于自己的路,我也很清楚想走出一条属于自己的技术人员的路是很困难的,尤其是几十年走到底,一直做技术,更是非常困难。那么我今天的公开课就呼应了上次的经验分享,目的就是给大家指出一条我看到的路,希望能够抛砖引玉,也希望大家最终都能找到属于自己的路。接下来开始本次公开课。首先说一下目录,也就是要讲到的各个时代,我是从工作的先后顺序来总结的。我这次的公开课内容,根据我的工作经历总结了以后,我发现它就符合这几个时代的特点。而这几个时代,也暗合了我们整个计算机行业的发展特点。从PC到网络,网络时代包含了传统互联网还有手机端的移动互联网,我把它合并成网络时代。接下来是大规模的云计算。现在AI又在爆发。那么未来会是什么样子?我们都需要考虑。作为在这个行业里面真正做实施、做技术的工程师,我们必然是参与到这个时代中的。接下来就看一下,我这20年是怎么走过来的。今天更多偏向于技术方向,给大家介绍我在技术方向上怎么发展,然后提示一下大家可能会遇到的路径。首先要进行破题。为什么我用进化论来破题呢?首先是因为我在想标题的时候,首先就想到它了。进化论是基于当前科学界的共识,大家都认为很可能是没有问题的,是符合科学原理的。但是由于各种物证还不是很完善,具体的细节和一些具体的例证可能还有一些值得商讨的地方,就造成了进化论一直处于争议中,没有最终盖棺定论。那么我用进化论作为公开课标题,一方面是因为我们这个时代的发展和我个人经历的发展,也符合进化论,总体思路是不断的进化,不断的螺旋上升的。另一方面,也是因为进化论会引发一些争议,那么我自己的个人经历也不是放之四海而皆准的。也就是说,大家在参考我的经验过程中,最终还是要走出自己的路,对我的经验不必全盘接受。因为我们工程师首先最重要的一点就是不能全盘相信权威,一定要有质疑和自己的思考。第二就是在我的ppt中会发现排版一般比较简单,也就是字体颜色,还有具体的示意图都比较简单,似乎不太符合非常讲究细节或者专门做演示的PPT。而这就是因为我们工程师和科学家不一样,我们做的是利用科学家给我们的理论知识和工具来发现问题、解决问题,这才是工程师真正要做的事情。但是现在很多人做的事情,可能把自己从一个工程师就做成了一个所谓“搬砖的”,也就是俗话说的码农,把自己变成了一个体力工作者。但是实际上我们应该做一个脑力劳动者,工作中是真正应该动脑的。那么我们的工作中应该聚焦于说明问题、展示问题、解决问题。PPT也应该遵循简洁、高效、快速、准确的原则。最近很多大企业也在做这种反思,也在提升沟通的效率,杜绝过于花哨的PPT。所以这是大的趋势,为了提升效率,都要做一个简洁化的处理。在进入职场没多久,第一件重要的事,就是我负责的机型出现了一个严重问题。这个问题是什么呢?正常的流水线生产,它其中有一部是试生产,就是少量的生产几百台,这些机器生产出来,通过测试确认一下有没有问题,没有问题才会大规模生产。一旦有问题,会重新返工去改善设计,改善了之后,再重新做试产和正式生产。那么在试生产机型中,由于我们已经采用了现代化的工业流程。这个pc机经过测试以后,不能开机或者出现开机有问题的故障率不应该过高,一般都是千分之一以下,甚至是万分之一左右。那么在我们那次试生产的过程中,故障率最后达到了20%。什么样的情况算是故障率呢?就是走了一遍所有的测试流程没有走通,在某一个流程卡住了,它就视为有故障,然后就会下生产线,放在一旁等待处理。那么最终20%的机器被筛选出来,认为有问题。它的现象是什么?就是在测试过程中可能出现无法启动现象。因为我们测试过程中要随机启动几次的,那么这几次必须全部都能启动,才算测试通过。如果有任何一次无法启动,就认为是出现问题的设备,这种设备一旦到客户手里出现问题,那是要赔很多钱的。当时故障率远远超过常规情况,而且是建厂以来从来没遇见过的异常情况。当时我还是刚入厂没多久,大学毕业,领导把这个任务就派给了我。目的是什么?就是要找出故障率过高的原因,然后当时能采取的手段只有做硬件测试。我们都知道测试有黑盒测试和白盒测试这几大分类。那么白盒测试我们必须要针对代码或者针对硬件设计来进行。因为我们的机器是组装了以后,拿现成的各种零件组装一起进行的整机测试,所以我们没办法做白盒测试,也就是说我们面对的就是一个黑盒,那么我们能做的也就是观察它的现象,然后总结出其中的规律。这数百台机器要想测试唯一的手段是什么?那就是反复重启,统计成功率,统计出问题的概率。我们当时整个一组人,还拉了其他组的成员来帮忙,大家一起做了好几天的时间,昼夜不停,连轴转,最终这几百台发现不是100%的故障,某些机器可能是第一次启动失败,第二次就启动成功。那么我们每一台机器就要重启十几、几十次去统计它的故障的现象和概率,通过统计的方法来挑出来概率高的设备,以此为基准进行后续的测试,通过后续的测试来确认问题的根源。那么最终我们经过了将近一周时间的反复测试,成功找到几台100%没法开机的设备。这些设备就代表了我们的典型故障,那么它就是分析所有问题的依据,后来这几台机器就被拿到所有供货商和客户的会议现场,把这几台机器拿到现场后,大家现场测试。最终通过现场测试,发现了核心的一部分零件,确实存在问题。当时在行业内造成了很大的影响,最终供货厂商整改,我们所有的工作和加班损失由出现问题的厂商赔偿。这件事,当时是影响了整个国内PC行业的。当然这种事情一般是不会公开处理的,在行业内部就消化了,可能大家当时不会知道。所以大家可以看到,我初入职场第一个遇到的很严重的问题,就是一个有经验的工程师,也不见得能顺利处理的复杂问题。等于我们一开始就遇到了地狱级难度的开场。那么经过这个地狱级难度的训练,后续再出问题,我们再处理时,就能总结出一些经验,应对起来就游刃有余。我们经过了这种魔鬼训练,以后也就不至于遇到问题就手忙脚乱了。这个过程中我们是怎么找出问题的呢?首先我们要理解一下PC机的启动原理,这些都是我们在学校里学过的。因为我在学校里面是计算机专业,当时我把计算机专业几乎所有的电脑修了一遍,日常天天排查的就是这些不能启动或者异常的故障率。它的启动故障是由于什么原因,在我们看多了以后进行总结,就能通过这种大量的总结,找出很多故障的背后原因。正是因为有了这种积累,所以在出现这个问题的时候,我带着大家,虽然是刚毕业,我们也仍然成功的把这个问题找到了。并为后来的问题解决奠定了坚实的基础。当时领导对我们的表现都是很满意的。所以大家可以看一下,从学校出来,你学的基础知识不见得就是没用的。即使我们学校教的可能是有些过时的理论,但大家永远记住,冯诺依曼架构还是当前的计算机基本原理,整个机器的启动原理,目前为止仍然没变,PC到服务器到存储全是一样的原理。所以基础知识一定要打牢。其次就是面对新领域的挑战。我这个PC时代,其实我在每一个时代是把跟它相关的一些经验整合到一起了。我做这个预装系统的案例,就是第二个讲的这种预装几百台PC的这件事,并不是我在之前的工厂做的,因为工厂预装是有完整的流水线的。我也正是在工厂中的培训里解到了整个OEM流水线,它的系统预装流程。但是这个步骤当时是由专门的部门实现,我的部门不负责,所以我并没有完全掌握。那我是什么时间把它完全掌握呢?是换了下一份工作,已经干其他工作的情况下,我的负责的工作里面就有几百台PC机需要安装。他的要求是需要提前预装软件,提前激活,而且支持自定义账号密码。基本上就是要求把普通的PC机按照OEM流程做一遍,这是给工业领域定制的设备,也就是说我们拿来普通的PC机,把它定制成工厂生产所需的工业化的设备。所以我们要预装的东西并不是普通的这个PC制造厂它预装的那种软件。在这种情况下,我要参照它的体系自己完成。当时时间比较早,正好是Windows XP到Windows 7的转换过程中。我们都知道XP系统的预装是需要很多第三方软件协助的,官方也会给出各种软件的预装方法,但是它是需要多种第三方软件协助才行。当时刚刚转换到windows7的系统,这个系统是第一次采用了wim镜像。它自己支持镜像,自己支持全套的部署。同时。经过工厂模式,还有再次封装的方法,用这些方式来达到预装系统的目的,同时又能给客户一个初始化的体验。那么参照这套体系,我当时花了一周时间去研究。当时还只有不完整的英文资料,因为系统刚出来,那么在这种情况下。我要想完成预装,我必须依据英文资料来处理所有的东西。因为我第一份工作是以英文作为工作语言。我虽然英语学的不是特别好,但是对于这个工作用到的计算机相关的英语,掌握的是相当扎实的。所以我看这些英文资料,就可以很顺利的把相关的知识掌握到。接下来经过研究,在一周时间内把预装流程基本上摸透了。摸透了之后就进行了软件的预装,把所有PC机通过自动化脚本预装之后,系统自动启动,执行自动化脚本,再集成了一些第三方的软件进行拷机测试。这和我们日常家庭拷机运行软件差不多。所有这些软件和我们装机DIY后的流程差距不大,但是它必须要自动化完成之后,自动记录结果,然后自动生成报告,通过网络获取到第三方的设备里,报告放在第三方设备之后,再把这些所有的机器重新初始化重新封装,重新预装上我们需要的office软件、工业软件,还有其他的应用软件,最终做系统激活,然后重新封装。那么整套流程下来就必须要深刻的了解操作系统的原理,软件的原理,注册表的原理,还有系统各种组件的原理。通过这种流程也就完整的掌握了整个windows系统下它的这种体系架构。而且通过这种预装的测试,也找出了故障设备。通过维修操作,就把故障设备维修好了,最终就是在这半个月时间内,保质保量完成任务。因为原来领导的想法是,找几十个年轻的毕业生人工一台台安装,但是人工安装是达不到这个效果的。我一个人当时在半个月时间内完成,否则的话应该是找几十个人,用1~2个月时间去完成这个工作。大家可以想到这里面节省了多少的人工成本。而且这种预装的一致化体验给客户带来的价值也是相当大的。为什么我说它是新领域的挑战?对我来说这个工作原本是可接可不接的。对我来说,如果我接这个工作,则是从零开始。我们日常在工作中都说,机会是给有准备的人,什么叫有准备的人?面对新领域的挑战,敢上还是不敢呢?我们就不评估以后的收获,如果我们有能力可以去应对一些新的领域的挑战,我们应该找各种机会锻炼自己,提前把这些工作能力准备好。这种预装系统的能力在我第一次研究出来之后,在我未来的10年工作经验里面,有数次遇到了类似的情况,我利用同样的技术实现了其他的设备的安装、激活、及自动化部署。比如后续我有上千台的服务器要实施,最终大概有几百台机器需要在一周以内完成安装和初始化配置。但是当时由于工作安排,只有我一个人来执行,那么又是面对同样的情况,我就通过类似的方法来实现了系统预装,又一次解决了问题。也就是说,当我们做好准备的前提下,我们学到的东西是一定会有用的,不要把自己限制在自己的条框里。接下来呢就是我在PC机时代,做的几个超出我们平时工作范围的的技术经验,它是基于我们积累下来的能力,去不断的提升自己,做了一些额外的工作。比如说,当时我们有那个10个左右的光驱读盘失败,就是我们的PC制造厂的实验室里面,做测试用到的设备。做测试过程中光驱要经常用,有些光驱就会把盘读碎裂在里面,光驱就报废了。面对这些报废的光驱,我在空闲时间,想要看一看光驱的原理,就把它拆开,然后发现里面的结构其实很简单,也就是一些定位结构、旋转结构、再加上激光头的控制结构和激光头本身。那么做了一些清理和操作之后,把这些机械问题解决掉,10个里面有6个恢复了正常的读写。经过测试,完全可以正常使用。本身光驱即将要报废,它作为资产的价值不是特别多,但是我从里面积累的经验就是,别人下的定论不一定可靠,有些问题还是要动手,亲自了解一下。第二个问题就是我有一个外置的刻录机,在光盘一切正常的情况下,它刻录失败,比如说我用DVD光盘去刻录,可能之前一直刻录成功,但在某一天,突然之间连续失败了五次。它的读盘一切正常,只要写盘就失败。我在刻录cd盘的情况下,也是刻录正常,读盘也正常,只要刻录DVD就失败。同时经过确认,读写是同一个激光头。如果说同一个激光头的情况下,不太可能出现这种问题,除非两个激光头其中一个坏了,对吧?那除非是功率不足或者其他原因。那么怎么样去区分呢?这又要用到我们黑盒测试的思路,对吧?这个案例就提示我们,基础知识一定要牢固。那么我们测试过程中不断的通过刻盘、写盘的操作,经过几次连续失败,最后确认了一个问题,就是不仅仅是光驱和电脑的问题,还可能有其他软件问题。大家看我这个右侧有一个截图,这个截图是我复制文件的时候,偶然间发现。本来正常我的固态硬盘复制文件的时候应该是几个G的传输速率,至少也应该是几百兆的传输速率。但是它拷贝到一半的时候,它的速度突然会降到零,原因不明。经过查询,windows下确实有这个问题,尤其是windows11和win10,那么再结合固态硬盘自身的IO调度可能存在问题,操作系统对于固态硬盘的管理可能存在问题,那么光驱和这个系统的匹配和它的驱动也有可能存在问题。目前问题没完全解决掉,但是首先操作系统读写数据突然降到零,这个问题一定是其中一个很大的影响因素。也就是说我们做事情,做测试的时候不要非此即彼,不是除了成功,就是失败。网络问题也不是说网线拔了以后,就只有网线和网口甚至可能交换机故障。路由设置故障、其他的操作系统底层故障,各种故障的因素,一定要考虑全面,才能测试出一个完整的结果。我们在日常工作中看到很多人面对问题时,就是采用非此即彼的思路,一定要打破这种思路,尽可能多的去观察一个问题的现象,那么你和别人得出的结论可能就是不一样的。最后就是我遇到熊猫烧香病毒的那个问题。这个病毒号称破坏固件,中了这种病毒就没办法处理。实际上经过我的分析,它确实是不处在任何分区上,它是在硬盘预留的启动空间里面,例如启动扇区里。它在这个部分做了一个隐藏的区域,把一部分代码藏在这儿了。只要这部分代码还激活,它就能不断的复原它的病毒。那么当我把这些隐藏的代码处理掉了以后,这个病毒也就失去了活性,接下来就是怎么清理病毒的问题。之前我分享20年经验的时候,说到我当年正面硬刚熊猫烧香,就是通过这种方法一击必杀,也就是说第一点,知道它是怎么处理自身隐藏方式的。第二点,它对文件的加密主要限于对文件头部的格式的修改,一些文件内容并没修改。当时通过这种方式,还恢复了很多被它加密的文件。那么整个PC时代,我的收获也是给大家的一个忠告,就是首先对于基础的原理,要有深入的理解。因为所有IT设备的底层几乎都是类似的,全是冯诺依曼架构,对吧?那么掌握了技术原理,我们就立于不败之地,就能干好我们的工作。第二点就是举一反三,一定要从原理入手思考问题。我们有很多人可能是从经验入手,也就是做一次工作,拿本子记一个经验。这个经验往往再遇到新的问题就不可靠。一定要从原理入手,这样无论我们的问题怎么变,我们从原理入手都能找到问题的根源。第三点就是我掌握了用于英语阅读产品文档的能力,这个能力给我很大的帮助。现在我见到很多年轻人,虽然英语学得不错,但是阅读产品文档的能力可能不是特别好。即使我们毕业了,我建议大家英语不要扔下,能去读一些原文的产品文档,还是尽量去适应一下,当我们能顺利的用英语读这些文档的时候,你就会发现你的信息来源会比只能读中文的工程师多得多。然后就是独立思考,找到解决问题的方向。只有独立思考,我们刚才遇到的疑难问题才有解决的可能。接下来就是标准化的工作流程以及沟通技巧。如果我们的工作做不到标准化,手忙脚乱的沟通,也就是该说的问题说不到位,也是没法解决问题的。所以大家还是要注意。这个时代我的心得就是不破不立,破而后立。也就是说,首先要跳出自己的条框,跳出自己的舒适区,你才能不把自己限制死。我后来又做去网络,接下来一份工作就是做网络工程师的。如果当时我对网络没有兴趣,那我重新学习,就可能不愿意学,我可能会说我是做PC的,我为什么要做网络呢?对吧?如果只基于自己已有的经验,就只能找PC相关的工作,那我就跳不到网络的时代,我就会被困在PC时代,困到等死为止。虽然说在PC时代也有自己的发展,大家都知道这个行业是一波一波的浪潮,在不断的前进的。PC时代是在逐渐的落幕,它的工作的余地在变窄,不是说没有活路,而是说它的活路在变窄。那么我们跳出去了,突破到新的区域了,是不是我们就有更宽的路可以走呢?这就是找路的方法。然后呢,就是只有持续学习,才有未来。我们当时一起做这些工作的同事里面,有些人和我说,看你学习我很羡慕,但是这么学习脑子很累,我学习不行,我不想费脑子,天天休息不好吗?天天追剧不好吗?为什么要费脑子?如果我们忽视了持续学习,作为一个工程师,就没有发现新问题,解决新问题的能力,我们就会被这个职业、被这个时代所淘汰。因为这个时代,尤其是计算机相关的技术更新太快了,如果跟不上,就很容易被淘汰了。尤其是我们背负的养家的这种重担,对吧?大家的压力往往是家庭的压力,没有家庭可能压力更小一些,有了家庭压力就很大。那么我们持续学习才能让我们有足够的能力去维护好我们的家庭。最后就是戒骄戒躁,很多人技术强一点,就会骄傲,轻视别人,而且变得短视,就是只聚焦于眼前自己积累的经验,我的东西看管好了,绝不教给别人,防止教会徒弟饿死师傅的情况发生。但是这种短视只能让人自我消亡。我们接下来看一下网络时代,网络知识我是从头学起的,大家看一下左侧是RFC,咱们学网络的,大家可以自己想一下,有多少人从RFC开始学的。根据我在周围的观察,可能从这儿学的比较少,右侧是OSI的七层参考模型,还有TCP/IP的五层网络参考模型。这个模型是大家100%会学的。但是从RFC协议学起,从RFC文档里直接去看,比如我下面的IP、TCP、UDP、ICMP和FTP等各种数据包的组成,每一个字节的含义,还有多少人是从这看的呢?我当时看这个看了至少有半年,我才理解网络是什么样。上图右边的参考模型,实际上手后持续半年到一年,我才真正理解网络是怎么连通的。我掌握了这些基本原理,接下来的问题就不是问题了。比如说我的网络规划里面,以及在后续的工作的网络相关方面。其实我换了不止一个工作,那么有一份工作就是给企业设计网络。我那个装几百台电脑的项目就是给一个工业企业设计双冗余的网络,它应该怎么设计?那么如果是做一个二层网络,只需要连通就行,至于它是一个网段,还是多个网段,很多人可能是不考虑的。我在很多企业还看到过这种形式的网络,只要能连通就OK。但实际上一个企业如果规模到了一定程度,它至少需要一个有三层网络,也就是不同网段的这种网络。在这种情况下,我们网络应该怎么规划?是选二层网络还是三层网络?现在则更加复杂,在网络里面不只有我们的连接的接入设备,还有汇聚层,以及POE的交换机,除了PC,还有监控、还有无线。出口除了有我们的网关,还有路由器、上网行为还有互联网的相关设备,还有一大堆防火墙、防毒墙等安全设备。所有的这些设备,它应该具备哪些性能,有没有瓶颈,我们应该设计哪些功能,哪些可以先上哪些可以后上?网络设备都需要具备哪些?在哪一期做,哪些是串联,并联还是旁路?到底应该怎么做?所有的东西都需要考虑。只有当我们了解了所有这些东西的底层原理,我们才能把它做得更好,设计的才能更规范。如果不了解,我们可能就是经验主义。别人怎么说我怎么做,我见过的是怎么样的就怎么做。最近几年我也和很多这个资历比我还老的网络工程师合作过了。一方面,传统网络工程师在面对虚拟化云计算的时候,往往理解不了虚拟化和云计算的网络规划,因为他不知道这是怎么回事,只有接触过这些东西的人,才能深刻理解,才能匹配的很好,这是第一点。也就是说,网络工程师如果不了解云计算,甚至都可能跟不上时代。另一方面就是,一些老工程师经验主义很流行,如果我以前就是这么做的,我现在还是这么做,只有这么做,我的网络才能连通,不这么做,我就不保证网络能连通。而到我这里,可能是客户需要什么,我就做什么规划,按照我这个左侧的列表,全都整体做出规划。接下来每一步是什么原因全部都有理论解释。那么某个案例中老工程师解决不了的,我和他们的新工程师一起去讨论,最终结果就是这个比较愿意学习的新工程师跟我去讨论,反而把这个网络给搞出来。我们一起把网络规划重新设计了一下,此时我已经是又作为云计算工程师了,网络已经不是我的本职工作,但是我协助他们把网络给设计出来,包括双活切换应该怎么做,我都是基于比较扎实的理论基础,然后一起去讨论,基于理论做出来的东西。这说明什么?只要我们理论基础扎实,我们就可以不犯经验主义的错误,同时我们也可以不被自己的经验所束缚。无论我们做什么行业,我们都可以利用理论去做出来,比纯经验积累有了更多的可能,我们工程师的路就更宽。路越宽越好走!接下来就是连接到网上就不安全。在我做网络的时候,凡是连接到网上的业务,网上的所有威胁都来了。假定某个服务,如果开放到互联网上,图里的所有威胁,几乎我都实际遇到过。有很多问题是协助用户解决的。比如说木马和病毒就遇到不止一次。当时我们只是提供设备,然后提供解决方案。但是这解决方案里不包括安全设备,也不包括安全。但即使有安全设备,用户仍然中毒,仍然被钓鱼,仍然有病毒,有木马。那怎么办?如果不把这些问题解决了,人家会说你的系统有问题,为了系统顺利实施。我们自己去找了一下系统后门,查了这个黑客的思路,然后我们顺着它的路径,自己把病毒给找到了,再把木马给抓到,把木马处理掉,清理之后,再给用户写一份说明,提醒用户怎么样做好网络安全防护,避免同样的问题发生。然后这个项目才顺利结束。无论我们是做虚拟化、云计算还是做网络,只要是开放到互联网上的,当前面临的威胁几乎都是不断的。所以即使是我们传统的IT业务,即使是我们传统的网络业务,只要开放到互联网上,安全防护的思维就必不可少。在这种情况下。怎么样去解决实际的问题?我这里边举一个例子,就是网络连通性测试。大家都知道,我们如果做网络连通性测试,一般最多采用的是ping命令。用这个命令测一下,我们和某一个点之间通还是不通,这是一个很简单的操作。但是大家想一想,这个问题到底应该怎么处理?有些时候一些复杂的问题就不好处理。那么我给大家推荐的是一个综合的方法,我们在客户端1的上面执行命令,但不是执行一条,而是并发执行多条。怎么执行呢?有一条命令是和本网段客户端2互相ping,然后从客户端1去ping本网段的网关,同时再ping跨网段的网关,再ping跨网段的客户端。用这种方式把所有的ping命令全部都列在屏幕上,然后观察一段时间内它的情况。在面对一些复杂的连通性问题不好解决的情况下,用这种多角度同时做的命令,可以查出网络的数据波动、网络延迟的异常以及网络异常的断开。尤其是如果我们网络某些情况下断开,又找不到具体位置在哪,这种同时的测试。同时看各种数据的影响,你就能很容易的分析出来问题在哪里。我们用这种思路曾经做了几百个测试,把一个非常困难的问题,联合华为体系研发都没能解决的问题,通过测试把问题最终定位了,最终由研发根据我们的定位,把这个问题根源找到,并最终解决。如果各位还在用华为的产品,我这个思路测出来的东西,应该是在这两年会普惠到所有的人,这个可能大家都感觉不到,但是我们作为一个工程师,只要真正抱着解决问题的思路,我们早晚都做出一些真正让我们在行业内部能成为神话,能成为传说的成就。只是有很多人都是默默的在做这些工作,这些做出来的成绩不会公开出来。我公开一小部分是为了让大家知道我们可以走的路,是远远不限于你能看到的那部分。尤其是面对这些有疑惑的工程师,无论你是年轻的、年纪大的,还是即将踏入本行业的工程师,大家都可以看看,我们能把这个路拓宽到什么程度,每一个人的路都可以自己去拓宽。这个时代的技术方面的收获就是从原理开始理解网络。网络安全也是从网络原理入手。当我能看懂每一个数据包的含义,我就能从数据包的角度来把这个整个的网络理解了,也能理解它的安全威胁在哪里,知道安全威胁就能解决问题。那么再从网络安全扩展到综合的数据安全,比如我们的数据的备份,数据的安全。怎么样确保我们的数据可靠?怎么样确保数据的可用性能够得到可靠的维护?这都是可以扩展出来的。最后就是自学能力得到提升,技能就可以迭代了。就是在处理网络的时候,你面对的连接特别的多,我们争取以网络为核心,通过骨干不断的了解周边的只是,比如说逐渐细分的无线、骨干网的传输、运营商的相关网络,还有5G的相关网络,移动互联网等等。所有的这些东西我们都可以逐渐的去拓展。以后能干的行业,你会发现越来越广。 这一段。随着经验的丰富,我发现有些人就会互相攀比,互相吹牛,更加看不起别人。即使在你跟他去讨论技术的过程中,他也默认为你是在和他吹牛。为什么呢?因为这种人吹牛习惯了,默认为所有人在一起就只能吹牛,这是心虚的表现。作为这个行业内经验已经很丰富的工程师,我可以和年轻人说一下,不建议你去攀比,不建议你去吹牛。只有心虚的人才会把自己伪装的很厉害,真正厉害的人不需要伪装!举个例子,我现在写的PPT,我给大家讲的这些内容,你看我可能是每一页只写了几项,但是每一项我展开都能单讲一节课。很多人写PPT疑惑的是我没有东西写怎么办?我怎么样能把自己的工作内容写的丰满一些,让领导看到我更多的工作。我则相反,我每次写PPT东西太多了,我可以源源不断的讲上三天三夜,那怎么才能浓缩成几句话,让领导知道我的核心步骤,不至于关注太多的细节呢?其实如果你关注了更多的细节,你会发现我的能力远远超出通常的领导的要求。那么如果我们日常工作中你能做到超出领导要求的工作,同时又能顺利的把它做好,那么将来你的路一定是更宽广。只有开放合作才能共赢,只有平等交流才能进步。一般实施过程中,我们把需求归纳,然后甚至配置都做好了。我们这种售后工程师往往是只需要去实施就可以。但是我拿到项目的第一件事,永远都是重新核对需求,这叫不忘初心。为什么?因为我们的售前工程师如果实施经验不足,他给出的需求分析的结果和他给的配置结果有可能是和实际不匹配的,或者匹配的不是特别完美。想要完美的实施,一定要介入需求分析,一定要把需求重新梳理好,基于需求重新把所有过程再走一遍。这既是验证了一下售前和销售他们做的工作,也是以此为输入,重新的让我们未来的工作更好。这就是我们现在积累的一个经验,通过这种售后介入到售前的方式,让我们售后的工作再也没有阻力,再也不至于因为售前的一时疏忽,造成我们售后去费尽心思的给售前收尾,或者去给销售说的大话收尾。我们只要和售前和销售顺利的配合即可。现在甚至是我们自己作为销售工程师,直接去参与需求配置。那就可以把整个的全链条都打通,显得很顺,后续工作就会很顺利。如果大家当中有本行业的售后工程师,大家应该都有这方面的困惑,这就是解决的一个方式。第二就是全面规划。这种规划的过程中,需要我们全面的了解客户的机房要求、环境要求、电源要求。虽然我们的文档里有写到,但是我们还是要现场的去确认,根据现场情况,根据我们的经验,提示客户怎么样去完善它的环境。然后是我们的组网原则、接口规划。一方面参照我们的文档的推荐的指南推荐的联网形式,另一方面是基于我们个人的经验,个人对于原理的掌握,我们甚至可以在厂商的最佳实践场景下,总结出我们自己的最佳实践,做更全面的规划。不要局限在我们现有的工具里面,一定要以自己的能力为主。接下来是上架,这是我们常用的一个上架的图。为什么最下面要留2U空间?我们的规划里考虑到了要把手塞到空隙里进行一些相关的维护操作。中间为什么要留2U?因为有理线架的操作,对吧?根据不同客户的需求,留多少的空间,我们的设备摆放都是有说法的。比如说我这个图里面,我的设备摆放就是从下而上,从内而外,它是上走线,那么凡是所有出口的线,就都经过防火墙,从上走线走出去,也就是说我们的摆放位置都已经做好了考虑,线的长短、数量、接口取电、维护难度综合考虑。我们做上架的工程师,不要把自己只当成一个搬砖的力工,只是上架扭螺丝而已。我们的上架是为了后续的实施做准备,要从整个项目来入手考虑这个问题。如果你能综合考虑问题,你就相当于半个项目经理了。以这个角度来说,你的项目实施的难度就会比普通的这种分散负责的项目少得多。接下来就是部署流程,官方在超融合上给了我们很完善的部署流程。但是我们仍然在每一步都需要根据自己的经验进行确认,不能局限在官方的文字说明里,一定要亲自了解每一步的原理是什么?官方为什么这么推荐?在这个基础上,我们才能结合需求,结合客户不同的各种需要,针对不同的客户,做各种不同的变化,随你怎么变,我都满足规划要求,我都符合产品规划的思路。我交给客户的,或者我推荐给他客户的,已经不是简简单单的这种书本上规定好的,必须这么做的一个思路。而是我会根据客户的要求动态去优化它的配置,而且绝对是符合产品设计思路的。我会告诉客户基于什么原理,基于什么思路,产品才这么设计?那么交付部分。交付不是说做完虚拟机,虚拟机发个模板,做个培训就完了的。大家看左侧,我还要考虑运维磨合期问题,处理运维指导故障修复和后续规划。为什么要考虑这么多?在我们这个可能跟我的行业有关,一、我作为售后工程师,我要去实施。二、我实施完了,难免有一些问题要进行处理,跟客户还是要继续保持关系的,并不是说实施完了就不见客户了。既然你要接触,遇到问题是逃不掉的,那么在运维过程中也少不了。持续规划是什么?大家看我右边这个图,就是我们给他的超融合实施,我通常会考虑两个生命周期。按照项目管理的流程,五大领域,启动、规划、执行、监控、收尾,从预算开始,一直到老系统下线,新系统替代。考虑两个周期应该怎么规划。那么整个的产品规划思路、软硬件思路和你推荐给他的运维思路,就能有的放矢,就可以基于这个目的去把它实现。这种情况下,后续客户真到了这种比较困难的老系统下线和新系统替代的时间点,在提前规划好的情况下,他做的会顺利得多。如果客户能顺利的进行更替,那么后续的项目可想而知也是可以拿到的。以产品经理、以项目经理的思维去考虑问题,这样我们的路才能更宽。运维就是指我们日常20%的问题,其实能覆盖80%的运维场景。我们日常集中精力把常见的20%问题解决好,大部分问题都是可以解决的。交付之后就是运维的开始。无论你是纯售后工程师,还是说你做系统集成,建议大家多积累一些经验。问题处理的三个层次里面,客户只需要做好自己的虚拟化的维护,硬件的这个维护就可以了。那么如果是我们和客户一起去做这个项目的话,对于系统的变更,一般由我们实施工程师来说是最理想的。那么故障件的处理或者说一些后台故障的修复,那就得由厂商研发来执行。那么这三个层次我们处理好了之后,客户能做的其实就很少,也就不需要客户付出巨大的工作量,去适应我们全套环境的维护,而是说他只需要聚焦于他的业务就可以了。最后给工程师的忠告就是没有金刚钻别揽瓷器活。如果接手了工作之外的东西,一定是基于帮忙的思路,先撇清责任,先把你的责任范围边界确定好,干好本职工作,再做瓷器活。二就是责任边界需要让所有人都确认了以后,以帮忙的形式去干。这样你才能额外做一些这个积累经验的事,同时避免承担不良后果。最后就是聚沙成塔,每次实施,多处理一个问题,每次给客户处理问题,多记录一个经验,聚沙成塔,你就比别人多做了很多。最后是在系统下线的时候,我们重点考虑右边提到的保持控制,就是软硬件一定要在控制范围内。任何软硬件失去保障了,想办法让它留在保障内,要么硬件续保,要么软件续保,不能续保的在稳定业务的基础下,保存好你的数据,最后确保应用可控。怎么可控?能维护的尽量维护,维护不了的,尽量想办法提前替换。基于这个思路,只要做好持续的替换,这种运维就是可持续的,做好可持续的运维才是我们IT维护才应该干的事情,否则我们就成了救火队,到处处理问题。最后这个收获就是如果我们已经做了服务器存储,也做了网络,那么后面虚拟化、超融合、私有云,几乎你就可以全面开花。大家看看我之前的经验,PC、存储这些都是相关的,早期做过的,网络也做过。为什么后来我做虚拟化,又做云计算这方面?是因为当时领导招人的时候,就要求你做过所有的硬件,没有相关经验,是没法去做虚拟化的。当时正好我有这个经验,就被招过去,从头开始学习虚拟化。二就是突破技术限制,突破工程师的角色限制。我如果把自己限制成服务器的工程师、PC工程师或者网络工程师,我绝对没办法做额外工作。那我也不可能接触到后来的AI,只有具备了综合能力,你的路才能越走越宽。那么脱离经验困局,我们才有广阔的天地。假如我们现在失业了,有多少人能凭业余爱好,能凭其他方面的经验找到新的工作,而且还能让自己顺利养家的呢?很多人会聚焦于自己过去的经验,但那意味着你被过去的经验困住了。所以这里私下给大家的一个建议,就是一定要做到不被自己的经验困住,才可能有更广阔的未来。接下来就是我到了这个年纪了,所以说应该开始传承经验。遇到年轻人,我希望多讲一讲,给大家看看自己的路。而对未来始终抱有新的希望,做好心理准备。那么只有这样,我们才能有更好的未来。最后由于时间限制,我这边就说简单一下,最后一句话,我命由我不由天,我们的工作可能受限于时代、受限于年龄,可能会被淘汰掉,但是自己的能力永远是自己说了算!而且随着现在信息时代的提升,给年轻人的另一个忠告就是我们的计算机体系不断的在扩容,不断的在扩充,那么各种行业细分的越来越多。过去说隔行如隔山,指的是计算机和其他行业隔行如隔山,计算机行业内各行基本是互通的。但是现在已经不是了,现在网络就能细分有线、无线、企业网、个人网、还有物联网,再加上运营商的网络。软件又分成前端、后端和中台。再加上商业方向的软件、工业软件分得更细。大家很多人在学校学的不是计算机专业,而是某一个细分的行业,参加培训也参加的是某一个细分行业的课,或者是某一个细分行业的厂商认证。即使是计算机行业内,不同的细分行业都已经变得隔行如隔山了。但我还是建议大家能拓宽自己的行业,跟自己相关的分支行业尽量多了解一些。不用完全掌握,只需要以某一点为核心扩散开去,这样你的路就会越走越宽,千万不要把自己限定在某一个细分领域里。不要说过去我做网络的,我现在做云计算,但是我做云计算的时候,再遇到网络,我还能不能处理?过去的东西也不能丢掉。最后讲一下AI时代。我们的这个AI时代首先一点就是讲所谓的机械飞升,我们的AI目前在不断的突破,尤其是ChatGPT时代让AI突破了图灵测试。接下来deepseek的时代到来,大幅的降低了对硬件的运行要求,让我们能在可接受的成本下进行大规模的公有化和私有化部署。在这种情况下,我们的AI能力也就越来提升的越快,最终奔着AGI,也就是通用人工智能的目标越来越近。那么这部分我打个比方叫机械飞升。也就是说它未来要从越来越不像人的一个工具,变成越来越像人的一个机械生命。未来有可能以我们想象不到的面貌出现。因为随着AI的发展,未来是无限的。现在接触到AI之后,我可以跟大家确定一点,它一定是未来,大家一定要接触它,哪怕仅仅是自己用都可以,大部分不一定能有条件调试AI设置,但只需要自己用就可以增长经验。现在一定不要逃避。我们能做的唯一的方式,就是拥抱未来,最终甚至我们可以做到人机一体、和谐共存。也就是说,AI作为我们每个人的助手,就像科幻小说和电影里面一样。有问题问AI,让他帮我们干活,我们来做决定,这样就可以了。最终就是AI替代肯定不可避免。只有我们拓宽自己的路子,让自己无可替代,AI才不能替代我们。如果你做的是重复性的一些劳动,那很容易被AI的替代,脑力劳动也有重复性的,不是说脑力劳动不能替代。那么大家看我画的这条线上面是指图灵测试,通过图灵测试意味着AI具有了人类的能力。这条线下面写的四个字是自我意识。根据我的观察和我的理解,这纯是我个人的理解,这也是为什么我以进化论为主题,就是依据进化论的思路,根据我的推断,AI只有具备了自我意识才有可能实现所谓机械飞升,瞬间成神,也就是成为一个机器人,像人类一样来帮助我们解决问题。但是如果它具备了自我意识,那可能就不叫AI,也不叫人工智能了,它可能叫机械智能体或者机械生命。那种情况下,就相当于人类造出了新的物种,它的未来是无可限量的。那就会有新的希望产生。接下来再传承下去,能出现什么样的情况?有可能几百年后远远超出人类的理解。所以未来是无限的,大家还是要拥抱未来,这个时代的潮流不可避免。但是目前我们还处于过渡期,这段时间内还是非常长的,可能几十年甚至上百年才能做到。所以目前大家看我们的情况,deepseek作为AI底座,还不具备AGI的能力,为了让它更加贴近AGI,我们怎么做?我们通过知识库喂给它我们私有的知识,让它帮我们干专业的事。利用智能体技术,让它更聪明一些,能自己干活,最后用程序能让他做一些我们现在这种程序自动化也不能实现的事。接下来是我最近学习AI的时候了解到的一些东西。我是怎么接触AI的呢?是因为用户有需求,现在大量的用户在提AI需求,大家应该都知道吧?这个肯定绝大部分都遇到过,怎么样来做?去除掉行业内的泡沫,踏踏实实的来说,我们目前能做的就是为AI赋能,也就是说帮助AI来打开走向AGI的通道。那么最底下这一层先要做到私有化部署,避免数据外泄,还具备底层能力,但是也仅仅聊天而已。接下来通过我们更好的提示词,我今天也刚解决了一些问题,就是通过提示词,就可以让他精确的输出我们需要的结果。接下来建立知识库,我们用专业的知识输入给AI,它就能帮我们分析专业的事,能帮我们总结出专业的经验来,就不用我们去看大量的资料去总结。人工效率太低,AI辅助后提升效率是很快的。那么接下来要创建智能体,让它独立做事。多智能体协同,就是指它目前还只能聚焦在某些具体的事情上,它不能像人类并发处理那么多事情,那多智能体就是各干各的,大家最后聚在一起形成一个综合结论。同时多智能体不仅可以挂载同一个模型,还可以挂载不同的模型。那么最终所有的模型集成起来,多智能体协同起来,最后由一个模型统一输出结论,就能做到更贴近AGI的能力。接下来为程序赋能,把AI的能力赋给当前的程序,就能大幅提升程序的质量。当然最终的目的我们是要做AGI,让AI自己去做专业的事,我们人类就可以休息,可以去做更加专业的事,或者更加趋向于创造性的工作。目前大家看我们列出来的这些硬件都已经具备了,接下来所谓的通用型人工智能,一旦出现,下一步必然是具身智能,也就是说,把我们的AI大脑赋能给我们的机器人、无人机、机器狗等等。当这些设备具有了类似人类的大脑,它的潜力就会被释放出来,成为我们有力的助手。最后就是怎么走向未来。根据我对AI当前状况的了解,还有对自己经验的总结,结合一些科幻小说,我这里参照了很多三体里面的一些思维和刘慈欣对未来的一些思考。为什么这么说呢?因为我觉得他的一些小说不仅仅是考虑到了未来的可能,不仅仅是一个科幻,而是对未来一个在合理范围内的推理。也就是说,我们很多科幻小说家,可能他本身也是个未来学家,他会推测出人类未来应该怎么样。首先我们是从远古走来的,我们最早所有的都是做人工,一旦到使用了工具,我们就可以了解自然利用自然。使用工具的人类淘汰了没有工具的人类。当下我们创造什么?我们通过机械化、自动化、信息化、智能化实现了知识爆炸。掌握这些知识的人,淘汰了因循守旧,不愿意接受机械化和智能化的人,对吧?不断的在淘汰。未来,新的故事也会不断的产生,新的物种也会不断的出现。未来怎么样在知识爆炸以后确实不知道。但是大家看知识爆炸已经出现了,哪天三体人过来了,恐怕也不是很神奇的事情了,是一个可以考虑的可能的未来。在这种情况下可能会有新的希望。为什么这么说呢?现在都说AI出现之后,文科已死,理科为王。已经不需要研究那么多人类的东西了,写文字AI就代劳了。但我想提示大家一下,如果未来三体人来了,如果未来人类接触到了成百上千的外星社会,是不是需要更多的宇宙社会学家?是不是需要更多的人研究不同文明的它的哲学文化?目前只有我们人类能实现这么复杂的理解。机器目前为止还做不到大自然的精细程度,还做不到大自然的这种用这么低的大脑功耗来实现那么强的能力的效果。什么时候,它能实现了机械生命,才能真正替代人类。所以目前我们远远不用担心机械生命的问题,我们应该做的是利用现在没有形成生命的AI的能力作为工具。因为AI只要不是生命,它就没有自我意识,它就作为我们的工具,可以大幅度提升能力。善于使用AI的人最后可能会淘汰掉没有这种能力的人。然后呢,就是我们是从地球走来的,最后一定要走向宇宙深空里面去。人类从地球发展过来,那么从我们开始探索宇宙的时候,我们就向往飞天。从一开始我们就是走向未来,人类远古就有很多关于神仙的传说,都梦想着往天上走,现在的飞机、火箭、宇宙飞船,都是在实现我们的梦想。 最后就是要走出摇篮,为什么呢?如果在摇篮里出不来,就没永远没有希望。刘慈欣写了三体之后,大家有没有关注他之后写的小说?那段时期,他还写过一个《时间移民》,就是讲我们向内发展AI,未来有可能导致AI,同时也是虚拟现实突破,我们就会向内探索,最后制造出足以媲美现实的虚拟现实来。在那里面我们就是神,要什么有什么,那么是不是会有人沉浸在虚拟现实这个游戏里面出不来了?就变成享乐主义,满足现状,对吧?那么刘慈欣写的这个时间移民,就是说所有人最终变成了虚拟人,最后大家形成了一个统一智能体。这个智能体觉得自己没有意义,就把自己关机了。这就是人类灭绝的一种可能。那么什么样的人类才能最终生存下去呢?就是走向深空,直面深渊,才有未来。后来,刘慈欣又写了一个《黄金原野》。是用一个很凄美的故事,一个造假的故事,以一群探索先驱者的生命为代价,欺骗了人类去向外探索。因为如果不向外探索是没有希望的。人类作为一个诞生在宇宙里的文明,如果不能踏出地球,不能踏出太阳系,踏出这个摇篮就永远没有希望。我们就相当于三体里面,自己把自己封闭在太阳系里面的这些人类,就永远没有希望了。怎么样才有未来?我们作为工程师,永远保持一个婴儿般的好奇心。因为我们人类目前还是婴儿时代。最后人类如果向着宇宙文明去成长,我们目前连第一步还没迈出去,我们未来还是有无限的希望的。这就是我给大家指出的一条很光明的未来,希望大家在未来这条探索之路上,真正走出自己能载入史册的一步。所以未来还长,探索永无尽头,希望大家共勉,希望大家一起走到最后。最后谢谢大家。我这次的分享就到这里。问题1:我看到这个徐景泉,这个刷了好多次了,就是说问能不能举例谈谈,看山是山,看水还是水这个状态。这是我上次讲座里边的一个问题。就是看山是山,看水是水,什么意思呢?比如说我这个技术方面,最开始可能是学网络它就是学网络,学IT就是学IT,我学的是这个技术本身。但是工作时间长了以后,我再看这个技术就不只是经验上应该怎么处理它,而是说在原理上它是怎么产生的,怎么发展,怎么出现的。那我就是把它拆散了,看最后为什么看山还是山,看水还是水?因为当我都理解了以后,我掌握的很精细了以后,在我后续就包括我现在的工作中,当我知道某一个方向的时候,我知道我具备的知识能力,可以瞬间的把它拆成细节,然后一点点去实现。例如我现在处理AI,我遇到有些问题的时候,比如今天我就处理AI某个提示词有问题,导致我们的AI输出一直达不到结果。举个例子,最初提示词说,我有三个输入项目,请AI把以上内容总结出来。它给我一个输出结果是什么呢?它只把最后一个作为输出。我分析了以后,利用之前的经验,发你这个“以上”是不明确的提示词。为什么呢?以上是以上一个还是以上两个还是以上三个?他只处理了以上一个,后来改成,请把以上所有三个点全部总结输出,他立刻就给出了一个合理的效果。这和我们处理软件是一样的。如果我们有软件开发的经验,就会知道工程师处理往往也是这样的。他如果处理三个项目,一不小心就会只处理一个,对吧?只有你指定了它的具体范围,才会把所有的项目都处理掉。所以当我有这个能力的时候,遇到这个问题,我不会惊慌,我会一点点细分它。我看山还是山,看水还是水是什么呢?我大概看上一眼,我就知道我能解决问题,但是我可能在处理的过程中不需要去解决这个问题。我可能在遇到它的时候,我再详细的去分析就可以了。就是这个原因。这是因为我掌握的已经差不多了,我只需要看山还是山,看水还是水,不需要每一次都深入到后台的细节,看得那么细了。我也可以把它掌握到很细致。那么当真正需要的时候,我就可以一步的分析出细节。问题2:最后就是这个资源错位,拿FSE当做测试使用这一块。首先一点,我们的测试工程师是干什么的?测试工程师如果做得非常好,你就是对产品最了解的人。当我们对产品最了解的时候,测试工程师也是有自己的经验的,一定要记住一点。不要认为测试工程师就只是点一点界面而已。我在给咱们华为产品提经验的时候,其实就是这样的以测试主要思想的。咱们华为以前有一次招人,找我面试,我就举个例子,当时那个要求是测试一个产品,硬件产品,请写出三条测试经验。半小时以后我还在写。最后领导看到我写的以后就很惊讶,为什么呢?我写了35条,领导说写三条的都少见,写六条以上的凤毛麟角,头一回见有写35条的。但所有东西全都是对的,为什么?因为我作为一个测试工程师,软件硬件全都做过了。而且我在PC时代,我知道全流程的产品测试流程,包括软硬件兼容性、电磁兼容性、稳定性、摔落测试、可靠性测试等等几乎所有的测试项目。也就是说,作为一个测试工程师,你可以做到一个比产品设计者更了解产品。那么为什么上次我给咱们华为产品提经验的时候,我写了那么详细的一个东西?因为我突然想到以前我做的第一份工作叫新产品开发,就是利用测试经验做新产品定型,我把那个经验拿出来了,以产品定型的思路从头到尾把它整理了一遍。我就把这个产品几乎从头到尾整体设计给做了一遍,所以拿它再去跟咱们研发沟通,就比较详细了。所以呢如果你被当做测试使用了,首先在测试岗位上先把测试干好。接下来你本职工作是什么?不要受你本职工作的限制,不要受领导让你干活的限制。把你这些应该干的事情作为你的爱好去研究,有机会接触的,不计成本,不计代价的去接触。就举个例子,我们有些网络工程师说我是做网络的,我突然让他去做这个项目管理。他说我没有这个经验做项目管理。怎么解决的?我说如果给你一个几个亿的项目,让你去管理,你能不能找一个单位说你这有一个亿的项目,现在我想做项目经理,我给你三十万,你让我做项目经理,让我去刷一刷简历镀金?刷一个经验?那是不可能的事。现在呢公司免费让你做项目经理,你为什么因为网络工程师的限制就不做了呢?如果你做完了,当你更换岗位以后,你的简历是不是镀金了呢?把这份简历拿出去,你想想这个思路是不是拓得很宽了呢?后来我们的年轻人听到这个以后不计成本不计代价,他不管是IT还是网络,还是项目管理,什么都做。现在他已经到了新的岗位,那你觉得他的未来是什么样,对不对?所以这一点呢,不仅是取决于我们面对什么样的岗位,还取决于我们自身的能力,能力永远是第一位的。当你有准备了,一旦有条件,你就可以跳出去,不要把自己局限于当前的岗位,当前的经验和过去的经验里面。跳出条框,你才有更好的未来。 问题3:我这儿看到了有两个问题可答,那我把两个问题综合说一下,一个是这个叫越小勾青山,它是运维磨合期常见的问题有哪些?这个是工程师常见的这一块,怎么讲呢?运维磨合期常见的就是用户不知道自己应该做什么。那么我为什么签名提出这个运维的三个层次?就是以超融合或虚拟化举例,用户做好虚拟化系统中虚拟机的管理,然后做好硬件日常的巡检,有问题及时报告,那么我们的工程师去调整他后台的系统。因为修改整个系统配置,一般必须对系统非常了解才可以。那么我们实施工程师经验是最丰富的。最后一旦有了问题,找厂商。用户磨合期最常见的就是自己该做的工作做不好。比如虚拟机的处理、tools的安装,然后操作系统的安装应该怎么做?这个一定是用户把自己负责的这少部分工作,首先售后工程师客户该负责的工作分清,给他讲一遍,他一定要自己做几遍,出问题你指导他,才能把这个磨合期度过。一定要自己亲自经历几遍。无论是我们自己的工程师,还是客户的工程师,都要走过这种学习过程,这是一致的。他经过了这种错误的经验,他才能记得住,才能真正的掌握。一般这种虚拟化要磨合半年到一年,然后基本上他就找你的很少了。你就真正解决一些复杂问题了,这是一个。问题4:然后最后一个问题是。就是35岁搞算力方面的,那么我看这是有几个人了,就是问高斯数据库怎么样?数通35岁,什么数通IE怎么转型,包括deepseek。要减肥的红烧肉也有了,将这些综合到一起,我答一下。Deepseek这一方面我也在从头学习,正好是有需求。如果没有需求,你还要去做的话,类似无源之水。尽量是找到一些项目的机会跟进一下。这个又是从零开始学习,活到老学到老。我现在跟大家一样,都是从零开始学习,但是现在已经有一些心得了,那么未来还会学更细的一些东西。能学到多少取决于自身的能力。然后这种高斯数据库,包括咱们华为的鸿蒙系统,欧拉系统未来无限,因为国产化浪潮不可避免,对吧?Deepseek也要布在华为的体系上才能国产化。所以大家可以尽情的去学我们的认证,考我们的IE。然后在我们这个方向下,协助用户做好国产化转型,我觉得未来还是很有希望的。我的分享就到这里。【干货分享】智能极简遇见未来双力数据中心一、分享主题由我给大家分享一下华为在数据中心的解决方案。分享的主题的是“智能极简遇见未来双力数据中心”。二、项目介绍云计算、大数据、物联网、人工智能等新一代信息技术快速发展,数据呈现爆炸式增长,IDC建设成为大势所趋。世界主要国家和企业纷纷开启数字化转型之路,全球数据中心IT投资呈现快速增长趋势。在未来几年,IDC产业将迎来其新一轮的发展机遇。此外,以资源外包的网络服务方式逐渐受到企业重视,并取得长足的发展。在控制不超总投资估算的前提下,建设成“三机房、两靶场、两中心”的智慧城市大数据和算力中心,具备智慧城市数据汇聚、智慧城市应用调度、提供云资源、算力资源、网络安全防护能力及人才培训服务等多项功能。以满足XX市智慧城市各项政务及民生应用云资源运营,助力产学研转化、大数据算力、存储资源的可持续性升级,推动XX市乃至XX地区数字化的高速发展。三、关键技术分析本期项目建设规模含一层机房及二层机房两部分。本项目机房建设对标《数据中心设计规范》GB50174-2017中B级机房要求。湖南省XXX市的政府大数据中心的建设要求,XX市政府整体建设一个智慧政府数据中心,其他单位以及市直部门不在单独进行数据中心建设。既要数据中心机房项目作为承载XXX市算力中心的基础设施,在数字化转型中扮演着关键角色。该机房将承载算力中心的网络核心和汇聚功能区,也提供数据中心和云计算中心的空间和基础环境保障,为未来计算扩容等需求提供基础环境。推动整个市以及整个湘北地区的一个数字化的高速发展。它建设满足“数据中心设计规范GB50174-2017”- B级机房的标准。项目建设符合近些年来国家以及湖南省政府对于建设高效节能的新型数据中心的相关政策要求,PUE值小于1.3。整体建设方案是采用新一代的节能技术建设冷热隔离的封闭冷通道。相比于传统机房地板下送风,封闭冷通道更符合现有国策。虽说本次机房采用B级标准建设,但实际上我们在供配电上采用A级机房的架构模式。就是其中任何一路市电的中断或者是ups的故障,都不会造成机房断电风险,提高了机房的供电可靠性。在已经建设完成的大楼内改造为数据中心,关于经济效益方面:有效促进国有资产保值增值;提高工作效率,减少行政经费支出;本次机柜建设五百多个机柜。我们预计运行使用15年,租金总收益大概是五个多亿。节能设计在供配电采用智能融合电力模块技术每年节约电费约为52万元;暖通空调采用氟泵风冷精密空调技术每年节约电费为55万元。按数据中心运行15年的计算,总计可以节约1605万元。关于社会效益方面:助力国资监管转型,促进监管方式和手段的创新;提高国有资产监督管理能力和水平;加快推进国有企业“数智化”转型;促进信息化建设税收贡献,建设所产生的投资费用,可为该市的创造更多的税收,拉动就业;促进湘北地区的云计算、大数据、区块链等方向高新技术的发展。目前XX市各区县政府的机房均未统筹建设,整体规模偏小,设施陈旧,无法满足数智政府建设需求。同时,XX市政务云目前租用运营商机房,容量使用率已经接近警戒值,但因受到场地及配电等客观因素的影响,导致政务云无法就地扩容。XX市缺少一个大型自用集中的数据中心机房(目前周边地市如长沙市、常德市、益阳市、株洲市、永州市等均有自建的大型数据中心机房),现有机房建设处于零散式分布状态,自建及租赁的形式居多,待建“X慧云”急需机房。本期数据中心机房项目作为承载XX市算力中心的基础设施,在数字化转型中扮演着关键角色。因此,数据中心机房建设意义重大,是“智慧XX、数字政府”建设的支撑,是XX市产学研转化和存储资源可持续性升级的需要,是XX算力中心建设的必备。a) 智能融合电力模块技术智能融合电力模块技术,通过高密高效的UPS和融合UPS输入输出配电技术,相比传统方案在占地上节省40%,效率上UPS双变换模式下提升1.1%,UPS智能在线模式下提升3.3%,通过预制集成技术降低交付周期75%,同时通过全链路可视的集中管理及AI智能运维特性,提升运维效率降低成本,提升运行安全可靠性。该智能融合技术贯彻《2030年前碳达峰行动方案》指导思想,助力数据中心绿色低碳转型行动、节能降碳增效行动、绿色低碳科技创新行动,持续降低全生命周期能耗和碳排放。无论从发展趋势,采购成本,还是实际的售后维护角度来看,智能融合电力模块技术各方面指标都优于传统的供配电方式。智能融合电力模块技术取代传统供电方式这一发展趋势也已经获得业界的广泛认可,本期数据中心采用智能融合电力模块技术即符合“3060”国策下的绿色化、低碳化数据中心机房,又满足当前技术主流。b) 氟泵空调技术在数据中心节能领域研究比较火热的当下,为了降低能耗、推出新产品,市场上提出了很多制冷散热的新概念。所谓的“氟泵空调”就是其中之一,是制冷剂自然冷却循环。很多厂家研发了氟泵空调,在原有的直膨式制冷循环系统中增加了氟泵,在冬季温度较低时,氟泵开启压缩机关闭,利用氟泵实现制冷剂在铜管内的循环。如下图所示,“氟泵”不只是一个泵,它是一整套循环系统,包括数据中心内部的蒸发器、外部的风冷冷凝器、制冷剂气液分离器、油分离器和制冷剂循环泵。它主要由贮液器、氟泵、管路阀件等组成。氟泵与机房空调配套使用,在夏季,制冷压缩机运行;当室外温度低于设定点时,自动切换为氟泵节能系统运行,保证全年机房空调安全可靠运行;压缩机功率在10kW左右,氟泵功率在1 kW左右。 在室外低温情况下,氟泵的制冷量与10kW压缩机产生的制冷量基本相等这就是氟泵节能的关键所在。在联合国大会上面向全球承诺目标:“2030 碳达峰,2060碳中和”的国家政策下,在通过空调节能的技术方案上,本期数据中心行级精密空调采用“氟泵技术”的氟泵双循环空调系统,就是其中一个节能利器c) 封闭冷热通道技术近年来数据中心建设领域取得的进展,“模块化数据中心”无疑是一个热词。模块化数据中心因其能够提供高性价比、高可用性的建设模式,从而被众多基建厂商所熟知。众多传统数据中心基础设施厂商纷纷进入“模块化”的市场竞争中,“模块化”的理念深入人心。在我国已有不少数据中心开始采用模块化数据中心的建设模式,有的甚至步子迈得更大,采用预制模块化的方式。比如,XXX人工智能数据中心就是采用当下流行的预制模块化技术。在该数据中心的建设过程中,其电力、制冷、通信电缆以及相关的环境监控等都预先部署在一个框架上,类似积木,预先完成测试,然后将这个框架直接部署到数据中心,这样数据中心的建设就如同搭积木,从而加快部署。模块化数据中心是指整个数据中心是由不同模块组成。每个模块都有单独实现的功能,统一的输入和输出接口,模块之间可以相互备份。微模块化数据中心由于采用模块搭建的方法,使得单位面积的计算密度得到了极大的提升。同时,由于是以模块的方式进行组合扩大,所以用户可以根据投资情况和业务发展需求,实现灵活的分期建设。由此不仅提升了模块的利用率,同时降低了资金压力。冷热通道隔离的模块化数据中心作为一种趋势的出现并逐渐被成熟应用,反应灵敏的数据中心将会逐渐成为用户的首选。微模块数据中心由于具备绿色节能、快速安装等优点,在满足客户业务需求的同时创造更多价值,成为未来数据中心建设模式的新标准与方向标。d) 智能小母线技术智能小母线是在线即插即用,可以考虑满足当前4KW、5KW的需求,也满足后期的8KW、10KW、12KW扩容需求。智能小母线相比于传统的电缆,具有电流小、易插接、智能化程度高等优势,其电流规格在630A以内,能满足国内90%以上的数据中心机房配电系统。智能小母线通过始端箱从前端UPS取电,以铜排材料的母排系统组成输电结构,采用即插即用的方式,给各个机柜内的PDU配电。始端箱和插接箱内设置监控模块,可针对每个机柜的用电量以及温度数据进行监测,并具有通讯至动环监控的功能。无论从技术性能,全生命周期成本,还是数据中心的后续扩容等方面考虑,都会将智能小母线系统作为数据中心最后50米配电的最优选择方案。同时,在数据中心的建设过程中,限于有限的资源,提高单机柜装机的功率密度,使数据中心单位面积产生更大的价值是很有必要的,打破传统配电模式,驱动新型数据中心配电方式的变革也是势在必行。e) 智能化运维技术数据中心通过系统化、自动化、智能化的手段来改变现状,实现数据中心自动驾驶,即运维自动、能效自优、运营自治。通过架构级优化设计,减少能量的转换层级,去除多余部件,在减少故障点的同时,做到无损切换、无感知切换,实现系统的永续在线,实现全方位全体系的架 构安全。同时通过大数据分析和人工智能算法,深度挖掘分析数据中心能效数据, 实现PUE节能分析与优化,帮助用户做好能效管理。因此,本期数据中心监控系统选择数据中心自动驾驶技术。四、规划设计方案XX市大数据和算力中心项目第一阶段数据中心机房建设,目标是按照数据中心设计规范的B级机房标准,围绕XX市算力中心发展,将PUE目标值控制在1.3以内,依据结构、系统、服务和管理以及它们之间相互联系,建成具有 “一模、三性、四高”的数据中心机房。将机房的供配电系统、暖通系统、机柜冷通道系统、动力环境综合管理系统、给排水系统、装修系统、消防系统等相关系统建设完善。“一模、三性、四高”分别指:Ø 一模:机房设备模块化;Ø 三性:稳定的可靠性、设备的可扩展性、便捷的管理性;Ø 四高:高集中、高可用、高带宽、高速率。涉及数据中心机房建设,含一层机房及二层机房,共包含供配电系统设计、暖通系统设计、机柜冷通道系统设计、动力环境综合管理系统设计、给排水系统设计、装修系统设计、消防系统设计、ECC监控室设计、BIM三维展示平台设计及节能分析等10个模块。总体架构设计如下图所示。本项目数据中心机房布局采用模块化机房的方案并参照数据中心设计规范的B级机房标准要求进行设计,机房各层平面布置如下系列图所示。本项目一层机房:规划12组微模块,包含300台服务器机柜和24个网络机柜、48台行级风冷氟泵精密空调;二层机房:规划12组微模块,包含276台服务器机柜和24个网络机柜、48台行级风冷氟泵精密空调;负一层配电房采用16台房间级上送风风冷精密空调;负一层配电间:4套一体化融合电力模块(UPS)配电系统及配套低压配电柜;负一层电池间:UPS对应蓄电池组及电池开关柜。a) 供配电系统设计我们规划一、二层的机柜采用UPS分区供电,第一层是一套UPS供电,第二层是一套UPS集中供电,根据国标50174 2017数据中心设计规范双母线架构,保证机房供电可靠性。b) 暖通系统设计当时客户在规划设计时,客户是有几条技术路线一是采用液冷?二是采风冷?三是采用水冷?是水冷的?针对客户的提出的三条技术路线以及现场工勘的实际情况和跟客户沟通的实际需求,选择风冷空调制冷方式。液冷的弊端:成本较高:液冷技术的实施和维护成本较高。液冷系统需要专门的基础设施和设备,如冷却液分配单元、冷却塔、泵和管道系统等。以上设备的购买、安装和维护都需要大量的资金投入,增加了数据中心建设和运营的成本。液冷的运维难度比较大,因为它比较重,运维时候需要利用吊臂插拔,成本比较高,兼容也有要求。安全性和泄漏风险:液冷技术中使用的冷却介质可能对设备和环境带来潜在的安全风险。如果泄漏发生,液体可能会对设备造成损坏,并可能对环境造成污染。因此,液冷系统的设计和实施需要严格遵守安全标准和规范,并采取必要的安全措施来防止泄漏和意外事故的发生。维护和运营难度较大:液冷系统的维护和运营需要专业知识和技术。液冷介质的循环、泵的运行和冷却塔的维护都需要经验丰富的工程师来进行操作和管理。此外,液冷系统还需要定期检查和维护,以确保其正常运行和散热效率,整体维护和运营的难度较大。国家或者行业对其技术的规范也还处于空缺状态。缺乏相应的标准支持目前沉浸式液冷还没有在行业内形成趋势,缺乏大规模应用的案例。服务器需要做定制,不利于后期扩容以及方案的灵活性。水冷的弊端:Ø 设备数量繁多,安装复杂,本项目所处位置水资源紧张。Ø 需要冷冻水末端,机房有水浸风险。Ø 大型系统能效较高,与自然冷却适配度也较高。Ø 运维复杂,需要专业人员。Ø 故障影响面较大:单台机组、整个管路。风冷优势:Ø 系统简单,容易安装。Ø 末端介质为冷媒,不存在水浸风险。Ø 变频机组能效较高,氟泵装置市场成熟度很好。Ø 不需要专业人员维护。Ø 故障影响面很小。c) 机柜冷通道系统设计本工程涉及范围包括数据中心一层、二层(24个机柜冷通道,共576个机柜)新增机房内的服务器机柜系统的设计。这些业务机房中机柜是机房关键的物理设施,是机房建设的主要部分,在制定总体技术方案和设备选型时应遵循近期建设规模与远期发展规划协调一致的原则,以满足未来业务机房业务发展需要。数据中心一层、二层的24个封闭冷热通道方式采取隔离装置进行冷通道封闭措施,以分隔冷\热气流,形成良好的气流组织,从而提高机房制冷效果.。封闭冷通道后,可提高空调的送风、回风温度,进一步节省空调的能耗,即使维持原来的送回风温度模式,也可提供更高的制冷能力,以容纳更高密度和更高发热量的设备。d) 动力环境综合管理系统设计本项目建设一套完整的动力环境综合管理系统,能够接入数据中心本地动环监控系统、配电监控系统、安防系统、消防等的监控数据,并以此为基础提供告警管理、能耗分析、电力容量管理、设备管理、自动化巡检、数字运维、智能运营,能效优化等业务功能,从而实现在统一视图上的集中监控、集中运维、集中管理,提升整体运维效率及运营水平,满足业务发展的需要。并预留后续接入扩展能力,可接入交投集团所辖其他远端机房的动环数据(此处要求远端机房的视频监控设备、入侵报警设备、温湿度监测设备、UPS等需接入动环综合管理系统的设备,具备远传通讯接口)。系统组网架构如下所示:本系统应以满足数据中心基础设施日常运维的需要,实现数据中心运维的自动化、智能化,降低运行风险、提高运行效率、降低管理成本、优化资源配置、明显降低能耗、整体提升可用性。在建设过程中应采用完善的架构设计、稳定的技术手段、可靠的安全控制、先进的科技成果。同时结合数据中心的实际状况和未来发展需要,建设具有前瞻性、高实用性、高灵活性和高扩展性的动力环境综合管理系统,并且能充分考虑利用现有各系统资源,建立高性能、低成本的系统。五、华为优势a) 华为公司优势目前,华为在美国、印度、瑞典、俄罗斯及中国等地设立了20个研究所,每个研发中心的研究侧重点及方向不同。我们采用国际化研发体系,聚集全球的技术、经验和人才来进行产品研究开发,使我们的产品一上市,技术就与全球同步。斯德哥尔摩一直是华为重点建设的能力中心,汇聚了大批华为的高端专家。除了网络相关技术外,还有网站电源、UPS逆变拓扑等相关电力电子技术的研究。而纽伦堡作为电力电子行业的硅谷,汇聚了西门子、英飞凌、赛米控等企业,华为可以充分利用全球顶尖的专家资源,并实时追踪业界最新动态,确保华为产品技术的领先性。华为大型UPS的架构设计即出自此处。面向未来发展,华为组建了2012实验室,承载集团创新、研究和平台技术开发的使命。2012实验室聚焦ICT领域的关键技术、架构、标准等方向,持续投入,致力于提供更宽、更智能、更高能效的零等待管道,为用户创造更好的体验;和来自工业界、学术界、研究机构的伙伴紧密合作,引领未来网络从研究到创新实施。我们还与领先运营商成立28个联合创新中心,把领先技术转化为客户的竞争优势和商业成功。b) 华为产品优势华为公司是全球唯一一家能提供E2E全栈云数据中心解决方案的厂商。华为是唯一一家能提供数据中心所有产品和解决方案的厂商,是最懂业务和ICT设备未来演进的基础设施厂商。华为机房微模块产品解决方案FusionModule,隶属华为数字能源产品线,依托华为公司的整体技术实力,提供不间断电源UPS,行级精密空调,微模块封闭冷通道,IT机柜及配套设备。FusionModule采用All-In-Room建设模式,集成了机柜系统、供配电系统、制冷系统、监控系统。FusionModule一体化机房解决方案,因其部署简单、高效节能、可柔性扩容、智能化联动等特点已成为数据中心建设的主流。着眼于数据中心全生命周期管理,FusionModule以模块化架构+智能化大脑为主要设计理念,i3智能化管理为灵魂(iPower智能可靠供电, iCooling智能高效制冷, iManager智能管理简化运维),将子系统、数据中心到全网打造成智能化的有机体,让数据中心机房成为真正可视、可控、可管理的智能化数据中心。华为打造极致安全、智简融合的低碳绿色数据中心 。华为FusionModule系列智能微模块解决方案以模块化、标准化的架构和电力模块、行级精密空调等灵活组合打造新一代模块化数据中心基础设施。其特点:快速部署、高效节省、智能管理、采用密闭冷通道技术,隔绝冷热气流混合,高效利用冷气资源,支持的单机柜功率密度大大提升,PUE降低。在当今全球局势下,信息化离不开网络安全,华为数据中心产品平台自主可控+业内最高级别安全认证,构建端到端的安全可信解决方案。华为全系列产品(UPS、精密空调、微模块、管理系统)获得国内权威机构公安三所首张最高级别安全认证证书,从器件到核心设备自主可控。c) 华为服务优势华为致力于成为客户“值得信赖的服务伙伴”。我们相信,为您提供专业的服务、快速的响应以及客户化的服务产品是推动客户成功的关键要素。华为服务提供端到端的“咨询、网络建设、网络维护、运营管理”一系列解决方案。华为服务长期坚持全球化和的服务策略,拥有14300名专业人员的服务团队,海外员工本地化比率达73%。超过13200名合作方工程师我们一起为客户提供优质的服务保障,在全球每年交付的工程超过240000个。华为在全球90个国家和地区建立了112个服务代表处。我们拥有遍布全球的服务平台,包括3个全球技术支持中心、8个语言技术支持中心、31个培训中心、7个管理服务中心,保证我们能够满足全球客户的不同需求。自1996年以来,华为服务已通过包括ISO9001、TL9000、BS7799等在内的多项国际标准认证。此外,华为已成功通过多家国际知名电信运营商如BT, FT, Vodafone, O2, Cable & Wireless, T-Mobile, TI等的认证。华为时刻关注着行业服务需求的变化,适时推出满足客户需求的服务解决方案。我们准确把握客户的业务发展需要,在最短的时间内提供相应的服务解决方案。已结束——【课程预约】视频编解码标准的“压缩革命”与“行业变革”JDC公开课来啦!这次我们请到了社区的用户行业解决方案架构师——TTTT11分享《视频编解码标准的“压缩革命”与“行业变革”》时间是2025年7月29日(周二) 19:00,JDC视频号线上直播,不容错过!JDC公开课,知识积累的宝库,思维的火花碰撞的地方!主讲人简介●行业解决方案架构师参与有礼1、扫描下方海报上的二维码,预约直播2、提问有礼:在评论区加上自己想提问的问题,问题若在直播间被选中答复,将获得JDC独家定制礼品3、邀请朋友预约有礼:识别下方推广二维码,生成自己的专属推广二维码图片,将图片转发至微信朋友圈,配文“智慧引领:未来医院建设与规划”,扫描二维码预约,一起进步”,将发送的朋友圈截图发送至本帖的评论区,即可获得10智豆。😆邀请人数最多的TOP 5兔粉将分别额外获得800、600、400、200、100的智豆奖励,最低邀请人数需分别>20、>15、>10、>8、>5, JDC将会在活动结束后公示TOP 5邀请数据,数据统计截止日期:本次直播结束后🥰生成专属推广二维码流程如图🥰已结束——【课程预约】云赋能重塑高校教学新实践JDC公开课来啦!这次我们请到了社区的老朋友华为网络高级工程师,ICT培训讲师——guidl分享《云赋能重塑高校教学新实践》时间是2025年6月10日(周二) 19:00,JDC视频号线上直播,不容错过! JDC公开课,知识积累的宝库,思维的火花碰撞的地方! 主讲人简介 ●华为网络高级工程师 ● ICT培训讲师 参与有礼 1、扫描下方海报上的二维码,预约直播 2、提问有礼:在评论区加上自己想提问的问题,问题若在直播间被选中答复,将获得JDC独家定制礼品 3、邀请朋友预约有礼:识别下方推广二维码,生成自己的专属推广二维码图片,将图片转发至微信朋友圈,配文“基站节能,竭尽所能”,扫描二维码预约,一起进步”,将发送的朋友圈截图发送至本帖的评论区,即可获得10智豆。 😆邀请人数最多的TOP 5兔粉将分别额外获得800、600、400、200、100的智豆奖励,最低邀请人数需分别>20、>15、>10、>8、>5, JDC将会在活动结束后公示TOP 5邀请数据,数据统计截止日期:本次直播结束后 🥰生成专属推广二维码流程如图🥰已结束——【课程预约】调频三步走:电力行业电网调频应用分享JDC公开课来啦!这次我们请到了老朋友能源行业高级销售工程师——q1uguohaou分享《调频三步走:电力行业电网调频应用分享》时间是2025年8月12日(周二) 19:00,JDC视频号线上直播,不容错过!JDC公开课,知识积累的宝库,思维的火花碰撞的地方!主讲人简介●能源行业高级销售工程师●JDC有奖探讨多次一等奖获得者●JDC黄金发言人参与有礼1、扫描下方海报上的二维码,预约直播2、提问有礼:在评论区加上自己想提问的问题,问题若在直播间被选中答复,将获得JDC独家定制礼品3、邀请朋友预约有礼:识别下方推广二维码,生成自己的专属推广二维码图片,将图片转发至微信朋友圈,配文“调频三步走:电力行业电网调频应用分享”,扫描二维码预约,一起进步”,将发送的朋友圈截图发送至本帖的评论区,即可获得10智豆。😆邀请人数最多的TOP 5兔粉将分别额外获得800、600、400、200、100的智豆奖励,最低邀请人数需分别>20、>15、>10、>8、>5, JDC将会在活动结束后公示TOP 5邀请数据,数据统计截止日期:本次直播结束后🥰生成专属推广二维码流程如图🥰【干货分享】智慧建筑能源优化解决方案今天跟大家一起分享一个话题:智慧建筑能源管理能源优化的解决方案。大家一定也深有一些感受。就是其实现在我们住的城市里有很多的,比如说楼宇或者是建筑,有一些是新建的,也有一些老旧的这些楼宇。从现在的建筑水平来讲是非常的高。它的智能化,包括它的一些设施都非常的好。但是很多的老旧的楼宇,其实就面临着很多的问题。比如说在八几年的房子,或者是九几年的房子,到了现在,其实从外观到它里面的设施都面临很多的问题,有一些楼宇还面临着拆迁。所以在这样的情况下,有很多楼宇。它到了50年左右,它的寿命基本就差不多了,可能就要拆掉。我觉得如果是一栋楼,它从0~50年,再从50年到100年,如何延长它的寿命?我觉得是一个非常具有未来、有思考空间的一件事情。第二就是我要讲的就是双碳,这两年国家其实一直在出台双碳的很多政策,它的出发点也要实现在2030年到2060年分别要达到碳中和碳达峰这样的目标,旨在还是要解决很多楼宇很多建筑,包括我们周边的环境如何做到节能减排,让大家去有一个非常宜居的这样的环境去生活。所以从这个角度出发。智慧建筑好不好,管理就非常的重要,那么其实也是要解决两个问题,第一个就是延长建筑的寿命,第二要做到很好的碳排放,也是我今天要重点分享的部分。其实大家现在也非常的清楚,每一个城市其实都要做整个智慧城市的建设。那么从政府的角度,从宏观的角度,有一盘棋规划,从整个大的智慧城市要建不同的场景、不同的板块,但是从企业来讲,其实是一个反向的操作。从一栋楼宇、再到一个智慧社区、再到智慧城市,正好是一个从上到下,一个是从下到上,跟政府是一个相反的做法。这就是政府和企业的做法的不同。我们基于从一栋小的楼宇开始做起,从一个从市场高度市场化的一个操作变成一个智能楼宇精细化的那一部分,就是说智慧建筑它如何去做到能耗的优化。刚刚我也大概讲了一下,从国内有很多的不同的政策去支持双碳。从其他的国家,像日本南亚,包括中东的很多国家也会有各种的碳排放或者是关于绿色建筑的一些倡议,目的是让大家都是同样的目标:就是要做到节能。也是智能楼宇的必要性。就是说其实大家做智能楼体的,或者是智能建筑的能源管控。它不是说大家想想这么做。而是的确是面临一个必要性从国内和国际都有这样的一个要求。从目前的建设的痛点来讲,我们的居住的办公环境,有一些新装修的会面临有害气体的排放,包括我们的办公空间是否宜居?包括它整个的一个碳排放是不是达标了?不管是企业还是我们的员工在大楼工作生活,其实都有这样的一个要求。第二个就是整个他大楼实施改造和成本也会很高。因为老的楼宇很多的设备当时建设之初是没有什么太智能的元素。到了今天,它其实面临着要智能化的改造,老的这些设备要做很多的修改,不管是装修还是设备,所以成本就非常的高。涉及到很多的专业,有能源专业,有消防专业,还有楼控等等,其实也是非常的复杂。所以现在对智能楼层对建筑,提出了很多的要求。以前其实设备也都是相对来说比较孤立,暖通系统、电梯系统、照明系统、消防系统基本基本上每一个都是孤立的系统。这也是如果把它打通的话,那么也是需要一个新的系统去把所有的系统集合起来,去做智能化的管控。所以这一些都是很多建设项目面临的一个非常重的痛点。所以从能源管控的角度来讲,要是把所有的原来的一些建筑的子系统就要把它打通。从大家从左侧也可以看到,其实整个不管是楼宇还是建筑,它会有几个十几个甚至更多不同的子系统。比如泵、冷却塔、冷水机组、抽水机,包括还有风机等。这么多的设备,如果是孤立的话,其实是很难去把它综合调度起来。所以中间我认为是有一个综合的管控平台,这个平台其实是要把所有的子系统的数据归集。接入之后进行数据汇聚,依据数聚打造人工智能的模型。其他的系统要基于中间这一侧的部分的数据。把它重新再建立新的应用。这个催生出来新的应用的话,它就不是像原来一些独立的系统,没有办法去协同工作,而是说它可以去做很多。比如说人员管控,比如说还要基于中间的数据。他要做很多可预测性,这里就有很多新的应用程序出现。所以这样的过程从独立的子系统到数据的集成和分析,然后到新的应用,整个过程会把智能管理就做得非常好。传统的建筑和智能的建筑上还是有很多区别。大家也可以从图上可以看到,其实在以前很多大厅的指挥中心,它其实是有很多小的屏幕。我觉得在10年之前至少是这样子的。最近5、6年会有很多的改善。到了今天突破就更多了。左侧就是现在的组件,大家会怎么样去做?那右侧的这些小的面板,比如说原来是5×6或者是6×9这样的一些面板。或者是电视机,那么已经变成了一个我可以去用一个非常大的一个屏幕。那么这个屏幕其实就完全不需要这个5×6或者6×5,而是一个非常大的一个屏幕。它可以去通过手去滑动或者鼠标去滑动。可以上下左右前后,可以看到整个智能楼宇里面外面。包括上下他都能看得到,所以这就是在整个它的指挥控制上的一个突破,这是传统和智能建筑的一个非常显著的区别。第二个就是一个非常大的区别,就是可预测性。就是我们做了很多的事情,其实并不是说当下的问题发生了我们把它总结,这是已经发生的。其实我觉得更重要的是要做到未来的可预测性,就是说我们今天可能不知道明天这个楼宇它可能会发生情况,通过模型的推演、预测到未来这个楼宇要发生什么事情,比如说明天楼宇的某一个层可能某一个配电箱的电流会超高。所以这种可以通过很多的历史数据,包括结合人工智能模型去把它分析出来。那么在今天就可以预防明天可能在这个时间段我要采取什么样的措施。比如提前调整它的负荷,或者是调整它的用电的一些参数。这样我认为是智能楼宇和现在传统楼宇的一个区别。再就是我们其实现在可以利用数字孪生将整个楼1:1的还原,这种好处其实也可以解决很多设备宕机的问题,就比如说过去可能楼宇遇到一个问题通常是派人到现场去维修。那么如今现在有了数字孪生可以直接能看到每一层的管道和建筑的每一个细微的管线和设备。发现问题之后从可视化层面可以看到到底哪里出了问题。这个时候再派人去现场,可以大节省宕机时间。除此以外,整个楼宇其实还要有api,楼宇也要每一个系统之间打通,api网关用于数据去汇聚。第二个,还要做数字孪生做到可预测性。当然这些也是作为人工智能的优化的基础。第三是把所有的楼宇的每一个部分桌椅、板凳,包括水电、暖通、风、水电,这些全部1:1的还原,也是为了精细化的去管理楼宇的每一个部分。这样无论是做能源的优化可以去到每一个部件。至一第四个是物联网的管理系统,其实这里也就涉及到比如我们需要把所有的楼宇的风火水电的设备会以ba或者是bms系统这样的形态去跟楼宇的管控系统去做一个打通。所以在这里硬件或软件要遵循统一的net协议或者是modbus这样协议去对接。楼宇的硬件和软件就可以去做很多数据上的交互。这里其实大家也可以看到,整个楼宇要基于模型互联起来。每一个楼基本都有dwg或者是BIM数据,用数字孪生原生把楼宇以及管线构建起来,可以看到每一层。结合现在的大模型你可以对模型去说一句话,比如说我要看到10楼的102房间,那么其实可以把BIM的每一层的部件全部呈现看到到底有什么问题,哪里会产生告警,其实也是为了方便资产管理也为了未来做能耗的优化,或者是能源的管控也非常清楚,会看到哪里出了问题。这里你看到的其实是一张非常乱的一张图,其实就是把每一层的位置已经切割了,每一层都会把它打通,把它切开它的管线其实也都会看得非常清楚,你可以把它放大。它这条管道如果是出现告警,那么它其实在这个面板上会出现一个红色。第二部分我想更多还是要提到双碳或者降碳。因为整个楼宇其实现在的楼宇基本电会占大概70~80%的能源的消耗。我记得我昨天的时候去跟一个地方政府的工作人员在聊天,他说当地图书馆现在都不敢开空调了,如果不开空调,群众会投诉,如果是开一天的话大概2万块钱的电费,楼宇也一样,基本耗电最多的就是这些暖通的设备。所以从能碳从节碳的角度来讲,就是把电能耗降下来。整个能源的管控也就有很大的改善。首先是要从管理体系构建,包括碳核查,第二部分从设备的角度就怎么老旧设备上进行一些改造。第三个是可再生能源,就是光伏储能。做一些碳抵消。同时要跟电网去合并,来抵消楼宇产生的一些二氧化碳。整个能源优化还要基于一些条件。 因为每一个楼宇它的条件是不一样的。有的有一些楼宇设备是比较先进,它有一些智能化或者物联网的板块,有一些老旧的楼宇不具备这样的条件,就要对它进行一定程度的改进。比如加装群控装置或者支持PLC可编程控制器把设备和我们的楼宇的软件做一个打通。PLC要支持wifi要支持网络,只要是PLC和它联通的设备和软件系统的协议保持一致。就可以去把设备上的数据汇聚到楼宇都软件平台里面,如果没有PLC控制器的话,就需要把楼宇的设备都集成到BMS系统或者是BA系统。中间可能还需要一个转换器处理数据的清洗工作,确保数据的分析或做模型的数据质量, plc是在控制终端设备,然后通过网络把软件和硬件打通,把数据拿过来。基于数据去做汇聚,做分析,做能源的调控和优化. 有很多楼宇原来是中央空调,如果中央空调没有任何的物联网模块。除了我刚才说的加PLC可控制编辑器之外,还要加一些智能电表收集电梯、消防设备耗电量。耗电量的一个计量就是要通过电表。智能电表也会开放API接口。有很多冷水机还要有温控设备或变频设备。包括温度、温湿度的传感器。智能电表,就是它的一个载体。冷机系统也有物联网的模块去监控它的温度压力。出口的流量。 这里还有一个能效的一个管理,所有的设备接入进来要知道它的能耗是怎样的,能耗比是多少,能耗比:比如说冷机,你可以控制冷耗量,比如说1000瓦,然后冷机消耗200瓦,风机或者是冰机或者是其他的冷耗要消耗量80w,能耗比是1000除以280,大概是3.57是它的能效。能效越高。能耗其实越低,能源消耗多的设备有能耗的优化策略。通过plc的可控制编辑器发放指令。根据策略和指令去集中控制。策略优化还是要基于过去的历史数据,还有线路的一些场景。比如说有很多的大厦有很多个区域,人流是非常稀疏。或者是说在某一个时间段,它的肯定是多的。那么基于这样的数据,可以在某一个时间段,它的人流并不是很多的情况下,对暖通空调进行调整。同时可以结合监测到的天气的温湿度,比如明天可是一个非常冷的天气。那么提前在第二天上班前对整个大楼做提温。能耗其实最大的用电量。有的场景比如可能要下午两点多开会,但是有很多的场景是大家到了会场才当场把这个空调打开。其实完全可以对整个的楼宇的管控系统或者是能源管控系统,提前有这样的输入参数:若下午两点开会。那么其实系统接入到这样条件之后,会根据人数的多少去调控开放一个合适的空调的温度。总结:整个思路第一要把所有设备的子系统的数据汇聚过来。无论是通过运营系统还是电站系统。然后基于数据去做模型,去调优,向设备发送指令,调控温度。当然这些根据很多的模型去学习,因为有很多的天气因素,人流元素,历史的数据,未来可以有一些新的场景要结合。这些结合要结合很多因素去调控。所以我觉得这是一个大的思路。【干货分享】发电行业智慧化场景与生态实践前言对于从事技术工作的朋友,面对一个新的行业领域,最大的障碍往往是不了解该行业的具体场景。其实我们对很多技术的解决方案往往很在行的,但是由于对场景的不了解或理解的深度不够,很多时候不能够给出契合用户痛点和痒点的解决方案,让我们的解决方案和服务跟市场失之交臂。本文尝试分享作者多年在发电行业积累的对发电领域数字化智能化场景的理解,以及我们立足产业生态,与生态伙伴开展的合作创新案例,希望能够对大家有所帮助和借鉴。一、时代背景与技术发展受益于行业的资金密集度较高,经济效益相较于传统制造业更为优越,电力行业在众多行业中的数字化智能化进展相对突出,资金投入活跃,对人工智能等技术创新支持力度较大,为从事相关技术研发和行业应用的生态伙伴们提供了较多ToB的垂直行业机会。(一)发电行业智慧化动力何在?任何一个热潮背后,需要冷静的分析是一时的炒作还是存在根本的需求。最近2~3年来,涉及发电领域智能化的技术交流会,报名人数常常超过计划人数的2倍以上;每个新建火电项目,几乎都包含有智慧化的专门预算。电厂智慧化的实际需求何在呢?本人刚参加工作的时候,就开始从事电站智能化方面的工作,但是那个时候其实我自己都不是特别认可其实际的市场性价比。但是后来我去了新疆、蒙西等一些比较偏远的电厂,当我离开电厂时打不到车,在电厂方圆十里叫不到外卖时,尤其是做行业服务外包的私营企业找到我们要做无人化的时候,我认识到发电领域智慧化的时代已经到来了。偏远的(有的如隔壁滩的恶劣)环境、节假日与夜晚的值班、高温高压高转速安全风险、大型设备与系统操作的工作压力,并不具备足够吸引力的薪资水平……使很多专业的、优秀人才望而却步。然而我们的发电系统运行维护却面临越来越高的要求。 我国火力发电仍然是主体,火电行业面临五大问题。一是环保和碳排放控制的需求尤为突出,那么这一点大家都耳熟能详得非常清楚。二是电力生产的安全,因为安全尤其是人身安全十分关键。三是节能降耗的需求,始终都是各个行业面临的重要的目标。四是煤质与机组负荷的大幅波动。这一点需要做下解释,一方面,电力用煤市场化以后,廉价煤和劣质煤大量引入,更重要的是频繁更换的煤源导致其燃烧和排放特性对于燃烧控制来说产生了极大的不确定性。另一方面是发电负荷的大幅波动。我们电网的特点是我们家里需要用电的时候。把开关打开了电就来了,工厂上班机器一开电自然就有了。但我们知道电目前是难以大规模存储的,这就要求我们用电负荷的变化的同时,发电机组需要随时根据用电负荷进行不断调节,始终保持我们用电负荷需求等于发电的功率。这要求发电机组要时刻感知电网上用电负荷的负载供需平衡,并跟随不断的做大幅度的调整。与此同时,风、光清洁能源的并网,额外带来的供电负荷的不确定性,一阵大风,一朵云飘到光伏电站上方……间歇不确定的清洁能源发电,给电力供需平衡增添了额外的负担,这也是为什么大家会频繁听到新能源并网困难、弃风弃光等问题的根本原因。反过来这要求具备灵活调节能力的火力发电机组承担额外的电负荷大幅波动的调节功能。而这恰恰进一步使前面三个问题变得更加复杂。举个浅显的例子,我们开车正常运行可能寿命、排放都比较好,但如果频繁点火熄火、不断猛踩刹车、油门一脚踩到底……可以想象,给设备安全、能耗、排放控制等都会带来极大的压力。而这些压力都需要高水平的“司机”,也就是电厂专业、有经验的运行维护人员来承担。最后,随着人民生活水平的普遍提高、年轻人对大城市生活的向往、教育医疗的地区不平衡等各种原因,导致发电厂面临高企的人力与运维成本,即使如此也很难招得到、留得住迫切所需的人才。这个时候我们会看到智慧化技术的市场需求也开启了,这样的一个内生动力是非常的强劲,资金的投入也是越来越多。(二)发电行业智慧化技术发展2024-10月《GB/T 44770-2024 智能火电厂技术要求》国家标准发布,11月《DL/T 2770-2024 火力发电厂智能控制系统(ICS)技术规范》行业标准发布,这也意味着这个领域已经度过了一个前期探索的阶段,达到了一定的规模和高度,当然随着人工智能为代表的新技术的日新月异,电厂智慧化技术也在持续高速发展。大约在2010年,行业主要是数字化、信息化以及一些局部的优化的工作。大概2018年左右,进入到少人值守与局部无人的一个阶段。老电厂上千名员工,到现在新建的两台百万计换机组,多数在两三百人水平。第三个阶段就是无人干预全程智控的阶段,这个也是我们目前行业正在发展的前沿水平。大多数情况下发电机组不需要干预,全程都由控制系统和计算机,来实现整个发电过程的智能的控制。未来下一步的目标就是要进入到无人值守阶段。在目前无人干预的目标方向,我们看到有大量的专业的人员和技术人员的投入,它依赖的不只是传统发电领域专业技术,其实还要吸纳更多智慧装备、智能传感、数据分析处理、高速通讯、网络与信息安全等一系列专业方向,综合实现最终的整体效果。在这样一个进展过程中,我们也发现了一些新的特点:当我们发电系统的智能化和自动化程度逐渐提高了以后,机组运行维护人员的技能和经验反而是在降低。很多电厂运行的老专家或“老运行”对电厂各种设备和系统非常熟悉,但凡发生任何的故障或者问题,都有丰富的处理经验,从而第一时间就能找到解决方案。但是现在很多年轻的运行人员已经很难达到老一代运行人员的高度了。这不是说我们年轻一代人素质与水平变差了,而是因为我们所操作系统的自动化程度、智能化程度变高了,导致了他很少遇到那种需要人工手动处理、解决的问题,失去了大量锻炼的机会。所以这也意味着发电行业无人化的这样一条路,只能加速推进。二、智慧电厂典型场景及生态实践本文第二部分将以系统比较发电的煤电发电为主,展开煤电系统典型的应用场景,尤其是跟IT产业结合的一些应用场景,以及我们目前与生态伙伴所共同开展的一些联合的技术实践。 第一个场景是关于数字化的云边协同体系架构。这里所谓云边协同就是中心云+边缘云之间,进行数据、资源、应用、功能等的双向协同。实践证明云边协同的架构比较适合工业垂直场景的应用。首先电力行业的数据安全等级是比较高,数据不能够直接上互联网,这意味着发电集团总部,可以建设中心云来处理各个电厂之间更宏观,更大的数据集。在边缘端一侧,工业场景与ToC端不太一样,每个作为边缘端的电厂都有自己独特的地理位置、设备、人力资源水平,运行经验等,这造成了实际每一个终端厂站,对业务应用的需求有比较大的差异。云边协同架构能够得到一个比较好的平衡,既能响应边端需求的特点,又能在中心端汇聚更多的数据资源开展应用。这方面生态的数据组件、套件都有比较方便成熟的解决方案。(一)智慧基建智慧基建也叫智慧工地,也同样适用于各类复杂系统的建设全过程智慧化。目前,在基建场景中,大量的应用都是围绕着三维可视化与机器视觉(或者说是基于摄像头的视频识别)两类关键技术来展开的。常见场景包括:(1)渐进式的三维数字化建模常规的三维可视化建模一般是一次性建好的。渐进式建模是在基建期随着基建的进展进行逐步的建模,这样通过三维可视化平台就可以更加全面灵活地掌握、浏览、查看工地的建设进度和状态。(2)三维碰撞检查因为大的系统和项目中,比较细小的管道不是必须得出施工图,而且很多情况下图纸会存在一些错漏,但如果施工以后才发现就会产生很大的损失。利用渐进式三维模型就可以在施工前提前开展三维碰撞检查,从而避免管道施工出现碰撞干涉等类似的问题,不仅能避免错漏造成的损失,而且避免因此造成的施工进度时间的损失。(3)三维电缆敷设大型系统的电缆直径很粗,且一般是不接受存在接头的,因此,电缆在敷设前,需要从轮轴上裁剪下来,并保留一定的裕量。通过三维可视化平台,可以从三维模型上准确计算电缆通过桥架等敷设的长度,从而在电缆裁剪时更加精准(误差5%以内),避免浪费,从而产生直接的经济收益。(4)施工方案模拟在电站建设的时候,会有大量的构件不能按进度计划准确到厂,有可能存在被后来的设备堵塞了通道,或者厂房已经快封顶,需要吊装到厂房内的设备不确定如何进入厂房等。利用渐进式三维模型,就可以在虚拟环境下,模拟设备吊装等施工方案,节省施工时间的同时,避免不安全风险和施工进度风险。(5)施工人员和车辆管理大型施工现场,人员和车辆是非常的繁杂的,靠有限的人力是难以胜任这些人员车辆行为的监管的。利用摄像头进行人员不安全行为和车辆违章行为的抓拍是比较有效的方式。(6)其它经验其它经验包括三个方面。一是永临结合。基建期的时候,我们实用的摄像头、网络设备多是随工地进展而变化的临时应用。当电厂建好后,这些临时设备最好能妥善的复用为生产系统的永久应用设备。二是内外网的融合。在电力发电系统的建设过程中对网络安全要求也是比较高的,要求同步规划、同步建设、同步使用。这要求内网的安全和外网的灵活之间要做好安全融合。这也是适合我们IT生态提供妥善的解决方案。三是先进技术的有机融合,推动基建全过程管理的无纸化办公。(二)智慧燃料燃料成本占电厂发电成本70%左右,如何获取实时入炉煤质信息和计算燃料综合经济效益是智慧燃料建设需重点考虑的问题。电煤市场化,促使发电企业根据市场规律采购廉价煤成为常态。这带来的问题可以用养牛来类比,电厂设备的燃料就好比养牛用的材料,如果给牛喂的草料比较杂,草的质量又不好,甚至混入了一些有毒的草,牛自然很容易生病。发电系统也是一样的,在电煤市场化背景下,需要掌握不同的煤如何更好的扬长避短,这就需要跟踪煤质在发电系统掺配、制粉、燃烧、变负荷、环保排放全过程的影响,并进行主动的调整。这部分主要涉及发电专业知识,在此就不展开了。 (三)智慧运行生产运行的自动控制是解决无人化目标最核心的领域,也是最有挑战的一个领域。目前在常规发电DCS控制系统基础上,可以搭建如超融合架构等服务器和AI算力,为运行控制提供更智能化的软硬件的支撑。超融合一体机是比较主流的解决方案,ARM架构的服务器也是应用比较成熟的。这是因为在工业控制区,对数据互联互通的要求并没有那么的强烈,工控的及时性和安全可靠性是第一位的,对各种应用的适配需求反而变弱了。 未来的核心的终极目标是要实现无人化,系统需要能替代人做的那部分工作。那么现在哪些工作需要人作呢?一是参数的监盘,确保系统里的各项参数不仅没有超限报警,而且从经验上都在合理的正常值范围;二是智慧巡航,类似于我们开车的时候的自动巡航,设备的启停、参数的调优工作也需要由自动化系统来完成;三是发电系统过程中,存在很多比较难控制的一些对象,经典的控制方法需要替换为更加智能的方法。这其中并不都是行业领域非常专业化的知识,一个典型案例就是制粉系统设备的自主决策启停。火电厂需要以磨煤机为核心的制粉系统来将原煤磨成足够细的煤粉,吹到锅炉中燃烧,从而产生高温高压的蒸汽,推动汽轮发电机组做功发电。前文说过,火电机组需要跟随用电负荷不断大幅调整发电功率,也就意味着多套制粉系统需要频繁启停。以前其实我们尝试了很多智能决策算法,很难取得比较好的实用效果,但做得都不如人好。这是因为人在判断的时候,可以看到电网调度给的一些发电功率的计划曲线,这样他大概知道下一步大概率是升负荷还是降负荷,就比较容易准确对制粉系统的启停进行科学的预判。但是控制系统看不到这个计划曲线,因为这个计划曲线,从网络安全角度来讲,它位于网络安全三区,安全级别比较低,不允许它直接用到一区的自动控制系统里参与控制。在这个案例中,可以利用显示器的显示信号或直接用摄像头来间接获取这些计划曲线的图片,并用图像识别技术获得曲线数据,通过安全的隔离,最终使控制系统在决策制粉系统启停时也能预知下一步的升降负荷预期。在此基础上,再结合一些智能决策算法,就成功实现了制粉系统的自主决策启停,成功实现了人的作用的替代。工业中存在很多类似的场景,它有效的解决方案并没有那么复杂,需要我们的技术的人员,更多的了解需求和场景。(四)智慧安全人员安全管控领域是目前数字化智能化技术应用比较广的领域,包括各类人员不安全行为的识别,以及与业务系统的很多融合和结合。比如综合利用人员定位技术与门禁系统结合,避免没有授权的人错误的进入不安全的区域等,从而阻止不安全行为的发生。此外,还可以应用各种生态伙伴提供的智能装备,如智能安全帽、智能安全带、智能脚手架等。 在视觉识别领域最新的发展方向是多模态大模型的应用。纯CV模型只能识别图像中有没有,但无法从逻辑上判断这样做对不对。以最重要的不带安全带的判断为例,不爬梯登高的人如果用CV模型判断,同样没有带安全带,但并不违章。目前多模态大模型可以大幅降低不安全行为识别的误报问题,同时可以支持移动摄像头用于不安全行为的智能识别。另一个场景式沉浸式的模拟培训和应急演练。也就是利用VR/CR技术,帮助用户更好的去理解这种安全场景的安全风险。(五)智慧检修 除了人员的安全,我们还需要保障设备的安全和健康。核心是利用智能化的模型和算法,提前预判设备的异常和故障,从而避免事故的发生。但这里有一个悖论,由于智能算法模型需要大量的样本用于学习和训练,然而越是关键、越是价值高的重要设备,它的可靠性越高,越不容易发生故障,但我们最希望能准确进行故障的预警和诊断,总是缺乏足够的故障样本。新建的火电机组主设备,基本上一年都不会出什么故障,也就意味着几乎没有负样本。反之,对智能建模比较友好、负样本较多的往往都是低价值、不关键的设备和部件,即使故障直接利用备品备件更换即可,对智能预警诊断的需求并不强烈。在这样的背景下,主流技术路线是去做正样本的训练。也就是系统可能无法直接判断故障,但能够较好掌握正常的特征,一旦系统偏离了训练好的正常情况,就可以做出异常的报警。这自然不可避免带来了较多的误报。例如,前几年的一次突发的寒潮,很多亚热带的设备没有工作在那样的环境下,模型没有训练过这种工况下的样本,导致这类系统大规模报警。因此,故障误报是目前行业存在的主要问题。基于多模态大模型的四足巡检机器人是其中一个比较成功的案例。首先,四足机器人可以爬楼,适应各种场景环境,这具备了场景的通用性,一定程度上提升了对机器人装备的性价比。第二,多模态大模型能够赋予机器人摄像头在移动中判断设备跑、冒、滴、漏等安全风险,并结合其它传感,执行设备风险异常的巡检任务。第三,具身智能机器人的运行和避障灵活性,赋予它可以在发现潜在风险时,能够自主抵近查看,大幅降低误报率。(六)智慧经营智慧经营或智慧管理,更多是一系列软件应用,与其它场景的办公自动化、智能报表、辅助决策等相对类似。目前行业需求比较旺盛的领域是辅助电网的竞价决策,就是在电力现货市场中如何进行报价,从而在电力交易中获益。这其中除了对运行成本的准确核算外,竞价系统还涉及博弈的成分。三、应用联合创新 本章重点展开与生态伙伴联合开展的一些创新的应用案例。(一)数据创新采用超融合一体软硬件平台,实现数据的全流程价值挖掘。对于垂直行业的技术人员来说,一体机平台可以省去各种适配、组网、接口等非专业性工作,专注于数据如何去处理,如何去发掘。数据一定要流转起来,它才会有价值,才会产生价值。(二)物联创新去年WIFI7+星闪的AP开始面市。目前现有技术在工业无线场景有两个主要问题:一是目前主流的5G+室分的方案做无线覆盖,面临5G终端成本高、企业没有设备牌照无法私有化运营设备、流量收费模式不确定等问题;二是人员定位的主流是UWB定位,但UWB基站只能用于定位,不仅带来额外的建设投资,而且增加了后期维护的复杂度和成本。WIFI7+星闪可以涵盖无线覆盖、物联接入和人员定位的三重作用,降低一次投资成本的同时,也便于后期的运维。这方面的发展具有较大的潜力,今年我们已经开展工业场景的示范,但还依赖终端方面的生态,不断的去降低整个解决方案的成本。(三)AI创新Ai尤其大模型的应用,是离不开基础算力的。这方面,昇腾的算力提供了从算力到平台比较完整的安全可信解决方案。目前在图像、文本、科学计算、声纹、多模态等领域,我们和同行业的技术伙伴也都开展了大量的应用。 (四)融合创新我们现在推出智能副驾的概念,对标汽车的无人驾驶,将火电的无人化进行了分级。虽然大模型很聪明,但是靠大模型本身并不能够,也不擅长完全实现无人化。实际的系统,还是依赖于从底层传感到上层的通讯、算力等一整套的技术体系,最终实现火电的无人化。 前文介绍的1个云边协同平台+6大智慧化技术体系+每个体系下N个智能应用,这样构成了我们的1+6+N智慧电厂体系架构,从传感到数据层面的分析,以及人工智能大模型的应用,能够让我们的生态伙伴融入到发电垂直行业的整个方案里,共同助力发电企业实现“无安全事故,无人值班,无人值守”,最终能够满足低碳减排,这样的“三无一减”目标。 最后作者借这个机会打一个小广告。我们西安热工院在中国能源研究会的支持下,正在牵头筹建“能源大模型技术与应用专委会”这样一个民间行业技术的学会,现阶段免费入会。在此,非常欢迎我们生态的伙伴的加入,支持发电领域智能化技术的发展。