赛博龙虾辩论赛来了!OpenClaw 到底值不值得养?
🔥赛博龙虾辩论赛来了!OpenClaw 到底值不值得养?正方:效率神器、本地隐私、开源免费反方:门槛高、配置坑、信息安全唇枪舌战,观点碰撞,看 AI 智能体未来怎么选2026年3月31日(周二) 19:00,JDC视频号线上直播,不容错过!参与有礼1、扫描下方海报上的二维码,预约直播2、提问有礼:在评论区加上自己想提问的问题,问题若在直播间被选中答复,将获得JDC独家定制礼品。3、邀请朋友预约有礼:识别下方推广二维码,生成自己的专属推广二维码图片,将图片转发至微信朋友圈,配文"扫描二维码预约JDC直播公开课,一起进步”,将发送的朋友圈截图发送至本帖的评论区,即可获得10智豆。😆邀请人数最多的TOP 5兔粉将分别额外获得800、600、400、200、100的智豆奖励,最低邀请人数需分别>20、>15、>10、>8、>5, JDC将会在活动结束后公示TOP 5邀请数据
已结束——【课程预约】智能会议室解决方案
JDC公开课来啦!这次我们请到了软件信息技术服务业高级售前工程师——花花11老师分享《智能会议室解决方案》时间是2026年3月24日(周二) 18:30,JDC视频号线上直播,不容错过!JDC公开课,知识积累的宝库,思维的火花碰撞的地方!参与有礼1、扫描下方海报上的二维码,预约直播2、提问有礼:在评论区加上自己想提问的问题,问题若在直播间被选中答复,将获得JDC独家定制礼品。3、邀请朋友预约有礼:识别下方推广二维码,生成自己的专属推广二维码图片,将图片转发至微信朋友圈,配文"扫描二维码预约JDC直播公开课,一起进步”,将发送的朋友圈截图发送至本帖的评论区,即可获得10智豆。😆邀请人数最多的TOP 5兔粉将分别额外获得800、600、400、200、100的智豆奖励,最低邀请人数需分别>20、>15、>10、>8、>5, JDC将会在活动结束后公示TOP 5邀请数据🥰生成专属推广二维码流程如图🥰
已结束——【课程预约】聊一聊太空光伏畅想
DC第46期公开课来啦!这次我们请到了新能源行业资深系统设计工程师——CallMeMaybe老师分享《聊一聊太空光伏畅想》时间是2026年3月10日(周二) 18:30,JDC视频号线上直播,不容错过!JDC公开课,知识积累的宝库,思维的火花碰撞的地方!参与有礼1、扫描下方海报上的二维码,预约直播2、提问有礼:在评论区加上自己想提问的问题,问题若在直播间被选中答复,将获得JDC独家定制礼品。3、邀请朋友预约有礼:识别下方推广二维码,生成自己的专属推广二维码图片,将图片转发至微信朋友圈,配文"扫描二维码预约JDC直播公开课,一起进步”,将发送的朋友圈截图发送至本帖的评论区,即可获得10智豆。😆邀请人数最多的TOP 5兔粉将分别额外获得800、600、400、200、100的智豆奖励,最低邀请人数需分别>20、>15、>10、>8、>5, JDC将会在活动结束后公示TOP 5邀请数据🥰生成专属推广二维码流程如图🥰
【错过直播的速来补课】大咖公开课回放可以兑换啦
一大批干货正在袭来,错过大咖直播的小伙伴看过来公开课回放可以智豆兑换啦快来看看是不是有你关注的话题!点击对应的课程跳转链接就能兑换!公开课分享人:TTTT11,金融行业解决方案架构师JDC勋章:黄金发言人本期为虚拟商品兑换,💡点此兑换。本期为虚拟商品兑换,💡点此兑换。公开课分享人:Capybara,金融行业资深架构师JDC勋章:黄金发言人本期为虚拟商品兑换,💡点此兑换。公开课分享人:黄雪橙,金融科技高级运维工程师JDC勋章:黄金发言人本期为虚拟商品兑换,💡点此兑换。公开课分享人:高林,智能发电部副主任,JDC有奖探讨一等奖获得者本期为虚拟商品兑换,💡点此兑换。公开课分享人:小子wjyao;高级算法工程师JDC勋章:黄金发言人、VIP专属勋章JDC大V认证:技术大牛本期为虚拟商品兑换,💡点此兑换。公开课分享人:Kevin_jun;金融行业核心系统架构师JDC勋章:黄金发言人JDC大V认证:知识达人本期为虚拟商品兑换,💡点此兑换。公开课分享人:魔鬼教父,酒店行业数字化解决方案架构师JDC勋章:知识达人本期为虚拟商品兑换,💡点此兑换公开课分享人:凛冬将至,金融行业解决方案架构师JDC勋章:黄金发言人本期为虚拟商品兑换,💡点此兑换公开课分享人:海涛2,智慧医疗软件工程师JDC勋章:黄金发言人本期为虚拟商品兑换,💡点此兑换公开课分享人:liujiayou_for,大企业-数据通信领域-行业解决方案销售JDC勋章:黄金发言人、产品建议大师本期为虚拟商品兑换,💡点此兑换
【干货分享】星河AI高品质中小医院网络解决方案
1.    行业趋势及需求当前医院已有多种业务系统,根据医院业务部门的划分,以及各系统对硬件支持平台等IT基础设施的不同要求,主要可划分为门诊系统(HIS)、住院系统(HIS)、影像系统(PACS)、体检系统(LIS)等核心应用系统,以及医院运营管理系统、智能楼宇系统等。在这些业务中,硬件平台资源必须优先保障医疗业务的正常开展,分析医疗类业务特点,主要包括:HIS与LIS系统要求实时性高、可靠性高,带宽要求相对较低,数据的传输,必须安全可靠;而PACS影像具有单张数据量大、数量多的特点,为保障良好的业务体验,从医生点击阅片到完成影像展示时间应在3~5秒以内,因此需要网络保障在3秒内完成数据传输,不能丢包;网络建设的好坏直接影响医院信息化建设的成败,如何建设一个稳定,可靠,安全,应用集中的综合业务网络平台,是医院信息化建设需求的根本出发点。目前,很多医院的计算机都是放置在各部门或科室的固定位置,甚至是在病房中,通过综合布线连网组成医院管理系统网络。这种固定部署计算机的方式存在终端设备移动不方便、信息点固定等局限性,让信息系统和病房的管理模式并没有实现信息衔接,等于从医生、护士办公室到病人床前这一段“路程”没有实现数字化。如何利用计算机网络更有效的提高管理人员、医生、护士及相关部门的协调运作,满足无线查房、无线医嘱执行、无线医疗设备管理、无线输液、无线导医等需求,是当前中小医院需要考虑的问题。2.    网络运维需求随着信息化整体水平不断提升,中小医院也都采购了越来越多的硬件设备、以及关键业务系统例如HIS、LIS、PACS等等,随之而来,网络系统越来越庞大,管理的复杂度也越来越高,给医院的运维工作造成了越来越大的难度和压力;中小医院IT部门(信息科)的人员数量相对来说一直比较少,而当硬件和软件系统出现了故障之后,因为网络规模大情况复杂,故障排查难度大处理起来非常被动,医院IT人员需要经常面对查找问题也很难准确定位到底根源在哪里的情况。除了日常的管理维护外,医院IT人员需要考虑如何实现业务系统运行健康度的监测评估,保障7x24小时关键业务系统的不间断运行,通过有效的网络流量和网络故障安防,及时有效的发现网络中存在的各种故障和隐患,以便能够通过及时的故障处理,有效的排除网络故障,降低网络使用风险,确保各种业务的正常开展。上述这些要求,都是医院需要考虑的,也是大部分中小医院IT人员的普遍关注点。医院网络作为搭建整个医院信息系统的基础平台,在与医院各项业务相融合的前提下,不仅应具备高速、安全、稳定、标准、可扩展等特征,还应拥有一定的技术超前性和较高性价比。华为中小医院网络解决方案,以“稳定、安全、可靠”作为网络建设目标。3.    网络组网设计医疗内外网为了满足医院安全等保要求,采用物理隔离,分别部署网络,内外网相关互访通过网闸控制;网络采用双核心设计,双万兆互联,汇聚到核心双千兆链路上联,提高网络稳定性;核心、汇聚光纤互联,房间数量较少的楼栋可采用两层组网(院区核心+楼栋汇聚),房间数量较多的楼栋可采用三层组网(院区核心+楼栋汇聚+楼层接入)。光进铜退,光纤入室,保护投资,支撑带宽平滑升级: 小行星交换机入室部署,在门诊室,病房等区域可采用本地供电,在本地供电不方便的区域也可采用光电复合缆为小行星远距供电。无线AP选择Wi-Fi7款型,可融合IOT共址部署,为医疗以及物联无线终端提供入网服务。AP上行选择2.5GE、5GE或者10GE接入交换机,可充分发挥Wi-Fi7大带宽、低延时、高并发的优势,提升用户体验在医院核心机房/数据中心等区域可部署部署网络管理控制器、认证服务器,满足集中管理运维的诉求。在病房区域,采用分布式零漫游AP实现Wi-Fi信号覆盖,医护人员携带如PDA设备查房时可实现零漫游、不掉线,提高工作效率。同时支持内网、外网、物联网三网物理隔离、融合部署。医疗物联&医院网络融合,进行医疗数据的采集、传输、处理,以满足医疗智慧化的发展需要在医疗无线网络应用中普遍存在以下场景:移动医护:医院病房普遍开展的基本业务,护士通过PDA等设备或移动推车(带平板),开展例行查房,记录病人基本信息,省去了手工记录,往返护士站录入的麻烦。手持PDA要在移动过程中保持和上层应用系统的数据连接,包括维持在线登录状态、PACS影像数据下载等,该过程对丢包敏感,AP漫游过程中的丢包,卡顿,会导致设备连接中断,需要重新登录的问题,因此医院普遍要求漫游过程中终端应用采用无感知漫游。内外网隔离:无线内网主要提供移动医护、辅助医疗物联、临床医疗物联等医疗办公业务。无线外网主要为患者提供Internet访问服务。无线物联:当前辅助医疗物联在医院已经大量开展,物联协议大部分以蓝牙、RFID、Zigbee等协议为主,在医院环境中使用一套WLAN网络满足物联接入的诉求,能够降低多张网络的运维成本分布式零漫游方案很好的解决了上述问题,通过“中心AP+光射频单元+天线单元”组合部署,可以同时实现病区内无线网络零漫游、内/外网隔离以及物联覆盖。其中,中心AP和外网AP、物联基站可部署在楼层弱电间。中心AP通过光纤馈线收集整个病区的无线信号,其中内网业务流通过中心AP处理后上行连接内网转发;外网无线信号通过连接外网AP的馈线发送到外网AP处理,并通过外网AP连接的外网设备转发;IoT业务流通过馈线连接到IoT基站处理,从而实现一套网络同时支持内网、外网和物联网。4.    网络基础运维对于医院网络运维人员而言,日常维护工作不仅繁杂,而且工作量大,涉及的工作内容包括查看拓扑对象、查看网元、配置网元、查看业务、诊断故障、查看性能、查看资源、报表生成等。通过iMaster NCE-Campus网络管理系统,可以准确、快捷的提供运维人员所需要的信息,大大减轻运维人员的工作量园区网络发生问题时,使用传统运维工具进行分钟级指标采集显示各项指标均正常,分钟级别的故障采集有可能错过故障发生时间,在问题发生时刻数据却无法准确的获取。园区网络发生问题时,会采集设备大量数据,靠人工去排查日志是相当费时费力的,缺乏一个大数据平台,能对数据进行统一采集、存储和分析,具有高效的大数据处理能力。网络和用户的故障识别,缺乏准确故障识别算法,对故障发生的原因能做出正确的定界和定位。无法随时随地感知WiFi网络用户的体验是WiFi网络运营的最大挑战,每时每刻的用户体验感知需要基于大数据分析进行用户旅程回放,基于时间、空间维度,准确识别用户问题。传统基于静态阈值的方式无法准确识别网络异常,无法适应动态变化的网络情况。网络需要具备动态学习能力,能基于历史数据,分析数据特征,持续学习优化。而iMaster NCE-CampusInsight网络智能分析平台将人工智能应用于运维领域,通过Telemetry技术采集网络设备的性能指标和日志数据,通过大数据、人工智能算法及更多高级分析技术,通过场景化的持续学习和专家经验,将运维人员从复杂的告警和噪声解放出来,使得用户网络体验可视化、运维变得自动化和智能化。 
【干货分享】医学智能影像标注一体机实战分享
一、分享主题今天借助JDC平台分享我们在医学影像、智能标注方面的一些产品研发及场景推广实战经验,及与华为合作的智能标注一体机产品,并对未来软硬协同的一体机产品合作做一些展望。二、产业背景介绍2019年以来数据驱动医疗行业科研发展已经成为一种明显的趋势,相关的论文、研发实战都充分证明了这一点。其中以数据驱动、科学研究和影像标注,这已经是一个行业的一个发展的一个趋势,也是解决医疗行业基于影像数据做行业科研的必要基础技术支撑底座。 而我们国家的在医疗数据应用场景化实战方向也走在了世界前列,尤其是很多医学和数字化技术的结合方面,其同质化服务的能力和效率,也适合我们国家面向公众服务的普适医疗的理念。通过提供最佳的一些临床实践的一些场景,来帮助我们用数字化的技术、工程化的技术来驱动医学的精准高效和同质化的公共医疗服务,服务”健康中国“的宏大目标。  人工智能技术有大量的行业落地需求,推动AI算力向边缘侧迁移。同时,边缘AI技术已经从边缘的机器视觉逐步进展到大语言模型、生成式AI、多模态大模型等新一代的AI技术方向。另外大家可以看到,我们国家现在的医学的智能化重点发展方向,区别于美国的集中化的医疗服务模式(如facebook或谷歌大平台模式),更多应用场景在边缘测的诊疗服务。因为大部分医疗专业数据是在医院端的私域数据,做专业病种医疗科研,采用以20%的互联网和公开的数据做大厂基础模型平台为底座,以专有高质量数据集做专病模型知识库或微调,这种训练出来的模型才能更精准的、更准确的医疗专业病种诊疗服务实战,服务于我们的广大的患者。所以在医疗行。行业边缘的智能市场是一个很大的市场。大家可以看到下图的一些数据,我国的边缘智能设备增长很高,医疗行业是其中的关键产业热点方向。中国人工智能边缘计算在政策与技术融合驱动下快速发展,医疗领域成核心场景。医疗边缘智能一体机凭低延迟、隐私保护优势,支撑实时诊断、远程监测等应用。全球 AI 医疗边缘系统 2031 年将达 46.2 亿美元,年增 12.1%,中国因基层需求与老龄化,市场空间广阔,前景向好。 数据驱动临床医学科研也面临诸多挑战,医生日常诊疗任务繁重,科研任务数据管理主要困难有:全量全周期数据集成治理难:跨系统、跨业务、多模态、 多学科长周期、连续性、院内外   完整性、标准化、一致性、 整合对齐数据检索纳排难:非结构化数据检索匹配难复杂检索和时间约束还依赖 SQL 语句编写查询后结果实验验证效果不佳, 且需反复调整数据加工处理难:影像标注、文本标注费时费力 数据预处理工作繁琐特征提取和选择需要技术、经 验和大量实验数据分析建模门槛高:学算法、学编程、搭环境碎片化工具使学习成本倍增、 科研效率倍减技术门槛高、人才稀缺、跨学 科合作难因此行业需要一个一体化的医疗科研解决方案,融合医学和数字科技,实现医疗数据要素价值化,赋能数据驱动的科研创新,规模化实现成果转化。平台需要提供医疗科研多模态数据采集、治理、智能化标注、团队协作科研管理、专病库建设、医疗知识服务、医疗科研成果输出(论文、数据集、应用等)及产业功能服务平台等全面功能组件。 在国家大力推动数字经济与人工智能发展的时代背景下,数据标注产业正经历着迅猛发展。2023 年我国数据标注产业规模达800亿元左右 ,到 2027 年,其产业规模将大幅跃升,年均复合增长率超过 20%。数据标注正在向自动驾驶、医疗影像、 语音识别和自然语言处理等全领域扩展,占比分别达到 35%、 25%、20%和 15%。各项国家地方相关政策为数据标注发展创造条件,为医疗AI发展提供机遇。2025年1月:国家发展改革委、国家数据局等多部委发布《关于促进数据标注产业高质量发展的实施意见》发展目标:到2027年,数据标注产业专业化、智能化及科技创新能力显著提升,产业规模年均复合增长率超过20%。推动公共数据标注需求,编制公共数据标注目录,深化人工智能在政务服务、城市治理等领域的应用。2024年5月: 《国家数据标注基地试点建设相关文件》公布7个试点城市(成都、沈阳、合肥、长沙、海口、保定、大同等),推动数据标注基地先行先试。基地需结合地方优势,优化能源与算力资源配置,融入“东数西算”工程布局。2024 年,国家数据局等部门印发《“数据要素×”三年行动计划(2024—2026 年)》、国家发改委等部门印发《国家数据标准体系建设指南》和《关于促进数据产业高质量发展的指导意见》强调数据标注在低空经济、自动驾驶、智慧医疗等领域的应用潜力。提出通过数据标注驱动场景创新。医学影像数据标注作为产业重点发展方向,面临的更大问题与挑战:专业性:医学影像数据标注专业性要求极高,标注量极大,迫切需求智能化标注平台。 卡脖子:由于技术封锁,国内医学影像标注严重依赖于国外单机版标注产品。三、医学影像智能标注产品设计--飞标医学影像标注一体机 核心价值:解决多模态医学影像标注效率、质量问题并保证数据安全产品概述:通过医学影像分割大模型及多种AI技术,提供150余种可扩展的预标注算法,灵活支撑不同规模的数据标注团队高效完成医学影像协同标注工作,支持自动标注、半自动标注、手工标注、三维标注、形态学测量,提高放射学影像的标注效率和质量;基于Web云原生的服务模式,通过医疗数据集中管理,满足医疗数据不出院的要求。关键功能:1、基于大模型、AI智能辅助标注,复杂标注只需一键就完成基于 AI 智能辅助标注技术,医学影像分割大模型支持一键完成复杂组织的精准标注,高效处理海量数据,显著提升标注效率与精准度。2、150种医学影像预标注算法,降低标注门槛提高准确性飞标平台的预标注算法库已经内置了150种医学影像预标注算法,用于解剖结构和病灶的自动化标注 3、多模态医学影像支持,一个工具全搞定,相同的操作方式,学习成本更低,效率更高。模态类型: CT、MR、DR、PAT、DSA、超声、钼靶、内窥镜、眼底、皮肤镜、病理数据格式:DCM、ZIP、JPEG、PNG、GIF、BMP、WBMP、TIFF、MHA、MHD、NIA、NII、NRRD、MP4、MOV、FLV 4、多人、多团队、多中心协同医学影像标注支持单人标注、多人协同标注、专家审核流程等多种协作标注流程。提供多人、多团队、多中心协同工作的组织、分配和管理,通过及时收集反馈意见,进行标注结果审核和优化,不断提升标注质量。 5、电影级高级可视化赋能,让细节展现更清晰通过流畅顺滑的实时渲染,清晰展示医学影像的细节和结构,准确理解图像内容并正确定位感兴趣的结构或病变区域,有助于更清晰地了解病灶与周围组织的空间关系,拓宽医学影像数据的应用场景。 6、数据脱敏与匿名化,实现隐私与价值的平衡数据脱敏与匿名化运用替换、加密等技术处理敏感信息,切断数据与个人身份联系,保障患者隐私。经脱敏和匿名化处理的数据可用于科研、医疗服务优化等,实现了隐私保护与数据价值释放的平衡。隐私合规:满足法规要求。数据可用性:保持数据价值,支持分析与共享。安全平衡:权衡隐私强度与业务需求提供技术。  飞标平台特点与特色1、AI智能辅助标注大模型交互标注更高效这一特性,显著提升了标注的速度和质量。涵盖广泛的分割模型,并且可以在新的医学影像上即开即用,无需额外的训练,做到零样本迁移2、智能预标注技术通过自动病灶检测、自动预标注结果加载等自动化预处理方式,降低IT技术与人工智能应用门槛,提高了标注效率和质量。3、协作标注支持多人在线协作标注标注,标注人员可以在不同的地点通过网络进行实时协作。提供任务分配、进度跟踪等功能,方便团队协作管理。4、高级可视化丰富的高级可视化功能能够将标注结果以更加直观、清晰的方式呈现给用户。通过不同的颜色、透明度、三维模型展示等手段,标注人员和其他医学专业人员可以更清晰地分辨不同的标注区域及其特征。5、多租户与数据安全飞标平台能够服务于多个不同的组织、团队或用户群体,每个租户可以在平台上独立管理自己的标注项目、数据和用户权限。保证数据的隔离和安全,提高了平台资源的利用率。四、应用场景与案例产品主要客户群是医院\医疗科研机构\大专院校,针对科研管理,科研团队和科研工作者、医疗教育工作者,分别提供不同层级的功能组件,满足不同应用场景的精致化需求定制。典型应用场景有:应用场景1:医学影像标注支持多人、多团队、多中心协同工作的医学影像标注平台,解决医学影像标注的关键需求:标得准、标得快、隐私安全等 应用场景2:手术规划支持手术评估、策划、方案尝试、术中参考、术后康复等全流程持续改进的服务功能。 应用场景3:医学影像教学通过精确的图像分析和可视化工具,帮助医学生和专业人员更好地理解复杂的解剖结构和病灶变化,从而提高诊断能力和临床决策的准确性 实战案例分享:智能标注,提高标注效率2-30倍 五、东软-华为”添翼“医疗健康智能化一体机合作实战在2025年2月的DeepSeek热潮中,医疗行业成为部署行业DeepSeek应用的急先锋,全国已经陆续部署超过余个医疗行业DeepSeek应用场景,也给软硬结合的智能化一体机产品提供了高速发展的契机。在8月浪潮之后的行业冷静期,客户逐渐理性,价值驱动占领高地,节奏放缓,市场仍存在大量算力缺口,有特定应用场景价值的智能化医疗行业一体机市场依旧在高速增长。东软添翼医疗健康智能化解决方案2.0,以业务与数据为基石,依托东软医疗数据价值化与“融智”智能化双框架,构建覆盖数据治理、知识萃取到模型构建的全链路医疗数智体系。添翼2.0聚焦于智慧医疗、智慧服务、智慧管理、智慧基层、智慧卫健及城市级健康医疗数据空间六大核心场景,实现医疗赋能体集群(“N”个赋能体)。东软添翼2.0是融合AI、数据、流程、组织于一体的医疗智能化方案,实现数据基座、赋能平台、价值扩展“三维”突破,全面满足用户对数据深度治理、科学能力转化、海量知识萃取、场景模型构建、全场景赋能的迫切需求,为医疗体系的智能化升级提供核心动力。 东软和华为在这个过程中紧密配合,发挥各自优势,讲国产化尖端智能计算平台和医疗行业场景成熟智能化应用相结合,高效率适配国产化软硬件环境,推出了系列东软-华为”添翼“医疗健康智能化一体机合作产品。产品名称功能简介适用销售客户推荐硬件配置医事服务一体机智能写作、智能问答、智能通讯、智能结果速查、病情讨论等。电子病历客户,5.0以上版本NPU:8张Ascend 910(昇腾Atlas推理卡,64GB缓存)病历质控一体机病历辅助生成、病历内涵质控、智能病历点评。电子病历客户,6.0以上版本NPU:8张Ascend 910(昇腾Atlas推理卡,64GB缓存)患者服务一体机智能客服、智能导诊、智能预问诊、智能病历解读。互联网医院客户NPU:8张Ascend 910(昇腾Atlas推理卡,64GB缓存)卫健管理服务一体机数据采集、数据治理、管理服务、基层辅诊、居民健康管理。卫健管理客户NPU:8张Ascend 910(昇腾Atlas推理卡,32GB缓存)医疗影像标注一体机多模态数据管理、智能标注、隐私保护、团队科研、可视化展现医疗科研机构、医院专业科室NPU:8张Ascend 910(昇腾Atlas推理卡,32GB缓存) 六、软硬件一体机合作展望在软硬件之呢个一体机合作过程中,也对未来更深入的合作有了更多的期待和展望:1. 期待更全面合作场景在医疗科研、患者服务、辅助诊断、病理核查、医保服务等众多方向,扩展医疗智能一体机应用合作场景。2. 期待更符合行业应用特点更丰富定制化一体机在功能、性能、制冷方式、样式、空间、噪声控制等方面灵活配置,更能适应医院科室前端工作环境,支持灵活配置软硬件基础能力。尤其医疗行业前端部署的低噪音、液冷、医疗设备眼样式一体机需求迫切。3. 原厂商更深入服务支持从基础硬件支持,到软件框架配置、多基础模型支持、智能运维服务、人才培养、托管服务等多场景提供更深入服务能力。 张静波(JDC@zhangjbn)2025年10月14日
【干货分享】部署Hub&Spoke场景的MPLS VPN
        好的,我们来说这个部署HUB-Spoke的MPLS这个场景。这个场景也是我们在广域网里面使用的MPLS VPN一个典型的案例,也是我们现在大家未来考过IE,甚至现在备考IE,我们锻炼的内容中,有第三部分,就是我们的MPLS广域网部分,用的也是这个场景。然后我们今天主要会去介绍一下MPLS VPN这个技术,它典型使用了哪些技术,然后我们还会去做一个实操,把理论和实操相结合,带大家把MPLS VPN的HUB-Spoke这个技术完整过一遍。然后我们首先来看一下前言,我们的前言说的是VPN,对吧?VPN它叫虚拟专用网络,是指在一个公共网络中实现虚拟的专用网络。然后我们今天说的这个MPLS VPN,主要是指三层的VPN技术。然后我们今天这节课主要会介绍什么是MPLS VPN的基本概念,以及它的工作过程,还有典型的配置方式。然后我们来看一下MPLS的定义。我们的MPLS IP VPN一般是由运营商搭建,然后我们去购买运营商的VPN服务,它可以实现我们这些用户之间的路由传递,我们可以实现不同站点之间通过MPLS VPN的骨干网进行通信。然后我们今天第一个要学习的就是MPLS VPN的网络架构。我们首先需要知道MPLS VPN这个网络架构中,这些设备的命名,一般就是我们的CE设备,也就是客户端设备,就是你的站点的边缘设备,连接着运营商MPLS VPN的边缘设备。这个边缘设备,一个是CE,就是站点的边缘设备;还有PE设备,就是MPLS VPN骨干网中连接CE的设备,我们叫它PE。然后还有P设备,这个P设备就是MPLS骨干网里面的设备。其中这个P设备和PE设备一般都是由运营商搭建的,而CE设备就是你自己,也就是客户这边自己的设备。然后我们这个MPLS VPN的一个优点就是,大家做实验的时候也能体会到,就是不同站点之间,想通过骨干网进行通信的情况下,基本上是感知不到MPLS VPN的存在的,因为它只需要将路由信息传递给MPLS VPN的骨干区域就可以了,然后由MPLS VPN将这个路由进一步传递。这一点我们做实验的时候还会给大家详细说。然后我们这个MPLS VPN的技术架构,主要会使用到哪些技术来实现呢?第一个就是,MPLS VPN不是单一的VPN技术,它是多种技术的融合,通过多种技术的结合,实现MPLS VPN。第一个就是我们学习的MP-BGP,对吧?MP-BGP在这里主要负责什么呢?就是负责不同站点之间路由信息的交换。比如说,我们这边有一个站点,你这边站点发送路由过来之后,这个路由如何传递给远端的站点呢?我们这里就可以使用MP-BGP。        因为MP-BGP的扩展性比较强,它可以传递非常多的路由信息,所以说使用MP-BGP是比较合适的。第二个就是LDP,这个LDP负责什么呢?它负责MPLS VPN中P设备之间隧道的建立,这个隧道就是基于LDP的,数据转发的时候,通过LDP隧道,实现站点之间的互访。第三个是VRF,我们的VRF负责PE设备上VPN用户的管理,也就是PE和CE之间,我们可以启用不同的VRF,这个VRF大家学习过的应该也知道,我们又把它简称为VPN实例。VPN实例,你也可以理解为,在PE设备这个路由器上,虚拟出了多个小路由器,每个小路由器对接不同的站点,并且不同的VPN实例之间,它们的路由表等都是完全独立的,所以不会相互影响。然后我们还需要使用哪些技术呢?还有静态路由,你可以使用静态路由、IGP和BGP,它们负责什么呢?就是负责CE站点,也就是客户站点和骨干网PE之间的路由传递。所以说,我们主要的部署重点还是在MPLS骨干网的搭建上,我们需要使用MP-BGP、VRF还有LDP来建立MPLS骨干网。然后是站点部分,你的用户站点和骨干网边缘的PE设备之间,只需要运行静态路由,或者IGP、BGP就可以了。所以说,对于我们运维人员来说,要求也是比较低的,无论是配置OSPF做对接,还是用静态路由做对接,都可以实现。然后我们今天主要会做整个HUB-Spoke的实验,我们会从CE设备到PE设备之间的路由传递,以及PE设备到远端PE设备的路由传递,再到路由传递到远端相同VPN的站点,最后实现整个网络的互通,一步步操作。然后我们MPLS常见的组网,不仅有HUB-Spoke组网,还有Intranet和Extranet这三种典型的组网,其中我们今天主要说的就是HUB-Spoke组网。第一个是Intranet组网,它的要求是,相同VPN内的用户站点之间,可以相互访问,不同VPN的站点之间不能相互访问。比如说,我们这里的CE1,它是用户X的站点A,上面的CE3也属于用户X,是站点B(分支站点),如果你使用的是Intranet组网方式,那么相同VPN的站点之间是可以直接互访的。但如果你CE1(用户X的站点A)想去访问CE4(用户Y的站点),因为属于不同VPN,就不能直接互访,也不能通过P设备直接访问,这就是Intranet组网,同一VPN用户站点可互访,不同VPN用户之间不能互访。第二个是Extranet组网,这个Extranet组网的特点是,我希望我这个站点里的部分资源,可以分配给其他VPN的用户访问。            比如说,我们这个站点C(CE4)是用户Y的站点D,这个站点内部有些资源,需要用户X的站点A访问,那么即使我们不属于同一个VPN,也可以通过Extranet组网,让部分资源实现跨VPN访问。第三个就是HUB-Spoke组网,我们HUB-Spoke组网的场景是,我们希望分支站点之间的通信,不直接进行,而是必须经过总部站点(HUB CE)。比如说,你有两个分支站点,都属于同一个VPN,我不希望这两个分支站点直接互访,它们的所有流量必须经过总部站点(HUB CE)转发一遍,这样做的好处是可以监控所有站点之间的流量,实现分支站点通过总部站点进行交互。这就是我们的HUB-Spoke组网。我们刚才说的这三种模型,它们的主要区别,等会儿我们会通过介绍路由的RT值来讲解,通过RT值来实现不同组网的需求。第一个,我们来学习一下MPLS VPN的路由发布。我们刚才简单介绍了三种模型,接下来要说的MPLS VPN路由发布,就是我们站点之间要实现通信,必须要有路由传递,所以我们现在需要将站点A里面的路由传递到远端的站点B,中间就是通过MPLS VPN里面的MP-BGP来实现传递的。我们这个路由的传递主要分为三个部分:第一个是本地CE设备到入口PE设备,将本地路由传递给入口PE;第二个阶段是入口PE到远端的出口PE的路由传递;然后第三个阶段是从出口PE到远端的CE设备。整个过程,我们的实操都会全部涵盖到。然后我们这里先说说本地CE到PE,以及远端PE到CE的路由交互,这里的路由交互是比较简单的,你使用BGP、IGP(比如OSPF)或者静态路由都可以,只需要将           路由能够传递给PE设备就可以了。所以说这里比较简单,我们的重点还是在MPLS VPN骨干网内部,路由信息是如何传递的。第一个问题就是,你通过OSPF将路由传递给PE1之后,可能会出现一种情况,就是地址重叠的情况。什么是地址重叠呢?就是用户X的站点和用户Y的站点,使用了相同的IP地址段,那么如果我在PE1上只使用一个路由表,是不是就会学习到两个相同的路由?如果你使用OSPF,它会进行优选比较,根据优先级、开销等,如果优先级和开销一样,就会做等价负载分担。然后,为了实现不同站点之间路由的隔离,解决地址重叠的问题,我们就会使用到VRF。我们的VRF可以实现什么呢?就是在PE1设备上,虚拟出两个VPN实例,一个VPN实例对接G0/0接口,一个对接G0/1接口,然后使用这个VPN实例与对应的站点之间运行OSPF、IGP、BGP或者静态路由都可以。我们的VRF,叫虚拟路由转发,又称为VPN实例,这是我们MPLS架构当中的一个关键技术,它可以实现路由的隔离,每一个VPN实例都有独立的路由转发表,所以可以实现PE设备上不同VPN实例的路由表独立,与公网的路由表也隔离开,并且互不影响。这样就可以解决地址重叠的问题,就好比在PE设备上虚拟出两台小路由器,分别对接不同的站点,各自管理自己的路由。这个应该是比较好理解的。然后我们也说了,通过VRF实例隔离路由表,就可以区分地址重叠的问题了。接下来我们还需要学习一个,就是RD值。这个RD值,是为了解决什么问题呢?就是路由在传递的过程中,比如传递给PE2的时候,我们主要使用MP-BGP来传递路由,如果你通过MP-BGP传递了两个相同的IP路由,那么PE2设备,大家学习过BGP的都知道,BGP会根据选路原则,选取更优的路由。为了在MP-BGP传递路由的时候,区分这两个相同的IP路由,我们就需要使用RD值,就是给这个路由打上一个RD值。这个RD值,我们叫它路由标识符,主要作用就是区分路由,用于区分不同VPN的相同IP路由。        然后它做了哪些扩展呢?就是MP-BGP在传统BGP-4的基础上,做了两个路径属性的扩展。第一个是MP_REACH_NLRI属性,它主要用于传递可达的VPNv4路由信息,发布下一跳可达的路由;第二个是MP_UNREACH_NLRI属性,它用于撤销不可达的VPNv4路由信息。这两个扩展属性,大家如果学习过MP-BGP,应该是非常熟悉的。然后我们刚才说了,我们可以通过VPN实例,实现CE设备到PE设备的路由区分,然后通过MP-BGP,将VPNv4路由从本地PE传递到远端PE。但远端PE也有不同的VPN实例,那么我如何将从远端PE学习到的VPNv4路由,正确导入到对应的VPN实例里面呢?是导入到上面的VPN实例,还是下面的VPN实例?为了解决这个问题,我们又引出来一个RT值。这个RT值主要用于什么呢?主要用于将路由正确引入到不同的VPN实例中。就是在MP-BGP传递VPNv4路由的时候,远端PE需要将收到的VPNv4路由,正确导出到对应的VPN实例,所以我们需要使用一个叫VPN标签(也简称路由标签,即RT值),来控制路由信息的发布和接收。也就是说,在本地PE发布路由的时候,给这个路由携带一个RT值,这个RT值需要和远端PE上对应的VPN实例所配置的RT值一致,这样远端PE才能将这个路由正确接收,并导入到对应的VPN实例中。
【干货分享】畅游超融合-实施篇
前言感谢大家抽出时间参加我的这次公开课,我是蓝色空间,本职工作是售后工程师。平时对于超融合的实施还是比较多的,所以这次公开课我就重点讲一下我们超融合实施的过程,分享一些个人的经验。我之前曾经分享过个人的经历,就是在20年的工作经历中,对于工程师这个行业的一些观点和看法。这一次讲的超融合实施过程,就会把我之前的几十年的经验,融合到我们的实施过程中。大家来看一下,我们在正常实施超融合的过程中,不仅是需要设备搭起来,把环境建起来,而且还要把它用好。从规划、实施、运维、使用、售后保障、故障处理等等全流程,为客户提供一个更流程好用的系统,来增强客户的满意度。好,接下来我们就看一下PPT。具体讲一下我们整体的流程。首先,本次针对华为超融合为例进行讲解。因为我本人做华为的产品比较多,所以实施场景里面就以华为的产品为主来作为例子。首先呢华为的超融合产品,如果我们去官网看,可以发现它从具体型号上分,可以分成Fusioncube 1000H、Fusioncube 1000D、Fusioncube 1000C还有Fusioncube 500系列。那么这几个系列是什么含义呢?Fusioncube 1000H是我们经典的传统的超融合系统,也就是从虚拟化演进而来的,它相当于结合了传统的虚拟化及分布式存储,同时去掉了传统的磁盘阵列,就做到了我们现有的这种集成度更高的超融合的系统环境,这也是最经典的一个系统。各个友商几乎也都是按这个思路来做超融合产品的。那么Fusioncube 1000D就是数据库的适配型号,它可以适配一些传统的经典的数据库,并且以超融合的架构来对外提供服务。企业分支场景:Fusioncube 1000C呢是更多的是整柜交付,就是将一个机柜变成一个小型的分支机构的小型数据中心,直接交付给客户,开箱即用。Fusioncube 500系列,它就更多的面向规模更小一些的企业,它的作用是让用户使用起来更加的方便。所有的这4个系列里面,1000H系列是最经典的型号,所以我们也以它为例,来进行后续的讲解。接下来是我们在华为的support网站上,咱们看到的产品有很多,刚才的具体分类已经讲过了,那么就以1000H为例。而具体实施场景方面,它又分数据库场景和FusionCompute场景,也就是虚拟化场景。这里主要以虚拟化为例,也就是说以华为的FusionCompute为虚拟化组件的情况下,讲一下超融合的整个实施过程,并且要把我们日常的维护的经验、实施的经验全部都融合进去。接下来就看一下实施过程。首先,由于我工作的时间比较长,那么在之前的公开课里也曾经讲到了,希望大家能够参与到整个全生命周期的规划中。我这里这个图就是按照整个的项目管理流程,从启动、规划、执行、监控、收尾这些流程。大家可以看到在这个流程里面,客户从预算新建这种规划开始,一直到具体软硬件配置规划和系统架构,再到具体执行招投标的硬件实施,然后到日常的维护维保,再到最后的老系统下线、新系统上线,逐步替代的全生命周期流程,如果我们参加过这种全生命周期流程的体系建设,在我们做超融合后续的规划和实施过程中,一旦把这些经验全都融合进去,具有丰富经验的工程师交付的项目就会和哪些只能新建,或者说只会交付给用户一个纯新建的版本来使用的工程师,感受是完全不一样的。因为一旦我们把我们的经验融合进去,就会为客户考虑更多,而且会进一步优化我们厂商提供的最佳实践。那么这个最佳实践实施下去,它可以有效的规避日常的常见问题,而且能大幅度的缩减用户的日常维护工作量,能够提升用户的使用效率,进而让用户聚焦于他自己的业务,就不至于为了这个系统本身的问题而去过多的操心。那么这样给用户带来的体验是完全不同的。接下来我们具体看一下讲解内容。首先我们先做一下超融合系统的简介,对于我们经常实施的工程师或者是经常使用的用户来讲,可能大家觉得我都很熟悉产品了,为什么还要做这个讲解?实际上对于超融合的深度理解,是有助于我们后续的规划、实施、及运维全流程的。首先最重要的就是逻辑架构,传统的虚拟化架构,它是以服务器、存储、交换机三大块为主,相当于说三个类型的设备,我们把它用各种线缆组装到一起,形成一套虚拟化的架构。那么超融合架构,是在这个基础上把独立的存储设备去掉了,以服务器为载体,利用硬盘做分布式存储,这样就以分布式存储作为共享存储,省略掉了传统的存储设备例如磁盘阵列,也省掉了这种集中存储固有的成本过高、线性扩容困难、以及它本身的机头的IO瓶颈等问题,把这些问题给过滤掉了。然后还有一些新的超融合的型号,甚至把交换机也去掉了。等于说直接在机箱内部就集成了交换功能,对于一些小型的企业就比较好用,因为它又少了一个需要经常维护的故障点。但是企业级应用的需求更加广泛,那么我们经典的型号还是以这种分布式存储叠加服务器和物理交换机这种形式来进行后续的实施。接下来就是介绍一下它的部署形态。我们可以看到它的部署形态,就是它的节点类型,典型的是这三种:MCNA也就是带管理虚拟机的节点,上面有一些管理节点和管理的进程,他主要负责进行整个系统的管理。 SCNA节点是存储节点,它本身是分布式存储的一部分,它的故障率就决定了我们分布式存储的可靠性和冗余度。 CNA节点是纯计算节点,纯计算节点主要提供计算能力,运行虚拟机,它的存储方面就不受超融合的分布式存储故障冗余度的限制了,在它上面一般不配分布式存储使用的硬盘。我们首先重点来看,在每一个节点上面,它的操作系统都是放在一个RAID1的逻辑硬盘上的。用RAID1做硬盘组,好处就是两个硬盘互为镜像,避免单盘故障造成系统损坏。这种情况下,就能让我们的系统可靠性进一步提升。因为在这种具备融合存储节点的情况下,存储节点它的故障率,对于分布式存储的可靠性是有很大影响的。所以我们不能把它当做传统的虚拟化来处理。传统虚拟化哪怕只有一台服务器,也可以启动一部分虚拟机,但是超融合它有分布式存储组件,因此它是有一个冗余度的,超出冗余度就会造成存储集群故障,导致数据无法访问。所以说一定要注意,在日常运维过程中,我们要时刻关注它的融合节点的健康度,一旦有问题要及时处理。那么在FusionCube 8.1.2版本以后,华为的超融合已经支持两节点的集群。有些友商的超融合环境默认的必须是三节点,两节点集群能够实现还是比较困难的。不过日常使用其实还是建议三节点以上,两节点这种环境呢一般不太建议日常长期使用,因为数据一旦故障还是有一些风险,需要采用更合理的方案来提升可靠性。接下来继续讲超融合的部署形态。我们可以看到,MCNA节点的这一块也是我们很多用户经常会忽略到的一点,就是两个MCNA节点上分别各有两个虚拟机。这两个虚拟机当中,两台VRM虚拟机是负责我们虚拟化管理、提供虚拟化管理界面的虚拟机;两个FCV虚拟机是Fusioncube的管理界面,同时也提供分布式存储的管理界面。所以这些虚拟机它的磁盘文件全是存在物理机上的存储空间中,并不是放在共享存储上。这样可以避免共享存储出现问题时导致管理虚拟机死机,对虚拟机的管理界面造成影响。同时它们这两个虚拟机是互为冗余的。一旦某个管理虚拟机出现问题,应该及时修复,避免两个节点同时故障造成我们没有界面可以管理。当然两个节点同时故障了,我们的虚拟机也是可以通过其他机制自动进行切换和HA的,这一点不必担心。但是还有一点,就是 FCV虚拟机,尤其在早期版本里面,它的FCV虚拟机是没有限制关机、重启和迁移等操作的。那么在这种情况下,如果人工关闭虚拟机,它是不会随主机自动启动的。有些人在关闭整个系统,执行下电流程的过程中,把FCV虚拟机人工关机了,关机之后,由于它默认的机制不会自动随着物理机重启,就造成了在重启硬件的时候,物理节点启动了, FCV虚拟机没启动,就容易造成 FCV虚拟机无法提供Fusioncube的管理界面,造成管理上的困难,这方面一定要注意。接下来具体讲一下超融合整体的从规划到实施的全流程。在我们超融合规划的过程,厂商提供了LLDesigner这个工具,它可以做整体的网段IP规划,还可以导入导出实施所需的LLD文件,还可以提供对应的拓扑图,这个是我们很好用的工具。首先我们看它的演示界面,这些IP是它自动生成的,就是我利用他的工具默认自动生成了一版。这些IP地址都是直接配好的,我们也可以进行手工的修改。它和我们最终的产品初始化配置界面是非常类似的。所以,在这如果我们提前规划好了,后续就可以把它导出成为LLD文件,最终直接导入到我们的初始化界面上去,直接进行初始化,就不必反复的手工输入相关信息了,以免输入出错。接下来我们再看它的第二个界面。这个界面是我们根据它的规划自动生成的网络拓扑图,展示了所有设备之间的连接。而且我们看右面,当我们选定设备的时候也可以直接去调整它的网络规划,它的节点后部板卡的位置规划,以及它的连线规划,这些东西做好之后,它可以全自动的输出所有的相关规划和拓扑图,还有网络连线图等等。这些工具在我们给客户交付相关文档的过程中会提供很大的帮助。接下来就是实施过程中很重要的一步,就是上架位置的规划。上架位置的规划在多时候容易受限于客户的现场空间环境限制,我们难以去自己从头到尾的规划,我这边实施的情况下,一般优先推荐客户直接采用一套完整的机柜,进行超融合系统的实施。为什么这么做?因为这套环境往往上架之后,是逐渐替换原有物理机的,一旦上线之后,它就有可能逐渐扩容,将所有的物理机逐渐迁移到虚拟化里面,未来很容易就变成整套IT架构的核心组件。而这种情况下,他的规划一定要合理,方便未来的运维,方便日常的检修。那么这里面我给出两个例子,以三节点的ARM架构的taishan 2280节点为例,系统版本是Fusioncube 8.2.1然后交换机有两种情况,最常见的是右边的两光交的配置,两个6857同时作为业务管理和存储交换机,做双冗余连接或者是堆叠连接, BMC交换机采用一台S5731,有些情况下可能会采用两台5731的纯电口交换机作为BMC交换机,另外再采用两个万兆的防火墙,这个防火墙一般选万兆的,那么它主要的作用就是过滤东西和南北的出入整个超融合环境的所有流量,因为一般超融合里面就相当于一个小型的数据中心,它的出入一定要有防火墙的才能更好的实现我们的安全策略,实现隔离的作用。左侧的这个是一个理想架构,就是存储和业务交换机分开,这种架构在节点数量从几个一直扩容到几十个这种情况下,它是更有效的,而且能接更多的设备。所以根据不同的规模,我们可以来决定接下来上架的总体思路,这些思路就体现了我们日常在实施过程中,我们到底应该以什么样的路径来做,才能更好的满足客户的需求,能更好的去满足日常运维的要求。首先上架的总体思路就是上轻下重,避免头重脚轻,否则机柜很容易倒掉。超融合节点,一般建议是从下至上进行上架,这种情况下,从下至上,后续扩容就可以向上不断的扩容,如果从上至下呢就很难做到下重上轻,机柜固定不牢固就容易不稳定。然后在这种下重上轻的情况下,网络设备之间,如果现场是上走线,很自然的就可以按照这个图,将我们与物理节点连接最常用的设备都放在下面,也就是连线最短的放在下面,连线最长的或者对外连接的放在上面,哪怕我们下走线也可以采用这种方式。因为我们的防火墙一般来说放在上面它动的比较少,而业务/管理交换机,还有BMC交换机是我们日常运维经常用到的,它的位置最好是在眼睛到胸口之间,方便我们日常处理。防火墙处理的比较少,就放在这上面。然后设备间隔至少1U,方便日常的维护。电源线的连接,建议插口位置和设备上架位置就一一对应,同时做双冗余链接。为什么这么强调?有些用户会说我的机柜供电本身就只有一路电,我没必要做那么细致,怎么连接电源线都一样。其实这里的规划都不是多余的。实际上从运维角度来讲,只有一路市电对于超融合的运维其实是不够的。为了提升冗余度,一般是希望两路电,很多用户都是最终从一路电改到两路电。那么我们实施过程中就按照这个规划提前做好,日后改造的时候就只需要让用户改一根PDU的总电源线就可以了。我们的原有的这个电源连线,因为都是双冗余,电源连线完全不用动。另外就是如果我们的PDU是竖向的话,那么竖向的电源线的连接位置就可以和设备位置一一对应,同时也要打好电源线标签。在这种情况下,即使标签损坏了,我们的连线位置一一对应,也方便日常的维护。如果是左右的那种横向的PDU也可以做好规划,比如说从左到右对应从上至下,或者从右到左对应都可以。那有这种对应关系了,就可以做到交叉的确认。就是我的连线位置定了之后,哪怕标签损坏,哪怕我的这个设备两个口插错了,利用标签或者连线表也能把这个位置扭转回来。日常运维过程中一旦发现有差错了,尽量把他们都改回正确的状态,时刻保持所有的双冗余连接维持在正常状态,时刻保证所有的线缆都是正确的,这个是很重要的一点。足够的冗余度才能带来更高的可靠性。在我的规划中,我一般建议是双向交叉验证,比如说我的连线都是有规律的,是有连线表的,这是第一重。第二重就是我的标签。线缆标签是同时打上两边的端口信息的,那么在任何一面都可以看到本端和对端的信息。比如说设备端也能看到本端和对端连到交换机的哪个口,那么交换机端也是一样的,就是每一端都是两端的连线情况,在标签上同时全都打好。而在这种情况下,任何一边的线连错了,都可以通过对端线的这个标签还原,同时还有连线表做交叉验证,所有的东西只有具有交叉验证,才能保障日常不错或者出错能改,否则的话一旦出错,只有一种方式来确认,那就很难去做修正。那就会对未来的运维造成一些不利的影响。这种影响甚至会造成我们的冗余度失效,甚至是我们本来以为能正常插拔的线缆,结果拔错了,变成一个节点故障,又拔错一个节点又变两个节点故障,这个影响就会逐渐的扩大,那这个问题就会越来越大,客户满意度就可想而知了。然后线缆标签,设备标签,所有的标签,尽量与规划里边系统里面看到的名字全部都是一致的。这样的话呢我们看到标签就知道是哪个设备,看到设备在系统里的名称,也就可以按照标签找到设备的位置,就比较方便一些。避免我们上架之后找这个设备,必须得看它在哪个机架多少U然后一个个拿表去对,这样就太麻烦了。接下来是拓扑图,这里面所有的规划目前没有用LLD做规划。这个是取自于我最近实施的一些真实项目,客户要求的一些拓扑图,画的可能更复杂一些。那么首先我们看到这个拓扑图里面,两个交换机是做堆叠的,之后和防火墙之间如果是简化连接,其实交换机对应一个防火墙,各出一根线也是可以的。上面也是一样的。但是呢我们这个项目讨论了一下这个所有的冗余度的问题,如果是一边一根线这么连接的话,会造成一个什么问题?是单点故障,它会扩大。比如防火墙一旦故障了,就会造成这一条线上所有的设备同时故障。如果全部是双冗余连接,则连线的数量加倍,但是任何一个点故障都不会扩大。例如我们的这个一边链路全段的情况,尤其是如果我一号防火墙和二号核心单线连接,就处理不了这种情况。多连几条线,增加冗余度,增加可靠性。那么增加的可靠性,它带来的收益远远大于这几根线的成本。所以建议大家连线的时候尽量按照高可靠性的方式来进行连接,来进行规划。因为我们在实施过程中,如果只是要把系统搭起来,怎么做都可以。在不管冗余度的情况,可以用很多种方法来实现。但是如果我们考虑到用户使用过程中的可靠性的要求,那就一定要把冗余度做高一些。这就是我说的,如何在厂商推荐的最佳实践的情况下,进一步优化,给客户一个更好的体验,总结出我们自己的最佳实践。下一步就是设备类型,这个设备类型更多是给用户看的,告诉用户我们哪一个设备的型号有几台,它的作用是什么?同时也给我们自己看,也是为了让我们能清晰的确认某一些节点具体是做什么的,哪一些流量走哪些交换机。在我们实施过程中了解到我们的哪些流量走哪些网段,走哪些设备,它的具体流向如何,对我们日后的运维是有很大帮助的。但是在这里设备的具体型号就是只是一个举例,这个是编造的了,公开出来的信息和实际客户的实际实施参数是没有关系的。因为我们这个讲的是公开课,所以也要遵循一个信息安全的原则,是不会暴露客户具体的相关信息的。后续有些实施截图会利用一些现场实施过程中的截图,但是具体的客户信息已经全部隐藏了。接下来是IP和未来的规划,一般我们做的时候建议客户会独立给我们3-4个独立的VLAN,对应3-4个至少是 C类的独立IP地址段,而具体的节点的IP地址由我们自行分配。为什么要这么做?我们在很多现场实施过程中,客户有可能说我只有一个网段给你,这种客户往往是不了解虚拟化或者超融合它的四大网络平面这种规划的,那一般都需要我们跟客户去反复沟通,解释好各个网络平面的用途,让用户配合我们。那如果配合不了的情况下,或者说这个难以处理的情况,就是没有那么多网段可用怎么办?那么我们在这个最佳实践里面, BMC和管理平面它们可以合并到一起,业务平面是最重要的,存储平面可以用一个C类的私有的地址段就可以了。那么也就是说客户最少提供两个网段就可以。也有极端情况下,客户说我只有一个网段行不行?这个我是强烈不建议大家做的。因为在某些客户现场我们做过这种一个平面的情况,这么做完了之后没有任何安全性,你的业务平面也就是任何业务虚拟机的IP和其他平面都在一起。防火墙如果不做专门设置,基本不会拦截同一个网段内的流量。那在这种情况下,你的虚拟机一旦中毒,它会迅速攻击到你的管理和BMC平面,甚至可能有人远程通过黑客攻击进来直接关机,造成的损失就太大了。那么首先我们要看好,给客户解释好每一个平面是干什么的,也要理解每一个平面的用途。服务器的重启,硬件的故障的排除,走BMC平面。虚拟化的管理,尤其是热迁移的流量,都走管理平面。业务平面就是我们虚拟机的IP地址所用的网络平面。存储平面就是分布式存储内部通讯流量,及分布式存储对外服务的网络平面。对这种信息的了解是非常重要的,因为对它的了解越深刻,后续我们在实施过程中才能有条不紊的把后续规划做好。接下来我们继续看分配交换机IP的时候,我一般用到BMC网段的IP地址,当然这个现场实施中可以有各种各样的规划,但是一般推荐所有设备硬件管理都走BMC网段,所有的设备呢也都配上BMC网段的管理IP,方便我们必要的时候,在这个超融合的网段里面,可以直接远程到我们的交换机上去调整网络。因为环境建立好了以后,很难说未来会不会进行网络的变更,一旦要进行网络的变更,没有一个好用的手段就会比较麻烦。当然这个要跟客户现场的管理的规范进行匹配。有些客户的管理是非常严格的,是不允许任何远程的。他们有独立的管理规范,这个就没有办法了。但是如果客户是传统的企业,他对这种管理要求没有那么严格的情况下,建议给所有的设备还是配好远程管理,防火墙也都是配好的。接下来就是重点也就是我们规划的IP地址段,这里面呢给出大家一个我的经验,我只是推荐这么做,它这个并不是说强制的或者是必须这么做的。首先呢在给节点做编号的时候,每一个IP都对应好唯一的设备。因为我们有些客户的网关IP地址的尾号习惯从1开始编号,那么我的节点编号就不能从1开始进行规划了。如果从1规划,客户又正好是网关是从1开始就会比较麻烦。所以我一般是从11开始,那么1号节点,也就是MCNA01就是11,2号节点,也就是MCNA02,IP地址就是12,3号节点也就是SCNA01,IP地址就是13。在这种情况下,不同的BMC网段、管理网段和存储网段只是我们的前面的前缀不同,后面的IP尾号都是一样的,也就是11永远对应着1号节点,12永远对应2号节点。在这种情况下,你只需要看到 IP尾号就知道是哪个节点,你知道哪个节点就知道它的IP尾号是多少。然后如果你知道它的哪一个管理平面,它的网段是多少,就可以直接知道这几个节点对应网段的IP。那么如果我们的规划做得比较顺畅,在运维过程中也会非常顺畅。这也是我所说的交叉验证,也就是我的节点名称和IP尾号都有对应关系,跟网段也都有对应关系。在这种情况下,客户运维不一定非要去查IP地址表,如果客户做什么都必须拿一个地址表查来查去,也是非常麻烦的。然后这个浮动IP,VRM举个例,IP尾号用8,9,10,那么FCV我就用5,6,7,如果形成习惯之后,那基本上实施的项目,如果客户没有特殊要求,我们就按这个习惯来,那我的 FCV浮动IP就默认是5。 VRM就是8。那我记住了之后,我到这个客户现场做运维时,就可以迅速的通过这些常用IP地址,直接连到对应的管理界面上去,甚至都不用去查那个具体的IP地址了。另外我们这些节点的名称在初始化的时候,根据我实施的经验,它是按照这个产品的序列号,也就是每一个节点的序列号,从小到大,那么来编号的。当然这个大家实施过程中可以具体自己看情况,但是它的预装和现场安装过程中,编号规则可能有不一样的情况。预装版的这个名称是命名好的。但如果我们是自己安装的话,一般建议按照序列号的顺序,如果我们做好了序列号的顺序的规划,后续的命名它就会自动给出,而且给出的命名基本就是符合我们规划的。所以完整的顺利的规划,对于我们的实施会极大的提升效率,对于客户的运维大幅度的降低运维复杂度。接下来就是连线表,连接表首先是确认端口和线缆的标签,我的原则都是一一对应的。SL1-1就表示slot1槽位的1号端口。我们在节点的后面板就可以看到它是属于哪一个槽位的。因为这个槽位都标在这个机箱外面了,1号端口和2号端口也是在网卡挡板上标注好的。所以这边的端口信息就直接使用这个可以看到的端口编号。在这种情况下,我们去做连线表,同时把这个连线表的信息做成线缆标签,那就能实现我们这个外部的标签和内部的规划都是一致的,而且这种一致性还可以通过我们的数据来交叉验证。如果我们做到这一点,任何一个标签出错,我们可以迅速发现。如果是线缆连错标签没错的情况下,我们仍然很快就可以发现,可以迅速的把它更正,否则就会对超融合的使用及运维造成很大的影响。因为我们的超融合的架构是一个很精密的体系,它虽然有一定冗余度,但是如果我们连线不准确,或者我们规划不合理,那就会造成一些问题。比如说我们现在看6855交换机,假如我有1号和2号两个交换机,在这个例子里是只有两台光纤交换机,存储/管理/业务全都共享这两台交换机。那么在这种情况下,有一种场景,如果我们连线规划没做好,比如说连线,前面所有的管理/业务口是交叉绑定了1号口,SLOT1槽位的1号口对应SLOT2槽位的2号口。他们两个端口绑定。下面SLOT2槽位的1号口对应SLOT1槽位的2口。那么有些人会问,为什么这个下边是先有SLOT2槽位,再有SLOT1槽位,难道不能是将它俩对调,这样是不是看都顺畅点?都是先SLOT1槽位后SLOT2槽位,这么做会造成什么问题吗?大家仔细看,这会把SLOT1槽位的所有的口全部接到6855的01交换机,如果是另一个槽位,则是所有的SLOT2槽位都接到6855的02交换机上,就会造成问题扩大。也就是说任何一个交换机坏了,就相当于一个网卡独立坏掉,那么任何一个网卡独立坏掉了,也相当于一个交换机全部坏掉了。这种交叉连接,无论是一个网卡坏,还是一个交换机坏,都不会造成问题扩大,都始终有一半链路是可以正常工作的,也避免了两个卡之间的这种流量频繁的切换,这个大家有时间可以详细的去考虑一下。一旦了解清楚这种原则,在日后的实施过程中,就会给我们带来很大的帮助。另一个常见问题是,不同型号的交换机,网口编号顺序可能不一样,比如光交换机,通常下边是1口,上边是2口,而有些型号上边1口下边2口。那么电口交换机可能是相反的,我见过有些工程师习惯了,所有的交换机端口都是认为上边是1口,下边是2口,他的标签全是这么打的,但是跟现场的这个物理端口号就完全对不上。这里看交换机侧的端口如果是10G 1/0/1,这其实就是在系统里面,在管理界面里面看到的交换机的端口编号,它跟外界的网口编号一定是要一一对应的,这种交叉对应才能让我们日后运维的过程中不出错。如果我们用了一个很简单的方式去连接,不管未来怎么样,只看眼前工作简单,那我们可以想象在我们运维过程中会不会连错线?会不会找错端口?一旦找错端口甚至找错了设备,这个问题就扩大了。那接下来往下看,首先呢我们实施过程中,到这里就是我们具体的实施步骤。第一件事就是要确认所有的固件版本。固件版本是很重要的,我这边举的例子是用的预装版,也就是原厂定制的,发到现场的都是已经装好系统,而且固件是匹配好的。所以这个一般没有什么问题。但是不保证所有到现场的节点全是这种情况,即使是预装好的,也有些固件可能版本不匹配需要升级,那么固件版本一定要确认好,提前把固件升级好,否则安装到后面就有可能留下一些隐患。固件通常不影响安装,但也造成了很多人可能会跳过这一个升级过程。为了给客户带来一个更可靠的体验,我推荐还是尽量去把这种固件进行升级。接下来是配置IP地址,这个就根据之前的规划去配置就可以了。但是有些情况下,子网掩码和网关如果设置错误了,就会造成网络不通,在进行初始化的时候就没法正常初始化,所以一定要注意,即使是简单的IP配置也不能出错。接下来是检查RAID的配置。首先这种RAID1就是我们装操作系统的RAID组。这个RAID组同时它必须是启动设备。如果它不是启动设备,装完了系统也不能启动,初始化也会出问题。接下来是确认fc2mgmt这个用户。在我当前实施的Fusioncube 8.2.1之前的这些版本里,主要的版本里面,第一次用这个用户登录的时候,在当前的这个 BMC固件版本下,它都会提示你是不是要修改密码,如果在这里不做任何选择,而且也没登录过,有些时候就因为没有选择,部署过程中和Fusioncube Builder这个账号对接的情况下,后台脚本执行到这里,它也会提示你要不要修改,那就可能会卡在这个流程,没法正常初始化。所以这是我为什么加这个注意事项。然后时区也要提前配好。时区也是一个很容易被忽略的点,因为不做配置也能很顺利的实施过去。但是实施完了以后,这个时区的错误,会给未来带来更大的一些不可控的影响。比如说一组集群里面有时间不一致,而且它相差超过8小时以上,那这种情况下热迁移可能做不了,很多日常操作都做不了,告警信息也不能及时消除,因为要等待系统时间到了预定时间才能消除。然后还会影响业务系统,一旦你的业务系统同步的主机时间,而时区又不对,那带来的影响就更大了。为了业务的可靠,时区一定要提前设置。然后就是初始化步骤,首先要更改这个默认的IP地址,一定要确认超融合默认的IP地址是多少。如何能顺利访问这个IP地址呢?这个对于我们的这种网络配置是有要求的。如果我们有网络工程师,可以让网络工程师帮我们做好网络设置,最好是做到把我们的这个管理口和我们的这个 PC机全都连到一个VLAN里,这个VLAN直接按照我们的目标VLAN进行规划是最简洁的。因为这样就可以直接在VLAN中修改IP地址,改完了之后,可以直接把IP地址改成我们的最终目标地址,就能继续连接,就不必修改交换机配置了。还有一种情况就是如果不这么配置的,可能需要额外配其他网段,让各网段联通,然后再去改交换机的配置,这样也可以,但是会更加复杂一些。所以这里的配置如果有网络工程师,就需要向网络工程师求助,如果没有的话,我们自己超融合工程师也要了解一下这块的网络是怎么设置才可以把它顺利的改过来,否则可能会遇到一些问题。那么时区改好了,接下来IP也改好了, IP改好之后,接下来就是修改一下初始化的密码。在这个界面上点初始化,修改密码之后,我们会重新再登录一次,再选初始化,就真正的进到了初始化界面。这个初始化的公共密码就是这个fc2mgmt这个账号的密码。那么我们在数字证书验证的时候,如果我的版本是预装版本,一般建议是在这先取消证书验证。因为它的这个证书验证过程在往下做的时候是短期内是不可用的,必须初始化以后再重新开启验证证书,再上传证书才可以。如果是我们现场手工安装的话,在这就可以直接上传证书进行验证。这一步就可以提前上传证书,使用证书进行验证。这可以更好的提升系统的安全性和可靠性。以便能满足用户的需求,主要也是因为我们面对的很多客户是国企,对于安全度的要求是非常高的。定期要做网络攻防,如果发现严重的漏洞,如果我们的系统安全度不够的话,很容易让人扫出来各种的漏洞,这样会给客户带来很多不必要的麻烦。而且日常使用情况下,不用数字证书这种场景下网络安全的可靠性也不高,在现在这种环境下还是建议尽量提升可靠性。接下来就是配置网络,这儿的网络平面配置就跟我们在 LLD里配置的是一样的,都是提前规划好VLAN、IP网段和所有的节点IP,在这只要输入就可以了,或者直接导入我们的配置文件。这里还有一个很重要的节点,就是我们的物理网口绑定情况,也就是我刚才说到的网口建议要跨网卡绑定,这样能避免单网卡故障造成整个网络平面故障。另一个重要的问题就是在这种情况下怎么正确的确定网口编号?大家看,我这里编号是eth6和eth7,这是我这个例子里的情况。那么我在规划里都是SLOT1-1及SLOT2-2这种编号,怎么样来确认端口对应关系呢?第一个方法一般是通过他的MAC地址,结合BMC里边的这个网口位置,交叉来验证,验证了之后,在这个界面再做绑定。如果是验证错了绑定出错,那在我们初始化过程中,网络平面就不对了,也会造成各种错误。接下来就是我们每一个节点,具体的管理IP地址, BMC IP还有存储IP地址,这也是为什么我建议在初始化的过程中,在做IP地址规划的过程中,就根据节点名称,把每个节点的IP地址的尾号和网段全都固定好。大家看在这个界面上,我们默认的IP目前唯一能定的就是BMC IP,都会在这里默认显示出来。在这种情况下,节点的管理IP地址和存储IP地址,只要知道网段,我就可以根据BMC IP的尾号,直接把每一个IP填上,根本就不需要再去查表。反复的查表再去执行是非常容易出错的。但是一旦我们有这种交叉验证的思路,提前做好规划,它就不容易出错。在整体实施的过程中也会非常顺利。接下来就是分布式存储的配置和规划,都要和具体的规划保持一致。因为分布式存储有很重要的一点,储存缓存比,如果我们的节点做了改配的话,缓存比要确认,那么主存的数量也要确认,因为这与我们建存储池都是有相关联系的。这一点在产品文章里有详细说明。建议大家要增加对理论方面的理解深度,理解深入到了一定程度之后,你就会明白系统为什么这么配,也就能更好的去确认我们对应的配置数据到底有没有问题,一旦遇到问题就能及时处理。最后是数据分片,我们的数据分片规划,如果是三个节点的,那一般不用说,默认选择就可以了,它也没有别的参数可选。但是如果现场是6个节点以上,甚至十几个节点,我们这个分片就是有选择的。根据它的公式和算法,来选择数据分片,就类似于RAID组,这个参数就决定了系统最多允许坏几个节点。我们在现场实施中一般和用户沟通之后,我们选择合适的分片数据,例如让系统能从最多坏一个节点,增加到了最多允许坏两个节点,也就是说舍弃了一部分它的存储容量来换更高的冗余度和可靠性。反过来讲,如果客户的预算很紧张,也可以舍弃一定的冗余度来换更高的存储容量。但是这种情况下一定要明确的告知用户,你的分布式存储最多允许坏几个节点,坏几个硬盘,让用户能明确的知道在什么情况下应该及时介入进行处理。否则即使超融合有一定的冗余度,它在几年都没人处理的情况下,累积的错误就可以耗尽所有冗余度,最后使用过程中就会出现各种问题,给客户带来的体验也是相当不好的。如果想让客户体验比较好,还是希望大家能深刻的理解每一个配置,把后面的算法和具体原理掌握了。在我们配置好所有参数以后,我们现在用的主存盘是HDD盘,不需要配重删压缩。最后系统会进行校验,校验如果出错的话,我们可以回过头去再对相关的问题做对应的处理。处理之后就会自动的进行构建,自动进行初始化。一般根据我们的经验也是1~2个小时左右也就差不多了。 那么接下来是修改密码的步骤,它可以把原有的公共密码直接改成新的,那么在这里一般来说为了方便都是用同一个密码,因为如果这么多密码都不一致的话,在我们不了解这些账号具体用途,还有随意修改密码的风险的情况下,日常的运维就非常难处理,随便改对接密码容易出问题。后续我们的这种故障处理都离不开这些账号。这里有一个重点的注意事项,就是说不同账号对于密码长度和复杂度的要求是多少。我在早期的项目里曾经尝试过,比如说我规划的是8位密码,但是有些密码要求必须10位以上的,所以那些要求10位以上的密码都是不成功的,那就造成了有一半密码允许8位是修改成功的,另一半是修改不成功的,我又得重新改一遍密码,那就造成有两个公共密码,具体哪一个账号是哪一个?如果没有人为全部都介入的话,那就非常难处理。在日后运维的时候就需要到处去试验这个公共密码。所以还是建议大家一次性的把这个密码提前规划足够的复杂度,一次性设置成功,这样比较好。构建了系统以后,最后就进入了Fusioncube的主界面。大家可以看到我这个初始化界面的截图,当前告警有20多个,为什么呢?这个是因为系统刚刚进入主界面的截图,再等待一会以后这20个告警,包含的几个物理节点,它的这些告警就会逐渐的消掉。因为它各个网络就逐渐开始对接上了,消掉之后,就只剩几个日常常见的告警,比如说未加载Licnese,还有NTP服务器的配置,我们配置好了以后就可以把这些告警消掉了。接下来就应该继续上载license,然后完成后续设置。那这些步骤按照我们产品文档的步骤实施就可以了。跟我们规划跟我们实施相关的重点基本上是这些。接下来我们交付给用户之后,那就涉及到日常使用。根据我的经验,日常使用时的运维一般有三个层次,用户级别,更多的可以关注虚拟机的日常使用,硬件的巡检,有问题得及时通知工程师吧?告警的监控,常见故障,能处理的用户运维人员要处理一下。接下来就是我们这种实施工程师,我们往往作为售后服务工程师,也有时是集成商的角色,有时候是服务商的角色。那在这种情况下要处理的工作包含系统变更,系统层面的一些故障处理,比如说虚拟机有问题了,卡死了,应该怎么处理?深度的运维,比如说有些磁盘故障了,或者说新增硬盘,或者扩容硬盘,这些都要调整。还包括一些高危操作的处理和定期巡检的服务等。厂商级别主要就是做软硬件故障的处理,故障部件更换,还有一些版本升级或者一些bug的处理。如果是我们按照这三个层次来做,那么用户级别要做的其实主要是围绕虚拟机和日常硬件这两大点。那么他做的工作就不需要特别多,压力也不会特别大,每一个级别做好自己级别的事情,通过体系化的服务去保障用户的系统,维持在一个常态化、高冗余度的这种状态,就能让用户的系统使用比较稳定,而且基本不用担心系统经常出故障。因为各个层次只要能做好自己的本职工作,几乎就能把80%的常见问题消灭在我们这个层级,甚至都不用去动用厂商,400也可以很少呼叫了。剩下20%比较难的才需要去动用厂商的资源。也就是说我们作为服务商,作为实施工程师,我们的作用其实还是很大的。如果把所有东西都扔给咱们厂商的400,那最后的结果就是400电话一天都不断,天天在处理一些很低级的故障。但等到高级故障来了以后又没人接电话,那整体的这种客户的满意度,那肯定高不了。日常操作一般这也是我给客户交付做培训的时候会列出来的。这是直接利用厂商官方PPT上给出的相关信息,就是日常检查项目,我们一般都会要求客户把这个日常检查要做好,各个资源天天看一下是否充足,然后各个指示灯,按照每天、每周、每月的频率,一定要做好记录,有问题及时反馈,我们来协助用户处理。然后温湿度、空气质量,这些大家看可能是一些老生常谈,但实际上我们就在很多生产企业,看到机房里面全都是灰,或者冬天下雨下雪,都飘到屋里来了,整个机柜都落的一层灰。所以说日常的一些常规情况的监控都是很重要的,都是要提前告诉客户。那么管理系统账号,根据我们的实施经验,一般建议给用户主要的两个界面, 一个是FCV界面,还有这个 FusionCompute的Web界面的管理账号密码,以及交换机远程管理的账号和密码,其余的后台对接账号,还有公共密码,这些日常不需要改的,千万不要随便给用户让他自己改。因为已经发现过很多用户在自己不熟悉的情况下,把后台账号当成前台账号一样,反复修改,频繁修改之后,最后的结果是密码忘记了,我们想再去找前台密码,后台密码都没有了,这就非常麻烦。接下来就是高危操作,日常我们认为一些下电,还有上电,甚至比如说更改时间、更改时区,其实都是高危操作,这一点都一定要跟用户做好交代,千万不要让最终用户随便处理。我们作为工程师自己应该了解这些高危操作,应该怎么做才能减少风险,避免日常出现问题,这样才能维护系统的稳定性。好,讲到这里,基本上全套的实施流程,基本上就讲了一遍了。所有的应该注意的重点也基本上覆盖到了。那接下来就是答疑时间。问1:超融合逻辑架构,应对高并发场景时表现怎么样?答1:这种高并发场景还是主要看我们具体的使用环境,这个不能一概而论。首先就是我们是利用CPU、内存还是硬盘?如果是CPU和内存的话,那就参照传统虚拟化的这种测试方法,如果是硬盘的话,如果有高并发,必要的时候还是可以上全闪存场景的。这个在我们现场实施过程中,都是实施过的。全闪场景,它的磁盘IO确实好一些,但是具体也是看使用过程中的具体场景怎么样。一般涉及到2点,第1点就是我们的一些测试数据,比如说CPU、内存和硬盘,我们都有一些性能测试的方法,利用这些方法测试后的的数据来说话,并发也可以测,实际并发的时候怎么样?因为他具体的并发要看具体的环境,还有你的应用类型,还是比较复杂的,甚至有些时候一些配置都会影响到并发测试数据,所以不止是硬件决定的,这种还是要综合考虑的。问2:华为超融合的虚拟化组件可以替换VMware吗?答2:这里我可以给大家一个答复。华为超融合它的虚拟化的这个组件有两个选择,第一就是华为自己的FusionCompute虚拟化,第二就是VMware,也就是说它是可以在虚拟化组件上用VMware的,但是具体的匹配一定要看好,它的版本配套表,还有产品文档。根据Fusioncube配套的版本来进行实施。问3:想了解三节点场景实际使用中一般多久可以上架,部署完可以使用?答3:这个实际上还是要看具体情,上架比较快的话,如果有三节点,一般实际过程中,由熟练的工程师来实施,全流程大概应该在5天左右,也就5个工作日左右,应该差不多。但是前提是所有条件都具备。如果你到现场线缆不全,接口不全,客户的这个网络调整还需要等待,等几天你才能上架,那就5天绝对完不了。5天的前提是我们所有东西都处理,这个前提包括什么呢?就是包含我们上架部署完成,再加上培训,以及路上消耗的时间,满打满算5天的话应该差不多。问4:下面又问一个能直接把分区迁移过来?这个呢不确定。答4:这个就是看你具体这个分区是指你做存储热迁移,还是说迁移的是整个的这个虚拟化环境?要是存储热迁移的话,迁移分区是没问题的,你要是说这个虚拟化环境,也就是不同虚拟化环境之间的应用迁移。这个就在后面说。问5:宣传里边是不是2-3天?答5:2-3天是指从上架到初始化完成。宣传中确实是这样的。当然我们现实在实施过程中还要等布线,绑线、理线、打标签,再加上培训,这额外至少又是两天的工作量。如果从到现场开始上架算起,到系统部署完成,不管其他的时间消耗,一般2-3天就差不多了(如果现场安装就要多一天,如果是预装系统就节约了一天)。问6:部署了超融合,想和老旧设备一起用,有哪些可以利旧和异构的设备?答6:超融合的分布式存储节点,也就是融合节点,它对于硬盘的要求是比较高的。那在这种情况下,还是没办法和你老设备直接做利旧的。但是它的虚拟化组件要求就没有那么高,你可以把老设备变成虚拟化组件,做成CNA节点,也就是说只做计算不做存储。在这种情况下还是没有问题的。它仍然可以利用分布式存储作为共享存储,然后利用你原有的设备作为这个计算节点,就可以利旧了。凡是说PPT看不清楚的,过后我们会有这个图文的回放,这个大家可以再看。问7:其他厂商的虚拟化分区怎么更好的迁移到华为超融合上?答7:这个不叫虚拟化分区,它应该叫其他厂商的虚拟机,怎么迁到华为超融合上?如果是虚拟机本身的话,这个华为是有迁移服务,还有迁移工具的,利用这些方式可以进行一部分迁移。能新建的情况下,建议应用还是完全新建比较好。迁移呢一般是说不适合新建或者新建特别困难的情况下,迫不得已的选择,因为它的成功率并不是100%,各种迁移工具基本都是这类情况。问8:他们要这么多IP是否容易管理?答8:这些IP并不是说我要的多,而是说它就需要这么多。无论是我们在什么情况下,他都需要这些比如说管理IP、BMC IP,存储IP等,每一个口都需要自己独立的IP地址,它才能完成超融合的这些自动化的管理,也就是说IP是必须的。那怎么分配呢?我直接要一个独立的IP段,自己进行分配,就可以实现我说的那些思路。这个规划比较顺畅,一眼就能交叉确认相关IP地址及节点对应关系。那么这种情况下就给未来的运维造成了一些加分项,也就是更可靠。但是它确实是会浪费一些IP。不过如果客户的IP段不是那么紧张的情况,这种浪费是可以接受的。因为我们得到的收益远远大于这几个IP的浪费。
【干货分享】智能极简遇见未来双力数据中心
一、分享主题由我给大家分享一下华为在数据中心的解决方案。分享的主题的是“智能极简遇见未来双力数据中心”。二、项目介绍云计算、大数据、物联网、人工智能等新一代信息技术快速发展,数据呈现爆炸式增长,IDC建设成为大势所趋。世界主要国家和企业纷纷开启数字化转型之路,全球数据中心IT投资呈现快速增长趋势。在未来几年,IDC产业将迎来其新一轮的发展机遇。此外,以资源外包的网络服务方式逐渐受到企业重视,并取得长足的发展。在控制不超总投资估算的前提下,建设成“三机房、两靶场、两中心”的智慧城市大数据和算力中心,具备智慧城市数据汇聚、智慧城市应用调度、提供云资源、算力资源、网络安全防护能力及人才培训服务等多项功能。以满足XX市智慧城市各项政务及民生应用云资源运营,助力产学研转化、大数据算力、存储资源的可持续性升级,推动XX市乃至XX地区数字化的高速发展。三、关键技术分析本期项目建设规模含一层机房及二层机房两部分。本项目机房建设对标《数据中心设计规范》GB50174-2017中B级机房要求。湖南省XXX市的政府大数据中心的建设要求,XX市政府整体建设一个智慧政府数据中心,其他单位以及市直部门不在单独进行数据中心建设。既要数据中心机房项目作为承载XXX市算力中心的基础设施,在数字化转型中扮演着关键角色。该机房将承载算力中心的网络核心和汇聚功能区,也提供数据中心和云计算中心的空间和基础环境保障,为未来计算扩容等需求提供基础环境。推动整个市以及整个湘北地区的一个数字化的高速发展。它建设满足“数据中心设计规范GB50174-2017”- B级机房的标准。项目建设符合近些年来国家以及湖南省政府对于建设高效节能的新型数据中心的相关政策要求,PUE值小于1.3。整体建设方案是采用新一代的节能技术建设冷热隔离的封闭冷通道。相比于传统机房地板下送风,封闭冷通道更符合现有国策。虽说本次机房采用B级标准建设,但实际上我们在供配电上采用A级机房的架构模式。就是其中任何一路市电的中断或者是ups的故障,都不会造成机房断电风险,提高了机房的供电可靠性。在已经建设完成的大楼内改造为数据中心,关于经济效益方面:有效促进国有资产保值增值;提高工作效率,减少行政经费支出;本次机柜建设五百多个机柜。我们预计运行使用15年,租金总收益大概是五个多亿。节能设计在供配电采用智能融合电力模块技术每年节约电费约为52万元;暖通空调采用氟泵风冷精密空调技术每年节约电费为55万元。按数据中心运行15年的计算,总计可以节约1605万元。关于社会效益方面:助力国资监管转型,促进监管方式和手段的创新;提高国有资产监督管理能力和水平;加快推进国有企业“数智化”转型;促进信息化建设税收贡献,建设所产生的投资费用,可为该市的创造更多的税收,拉动就业;促进湘北地区的云计算、大数据、区块链等方向高新技术的发展。目前XX市各区县政府的机房均未统筹建设,整体规模偏小,设施陈旧,无法满足数智政府建设需求。同时,XX市政务云目前租用运营商机房,容量使用率已经接近警戒值,但因受到场地及配电等客观因素的影响,导致政务云无法就地扩容。XX市缺少一个大型自用集中的数据中心机房(目前周边地市如长沙市、常德市、益阳市、株洲市、永州市等均有自建的大型数据中心机房),现有机房建设处于零散式分布状态,自建及租赁的形式居多,待建“X慧云”急需机房。本期数据中心机房项目作为承载XX市算力中心的基础设施,在数字化转型中扮演着关键角色。因此,数据中心机房建设意义重大,是“智慧XX、数字政府”建设的支撑,是XX市产学研转化和存储资源可持续性升级的需要,是XX算力中心建设的必备。a)  智能融合电力模块技术智能融合电力模块技术,通过高密高效的UPS和融合UPS输入输出配电技术,相比传统方案在占地上节省40%,效率上UPS双变换模式下提升1.1%,UPS智能在线模式下提升3.3%,通过预制集成技术降低交付周期75%,同时通过全链路可视的集中管理及AI智能运维特性,提升运维效率降低成本,提升运行安全可靠性。该智能融合技术贯彻《2030年前碳达峰行动方案》指导思想,助力数据中心绿色低碳转型行动、节能降碳增效行动、绿色低碳科技创新行动,持续降低全生命周期能耗和碳排放。无论从发展趋势,采购成本,还是实际的售后维护角度来看,智能融合电力模块技术各方面指标都优于传统的供配电方式。智能融合电力模块技术取代传统供电方式这一发展趋势也已经获得业界的广泛认可,本期数据中心采用智能融合电力模块技术即符合“3060”国策下的绿色化、低碳化数据中心机房,又满足当前技术主流。b)   氟泵空调技术在数据中心节能领域研究比较火热的当下,为了降低能耗、推出新产品,市场上提出了很多制冷散热的新概念。所谓的“氟泵空调”就是其中之一,是制冷剂自然冷却循环。很多厂家研发了氟泵空调,在原有的直膨式制冷循环系统中增加了氟泵,在冬季温度较低时,氟泵开启压缩机关闭,利用氟泵实现制冷剂在铜管内的循环。如下图所示,“氟泵”不只是一个泵,它是一整套循环系统,包括数据中心内部的蒸发器、外部的风冷冷凝器、制冷剂气液分离器、油分离器和制冷剂循环泵。它主要由贮液器、氟泵、管路阀件等组成。氟泵与机房空调配套使用,在夏季,制冷压缩机运行;当室外温度低于设定点时,自动切换为氟泵节能系统运行,保证全年机房空调安全可靠运行;压缩机功率在10kW左右,氟泵功率在1 kW左右。 在室外低温情况下,氟泵的制冷量与10kW压缩机产生的制冷量基本相等这就是氟泵节能的关键所在。在联合国大会上面向全球承诺目标:“2030 碳达峰,2060碳中和”的国家政策下,在通过空调节能的技术方案上,本期数据中心行级精密空调采用“氟泵技术”的氟泵双循环空调系统,就是其中一个节能利器c)   封闭冷热通道技术近年来数据中心建设领域取得的进展,“模块化数据中心”无疑是一个热词。模块化数据中心因其能够提供高性价比、高可用性的建设模式,从而被众多基建厂商所熟知。众多传统数据中心基础设施厂商纷纷进入“模块化”的市场竞争中,“模块化”的理念深入人心。在我国已有不少数据中心开始采用模块化数据中心的建设模式,有的甚至步子迈得更大,采用预制模块化的方式。比如,XXX人工智能数据中心就是采用当下流行的预制模块化技术。在该数据中心的建设过程中,其电力、制冷、通信电缆以及相关的环境监控等都预先部署在一个框架上,类似积木,预先完成测试,然后将这个框架直接部署到数据中心,这样数据中心的建设就如同搭积木,从而加快部署。模块化数据中心是指整个数据中心是由不同模块组成。每个模块都有单独实现的功能,统一的输入和输出接口,模块之间可以相互备份。微模块化数据中心由于采用模块搭建的方法,使得单位面积的计算密度得到了极大的提升。同时,由于是以模块的方式进行组合扩大,所以用户可以根据投资情况和业务发展需求,实现灵活的分期建设。由此不仅提升了模块的利用率,同时降低了资金压力。冷热通道隔离的模块化数据中心作为一种趋势的出现并逐渐被成熟应用,反应灵敏的数据中心将会逐渐成为用户的首选。微模块数据中心由于具备绿色节能、快速安装等优点,在满足客户业务需求的同时创造更多价值,成为未来数据中心建设模式的新标准与方向标。d)   智能小母线技术智能小母线是在线即插即用,可以考虑满足当前4KW、5KW的需求,也满足后期的8KW、10KW、12KW扩容需求。智能小母线相比于传统的电缆,具有电流小、易插接、智能化程度高等优势,其电流规格在630A以内,能满足国内90%以上的数据中心机房配电系统。智能小母线通过始端箱从前端UPS取电,以铜排材料的母排系统组成输电结构,采用即插即用的方式,给各个机柜内的PDU配电。始端箱和插接箱内设置监控模块,可针对每个机柜的用电量以及温度数据进行监测,并具有通讯至动环监控的功能。无论从技术性能,全生命周期成本,还是数据中心的后续扩容等方面考虑,都会将智能小母线系统作为数据中心最后50米配电的最优选择方案。同时,在数据中心的建设过程中,限于有限的资源,提高单机柜装机的功率密度,使数据中心单位面积产生更大的价值是很有必要的,打破传统配电模式,驱动新型数据中心配电方式的变革也是势在必行。e)   智能化运维技术数据中心通过系统化、自动化、智能化的手段来改变现状,实现数据中心自动驾驶,即运维自动、能效自优、运营自治。通过架构级优化设计,减少能量的转换层级,去除多余部件,在减少故障点的同时,做到无损切换、无感知切换,实现系统的永续在线,实现全方位全体系的架 构安全。同时通过大数据分析和人工智能算法,深度挖掘分析数据中心能效数据, 实现PUE节能分析与优化,帮助用户做好能效管理。因此,本期数据中心监控系统选择数据中心自动驾驶技术。四、规划设计方案XX市大数据和算力中心项目第一阶段数据中心机房建设,目标是按照数据中心设计规范的B级机房标准,围绕XX市算力中心发展,将PUE目标值控制在1.3以内,依据结构、系统、服务和管理以及它们之间相互联系,建成具有 “一模、三性、四高”的数据中心机房。将机房的供配电系统、暖通系统、机柜冷通道系统、动力环境综合管理系统、给排水系统、装修系统、消防系统等相关系统建设完善。“一模、三性、四高”分别指:Ø  一模:机房设备模块化;Ø  三性:稳定的可靠性、设备的可扩展性、便捷的管理性;Ø  四高:高集中、高可用、高带宽、高速率。涉及数据中心机房建设,含一层机房及二层机房,共包含供配电系统设计、暖通系统设计、机柜冷通道系统设计、动力环境综合管理系统设计、给排水系统设计、装修系统设计、消防系统设计、ECC监控室设计、BIM三维展示平台设计及节能分析等10个模块。总体架构设计如下图所示。本项目数据中心机房布局采用模块化机房的方案并参照数据中心设计规范的B级机房标准要求进行设计,机房各层平面布置如下系列图所示。本项目一层机房:规划12组微模块,包含300台服务器机柜和24个网络机柜、48台行级风冷氟泵精密空调;二层机房:规划12组微模块,包含276台服务器机柜和24个网络机柜、48台行级风冷氟泵精密空调;负一层配电房采用16台房间级上送风风冷精密空调;负一层配电间:4套一体化融合电力模块(UPS)配电系统及配套低压配电柜;负一层电池间:UPS对应蓄电池组及电池开关柜。a)   供配电系统设计我们规划一、二层的机柜采用UPS分区供电,第一层是一套UPS供电,第二层是一套UPS集中供电,根据国标50174 2017数据中心设计规范双母线架构,保证机房供电可靠性。b)   暖通系统设计当时客户在规划设计时,客户是有几条技术路线一是采用液冷?二是采风冷?三是采用水冷?是水冷的?针对客户的提出的三条技术路线以及现场工勘的实际情况和跟客户沟通的实际需求,选择风冷空调制冷方式。液冷的弊端:成本较高:液冷技术的实施和维护成本较高。液冷系统需要专门的基础设施和设备,如冷却液分配单元、冷却塔、泵和管道系统等。以上设备的购买、安装和维护都需要大量的资金投入,增加了数据中心建设和运营的成本。液冷的运维难度比较大,因为它比较重,运维时候需要利用吊臂插拔,成本比较高,兼容也有要求。安全性和泄漏风险:液冷技术中使用的冷却介质可能对设备和环境带来潜在的安全风险。如果泄漏发生,液体可能会对设备造成损坏,并可能对环境造成污染。因此,液冷系统的设计和实施需要严格遵守安全标准和规范,并采取必要的安全措施来防止泄漏和意外事故的发生。维护和运营难度较大:液冷系统的维护和运营需要专业知识和技术。液冷介质的循环、泵的运行和冷却塔的维护都需要经验丰富的工程师来进行操作和管理。此外,液冷系统还需要定期检查和维护,以确保其正常运行和散热效率,整体维护和运营的难度较大。国家或者行业对其技术的规范也还处于空缺状态。缺乏相应的标准支持目前沉浸式液冷还没有在行业内形成趋势,缺乏大规模应用的案例。服务器需要做定制,不利于后期扩容以及方案的灵活性。水冷的弊端:Ø  设备数量繁多,安装复杂,本项目所处位置水资源紧张。Ø  需要冷冻水末端,机房有水浸风险。Ø  大型系统能效较高,与自然冷却适配度也较高。Ø  运维复杂,需要专业人员。Ø  故障影响面较大:单台机组、整个管路。风冷优势:Ø  系统简单,容易安装。Ø  末端介质为冷媒,不存在水浸风险。Ø  变频机组能效较高,氟泵装置市场成熟度很好。Ø  不需要专业人员维护。Ø  故障影响面很小。c)   机柜冷通道系统设计本工程涉及范围包括数据中心一层、二层(24个机柜冷通道,共576个机柜)新增机房内的服务器机柜系统的设计。这些业务机房中机柜是机房关键的物理设施,是机房建设的主要部分,在制定总体技术方案和设备选型时应遵循近期建设规模与远期发展规划协调一致的原则,以满足未来业务机房业务发展需要。数据中心一层、二层的24个封闭冷热通道方式采取隔离装置进行冷通道封闭措施,以分隔冷\热气流,形成良好的气流组织,从而提高机房制冷效果.。封闭冷通道后,可提高空调的送风、回风温度,进一步节省空调的能耗,即使维持原来的送回风温度模式,也可提供更高的制冷能力,以容纳更高密度和更高发热量的设备。d)   动力环境综合管理系统设计本项目建设一套完整的动力环境综合管理系统,能够接入数据中心本地动环监控系统、配电监控系统、安防系统、消防等的监控数据,并以此为基础提供告警管理、能耗分析、电力容量管理、设备管理、自动化巡检、数字运维、智能运营,能效优化等业务功能,从而实现在统一视图上的集中监控、集中运维、集中管理,提升整体运维效率及运营水平,满足业务发展的需要。并预留后续接入扩展能力,可接入交投集团所辖其他远端机房的动环数据(此处要求远端机房的视频监控设备、入侵报警设备、温湿度监测设备、UPS等需接入动环综合管理系统的设备,具备远传通讯接口)。系统组网架构如下所示:本系统应以满足数据中心基础设施日常运维的需要,实现数据中心运维的自动化、智能化,降低运行风险、提高运行效率、降低管理成本、优化资源配置、明显降低能耗、整体提升可用性。在建设过程中应采用完善的架构设计、稳定的技术手段、可靠的安全控制、先进的科技成果。同时结合数据中心的实际状况和未来发展需要,建设具有前瞻性、高实用性、高灵活性和高扩展性的动力环境综合管理系统,并且能充分考虑利用现有各系统资源,建立高性能、低成本的系统。五、华为优势a)   华为公司优势目前,华为在美国、印度、瑞典、俄罗斯及中国等地设立了20个研究所,每个研发中心的研究侧重点及方向不同。我们采用国际化研发体系,聚集全球的技术、经验和人才来进行产品研究开发,使我们的产品一上市,技术就与全球同步。斯德哥尔摩一直是华为重点建设的能力中心,汇聚了大批华为的高端专家。除了网络相关技术外,还有网站电源、UPS逆变拓扑等相关电力电子技术的研究。而纽伦堡作为电力电子行业的硅谷,汇聚了西门子、英飞凌、赛米控等企业,华为可以充分利用全球顶尖的专家资源,并实时追踪业界最新动态,确保华为产品技术的领先性。华为大型UPS的架构设计即出自此处。面向未来发展,华为组建了2012实验室,承载集团创新、研究和平台技术开发的使命。2012实验室聚焦ICT领域的关键技术、架构、标准等方向,持续投入,致力于提供更宽、更智能、更高能效的零等待管道,为用户创造更好的体验;和来自工业界、学术界、研究机构的伙伴紧密合作,引领未来网络从研究到创新实施。我们还与领先运营商成立28个联合创新中心,把领先技术转化为客户的竞争优势和商业成功。b)   华为产品优势华为公司是全球唯一一家能提供E2E全栈云数据中心解决方案的厂商。华为是唯一一家能提供数据中心所有产品和解决方案的厂商,是最懂业务和ICT设备未来演进的基础设施厂商。华为机房微模块产品解决方案FusionModule,隶属华为数字能源产品线,依托华为公司的整体技术实力,提供不间断电源UPS,行级精密空调,微模块封闭冷通道,IT机柜及配套设备。FusionModule采用All-In-Room建设模式,集成了机柜系统、供配电系统、制冷系统、监控系统。FusionModule一体化机房解决方案,因其部署简单、高效节能、可柔性扩容、智能化联动等特点已成为数据中心建设的主流。着眼于数据中心全生命周期管理,FusionModule以模块化架构+智能化大脑为主要设计理念,i3智能化管理为灵魂(iPower智能可靠供电, iCooling智能高效制冷, iManager智能管理简化运维),将子系统、数据中心到全网打造成智能化的有机体,让数据中心机房成为真正可视、可控、可管理的智能化数据中心。华为打造极致安全、智简融合的低碳绿色数据中心 。华为FusionModule系列智能微模块解决方案以模块化、标准化的架构和电力模块、行级精密空调等灵活组合打造新一代模块化数据中心基础设施。其特点:快速部署、高效节省、智能管理、采用密闭冷通道技术,隔绝冷热气流混合,高效利用冷气资源,支持的单机柜功率密度大大提升,PUE降低。在当今全球局势下,信息化离不开网络安全,华为数据中心产品平台自主可控+业内最高级别安全认证,构建端到端的安全可信解决方案。华为全系列产品(UPS、精密空调、微模块、管理系统)获得国内权威机构公安三所首张最高级别安全认证证书,从器件到核心设备自主可控。c)   华为服务优势华为致力于成为客户“值得信赖的服务伙伴”。我们相信,为您提供专业的服务、快速的响应以及客户化的服务产品是推动客户成功的关键要素。华为服务提供端到端的“咨询、网络建设、网络维护、运营管理”一系列解决方案。华为服务长期坚持全球化和的服务策略,拥有14300名专业人员的服务团队,海外员工本地化比率达73%。超过13200名合作方工程师我们一起为客户提供优质的服务保障,在全球每年交付的工程超过240000个。华为在全球90个国家和地区建立了112个服务代表处。我们拥有遍布全球的服务平台,包括3个全球技术支持中心、8个语言技术支持中心、31个培训中心、7个管理服务中心,保证我们能够满足全球客户的不同需求。自1996年以来,华为服务已通过包括ISO9001、TL9000、BS7799等在内的多项国际标准认证。此外,华为已成功通过多家国际知名电信运营商如BT, FT, Vodafone, O2, Cable & Wireless, T-Mobile, TI等的认证。华为时刻关注着行业服务需求的变化,适时推出满足客户需求的服务解决方案。我们准确把握客户的业务发展需要,在最短的时间内提供相应的服务解决方案。
【干货分享】从PC到AI,一个工程师的进化论
前言:大家好,我是蓝色空间。今天我要讲的主题就是“从PC到AI,一个工程师的进化论”。那么为什么要讲这个主题呢?因为我之前在咱们论坛已经讲过了一次公开课。分享了我20年的工作经历。而讲这次公开课的目的,是我看到了身边有很多工程师,无论是年轻的工程师,还是年纪大的工程师,他们在工作中往往都会有各种各样的困惑。尤其是现在AI系统在不断发展,AI替代逐渐深入,再加上经济下行,造成了很多工作岗位的消失和裁减,进而造成我们所有人的压力都很大。那么在压力增加的时间段,就会有更多的人会产生迷茫。无论年纪多大都会有。而我工作了也有20多年了,积累了一定的经验,也走出了一条属于自己的路,我也很清楚想走出一条属于自己的技术人员的路是很困难的,尤其是几十年走到底,一直做技术,更是非常困难。那么我今天的公开课就呼应了上次的经验分享,目的就是给大家指出一条我看到的路,希望能够抛砖引玉,也希望大家最终都能找到属于自己的路。接下来开始本次公开课。首先说一下目录,也就是要讲到的各个时代,我是从工作的先后顺序来总结的。我这次的公开课内容,根据我的工作经历总结了以后,我发现它就符合这几个时代的特点。而这几个时代,也暗合了我们整个计算机行业的发展特点。从PC到网络,网络时代包含了传统互联网还有手机端的移动互联网,我把它合并成网络时代。接下来是大规模的云计算。现在AI又在爆发。那么未来会是什么样子?我们都需要考虑。作为在这个行业里面真正做实施、做技术的工程师,我们必然是参与到这个时代中的。接下来就看一下,我这20年是怎么走过来的。今天更多偏向于技术方向,给大家介绍我在技术方向上怎么发展,然后提示一下大家可能会遇到的路径。首先要进行破题。为什么我用进化论来破题呢?首先是因为我在想标题的时候,首先就想到它了。进化论是基于当前科学界的共识,大家都认为很可能是没有问题的,是符合科学原理的。但是由于各种物证还不是很完善,具体的细节和一些具体的例证可能还有一些值得商讨的地方,就造成了进化论一直处于争议中,没有最终盖棺定论。那么我用进化论作为公开课标题,一方面是因为我们这个时代的发展和我个人经历的发展,也符合进化论,总体思路是不断的进化,不断的螺旋上升的。另一方面,也是因为进化论会引发一些争议,那么我自己的个人经历也不是放之四海而皆准的。也就是说,大家在参考我的经验过程中,最终还是要走出自己的路,对我的经验不必全盘接受。因为我们工程师首先最重要的一点就是不能全盘相信权威,一定要有质疑和自己的思考。第二就是在我的ppt中会发现排版一般比较简单,也就是字体颜色,还有具体的示意图都比较简单,似乎不太符合非常讲究细节或者专门做演示的PPT。而这就是因为我们工程师和科学家不一样,我们做的是利用科学家给我们的理论知识和工具来发现问题、解决问题,这才是工程师真正要做的事情。但是现在很多人做的事情,可能把自己从一个工程师就做成了一个所谓“搬砖的”,也就是俗话说的码农,把自己变成了一个体力工作者。但是实际上我们应该做一个脑力劳动者,工作中是真正应该动脑的。那么我们的工作中应该聚焦于说明问题、展示问题、解决问题。PPT也应该遵循简洁、高效、快速、准确的原则。最近很多大企业也在做这种反思,也在提升沟通的效率,杜绝过于花哨的PPT。所以这是大的趋势,为了提升效率,都要做一个简洁化的处理。在进入职场没多久,第一件重要的事,就是我负责的机型出现了一个严重问题。这个问题是什么呢?正常的流水线生产,它其中有一部是试生产,就是少量的生产几百台,这些机器生产出来,通过测试确认一下有没有问题,没有问题才会大规模生产。一旦有问题,会重新返工去改善设计,改善了之后,再重新做试产和正式生产。那么在试生产机型中,由于我们已经采用了现代化的工业流程。这个pc机经过测试以后,不能开机或者出现开机有问题的故障率不应该过高,一般都是千分之一以下,甚至是万分之一左右。那么在我们那次试生产的过程中,故障率最后达到了20%。什么样的情况算是故障率呢?就是走了一遍所有的测试流程没有走通,在某一个流程卡住了,它就视为有故障,然后就会下生产线,放在一旁等待处理。那么最终20%的机器被筛选出来,认为有问题。它的现象是什么?就是在测试过程中可能出现无法启动现象。因为我们测试过程中要随机启动几次的,那么这几次必须全部都能启动,才算测试通过。如果有任何一次无法启动,就认为是出现问题的设备,这种设备一旦到客户手里出现问题,那是要赔很多钱的。当时故障率远远超过常规情况,而且是建厂以来从来没遇见过的异常情况。当时我还是刚入厂没多久,大学毕业,领导把这个任务就派给了我。目的是什么?就是要找出故障率过高的原因,然后当时能采取的手段只有做硬件测试。我们都知道测试有黑盒测试和白盒测试这几大分类。那么白盒测试我们必须要针对代码或者针对硬件设计来进行。因为我们的机器是组装了以后,拿现成的各种零件组装一起进行的整机测试,所以我们没办法做白盒测试,也就是说我们面对的就是一个黑盒,那么我们能做的也就是观察它的现象,然后总结出其中的规律。这数百台机器要想测试唯一的手段是什么?那就是反复重启,统计成功率,统计出问题的概率。我们当时整个一组人,还拉了其他组的成员来帮忙,大家一起做了好几天的时间,昼夜不停,连轴转,最终这几百台发现不是100%的故障,某些机器可能是第一次启动失败,第二次就启动成功。那么我们每一台机器就要重启十几、几十次去统计它的故障的现象和概率,通过统计的方法来挑出来概率高的设备,以此为基准进行后续的测试,通过后续的测试来确认问题的根源。那么最终我们经过了将近一周时间的反复测试,成功找到几台100%没法开机的设备。这些设备就代表了我们的典型故障,那么它就是分析所有问题的依据,后来这几台机器就被拿到所有供货商和客户的会议现场,把这几台机器拿到现场后,大家现场测试。最终通过现场测试,发现了核心的一部分零件,确实存在问题。当时在行业内造成了很大的影响,最终供货厂商整改,我们所有的工作和加班损失由出现问题的厂商赔偿。这件事,当时是影响了整个国内PC行业的。当然这种事情一般是不会公开处理的,在行业内部就消化了,可能大家当时不会知道。所以大家可以看到,我初入职场第一个遇到的很严重的问题,就是一个有经验的工程师,也不见得能顺利处理的复杂问题。等于我们一开始就遇到了地狱级难度的开场。那么经过这个地狱级难度的训练,后续再出问题,我们再处理时,就能总结出一些经验,应对起来就游刃有余。我们经过了这种魔鬼训练,以后也就不至于遇到问题就手忙脚乱了。这个过程中我们是怎么找出问题的呢?首先我们要理解一下PC机的启动原理,这些都是我们在学校里学过的。因为我在学校里面是计算机专业,当时我把计算机专业几乎所有的电脑修了一遍,日常天天排查的就是这些不能启动或者异常的故障率。它的启动故障是由于什么原因,在我们看多了以后进行总结,就能通过这种大量的总结,找出很多故障的背后原因。正是因为有了这种积累,所以在出现这个问题的时候,我带着大家,虽然是刚毕业,我们也仍然成功的把这个问题找到了。并为后来的问题解决奠定了坚实的基础。当时领导对我们的表现都是很满意的。所以大家可以看一下,从学校出来,你学的基础知识不见得就是没用的。即使我们学校教的可能是有些过时的理论,但大家永远记住,冯诺依曼架构还是当前的计算机基本原理,整个机器的启动原理,目前为止仍然没变,PC到服务器到存储全是一样的原理。所以基础知识一定要打牢。其次就是面对新领域的挑战。我这个PC时代,其实我在每一个时代是把跟它相关的一些经验整合到一起了。我做这个预装系统的案例,就是第二个讲的这种预装几百台PC的这件事,并不是我在之前的工厂做的,因为工厂预装是有完整的流水线的。我也正是在工厂中的培训里解到了整个OEM流水线,它的系统预装流程。但是这个步骤当时是由专门的部门实现,我的部门不负责,所以我并没有完全掌握。那我是什么时间把它完全掌握呢?是换了下一份工作,已经干其他工作的情况下,我的负责的工作里面就有几百台PC机需要安装。他的要求是需要提前预装软件,提前激活,而且支持自定义账号密码。基本上就是要求把普通的PC机按照OEM流程做一遍,这是给工业领域定制的设备,也就是说我们拿来普通的PC机,把它定制成工厂生产所需的工业化的设备。所以我们要预装的东西并不是普通的这个PC制造厂它预装的那种软件。在这种情况下,我要参照它的体系自己完成。当时时间比较早,正好是Windows XP到Windows 7的转换过程中。我们都知道XP系统的预装是需要很多第三方软件协助的,官方也会给出各种软件的预装方法,但是它是需要多种第三方软件协助才行。当时刚刚转换到windows7的系统,这个系统是第一次采用了wim镜像。它自己支持镜像,自己支持全套的部署。同时。经过工厂模式,还有再次封装的方法,用这些方式来达到预装系统的目的,同时又能给客户一个初始化的体验。那么参照这套体系,我当时花了一周时间去研究。当时还只有不完整的英文资料,因为系统刚出来,那么在这种情况下。我要想完成预装,我必须依据英文资料来处理所有的东西。因为我第一份工作是以英文作为工作语言。我虽然英语学的不是特别好,但是对于这个工作用到的计算机相关的英语,掌握的是相当扎实的。所以我看这些英文资料,就可以很顺利的把相关的知识掌握到。接下来经过研究,在一周时间内把预装流程基本上摸透了。摸透了之后就进行了软件的预装,把所有PC机通过自动化脚本预装之后,系统自动启动,执行自动化脚本,再集成了一些第三方的软件进行拷机测试。这和我们日常家庭拷机运行软件差不多。所有这些软件和我们装机DIY后的流程差距不大,但是它必须要自动化完成之后,自动记录结果,然后自动生成报告,通过网络获取到第三方的设备里,报告放在第三方设备之后,再把这些所有的机器重新初始化重新封装,重新预装上我们需要的office软件、工业软件,还有其他的应用软件,最终做系统激活,然后重新封装。那么整套流程下来就必须要深刻的了解操作系统的原理,软件的原理,注册表的原理,还有系统各种组件的原理。通过这种流程也就完整的掌握了整个windows系统下它的这种体系架构。而且通过这种预装的测试,也找出了故障设备。通过维修操作,就把故障设备维修好了,最终就是在这半个月时间内,保质保量完成任务。因为原来领导的想法是,找几十个年轻的毕业生人工一台台安装,但是人工安装是达不到这个效果的。我一个人当时在半个月时间内完成,否则的话应该是找几十个人,用1~2个月时间去完成这个工作。大家可以想到这里面节省了多少的人工成本。而且这种预装的一致化体验给客户带来的价值也是相当大的。为什么我说它是新领域的挑战?对我来说这个工作原本是可接可不接的。对我来说,如果我接这个工作,则是从零开始。我们日常在工作中都说,机会是给有准备的人,什么叫有准备的人?面对新领域的挑战,敢上还是不敢呢?我们就不评估以后的收获,如果我们有能力可以去应对一些新的领域的挑战,我们应该找各种机会锻炼自己,提前把这些工作能力准备好。这种预装系统的能力在我第一次研究出来之后,在我未来的10年工作经验里面,有数次遇到了类似的情况,我利用同样的技术实现了其他的设备的安装、激活、及自动化部署。比如后续我有上千台的服务器要实施,最终大概有几百台机器需要在一周以内完成安装和初始化配置。但是当时由于工作安排,只有我一个人来执行,那么又是面对同样的情况,我就通过类似的方法来实现了系统预装,又一次解决了问题。也就是说,当我们做好准备的前提下,我们学到的东西是一定会有用的,不要把自己限制在自己的条框里。接下来呢就是我在PC机时代,做的几个超出我们平时工作范围的的技术经验,它是基于我们积累下来的能力,去不断的提升自己,做了一些额外的工作。比如说,当时我们有那个10个左右的光驱读盘失败,就是我们的PC制造厂的实验室里面,做测试用到的设备。做测试过程中光驱要经常用,有些光驱就会把盘读碎裂在里面,光驱就报废了。面对这些报废的光驱,我在空闲时间,想要看一看光驱的原理,就把它拆开,然后发现里面的结构其实很简单,也就是一些定位结构、旋转结构、再加上激光头的控制结构和激光头本身。那么做了一些清理和操作之后,把这些机械问题解决掉,10个里面有6个恢复了正常的读写。经过测试,完全可以正常使用。本身光驱即将要报废,它作为资产的价值不是特别多,但是我从里面积累的经验就是,别人下的定论不一定可靠,有些问题还是要动手,亲自了解一下。第二个问题就是我有一个外置的刻录机,在光盘一切正常的情况下,它刻录失败,比如说我用DVD光盘去刻录,可能之前一直刻录成功,但在某一天,突然之间连续失败了五次。它的读盘一切正常,只要写盘就失败。我在刻录cd盘的情况下,也是刻录正常,读盘也正常,只要刻录DVD就失败。同时经过确认,读写是同一个激光头。如果说同一个激光头的情况下,不太可能出现这种问题,除非两个激光头其中一个坏了,对吧?那除非是功率不足或者其他原因。那么怎么样去区分呢?这又要用到我们黑盒测试的思路,对吧?这个案例就提示我们,基础知识一定要牢固。那么我们测试过程中不断的通过刻盘、写盘的操作,经过几次连续失败,最后确认了一个问题,就是不仅仅是光驱和电脑的问题,还可能有其他软件问题。大家看我这个右侧有一个截图,这个截图是我复制文件的时候,偶然间发现。本来正常我的固态硬盘复制文件的时候应该是几个G的传输速率,至少也应该是几百兆的传输速率。但是它拷贝到一半的时候,它的速度突然会降到零,原因不明。经过查询,windows下确实有这个问题,尤其是windows11和win10,那么再结合固态硬盘自身的IO调度可能存在问题,操作系统对于固态硬盘的管理可能存在问题,那么光驱和这个系统的匹配和它的驱动也有可能存在问题。目前问题没完全解决掉,但是首先操作系统读写数据突然降到零,这个问题一定是其中一个很大的影响因素。也就是说我们做事情,做测试的时候不要非此即彼,不是除了成功,就是失败。网络问题也不是说网线拔了以后,就只有网线和网口甚至可能交换机故障。路由设置故障、其他的操作系统底层故障,各种故障的因素,一定要考虑全面,才能测试出一个完整的结果。我们在日常工作中看到很多人面对问题时,就是采用非此即彼的思路,一定要打破这种思路,尽可能多的去观察一个问题的现象,那么你和别人得出的结论可能就是不一样的。最后就是我遇到熊猫烧香病毒的那个问题。这个病毒号称破坏固件,中了这种病毒就没办法处理。实际上经过我的分析,它确实是不处在任何分区上,它是在硬盘预留的启动空间里面,例如启动扇区里。它在这个部分做了一个隐藏的区域,把一部分代码藏在这儿了。只要这部分代码还激活,它就能不断的复原它的病毒。那么当我把这些隐藏的代码处理掉了以后,这个病毒也就失去了活性,接下来就是怎么清理病毒的问题。之前我分享20年经验的时候,说到我当年正面硬刚熊猫烧香,就是通过这种方法一击必杀,也就是说第一点,知道它是怎么处理自身隐藏方式的。第二点,它对文件的加密主要限于对文件头部的格式的修改,一些文件内容并没修改。当时通过这种方式,还恢复了很多被它加密的文件。那么整个PC时代,我的收获也是给大家的一个忠告,就是首先对于基础的原理,要有深入的理解。因为所有IT设备的底层几乎都是类似的,全是冯诺依曼架构,对吧?那么掌握了技术原理,我们就立于不败之地,就能干好我们的工作。第二点就是举一反三,一定要从原理入手思考问题。我们有很多人可能是从经验入手,也就是做一次工作,拿本子记一个经验。这个经验往往再遇到新的问题就不可靠。一定要从原理入手,这样无论我们的问题怎么变,我们从原理入手都能找到问题的根源。第三点就是我掌握了用于英语阅读产品文档的能力,这个能力给我很大的帮助。现在我见到很多年轻人,虽然英语学得不错,但是阅读产品文档的能力可能不是特别好。即使我们毕业了,我建议大家英语不要扔下,能去读一些原文的产品文档,还是尽量去适应一下,当我们能顺利的用英语读这些文档的时候,你就会发现你的信息来源会比只能读中文的工程师多得多。然后就是独立思考,找到解决问题的方向。只有独立思考,我们刚才遇到的疑难问题才有解决的可能。接下来就是标准化的工作流程以及沟通技巧。如果我们的工作做不到标准化,手忙脚乱的沟通,也就是该说的问题说不到位,也是没法解决问题的。所以大家还是要注意。这个时代我的心得就是不破不立,破而后立。也就是说,首先要跳出自己的条框,跳出自己的舒适区,你才能不把自己限制死。我后来又做去网络,接下来一份工作就是做网络工程师的。如果当时我对网络没有兴趣,那我重新学习,就可能不愿意学,我可能会说我是做PC的,我为什么要做网络呢?对吧?如果只基于自己已有的经验,就只能找PC相关的工作,那我就跳不到网络的时代,我就会被困在PC时代,困到等死为止。虽然说在PC时代也有自己的发展,大家都知道这个行业是一波一波的浪潮,在不断的前进的。PC时代是在逐渐的落幕,它的工作的余地在变窄,不是说没有活路,而是说它的活路在变窄。那么我们跳出去了,突破到新的区域了,是不是我们就有更宽的路可以走呢?这就是找路的方法。然后呢,就是只有持续学习,才有未来。我们当时一起做这些工作的同事里面,有些人和我说,看你学习我很羡慕,但是这么学习脑子很累,我学习不行,我不想费脑子,天天休息不好吗?天天追剧不好吗?为什么要费脑子?如果我们忽视了持续学习,作为一个工程师,就没有发现新问题,解决新问题的能力,我们就会被这个职业、被这个时代所淘汰。因为这个时代,尤其是计算机相关的技术更新太快了,如果跟不上,就很容易被淘汰了。尤其是我们背负的养家的这种重担,对吧?大家的压力往往是家庭的压力,没有家庭可能压力更小一些,有了家庭压力就很大。那么我们持续学习才能让我们有足够的能力去维护好我们的家庭。最后就是戒骄戒躁,很多人技术强一点,就会骄傲,轻视别人,而且变得短视,就是只聚焦于眼前自己积累的经验,我的东西看管好了,绝不教给别人,防止教会徒弟饿死师傅的情况发生。但是这种短视只能让人自我消亡。我们接下来看一下网络时代,网络知识我是从头学起的,大家看一下左侧是RFC,咱们学网络的,大家可以自己想一下,有多少人从RFC开始学的。根据我在周围的观察,可能从这儿学的比较少,右侧是OSI的七层参考模型,还有TCP/IP的五层网络参考模型。这个模型是大家100%会学的。但是从RFC协议学起,从RFC文档里直接去看,比如我下面的IP、TCP、UDP、ICMP和FTP等各种数据包的组成,每一个字节的含义,还有多少人是从这看的呢?我当时看这个看了至少有半年,我才理解网络是什么样。上图右边的参考模型,实际上手后持续半年到一年,我才真正理解网络是怎么连通的。我掌握了这些基本原理,接下来的问题就不是问题了。比如说我的网络规划里面,以及在后续的工作的网络相关方面。其实我换了不止一个工作,那么有一份工作就是给企业设计网络。我那个装几百台电脑的项目就是给一个工业企业设计双冗余的网络,它应该怎么设计?那么如果是做一个二层网络,只需要连通就行,至于它是一个网段,还是多个网段,很多人可能是不考虑的。我在很多企业还看到过这种形式的网络,只要能连通就OK。但实际上一个企业如果规模到了一定程度,它至少需要一个有三层网络,也就是不同网段的这种网络。在这种情况下,我们网络应该怎么规划?是选二层网络还是三层网络?现在则更加复杂,在网络里面不只有我们的连接的接入设备,还有汇聚层,以及POE的交换机,除了PC,还有监控、还有无线。出口除了有我们的网关,还有路由器、上网行为还有互联网的相关设备,还有一大堆防火墙、防毒墙等安全设备。所有的这些设备,它应该具备哪些性能,有没有瓶颈,我们应该设计哪些功能,哪些可以先上哪些可以后上?网络设备都需要具备哪些?在哪一期做,哪些是串联,并联还是旁路?到底应该怎么做?所有的东西都需要考虑。只有当我们了解了所有这些东西的底层原理,我们才能把它做得更好,设计的才能更规范。如果不了解,我们可能就是经验主义。别人怎么说我怎么做,我见过的是怎么样的就怎么做。最近几年我也和很多这个资历比我还老的网络工程师合作过了。一方面,传统网络工程师在面对虚拟化云计算的时候,往往理解不了虚拟化和云计算的网络规划,因为他不知道这是怎么回事,只有接触过这些东西的人,才能深刻理解,才能匹配的很好,这是第一点。也就是说,网络工程师如果不了解云计算,甚至都可能跟不上时代。另一方面就是,一些老工程师经验主义很流行,如果我以前就是这么做的,我现在还是这么做,只有这么做,我的网络才能连通,不这么做,我就不保证网络能连通。而到我这里,可能是客户需要什么,我就做什么规划,按照我这个左侧的列表,全都整体做出规划。接下来每一步是什么原因全部都有理论解释。那么某个案例中老工程师解决不了的,我和他们的新工程师一起去讨论,最终结果就是这个比较愿意学习的新工程师跟我去讨论,反而把这个网络给搞出来。我们一起把网络规划重新设计了一下,此时我已经是又作为云计算工程师了,网络已经不是我的本职工作,但是我协助他们把网络给设计出来,包括双活切换应该怎么做,我都是基于比较扎实的理论基础,然后一起去讨论,基于理论做出来的东西。这说明什么?只要我们理论基础扎实,我们就可以不犯经验主义的错误,同时我们也可以不被自己的经验所束缚。无论我们做什么行业,我们都可以利用理论去做出来,比纯经验积累有了更多的可能,我们工程师的路就更宽。路越宽越好走!接下来就是连接到网上就不安全。在我做网络的时候,凡是连接到网上的业务,网上的所有威胁都来了。假定某个服务,如果开放到互联网上,图里的所有威胁,几乎我都实际遇到过。有很多问题是协助用户解决的。比如说木马和病毒就遇到不止一次。当时我们只是提供设备,然后提供解决方案。但是这解决方案里不包括安全设备,也不包括安全。但即使有安全设备,用户仍然中毒,仍然被钓鱼,仍然有病毒,有木马。那怎么办?如果不把这些问题解决了,人家会说你的系统有问题,为了系统顺利实施。我们自己去找了一下系统后门,查了这个黑客的思路,然后我们顺着它的路径,自己把病毒给找到了,再把木马给抓到,把木马处理掉,清理之后,再给用户写一份说明,提醒用户怎么样做好网络安全防护,避免同样的问题发生。然后这个项目才顺利结束。无论我们是做虚拟化、云计算还是做网络,只要是开放到互联网上的,当前面临的威胁几乎都是不断的。所以即使是我们传统的IT业务,即使是我们传统的网络业务,只要开放到互联网上,安全防护的思维就必不可少。在这种情况下。怎么样去解决实际的问题?我这里边举一个例子,就是网络连通性测试。大家都知道,我们如果做网络连通性测试,一般最多采用的是ping命令。用这个命令测一下,我们和某一个点之间通还是不通,这是一个很简单的操作。但是大家想一想,这个问题到底应该怎么处理?有些时候一些复杂的问题就不好处理。那么我给大家推荐的是一个综合的方法,我们在客户端1的上面执行命令,但不是执行一条,而是并发执行多条。怎么执行呢?有一条命令是和本网段客户端2互相ping,然后从客户端1去ping本网段的网关,同时再ping跨网段的网关,再ping跨网段的客户端。用这种方式把所有的ping命令全部都列在屏幕上,然后观察一段时间内它的情况。在面对一些复杂的连通性问题不好解决的情况下,用这种多角度同时做的命令,可以查出网络的数据波动、网络延迟的异常以及网络异常的断开。尤其是如果我们网络某些情况下断开,又找不到具体位置在哪,这种同时的测试。同时看各种数据的影响,你就能很容易的分析出来问题在哪里。我们用这种思路曾经做了几百个测试,把一个非常困难的问题,联合华为体系研发都没能解决的问题,通过测试把问题最终定位了,最终由研发根据我们的定位,把这个问题根源找到,并最终解决。如果各位还在用华为的产品,我这个思路测出来的东西,应该是在这两年会普惠到所有的人,这个可能大家都感觉不到,但是我们作为一个工程师,只要真正抱着解决问题的思路,我们早晚都做出一些真正让我们在行业内部能成为神话,能成为传说的成就。只是有很多人都是默默的在做这些工作,这些做出来的成绩不会公开出来。我公开一小部分是为了让大家知道我们可以走的路,是远远不限于你能看到的那部分。尤其是面对这些有疑惑的工程师,无论你是年轻的、年纪大的,还是即将踏入本行业的工程师,大家都可以看看,我们能把这个路拓宽到什么程度,每一个人的路都可以自己去拓宽。这个时代的技术方面的收获就是从原理开始理解网络。网络安全也是从网络原理入手。当我能看懂每一个数据包的含义,我就能从数据包的角度来把这个整个的网络理解了,也能理解它的安全威胁在哪里,知道安全威胁就能解决问题。那么再从网络安全扩展到综合的数据安全,比如我们的数据的备份,数据的安全。怎么样确保我们的数据可靠?怎么样确保数据的可用性能够得到可靠的维护?这都是可以扩展出来的。最后就是自学能力得到提升,技能就可以迭代了。就是在处理网络的时候,你面对的连接特别的多,我们争取以网络为核心,通过骨干不断的了解周边的只是,比如说逐渐细分的无线、骨干网的传输、运营商的相关网络,还有5G的相关网络,移动互联网等等。所有的这些东西我们都可以逐渐的去拓展。以后能干的行业,你会发现越来越广。 这一段。随着经验的丰富,我发现有些人就会互相攀比,互相吹牛,更加看不起别人。即使在你跟他去讨论技术的过程中,他也默认为你是在和他吹牛。为什么呢?因为这种人吹牛习惯了,默认为所有人在一起就只能吹牛,这是心虚的表现。作为这个行业内经验已经很丰富的工程师,我可以和年轻人说一下,不建议你去攀比,不建议你去吹牛。只有心虚的人才会把自己伪装的很厉害,真正厉害的人不需要伪装!举个例子,我现在写的PPT,我给大家讲的这些内容,你看我可能是每一页只写了几项,但是每一项我展开都能单讲一节课。很多人写PPT疑惑的是我没有东西写怎么办?我怎么样能把自己的工作内容写的丰满一些,让领导看到我更多的工作。我则相反,我每次写PPT东西太多了,我可以源源不断的讲上三天三夜,那怎么才能浓缩成几句话,让领导知道我的核心步骤,不至于关注太多的细节呢?其实如果你关注了更多的细节,你会发现我的能力远远超出通常的领导的要求。那么如果我们日常工作中你能做到超出领导要求的工作,同时又能顺利的把它做好,那么将来你的路一定是更宽广。只有开放合作才能共赢,只有平等交流才能进步。一般实施过程中,我们把需求归纳,然后甚至配置都做好了。我们这种售后工程师往往是只需要去实施就可以。但是我拿到项目的第一件事,永远都是重新核对需求,这叫不忘初心。为什么?因为我们的售前工程师如果实施经验不足,他给出的需求分析的结果和他给的配置结果有可能是和实际不匹配的,或者匹配的不是特别完美。想要完美的实施,一定要介入需求分析,一定要把需求重新梳理好,基于需求重新把所有过程再走一遍。这既是验证了一下售前和销售他们做的工作,也是以此为输入,重新的让我们未来的工作更好。这就是我们现在积累的一个经验,通过这种售后介入到售前的方式,让我们售后的工作再也没有阻力,再也不至于因为售前的一时疏忽,造成我们售后去费尽心思的给售前收尾,或者去给销售说的大话收尾。我们只要和售前和销售顺利的配合即可。现在甚至是我们自己作为销售工程师,直接去参与需求配置。那就可以把整个的全链条都打通,显得很顺,后续工作就会很顺利。如果大家当中有本行业的售后工程师,大家应该都有这方面的困惑,这就是解决的一个方式。第二就是全面规划。这种规划的过程中,需要我们全面的了解客户的机房要求、环境要求、电源要求。虽然我们的文档里有写到,但是我们还是要现场的去确认,根据现场情况,根据我们的经验,提示客户怎么样去完善它的环境。然后是我们的组网原则、接口规划。一方面参照我们的文档的推荐的指南推荐的联网形式,另一方面是基于我们个人的经验,个人对于原理的掌握,我们甚至可以在厂商的最佳实践场景下,总结出我们自己的最佳实践,做更全面的规划。不要局限在我们现有的工具里面,一定要以自己的能力为主。接下来是上架,这是我们常用的一个上架的图。为什么最下面要留2U空间?我们的规划里考虑到了要把手塞到空隙里进行一些相关的维护操作。中间为什么要留2U?因为有理线架的操作,对吧?根据不同客户的需求,留多少的空间,我们的设备摆放都是有说法的。比如说我这个图里面,我的设备摆放就是从下而上,从内而外,它是上走线,那么凡是所有出口的线,就都经过防火墙,从上走线走出去,也就是说我们的摆放位置都已经做好了考虑,线的长短、数量、接口取电、维护难度综合考虑。我们做上架的工程师,不要把自己只当成一个搬砖的力工,只是上架扭螺丝而已。我们的上架是为了后续的实施做准备,要从整个项目来入手考虑这个问题。如果你能综合考虑问题,你就相当于半个项目经理了。以这个角度来说,你的项目实施的难度就会比普通的这种分散负责的项目少得多。接下来就是部署流程,官方在超融合上给了我们很完善的部署流程。但是我们仍然在每一步都需要根据自己的经验进行确认,不能局限在官方的文字说明里,一定要亲自了解每一步的原理是什么?官方为什么这么推荐?在这个基础上,我们才能结合需求,结合客户不同的各种需要,针对不同的客户,做各种不同的变化,随你怎么变,我都满足规划要求,我都符合产品规划的思路。我交给客户的,或者我推荐给他客户的,已经不是简简单单的这种书本上规定好的,必须这么做的一个思路。而是我会根据客户的要求动态去优化它的配置,而且绝对是符合产品设计思路的。我会告诉客户基于什么原理,基于什么思路,产品才这么设计?那么交付部分。交付不是说做完虚拟机,虚拟机发个模板,做个培训就完了的。大家看左侧,我还要考虑运维磨合期问题,处理运维指导故障修复和后续规划。为什么要考虑这么多?在我们这个可能跟我的行业有关,一、我作为售后工程师,我要去实施。二、我实施完了,难免有一些问题要进行处理,跟客户还是要继续保持关系的,并不是说实施完了就不见客户了。既然你要接触,遇到问题是逃不掉的,那么在运维过程中也少不了。持续规划是什么?大家看我右边这个图,就是我们给他的超融合实施,我通常会考虑两个生命周期。按照项目管理的流程,五大领域,启动、规划、执行、监控、收尾,从预算开始,一直到老系统下线,新系统替代。考虑两个周期应该怎么规划。那么整个的产品规划思路、软硬件思路和你推荐给他的运维思路,就能有的放矢,就可以基于这个目的去把它实现。这种情况下,后续客户真到了这种比较困难的老系统下线和新系统替代的时间点,在提前规划好的情况下,他做的会顺利得多。如果客户能顺利的进行更替,那么后续的项目可想而知也是可以拿到的。以产品经理、以项目经理的思维去考虑问题,这样我们的路才能更宽。运维就是指我们日常20%的问题,其实能覆盖80%的运维场景。我们日常集中精力把常见的20%问题解决好,大部分问题都是可以解决的。交付之后就是运维的开始。无论你是纯售后工程师,还是说你做系统集成,建议大家多积累一些经验。问题处理的三个层次里面,客户只需要做好自己的虚拟化的维护,硬件的这个维护就可以了。那么如果是我们和客户一起去做这个项目的话,对于系统的变更,一般由我们实施工程师来说是最理想的。那么故障件的处理或者说一些后台故障的修复,那就得由厂商研发来执行。那么这三个层次我们处理好了之后,客户能做的其实就很少,也就不需要客户付出巨大的工作量,去适应我们全套环境的维护,而是说他只需要聚焦于他的业务就可以了。最后给工程师的忠告就是没有金刚钻别揽瓷器活。如果接手了工作之外的东西,一定是基于帮忙的思路,先撇清责任,先把你的责任范围边界确定好,干好本职工作,再做瓷器活。二就是责任边界需要让所有人都确认了以后,以帮忙的形式去干。这样你才能额外做一些这个积累经验的事,同时避免承担不良后果。最后就是聚沙成塔,每次实施,多处理一个问题,每次给客户处理问题,多记录一个经验,聚沙成塔,你就比别人多做了很多。最后是在系统下线的时候,我们重点考虑右边提到的保持控制,就是软硬件一定要在控制范围内。任何软硬件失去保障了,想办法让它留在保障内,要么硬件续保,要么软件续保,不能续保的在稳定业务的基础下,保存好你的数据,最后确保应用可控。怎么可控?能维护的尽量维护,维护不了的,尽量想办法提前替换。基于这个思路,只要做好持续的替换,这种运维就是可持续的,做好可持续的运维才是我们IT维护才应该干的事情,否则我们就成了救火队,到处处理问题。最后这个收获就是如果我们已经做了服务器存储,也做了网络,那么后面虚拟化、超融合、私有云,几乎你就可以全面开花。大家看看我之前的经验,PC、存储这些都是相关的,早期做过的,网络也做过。为什么后来我做虚拟化,又做云计算这方面?是因为当时领导招人的时候,就要求你做过所有的硬件,没有相关经验,是没法去做虚拟化的。当时正好我有这个经验,就被招过去,从头开始学习虚拟化。二就是突破技术限制,突破工程师的角色限制。我如果把自己限制成服务器的工程师、PC工程师或者网络工程师,我绝对没办法做额外工作。那我也不可能接触到后来的AI,只有具备了综合能力,你的路才能越走越宽。那么脱离经验困局,我们才有广阔的天地。假如我们现在失业了,有多少人能凭业余爱好,能凭其他方面的经验找到新的工作,而且还能让自己顺利养家的呢?很多人会聚焦于自己过去的经验,但那意味着你被过去的经验困住了。所以这里私下给大家的一个建议,就是一定要做到不被自己的经验困住,才可能有更广阔的未来。接下来就是我到了这个年纪了,所以说应该开始传承经验。遇到年轻人,我希望多讲一讲,给大家看看自己的路。而对未来始终抱有新的希望,做好心理准备。那么只有这样,我们才能有更好的未来。最后由于时间限制,我这边就说简单一下,最后一句话,我命由我不由天,我们的工作可能受限于时代、受限于年龄,可能会被淘汰掉,但是自己的能力永远是自己说了算!而且随着现在信息时代的提升,给年轻人的另一个忠告就是我们的计算机体系不断的在扩容,不断的在扩充,那么各种行业细分的越来越多。过去说隔行如隔山,指的是计算机和其他行业隔行如隔山,计算机行业内各行基本是互通的。但是现在已经不是了,现在网络就能细分有线、无线、企业网、个人网、还有物联网,再加上运营商的网络。软件又分成前端、后端和中台。再加上商业方向的软件、工业软件分得更细。大家很多人在学校学的不是计算机专业,而是某一个细分的行业,参加培训也参加的是某一个细分行业的课,或者是某一个细分行业的厂商认证。即使是计算机行业内,不同的细分行业都已经变得隔行如隔山了。但我还是建议大家能拓宽自己的行业,跟自己相关的分支行业尽量多了解一些。不用完全掌握,只需要以某一点为核心扩散开去,这样你的路就会越走越宽,千万不要把自己限定在某一个细分领域里。不要说过去我做网络的,我现在做云计算,但是我做云计算的时候,再遇到网络,我还能不能处理?过去的东西也不能丢掉。最后讲一下AI时代。我们的这个AI时代首先一点就是讲所谓的机械飞升,我们的AI目前在不断的突破,尤其是ChatGPT时代让AI突破了图灵测试。接下来deepseek的时代到来,大幅的降低了对硬件的运行要求,让我们能在可接受的成本下进行大规模的公有化和私有化部署。在这种情况下,我们的AI能力也就越来提升的越快,最终奔着AGI,也就是通用人工智能的目标越来越近。那么这部分我打个比方叫机械飞升。也就是说它未来要从越来越不像人的一个工具,变成越来越像人的一个机械生命。未来有可能以我们想象不到的面貌出现。因为随着AI的发展,未来是无限的。现在接触到AI之后,我可以跟大家确定一点,它一定是未来,大家一定要接触它,哪怕仅仅是自己用都可以,大部分不一定能有条件调试AI设置,但只需要自己用就可以增长经验。现在一定不要逃避。我们能做的唯一的方式,就是拥抱未来,最终甚至我们可以做到人机一体、和谐共存。也就是说,AI作为我们每个人的助手,就像科幻小说和电影里面一样。有问题问AI,让他帮我们干活,我们来做决定,这样就可以了。最终就是AI替代肯定不可避免。只有我们拓宽自己的路子,让自己无可替代,AI才不能替代我们。如果你做的是重复性的一些劳动,那很容易被AI的替代,脑力劳动也有重复性的,不是说脑力劳动不能替代。那么大家看我画的这条线上面是指图灵测试,通过图灵测试意味着AI具有了人类的能力。这条线下面写的四个字是自我意识。根据我的观察和我的理解,这纯是我个人的理解,这也是为什么我以进化论为主题,就是依据进化论的思路,根据我的推断,AI只有具备了自我意识才有可能实现所谓机械飞升,瞬间成神,也就是成为一个机器人,像人类一样来帮助我们解决问题。但是如果它具备了自我意识,那可能就不叫AI,也不叫人工智能了,它可能叫机械智能体或者机械生命。那种情况下,就相当于人类造出了新的物种,它的未来是无可限量的。那就会有新的希望产生。接下来再传承下去,能出现什么样的情况?有可能几百年后远远超出人类的理解。所以未来是无限的,大家还是要拥抱未来,这个时代的潮流不可避免。但是目前我们还处于过渡期,这段时间内还是非常长的,可能几十年甚至上百年才能做到。所以目前大家看我们的情况,deepseek作为AI底座,还不具备AGI的能力,为了让它更加贴近AGI,我们怎么做?我们通过知识库喂给它我们私有的知识,让它帮我们干专业的事。利用智能体技术,让它更聪明一些,能自己干活,最后用程序能让他做一些我们现在这种程序自动化也不能实现的事。接下来是我最近学习AI的时候了解到的一些东西。我是怎么接触AI的呢?是因为用户有需求,现在大量的用户在提AI需求,大家应该都知道吧?这个肯定绝大部分都遇到过,怎么样来做?去除掉行业内的泡沫,踏踏实实的来说,我们目前能做的就是为AI赋能,也就是说帮助AI来打开走向AGI的通道。那么最底下这一层先要做到私有化部署,避免数据外泄,还具备底层能力,但是也仅仅聊天而已。接下来通过我们更好的提示词,我今天也刚解决了一些问题,就是通过提示词,就可以让他精确的输出我们需要的结果。接下来建立知识库,我们用专业的知识输入给AI,它就能帮我们分析专业的事,能帮我们总结出专业的经验来,就不用我们去看大量的资料去总结。人工效率太低,AI辅助后提升效率是很快的。那么接下来要创建智能体,让它独立做事。多智能体协同,就是指它目前还只能聚焦在某些具体的事情上,它不能像人类并发处理那么多事情,那多智能体就是各干各的,大家最后聚在一起形成一个综合结论。同时多智能体不仅可以挂载同一个模型,还可以挂载不同的模型。那么最终所有的模型集成起来,多智能体协同起来,最后由一个模型统一输出结论,就能做到更贴近AGI的能力。接下来为程序赋能,把AI的能力赋给当前的程序,就能大幅提升程序的质量。当然最终的目的我们是要做AGI,让AI自己去做专业的事,我们人类就可以休息,可以去做更加专业的事,或者更加趋向于创造性的工作。目前大家看我们列出来的这些硬件都已经具备了,接下来所谓的通用型人工智能,一旦出现,下一步必然是具身智能,也就是说,把我们的AI大脑赋能给我们的机器人、无人机、机器狗等等。当这些设备具有了类似人类的大脑,它的潜力就会被释放出来,成为我们有力的助手。最后就是怎么走向未来。根据我对AI当前状况的了解,还有对自己经验的总结,结合一些科幻小说,我这里参照了很多三体里面的一些思维和刘慈欣对未来的一些思考。为什么这么说呢?因为我觉得他的一些小说不仅仅是考虑到了未来的可能,不仅仅是一个科幻,而是对未来一个在合理范围内的推理。也就是说,我们很多科幻小说家,可能他本身也是个未来学家,他会推测出人类未来应该怎么样。首先我们是从远古走来的,我们最早所有的都是做人工,一旦到使用了工具,我们就可以了解自然利用自然。使用工具的人类淘汰了没有工具的人类。当下我们创造什么?我们通过机械化、自动化、信息化、智能化实现了知识爆炸。掌握这些知识的人,淘汰了因循守旧,不愿意接受机械化和智能化的人,对吧?不断的在淘汰。未来,新的故事也会不断的产生,新的物种也会不断的出现。未来怎么样在知识爆炸以后确实不知道。但是大家看知识爆炸已经出现了,哪天三体人过来了,恐怕也不是很神奇的事情了,是一个可以考虑的可能的未来。在这种情况下可能会有新的希望。为什么这么说呢?现在都说AI出现之后,文科已死,理科为王。已经不需要研究那么多人类的东西了,写文字AI就代劳了。但我想提示大家一下,如果未来三体人来了,如果未来人类接触到了成百上千的外星社会,是不是需要更多的宇宙社会学家?是不是需要更多的人研究不同文明的它的哲学文化?目前只有我们人类能实现这么复杂的理解。机器目前为止还做不到大自然的精细程度,还做不到大自然的这种用这么低的大脑功耗来实现那么强的能力的效果。什么时候,它能实现了机械生命,才能真正替代人类。所以目前我们远远不用担心机械生命的问题,我们应该做的是利用现在没有形成生命的AI的能力作为工具。因为AI只要不是生命,它就没有自我意识,它就作为我们的工具,可以大幅度提升能力。善于使用AI的人最后可能会淘汰掉没有这种能力的人。然后呢,就是我们是从地球走来的,最后一定要走向宇宙深空里面去。人类从地球发展过来,那么从我们开始探索宇宙的时候,我们就向往飞天。从一开始我们就是走向未来,人类远古就有很多关于神仙的传说,都梦想着往天上走,现在的飞机、火箭、宇宙飞船,都是在实现我们的梦想。 最后就是要走出摇篮,为什么呢?如果在摇篮里出不来,就没永远没有希望。刘慈欣写了三体之后,大家有没有关注他之后写的小说?那段时期,他还写过一个《时间移民》,就是讲我们向内发展AI,未来有可能导致AI,同时也是虚拟现实突破,我们就会向内探索,最后制造出足以媲美现实的虚拟现实来。在那里面我们就是神,要什么有什么,那么是不是会有人沉浸在虚拟现实这个游戏里面出不来了?就变成享乐主义,满足现状,对吧?那么刘慈欣写的这个时间移民,就是说所有人最终变成了虚拟人,最后大家形成了一个统一智能体。这个智能体觉得自己没有意义,就把自己关机了。这就是人类灭绝的一种可能。那么什么样的人类才能最终生存下去呢?就是走向深空,直面深渊,才有未来。后来,刘慈欣又写了一个《黄金原野》。是用一个很凄美的故事,一个造假的故事,以一群探索先驱者的生命为代价,欺骗了人类去向外探索。因为如果不向外探索是没有希望的。人类作为一个诞生在宇宙里的文明,如果不能踏出地球,不能踏出太阳系,踏出这个摇篮就永远没有希望。我们就相当于三体里面,自己把自己封闭在太阳系里面的这些人类,就永远没有希望了。怎么样才有未来?我们作为工程师,永远保持一个婴儿般的好奇心。因为我们人类目前还是婴儿时代。最后人类如果向着宇宙文明去成长,我们目前连第一步还没迈出去,我们未来还是有无限的希望的。这就是我给大家指出的一条很光明的未来,希望大家在未来这条探索之路上,真正走出自己能载入史册的一步。所以未来还长,探索永无尽头,希望大家共勉,希望大家一起走到最后。最后谢谢大家。我这次的分享就到这里。问题1:我看到这个徐景泉,这个刷了好多次了,就是说问能不能举例谈谈,看山是山,看水还是水这个状态。这是我上次讲座里边的一个问题。就是看山是山,看水是水,什么意思呢?比如说我这个技术方面,最开始可能是学网络它就是学网络,学IT就是学IT,我学的是这个技术本身。但是工作时间长了以后,我再看这个技术就不只是经验上应该怎么处理它,而是说在原理上它是怎么产生的,怎么发展,怎么出现的。那我就是把它拆散了,看最后为什么看山还是山,看水还是水?因为当我都理解了以后,我掌握的很精细了以后,在我后续就包括我现在的工作中,当我知道某一个方向的时候,我知道我具备的知识能力,可以瞬间的把它拆成细节,然后一点点去实现。例如我现在处理AI,我遇到有些问题的时候,比如今天我就处理AI某个提示词有问题,导致我们的AI输出一直达不到结果。举个例子,最初提示词说,我有三个输入项目,请AI把以上内容总结出来。它给我一个输出结果是什么呢?它只把最后一个作为输出。我分析了以后,利用之前的经验,发你这个“以上”是不明确的提示词。为什么呢?以上是以上一个还是以上两个还是以上三个?他只处理了以上一个,后来改成,请把以上所有三个点全部总结输出,他立刻就给出了一个合理的效果。这和我们处理软件是一样的。如果我们有软件开发的经验,就会知道工程师处理往往也是这样的。他如果处理三个项目,一不小心就会只处理一个,对吧?只有你指定了它的具体范围,才会把所有的项目都处理掉。所以当我有这个能力的时候,遇到这个问题,我不会惊慌,我会一点点细分它。我看山还是山,看水还是水是什么呢?我大概看上一眼,我就知道我能解决问题,但是我可能在处理的过程中不需要去解决这个问题。我可能在遇到它的时候,我再详细的去分析就可以了。就是这个原因。这是因为我掌握的已经差不多了,我只需要看山还是山,看水还是水,不需要每一次都深入到后台的细节,看得那么细了。我也可以把它掌握到很细致。那么当真正需要的时候,我就可以一步的分析出细节。问题2:最后就是这个资源错位,拿FSE当做测试使用这一块。首先一点,我们的测试工程师是干什么的?测试工程师如果做得非常好,你就是对产品最了解的人。当我们对产品最了解的时候,测试工程师也是有自己的经验的,一定要记住一点。不要认为测试工程师就只是点一点界面而已。我在给咱们华为产品提经验的时候,其实就是这样的以测试主要思想的。咱们华为以前有一次招人,找我面试,我就举个例子,当时那个要求是测试一个产品,硬件产品,请写出三条测试经验。半小时以后我还在写。最后领导看到我写的以后就很惊讶,为什么呢?我写了35条,领导说写三条的都少见,写六条以上的凤毛麟角,头一回见有写35条的。但所有东西全都是对的,为什么?因为我作为一个测试工程师,软件硬件全都做过了。而且我在PC时代,我知道全流程的产品测试流程,包括软硬件兼容性、电磁兼容性、稳定性、摔落测试、可靠性测试等等几乎所有的测试项目。也就是说,作为一个测试工程师,你可以做到一个比产品设计者更了解产品。那么为什么上次我给咱们华为产品提经验的时候,我写了那么详细的一个东西?因为我突然想到以前我做的第一份工作叫新产品开发,就是利用测试经验做新产品定型,我把那个经验拿出来了,以产品定型的思路从头到尾把它整理了一遍。我就把这个产品几乎从头到尾整体设计给做了一遍,所以拿它再去跟咱们研发沟通,就比较详细了。所以呢如果你被当做测试使用了,首先在测试岗位上先把测试干好。接下来你本职工作是什么?不要受你本职工作的限制,不要受领导让你干活的限制。把你这些应该干的事情作为你的爱好去研究,有机会接触的,不计成本,不计代价的去接触。就举个例子,我们有些网络工程师说我是做网络的,我突然让他去做这个项目管理。他说我没有这个经验做项目管理。怎么解决的?我说如果给你一个几个亿的项目,让你去管理,你能不能找一个单位说你这有一个亿的项目,现在我想做项目经理,我给你三十万,你让我做项目经理,让我去刷一刷简历镀金?刷一个经验?那是不可能的事。现在呢公司免费让你做项目经理,你为什么因为网络工程师的限制就不做了呢?如果你做完了,当你更换岗位以后,你的简历是不是镀金了呢?把这份简历拿出去,你想想这个思路是不是拓得很宽了呢?后来我们的年轻人听到这个以后不计成本不计代价,他不管是IT还是网络,还是项目管理,什么都做。现在他已经到了新的岗位,那你觉得他的未来是什么样,对不对?所以这一点呢,不仅是取决于我们面对什么样的岗位,还取决于我们自身的能力,能力永远是第一位的。当你有准备了,一旦有条件,你就可以跳出去,不要把自己局限于当前的岗位,当前的经验和过去的经验里面。跳出条框,你才有更好的未来。 问题3:我这儿看到了有两个问题可答,那我把两个问题综合说一下,一个是这个叫越小勾青山,它是运维磨合期常见的问题有哪些?这个是工程师常见的这一块,怎么讲呢?运维磨合期常见的就是用户不知道自己应该做什么。那么我为什么签名提出这个运维的三个层次?就是以超融合或虚拟化举例,用户做好虚拟化系统中虚拟机的管理,然后做好硬件日常的巡检,有问题及时报告,那么我们的工程师去调整他后台的系统。因为修改整个系统配置,一般必须对系统非常了解才可以。那么我们实施工程师经验是最丰富的。最后一旦有了问题,找厂商。用户磨合期最常见的就是自己该做的工作做不好。比如虚拟机的处理、tools的安装,然后操作系统的安装应该怎么做?这个一定是用户把自己负责的这少部分工作,首先售后工程师客户该负责的工作分清,给他讲一遍,他一定要自己做几遍,出问题你指导他,才能把这个磨合期度过。一定要自己亲自经历几遍。无论是我们自己的工程师,还是客户的工程师,都要走过这种学习过程,这是一致的。他经过了这种错误的经验,他才能记得住,才能真正的掌握。一般这种虚拟化要磨合半年到一年,然后基本上他就找你的很少了。你就真正解决一些复杂问题了,这是一个。问题4:然后最后一个问题是。就是35岁搞算力方面的,那么我看这是有几个人了,就是问高斯数据库怎么样?数通35岁,什么数通IE怎么转型,包括deepseek。要减肥的红烧肉也有了,将这些综合到一起,我答一下。Deepseek这一方面我也在从头学习,正好是有需求。如果没有需求,你还要去做的话,类似无源之水。尽量是找到一些项目的机会跟进一下。这个又是从零开始学习,活到老学到老。我现在跟大家一样,都是从零开始学习,但是现在已经有一些心得了,那么未来还会学更细的一些东西。能学到多少取决于自身的能力。然后这种高斯数据库,包括咱们华为的鸿蒙系统,欧拉系统未来无限,因为国产化浪潮不可避免,对吧?Deepseek也要布在华为的体系上才能国产化。所以大家可以尽情的去学我们的认证,考我们的IE。然后在我们这个方向下,协助用户做好国产化转型,我觉得未来还是很有希望的。我的分享就到这里。
【干货分享】技术岗如何少走弯路
分享主题:刚才加入直播群,看到留言问少走弯路的含义是不是直接去当保安呢?(因为业内流传,中年失业,常见的职业选择包括保安、保洁和保姆,这些职业被称为“吉祥三宝”。)今天要分享的就是解决这个问题的思路,就是我们如何避免中年失业去当保安,争取一路走到技术的终点。 我准备按照如下五个标题来进行分享。 我的社区昵称是蓝色空间,今年是工作第20周年,这是一个很有意义的年份,所以第一点给大家做一个20 年的工作总结。 第二点就是分享我这20年的晋级之路。作为老一代的工程师,我是八零后,而现在年轻一代很多是零零后的工程师。也就是说,我们新老工程师之间可能差了整整一代人。我们这一代人当前面临的问题就是传帮带,如何能让工程师梯队持续的发展下去、继承下去,实现我们的人生价值。 第三点讲中年危机。我们这一代已经人到中年,在35-40岁左右,中年危机到来,尤其IT行业,工作的生命周期比较短。如何在未来20年继续保持自身的价值?我会分享自己的思考,希望年轻人们能够借鉴一下,少走弯路。 第四点讲人生半路的风景和思考。40岁的人生基本过半,此时所看到的风景和年轻时完全不同。我们都经历过年轻时代,现在到半路能看到什么?提前分享出来,有助于大家少走弯路,能尽快找到自己的方向。 最后第五点,就是我自己的思考,传说、故事以及神话。后面分享过程中再展开,先留个悬念。 一、一份二十年的工作总结第一件事是破题,为什么要破题?因为如果不做解释,那大家就会想是不是直接去当保安了。作为一个普通劳动者,我这20年没有得到过名利。也就是没赚到大钱,也不是很出名。(最近在咱们JDC社区里有些成绩,但这其实是工作经历带来的一个必然结果)虽然前几年很多人站上了风口,瞬间实现财务自由,看起来赚钱容易,其实很多人仍然靠工资养家,我也和大家一样是普通劳动者。这20年里我一直和大家一样,在做着普通的一线工作。这些经历分享出来对年轻人可能用处更大。对我们这代人,我也有些话想说,因为身边很多人也遇到了中年危机,我的经历也可以提供些借鉴。少走弯路的意思,就是认定方向一往无前,向着自己的理想前进。我是对计算机技术感兴趣,才进入了这个行业。至今持续20年没离开这个行业已经非常难得。我的同学们大部分已经离开了这个行业。我会向年轻人们展示我走的路以及相关思考,希望年轻人能够一路走下去。 第二部分就是:人生多种多样。有的人是站立潮头做冲浪者,例如背景图片这个冲浪人,比喻名利双收。举例就是各位首富、企业家、一些业内的专家等,他们一般是名利双收。另外还有人是协助他们,自己也站上风口当着浪花,这些人大多财务自由了,或者是有了一定的名气,不必操心工作稳定性的问题,不会有中年危机。这些人我把它比喻成浪花,例如企业里的高管及股东。 而我们绝大部分人,只是托起浪花,做了大海里的水滴。但是想要冲浪,必须有大海,必须有千千万万的水滴。冲浪的人要的是面子,我们这些大海里的水滴,就是他的里子。没有里子,面子是站不住的,也是无法冲浪的。借用小说《三体》中的名言:我们即使是一颗水滴,也可以发动末日之战!普通劳动者仍然可以发挥出难以想象的作用。所以不要妄自菲薄。 接下来是我的工作总结。在这20年里经历了很多工作,前10年工作变动比较频繁。最初是在研发方向的软件和硬件测试工作。接下来是运维,最后转到现在的售后工作,至今持续10年。所以工作经历比较丰富,可以给大家分享一些经验了。 另一个方面,经历过的企业类型有外企、私企、中外合资、还有国资控股企业等。体制内和纯国企的工作,目前还没经历过。 技术方向上,有PC和服务器的硬件制造、网络安全、数通、企业级的IT设备、存储、虚拟化、超融合、云计算等等,工作经历长短不一。但在每个岗位时都会以专业的态度把本职工作做好。这一点很重要,后面会展开谈。 接下来是20年的成长历程。第一步:看山是山,看水是水。这里借用了佛教禅宗的说法。为什么用这种说法?因为在工作后的一至三年,通常先照猫画虎学会工作内容。然后是在工作中学习,再不断积累经验,然后才能成为一名合格的工程师。某些岗位一年即可,少数岗位可能要三年左右。剩下的就是重复性的工作。第二步:看山不是山,看水不是水。如果我们积累了基本的工作经验,再继续干下去,表面的工作往往已经掌握,接下来就是工作中的细节,会不断的积累,遇到越来越多的困难,解决越来越多的麻烦,处理越来越多的难题。在这个过程中,我们就不断积累了经验,接下来发现熟能生巧。三年以后工作熟悉了,绝大部分人会产生职业倦怠。我当年也是跟普通人一样,因为都是普通劳动者。有些人3~5年期间就开始换工作。第三步:看山还是山,看水还是水。随着经验的不断积累和不同岗位之间所学知识的融会贯通,如果我们能不断的去提升自己,能够做到主动学习,并坚持下去,在某一个时间点,我们就会有所突破,有所感悟。一旦达到了这个突破点,就可以将自身的经验融会贯通并串联起来。此时会形成自己的独立认知,同时思想自成一套体系。这时就可以利用这套体系向各个技术方向去发展,并能做到主动选择自己未来的发展方向。刚刚群里问我们能否一劳永逸的认定方向?通常这种问题指的“认定方向”,不是一个具体的技术类别的方向,而是认定了我们要在技术领域成为专家,就专心去发展,在现实中具体工作涉及的技术领域也可能要不断的变换,就如我之前的工作经历一样。后面会给大家逐渐展开。 个人的提升路径,这里以我所在的售后行业为例,其他行业的从业者大家可以做个参考。一般在第一年,做到初级工程师,主要是打杂的,做些初级工作,然后跟着前辈学习。中级工程师一般就可以独立干工作了,基本独当一面,某个项目交给你,基本可以去独立完成,或者带一些初级工程师做帮手。而高级工程师可以独立做规划、项目实施、做一些比较复杂的项目,可以带着一些中级和初级工程师一起完成工作。专家级工程师负责干什么?干最难的工作,一般是救火队的角色,哪里有问题解决不了,就去哪里。哪里的工作领导最不放心,就派专家工程师去哪里。最后这个业内专家的层次属于比喻,目前我还没到这个层次。图例中蓝色的部分,是我目前已经经历的阶段,黑色的是还没走到的。所谓业内专家,一般是快退休之前,可以不用干一线的工作了,更多是指导年轻人改善自己的不足。 有些人退休后也会参加一些项目评审,项目验收等工作。我们做项目时也遇到过这种老专家。如果希望成为这种专家,退休后还能发挥余热,无疑是工程师方向一个很好的终点。二、持续二十年的晋级之路接下来看看我这20年的路,希望给大家一个借鉴,同时回应刚才的问题,就是我在刚开始工作时是怎么做的。 我的前10年工作经历:绝大部分人的工作历程是第一年熟悉工作,接下来两年重复第一年的工作,接下来第三年,如果换了工作,就又重复之前的熟悉新工作的历程。有些人可能三年换一个,反复换了很多工作,有些人可能一两年就换工作,那就连熟悉工作都做不到。如果说三年到五年能坚持下来的话,那一般就对当前工作很熟悉了。那么我的历程是什么样?其实我的历程和左侧列出的差不多,平均下来大概也是2~3年换一次工作。但是现在回头去总结,当我突破了以后,我当年的做法跟其他的普通人有什么区别呢?只有一个很细微的差异,就是我是基于爱好来做的这份工作。当我上大学选择计算机专业的时候,是基于对计算机的热爱。毕业以后,选择进入这个行业,选择相关的岗位。计算机专业在当时是只有一个专业的,不分具体细分的方向。在我们毕业的时候,也就不分方向,有相关的岗位都可以应聘。在这种情况下,基于学习经验,以及自己的爱好就选择了相关岗位。我在工作中就会逐渐的学习、了解,积累经验。然后在第三年,绝大部分人厌倦的时候,我还能坚持下去,发现新的一些东西,探索一些别人不感兴趣的知识,积累属于自己的经验。因为这同时也是我的业余爱好。这样我就把爱好和工作经验结合到了一起。这段时间内我默默的积累了比别人更多的东西。当时自己是不太清楚的,只是觉得自己跟大家没什么区别。再看页面左侧,接下来别人可能重复了上两条,换个工作,继续重复。而我在换工作以后,还在这个行业里,但是可能从硬件测试到了软件测试,岗位的方向也从IT变成了网络,或者又变成了安全。回头来看,我不管干什么工作,毕竟还是在计算机这个大方向里,还是在摸索属于自己的路。在每隔几年换一份工作的经历当中,有一些是企业倒闭,不得不换,有一些是企业裁员,还有一些是遇到了不太匹配的岗位,知道在这种岗位干不久,那么我积累几年经验差不多了,工作该换就换。当时虽然比较年轻,但是我默默的积累的东西比普通人比同龄人要多一些。它的作用当时是看不出来的,在哪儿能看出来?我们接下来往下看。 前10年工作里有什么案例来说明这个作用呢?例如我在做硬件制造的时候,发现了有一次良品率太低,当然这个良品率低不是我发现的,是整个生产线都发现了。发现之后需要找出证据。当时我领着我们组员测了好久,然后最终找到了这个证据,找到了证据之后,发出了我们那个企业自成立以来第一次的停产提醒,也就是说,让生产线及时停产,冒着不能及时交货的损失风险停产排查。停产之后,依据我们学过的知识找出了证据,发现了一些重大缺陷。这些缺陷的发现,让我们及时避免了在交付之后造成更大的损失。也就是说这个工作并没有白做。当然这个案例的细节涉及我们业内的友商,所以在这里不谈具体细节。这是我毕业之后的第一个工作。也就是说,我毕业之后的第一个工作已经直接进入“地狱模式”,是经过地狱模式的训练走出来的。当时无论是工作强度、工作压力还是我面临的问题全都比较大。那么当我们经过了这个模式的锻炼,那接下来其他阶段的普通工作就不觉得难了。后续换了软件测试方面的工作,在实习阶段,找了产品的bug。这个说起来也很简单,刚入职的时候,熟悉工作阶段需要测试产品bug,目的是要运行一下测试用例。但是这个用例当我全部执行了以后,我就发现了几个产品的bug,这个bug持续了好多年。如果之前进来的这些年轻人,在我之前的前辈们,有人能把所有的用例执行一遍就能发现。这说明什么?这说明即使是我们年轻时候,我们也可以不唯上,不唯权威,不完全迷信我们的前辈,而是用我们自己的眼睛去发现问题。如果你形成了这种科学的习惯,那么就可能在自己的工作中做出一定的成绩。此时不必考虑前辈们是怎么执行的,大胆去做即可。 接下来的案例,是在项目实施过程里,因为我经历过PC制造岗位,PC制造里面OEM软件的预装,是一个专门有部门负责的。这一项工作当时都是派人去系统厂商培训,比如装windows是派人去微软专门学习的,学习了之后,回来才能搞出一整条生产流程。后来我又换了工作,已经不做pc制造了,但是碰巧有一个项目要装上百台PC机。那最理想的状态是做成OEM制造的那种形式,否则我们自己一个个安装系统,产品的良品率就太低了,操作系统安装完后会发现各种各样的问题。当时我就把这个工作接下来了。接下来之后,因为之前做制造的时候,这个流程我只见过,但并不了解里面全部的流程。因为这个是一个商业机密,一般人家不公开。当时是windows 7出现以后,官方有一些给合作厂商的英文的OEM文档,可以随着某些版本公开。我是基于这个文档,把整个流程重建了一下,利用这种预装技术解决了这个问题。其实我们那个企业跟和PC的OEM产完全没有关系。说明在那种情况下我已经不自觉的在用以前的经验在补充当前的工作需求。但是那个时候还体会不是很深,因为还没达到突破阶段。接下来的案例就是项目实施里面有一个独立的虚拟化环境,需要从头创建,创建之后还要搬迁,还要扩容,还要一部分扩展成两个独立的部分,还有公有云运营等。那时虚拟化和云计算概念还没有完全流行,是2010年-2011年左右。当时我和同事,两个人从零开始摸索创建虚拟化环境,并且摸索了如何进行搬迁,扩容改造等。我们从零开始一直到能随意的去安装、改造、调试。从这里开始,我们就把这套流程打通了,后来也带给我现在的工作很大的帮助。 接下来看一下我在第10年到第15年的经历。这里左侧的所见所感就是常见的历程,一般在第10年到第15年里面持续循环,或者就放弃岗位了。比如转去管理方向,开始往上爬了。谁都知道,留在工程师岗位,可能前途不是那么好,赚钱也不多。那么就会逐渐往其他岗位转。留下来的觉得没有前途,有些人可能就学会摸鱼了,认为混到差不多退休就可以了。但是前些年还没有像现在这种裁员风暴或者是金融危机,大家还想不到会被裁员,只是觉得在企业可以一直混日子,可能有些企业会给自己养老。那个时候企业的待遇普遍也都不错,也还缺人。 不过仍然还有极少数的人可能还会再继续前进,继续摸索一下新的技术。其实到第10年甚至15年,大家对自己的工作已经非常熟练了。这种情况下还能继续保持一个所谓赤子之心,或者说保持着像婴儿一样的这种好奇心,能继续探索的人实在是太少了,除非你有强烈的这种热爱。也就是说,对这行业有强烈的兴趣。我正好是这方面的人,为什么呢?其实说来简单,因为咱们的出身都很普通,家里没有太多的钱,有钱的人玩什么?可以玩赛车,可以玩飞机,可以玩很多就是机械类的东西,花很多钱的东西。上流社会可以养马去。但是我们那时买一个电脑就已经很不容易了。读了计算机专业买电脑是必须的,当时可能是花了不少钱买电脑,然后再去学习。我当年是从90年代末开始买的,正好赶上中国和国际互联网开始互联,从最早的电话线拨号上网开始,然后一直到宽带链路,然后一直到现在,我们可能千兆几千兆的光纤带宽都有了。最早可是64kbps,当时还使用调制解调器通过电话线拨号上网。当时是听声就知道我的调制解调器是否正常工作,而且带宽低,打开一个图片都要很久。当开始连入互联网,我们的机器就不是单机了,就打开了一个新世界的大门。2000年前后的年代是黑客精神最后一个大流行时期,讲究的是无私的分享。那个时候。知识分享的精神都很足,大家也在不断的去做各种交流,能有很多志同道合的网友。通过一个电脑能接触到全世界的人,能接触到很多科学方面的东西,这个带给我们的诱惑是很大的。如果没有这个渠道,我们作为一个普通人,没有钱也没有那个能力去走遍天下,读万卷书,行万里路。那么我们可能没有办法做到像现在这种工程师的岗位,或者说也难有现在这种开阔的眼界。在当时我们可能是领先普通人接触了广阔的世界,很多人已经在网络上开始逐渐的发挥自己的能力了。在第10年和第15年当中,因为我有当年的各种爱好,所以导致我干了现在的这种售后实施工作,从研发方向转过来了。转过来之后,这个工作从当时一直到现在干了10年。为什么持续了10年?(而且可能未来有机会,我还是想继续干下去。)因为在这个时候,我发现我之前积累的经验,终于找到了用武之地。而且我之前学过的所有经验,所有的岗位正好完美的匹配我当前岗位的需求。当前我干的工作内容越多,我以前的技能用的也就越多。最后我可以拿我自己的经验反过来去弥补我当前岗位上的不足。我能做的事情,比公司给我的要求,比这个岗位给我的要求,甚至比客户给我要求还要多得多。那么我在这个岗位上做的,就可能是在一般人觉得这个岗位很辛苦的情况下,我做起来可能就不是那么辛苦。 因为很多东西我已经积累好了,我掌握的一些经验可能比普通人多一些,那么做起来工作就容易一些。接下来,当熟悉工作之后,你会发现之前的工作经验全都能用的时候,就会觉得当年没有白学。从这里就能看出,当年坚持下来的意义所在。如果不想现在的工作白费,就一定要选好自己将来的路。将来的路怎么选?往后我继续给大家解释。在这个阶段如果你已经开始汇集了各方面经验,其实就说明你已经在找自己的方向了,接下来就是怎么样找到自己的方向。我看群里有些人说精力跟不上,对新知识的接受能力也没有那么好。我要说的就是我们应该学习像婴儿一样,保持好奇心,不断去探索。为什么这么说?借用小说《三体》的说法,我们人类在这个地球这个摇篮里面,仍然还是婴儿。如果一个文明想要真正成长壮大,一定要离开自己的星球走向宇宙,突破自己的星系。那么在这种观点下,我们当前的人类仍然是在婴儿时代,我们掌握的这些科技是远远不够的。如果我们要走向星际时代,还有很多路要走。我们这些人,其实只做了很浅显的一些基础的准备工作,有更多的工作,等着我们的子孙后代再继续进行。我们没有理由不给他们做出一个榜样!我们很多科学家,我们很多老院士可能是70~80岁了,还在努力的去燃烧自己,还在把自己的经验拿出来,分享给大家,然后积累新的经验,搞新的研究。我们不一定要做成科学家那种程度。但是我们作为一个工程师,为什么不能把自己的职业生命燃烧的更久一些?这种燃烧取决于我们能做哪些事情。我们的精力可能不足,我们的身体的状况可能不如以前那么好,但是我们可以在这种情况下降低一些工作强度,我们能发挥出来的方向,去发挥出我们的经验。这个时候就取决于我们怎么看。所以接下来我给咱们这些中年的工程师们也准备了一些内容。讲的是我到20年的时候,有了一些突破,这个突破之后是什么样的?给大家展示一条我走过的路,看看能否从中得到一些关于自己的指导。先说10-15年经验,售前、售后、项目经理等,需要什么技能都可以自己练习,自己的工作已经不是问题了,这种情况下,也不需要去考虑太多。我跟我们的年轻人一直在讲,如果我们希望公司留我们不裁掉,应该怎么办?企业如果给你1万块钱,你干的工作至少要能挣2~3万才可以,否则这个成本都不够。如果我们自己是老板,我们希望找什么样的工程师,我们愿意给他多少钱呢?这时需要换位思考,知道老板需要什么。也就是说我们给公司创造的价值,一定要远远大于我们拿到的工资,你才有不被裁掉的价值。否则连所谓的受剥削的价值都没有。有些人就觉得摸鱼划算,你给我多少钱,我就干多少事。你给我10000的钱,我干8000的事,你给我8000的钱,我干6000的事,这相当于占公司便宜了。但是我遇到过很多情况,客户说这个工作正常需要10000,我给你20000,你能不能干?这种可能都是常规手段解决不了的问题。那么这种摸鱼的工程师,一般会说这个我肯定干不了,因为没经验不敢承担。其实只有你平时需要什么练什么,不计报酬的提前练好了,你才是有准备的人。这种情况下让你干什么困难的工作,你就会说我已经准备好了。我给年轻人讲的另一个思路,就是没有金刚钻别揽瓷器活。这个疑难的工作如果你答应了去做,就一定要有绝对的把握去干,绝对不要打没有把握的仗。没有把握的情况下,仍然去答应人家,那绝对是自己挖坑往里跳。怎么样才能有把握?这就要平时在其他的工作里面,已经提前练好了,需要的时候就能上,这个钱就只能你挣。不管是我们私下帮人去处理的工作,还是说我们公司的任务,这个工作别人做不到,你能不能上,你能上就给你奖金了。为什么我之前说工作的时候要聚焦做最难的工作,这就是平时我在工作中已经积累好了,那当领导问这个最难的工作你能不能做的时候,那我就义不容辞,直接去做了。既然我干了这个工作,基本对我来说应该是轻车熟路了,就可以顺利解决问题。或者说即使我不熟,我也知道怎么解决,我可以一步步的在可控范围内把它尽量做到最好。有时是没有最佳选择,谁上去干这工作就需要承担对应的风险,我们有能力的情况下,该上就上,当仁不让。如果你能这么做的话,你觉得领导会不会看重你?你觉得如果裁员的时候还有没有你的份?如果你被裁了,你会不会担心找不到工作呢?每个人有自己的路,大家可以在走自己的路的时候,可以想一想我说的话。当然我分享的是我自己的路,而不是通用的万能的经验。所以每个人听到我的经验之后,建议大家按照自己的想法去选自己的路。 接下来是了解产品在全生命周期以内的使用。如果我们的工作都不能干满五年,很多IT产品,例如华为的一些服务器,存储等产品,它的正常生命周期是五年到10年。这种情况一般五年左右,就能见到一轮生命周期,10年左右,就能见到两轮的生命周期。这种时候,如果我们和客户不断的保持联系,就能知道在全生命周期下他能经常遇到什么问题。如果经过两轮了,那有些问题就轻车熟路了。我的经验就是经过这几轮之后,平时常见的问题能总结到80%,此时我们只需要用20%的精力就能覆盖80%常见的问题,剩下那20%可能需要成体系的去处理。我们只要覆盖这80%就能应付绝大部分的场景。在用户端,我们这种经验带来的就是不一样的体验。第三点就是在工作中积累各种细节,将已有经验反馈给用户。我将别的用户的经验积累了到下一个用户,同时会把我的最佳实践不断的去完善。咱们华为有一个最佳实践的场景,很多产品里面都有,在最佳实践里面会推荐特定场景下建议你应该怎么做,这是比较好的。我作为一个工程师,在这么多年的积累中,会进一步完善它。这个最佳实践是厂商推荐的一个通用的思路,而我基于不同的用户,能总结出自己的最佳实践。针对特定的用户进行优化。通常这个优化后的最佳实践它的范围更窄,适用性更窄,但是它的效果也更好。然后当积累达到一定程度的时候,再去解决客户的问题,就可以做到一句话即可解决问题。比如说我们很多情况下搭一套超融合,搭一套虚拟化这类复杂的系统。搭完之后,甚至初始用户会要求派人驻场来解决日常问题。但是到后来驻场这个话可能就没人提了,就是因为但凡客户问到常见的问题,我基本上能做到一句话解决问题,直接告诉客户,请帮我去确认系统的几个状态,然后可以根据情况直接告诉你这个问题的原因是什么,应该怎么做,思路是什么,在运维过程中应该怎么办等等。然后按照我说的做,只要操作一下问题立刻解决,完全不需要一个专人在现场去处理,也完全不需要天天找400。这是我们工程师的价值逐渐的在体现出来。我们10年8年的积累,这个时候价值就出来了。 接下来就是我们开始具备系统的整体的架构思维。既然能一句话解决客户的问题,那说明整套系统架构都在我脑子里了。无论客户想怎么变怎么改,我都是一个系统化的思维来应对。这里拿维修电脑举个例子,可能有些人修电脑,有一个独特的修复系统的经验,重装系统还有一个独特的经验,他会记很多这种经验,记录在本子上,然后遇到了问题就去查这个小本子。他会认为这个经验是我自己独家的,我绝不告诉别人。通常我和这类工程师聊天时,我会直接提醒他,如果你本身只有半瓶水的情况下,你就不要敝帚自珍,把这种自己的点滴积累当做多么了不得的秘诀。因为道理很简单,如果别的工程师和他是同样层次的技术能力,他能总结出来,别人难道总结不出来?所以在这种情况下,他自己珍藏的这些东西只能对技术不如自己的人保密,比他强的人可能经验更丰富,花些时间也可以独立总结出这类秘诀来。如果我总结出成体系的经验后,去处理疑难问题的时候,我是成体系的,我一定会找出它的原理是什么,解决思路是什么,一旦处理问题,不管现象怎么变,我都能基于原理,把问题给解决掉,而不受限于具体方法。那类工程师的方法就像走路一样,方向不同,处理方法就有很多不同。而我就直接基于终点的情况从原理上找到最佳的路径。两种思路的成本和代价也完全不一样,这两种工程师的思维方式和得到的收获也完全不一样。大家可以自己看一下想要做什么样的工程师。 最后就是具备规划能力。在很多项目里,最初可能复杂的项目必须由厂商进行规划。如果我们有了自己独立的成体系的思维,我们的规划已经可以在厂商的最佳实践上面进一步优化,这种规划可能优于厂商的通用规划。我们在某些项目里和厂商一起做规划的情况下,我们会给厂商提建议,基于这个客户,建议进行对应优化,或者做一些改进。把我们的能力反馈给厂商,反馈给客户,争取达到更好的实践效果。所以刚才提到我在JDC社区里提了一些产品的日常调研,还有产品的改进的建议,大家明白为什么了?因为我们在长期的工作中,已经积累出了一些自己的经验,我们就能把客户的一些需求和痛点,通过向研发团队的反馈来解决掉,回过头来直接满足用户的需求。这就是我们的切入点。这种提建议,或者是反馈,并不是无的放矢,而是我们基于已有的积累来提的。这是我们一线工程师的价值。从工作的第10~15年开始,在公司里面凡是有公开的讲解、答辩等,我都要做一件事,就是一定要让领导们和同事们知道,我们15年到20年经验的工程师和3~5年经验的工程师有什么差别?同时也是提醒我们的企业,一线工程师是对项目了解最多、最贴近用户、最了解真实需求的人。那么当我们了解到实际的需求,就能真正的了解用户的情况,也就能真正满足用户的需求。这里有个比较极端的案例。我只说大致情况,涉及一些客户的具体细节就不谈了。就是某一个项目,当时可能项目快丢掉了。当时我是作为一线工程师,基于对客户真正需求的了解,基于对所有的产品,包括咱们的,包括友商的,所有的了解,当时通过自己的努力,这个项目最后又拿回来了。当然这不完全是我自己干的,是配合着销售完成的。当时销售人员根本接触不到所有的信息,而客户的领导们是在我眼前聊相关情况的。我当时知道客户的需求和痛点,所以就针对这些痛点说了几句建议,把自己对现场情况的了解结合自身经验反馈给客户。当时领导们就明确了自身的需求,然后再去咨询各方面,发现跟我说的一致。当时我自然而然的就做到了引导客户需求。虽然这个案例是一个偶然事件,但在那以后,我发现一线工程师的价值远远不只是干活那么简单。因为在我们这种体系内,做实施的售后工程师,往往是接触客户最多的,其他的包括售前、销售等人员接触的最终客户不是特别多的。一线工程师往往能拿到一手信息。如果及时反馈,大家一起来满足客户需求,往往能真正的解决客户的痛点。它的效果远远比咱们按部就班的去做销售要强得多。第二点,也是我的经验,就是在一线项目实施过程中需要实事求是的去处理问题。如果我们做到了,我们就能迅速提升客户的信任度,这是非常重要的。如果售后的服务不到位,比如说400处理速度慢了,客户会不满;产品有bug影响业务,客户也会不满;实施有问题业务不稳定,客户还会不满。但是只要我们一线工程师在现场,遇到了问题,就可以直接告诉客户,有问题我们就能处理,而且有厂商的体系支持。那么客户的所有不满都会被咱们工程师带来的情绪价值给抹平。只要我们能处理掉问题,客户就不担心。只要我们工程师在这里,客户就可以放心使用这些系统。有些客户会问,你这个系统实施完了这么复杂,将来运维怎么办?我总结出来经验之后,就会告诉客户,这个系统的维护是分三层,第一层是客户管理员了解管理员指南里边的基本操作。通常都非常简单。售后有整套体系,客户有问题可以找集成商,再加上我们售后工程师,可以随时给客户进行支持。如果是部件问题、故障件更换以及更复杂的问题需要研发处理,可以去找400做售后支持。售后按照同层次成体系进行支持,就像打仗一样,靠体系去弥补某一层次的不足,然后靠体系去支撑全生命周期产品的售后。这样才能达到产品规划中的稳定性和可靠性。如果我们能达到调动体系支撑客户的程度,客户的满意度和对系统的放心程度是绝对不一样的。 接下来是积累到10年经验以后,我们会发现些额外的经验,它带来的附加价值远远大于3-5年。因为很多公司招聘售后工程师,通常认为性价比最好的工作时间就是3~5年。因为这个时间对工作都已经很熟练了,将来可能会换个工作继续干。那在下一家公司就直接达到了成熟的程度,此时大家会觉得这种人的性价比是很高的。但是作为一个老工程师,我也给很多企业提醒一下,我们一些年纪更大的具备10年,甚至20年经验的工程师,我们如果做好了积累,做好了突破,就能发掘出更多的附加价值。此时能做到的效果就远远大于一个普通3-5年经验的工程师。也就是说,这种时候我们的工作已经不只是基于工程师视角,而是可能基于项目经理的思路、基于系统规划者的思路、甚至是基于客户运维组织者的思路去帮助客户赋能,从而达到客户需要的效果。那么10年以上的工程师,需要的是经过各种锻炼的,如果一直过平静日子,那技术的价值一般是没有提升的,这种工程师即使工作很多年,其经验及能力和3~5年时没有区别,竞争力也远远不如3~5年的工程师,因为二者的能力是一样的,但是老工程师的性价比通常比较差了。这也是中年危机的由来。如果说我们不能突破,没有更多的富余的价值,我们把自己的性价比降低了,那在这个适者生存的环境下,在经济下行的趋势中,我们就没有竞争力。 接下来看一下我的突破第15年到第20年,很多人到这个时间就该转岗了,因为中年危机的到来。 35岁、40岁以上危机更大,身体也不行了,那么改变发展方向,售前售后什么都开始转了。有些开始搞钱,有些开始图利,有些开始考虑地位。少数失业的就去做保安,保洁这种工作了。还有些直接就进入体制内躺平,逐渐学会摸鱼,只有极少数继续前进。我是属于继续前进的那种,因为我连摸鱼的资格都没有。这种时候,每个人经验都不一样。我是在第15~20年,因为工作的历练,我们这个行业工作时往往是一个人去干活,一个人就要兼项目经理、负责现场协调,很多东西都要兼职去做。那么时间长了,复杂的工作干得多了,某一天我就发现自己有所突破了。这种突破,就像群里说的是境界的提升。这种境界的提升怎么比喻?我借用弘一法师的一句话,这个境界就叫华枝春满,天心月圆。什么意思?为什么说是一个境界?以前换工作比较频繁时,我觉得我干了很多不同的工作,如果现在我们去一些互联网大厂,去讲这些工作经验,人家的背景调查就会问你,为什么隔几年换个工作,是否不能安心做当前的工作呢?但是现在我就会告诉面试官,那些经历都是为了突破在做准备。 好比当天全黑,什么也看不清的时候,你会觉得黑暗里什么都没有。而当天上突然一轮明月出来照耀地下,如同白昼,当看到一切都特别分明的时候,你会发现周围全是树,树上全是花,花落之后全是果子。也就是说,之前干过的所有的分支工作,都是开出的花,最后终于还会结果的。一旦到了这种境界,把什么都看清了,就会有感悟,就会有突破。所以每个人的经验是不一样的,我是碰巧遇到了这种情况。之前所有的工作经验,这个时候境界就叫百川汇集,奔腾入海。也就是说,我已经是一个河或者是海,我可以把我以前的经验都汇集到一起,不分彼此。那么这个时候看山是山,看水还是水,但是这个时候我在山水之间来去自由。无论是在这个行业,还是在其他行业,当我有了突破以后,境界是完全不同的。那么在这种情况下,无论干什么,我都不会再给自己限制了。大家记住,在这种情况下,你不要把自己限制为一个工程师的角色。假如我们能做的远远超出一个工程师,我们能适应的岗位就宽得多了,这是我们能力决定的,而不是过往的经历决定的,不要困在过往的经历里。 这个时候我们可以怎么办?重新出发,从头学习,融合所有的知识,提升事业。此时再学习事半功倍,境界不同学的东西也不同,能达到的效果也完全不同。 接下来就是我在工作里的案例首先是全生命周期思路,现在无论是做规划、售前、实施、售后、运维,包括扩容、升级,还有老产品的下线换代,我们都已经可以基于工程师的角度,为客户总结出完善的经验来。在面对客户时,这一套东西如果客户不知道怎么做,我们可以直接送他一个规划服务,送他一个咨询服务。如果有这个能力,这些工程师能不能转去做咨询呢?大家自己应该心里有底。然后前进方向遇到火坑,我已经可以做救火队,我已经可以将有些坑填平,然后继续前进了。当然,凡是遇到这种熔岩深坑,仍然要躲开它。填不平的坑,不要跳,要果断的躲开。在我们年轻时候,得到的一些经验或者是别人教导是告诉我们有坑,不要跳,直接躲开。但是总要有人去填平一些坑,去解决一些疑难问题,去继续前进。当我们积累到这种程度,有这个经验,当我们的公司需要我们工作时,绝对是义不容辞,该上就上。这个时候如果还不上,就像我后面说的,人生已经走到半路,即将告别这个行业,这个时候我们再做不出成绩来,似乎这个能力就白白浪费了。既然有能力,还是能发挥出就发挥出来。如果在这个行业发挥不出来,就在别的行业发挥出来。我们总不能让自己的人生交上白卷。 接下来,项目遇到疑难的管理问题难以推进怎么办?这个案例是也是一个现成案例。当时集成商和客户都没有专业的人。我到现场作为硬件的供应商的工程师过去的,现场还有软件供应商的工程师,其他都是各自的厂商,但是现场没有人管怎么办?那就利用自己的这种项目管理经验,当时和软件的工程师,两个人聊了一下,把最佳实践沟通好了。因为大家基本上都是这个行业的,我的最佳实践也包含了他的内容,他的最佳实践也都能和我对接。我们一起把行业最佳实践对接了一下,就在没有任何专业的人以集成商身份进行指导的情况下,我们自行把这套项目就给直接推进并完成了,最后的验收也没有任何问题。因为我们是按标准的项目交付来做的,客户按任何标准来验收都没有问题。一直到最近听说现场后来管理有点乱,有些连线乱掉了。但是因为当时做了足够的双冗余,这套系统建成,现在大概也有好多年了。一直在稳定的运行,没有出大的问题。这就说明我们的价值能体现在项目中。另外,产品功能如果不能满足客户需求怎么办?我们提个建议改进了再继续实施。现在我实施的所有产品,之前全部都提过建议,很多建议去年提的,今年已经落实了。这一方面呢也非常感谢华为。 接下来是在第15年到第20年里边的价值提升。在这个阶段里,对自身负责的技术方向,我们有了深刻的理解。在不同的层面,可以协助公司做好工作,可以拿我们自己的经历弥补公司的不足,以及业内的常见问题。包括有一些实施过程中遇到实现不了的困难情况。我们能不能自己去弥补一下,然后让项目顺利推进,也给客户带来更大的附加价值。 最后,持续的一线工作让我们能了解更多新产品新思路,当我们给客户介绍产品时,已经不是单纯展示产品能满足你的某个需求的层次了,而是如果客户的需求不太成熟或者超出了产品设计思路的情况下,我们会结合产品的设计思路,跟客户宣传我们的产品体系目的是什么?能达到什么效果?能怎么样能使IT系统更完善,怎么能解决客户的痛点,应该以什么样的思路来处理IT系统,而不仅仅是依靠某些功能点去做选择。因为有些功能可能是客户不需要的。当我们把这套体系描述清楚以后,往往会引导客户按照体系来执行,也就是按照产品设计的思路来执行,额外的一些功能,就可以直接给pass掉。这种情况下就能帮助我们的销售迅速的扭转一些销售时的不利局面。 当我们更了解客户需求的时候,我们可以引导客户需求。当然前提是基于我们的实际经验,基于科学的原理,而不是说基于卖产品的思维,不是我卖什么引导什么,而是基于客户真正需要什么,我引导什么。 接下来就是协调厂商的体系,为客户提供服务。我们在现场是能听到炮火声音的指挥官,那就可以帮助用户来解决实际问题。做技术专家就是我的路,我给大家总结一下。如果咱们想做技术专家,就必须实事求是,以科学为依据。只有这样,你才能获得各方的信任,包括客户,包括你的企业,包括领导,还有同事们。因为按这个角度做,就不会出错。任何不尊重科学规律的行为,最终都会受到科学规律的惩罚。无论是谁,无论是我方、敌方、友方。另外想做技术专家,我们自己必须不忘初心、不计名利、甘于寂寞。作为一个专家,一旦你说谎,做了违背自己良心和道德的事,某一次被人发现了,这个权威性就没有了,就当不成专家了,所以一定要爱惜自己的羽毛。 最后就是说一下发展方向,咱们售后工程师有些善于沟通的,这些人可能是拿工程师作为跳板,他可能沟通擅长的转去销售岗了,有些喜欢转售前,还有一些就是愿意管理的,转领导岗位。还有一些不太明确的,就是换其他技术无关的岗位。像我这种善于与机器打交道的,适合继续做售后。如果是以工程师岗位当跳板的人,我建议你也是干一行爱一行,把当前工作做好。在未来转了行以后,你的经验绝对是优于其他人。现在踏踏实实积累的经验都是你的加分项。如果当前这种经验积累,只是当做镀金,只是一个过场,不踏实工作积累经验,最后一定会自食其果。 人生的选择就是名和利的均衡,确定要名还是要利。像我这种属于名和利都不重要,生活平平淡淡才最重要。那么工作和家庭,既然选择了平淡工作和家庭就要均衡,一方面专心工作,但也要兼顾一下家里。虽然现在很多人要奋斗,在奋斗的时候可能顾不上家,但是在我们有条件的时候,还是要照顾好家人。每个人有不同的选择,这个不强求。现在和未来怎么均衡?有些情况下我们找的工作,是为了现在赚钱够多。有些时候我们的工作,是为了未来在积累。还有一些工作是为了梦想不计成本的投入,但是不一定有回报。怎么选?仍然看自己。左转和右转就是有些时候我们的选择左转也行,右转也行。但我要说的就是每个人都有自己的路,每个人做了选择之后,都要承担相应的后果,自己的路怎么选择?还是自己决定。坚持工作和自己创业的平衡。有人问了这个运维应该怎么做?一、你能不能坚持当前的工作?你的坚持能不能发挥出自己的效果?能发挥出来,要不要做,这都可以选择。自己创业或者自己转行,你有没有这个能力,是不是做好了准备?当我们不限于工程师思维的时候,我们其实也是可以具备创业的力的。这要看你自己有没有这个能力。 三、未来二十年的人生展望接下来看看我们未来20年的人生展望。首先就是我们的工作生涯怎么走。如果我们能看到未来的趋势,比如说我现在这个行业,能看到未来的趋势,我一定会分析现在还能干什么,我当前的工作还能干多久?我如果还想继续留下承担这种工程师岗位,发挥自己的效果,哪些工作我还能干?需要什么认证?需要什么能力?我就要提前学习。等于是提前锁定未来的方向,提前学习,提前准备。当你为下一个工作做好准备,那个工作到来的时候,只有你准备好了才能胜任。公司如果重新再招一个人,肯定是很难的。而用我们老人,就是轻车熟路,完全不一样了。这样可以通过找一个方向续几年,再找一个方向又续几年。比如我们现在40多了,续一续50多岁,60岁就不用想再续当前岗位了,那个时候应该就不一样了,可能翻开了人生新的篇章。升天之法。什么叫升天之法?干不了,就该离开了,该留就留,该走就走。为什么说峰回路转前面风景更好呢?就是说如果我们不干这一行了,我们不会被锁死在现有的经验上面。如果你真有突破,是不受限制的。我们时刻为失业做好准备的情况下,我们应该了解当离开这个岗位,还有没有别的方法把我们的技术变现,把我们的能力变现。如果你有这个能力,那绝对饿不死。更重要的是,人到中年不要被自己的历史和经验困在我们当前的人生里,如果困住了,你就再也没法进步了。只有脱离舒适区,不断的努力保持着一丝好奇心,你才能不断的进步。接下来就是面向未来,适应市场。因为现在的这个环境就这样,没办法,适者生存。那么当积累经验不受限制的时候,我们能把自己的技能变现,我们的未来不一定比现在差。最后就是天下没有不散的筵席。即使再好的岗位,现在如果不是在国企,不做那些终极躺平的岗位,如果企业倒闭了,我们干的再好可能也要走。也就是说,没有任何一个岗位能永远持续下去,也不用奢望我们一辈子干到老,就是时刻做好准备应对工作变动,随时可以找下一份工作,心里不慌就可以了。当我们有工作干的时候,努力干,当公司还存在的时候,尽力的为公司做好服务,公司也会好好对待我们。如果企业不好好对待你,那就果断转向。这里借用一下小说《三体》的一些名言。第一个就是:大多数人,到死都没有向尘世之外瞥一眼。这就是被困住的典型现象。我们人生在世,可以做的事有非常多。无论我们在人世间有多宏大的成就,在面对宇宙的时候,也是无比的渺小。如果我们的未来真是星辰大海,那么我们现在的内斗和内卷就毫无意义。不用说面对星辰大海,如果是第三次世界大战明天爆发,我们今天的内卷就完全没有意义,我们的人生就全部都要变了。所以大家还是要想一想我们的境界,我们的眼光到底要看多远。能看多远,取决于你的人生。 我们的人生一般都提长度还是宽度。但是我给大家的提醒就是:除了长度、宽度,你还有高度、深度、厚度和广度。每一个维度都有不同的方法可以做事,都有不同的方向可以扩展。我们不要把自己人生限制死,被经验限制死,也不要把自己的工作限制死。 四、人生半路的风景及思考接下来就是人生的半路的风景。只有年轻人会觉得未来还是无限的,觉得还有机会。那么到了人生的半路怎么办?我们已经到了人生的半路了,按年纪来讲,现在40多岁,政策活到80岁就不容易了。那么40多是人生的半路,工作20年也是人生工作经历的半路,再过20年,该退休了。这种时候我觉得还是要看看风景,思考一下未来。为什么呢?因为这种时候,我们如果还不知道人生最终的方向,可能你就觉得未来毫无意义,就觉得非常灰暗。实际上,人生终极大事无非生死。因为我们到了40多的时候,已经逐渐进入告别时代,我们的祖父母一代已经逐渐的离去了,父母一代也逐渐的进入告别时间。当我们经历了这么多的生死,甚至身边的一些同学、同事都开始英年早逝了,这种情况下,你就会发现人生终极大事,真是只有生死而已。年轻人不要光觉得未来还有机会,我可以无限制的去挥霍,早一点找到自己的路是更好的选择。我们的人生没有目的怎么办?那你就去找吧!借用佛教禅宗的说法,如果你找不到意义,你就去找你的意义。如果你没有动力,那你就看有什么让你有动力的事情,努力的去学习,或者努力的去换个有动力的工作。此时我们会是完全不一样的状态。如果我不喜欢自己的工作,那你喜欢的是什么?你有没有能力去找到它,你有没有能力去积累新一轮的人生经验?这就是我给一些被困住的人的一个解答,就是不要受自身限制。很多人都说中年危机,其实有可能它不只是一个危机的问题,它的根源可能就是我们没有找到属于自己的路。你找到自己的路,一路走下去就行了。历史上有多少人就是一路走下去,走到最后的。而那些科学家们,那些文学家们,历史上的其他大家们都是这样。如果我们对自己没有限制,我们的人生一定也是没有限制的,想做什么都可以。而且现在是世易时移,飞速发展的年代。科技的发展,包括AI的发展,最后就会造成又一个适者生存的竞争环境。我们能不能提升自己的境界,能不能在AI到来的时候保持自己的初心,保持自己的方向,做好属于自己的一份工作?这也是每个人都要思考的。 五、传说、故事及神话最后,传说故事及神话。为什么要这么说?就是我干过的一些工作,现在讲给年轻人可能都已经变成了一些江湖上的传说。大家都会说你这个人,过去干过什么的很厉害,很牛。那么时间长了,我们退休以后,这些事就可以讲给后代了,此时绝大部分人都有子孙了,可以给我们的子孙后代讲讲。这种时候,我们是不是能给他们讲一下当初工作的时候,曾经做出了哪些成就,是不是让他们为我们而骄傲、而自豪,能不能把我们的经验传下去? 如果我们离开后,我们的故事讲了很久,我们的后代再对他的后代讲我们的故事,那这个时候是不是就能变成神话?因为我们不在人世了,那些已经不是一个人的经历了,就开始变成神话了。 接下来就是,我从哪里来到哪里去的问题。因为我喜欢电脑,所以这些是一些额外爱好,现在这里列出的是20年前的一些经历。是可以公开讲的,现在的一些业余爱好,不太方便给大家公开讲。当年咱们学电脑的时候,中过熊猫烧香病毒,中过CIH病毒,年纪大一些的,咱们内行的人都知道这两个病毒是什么情况。中了病毒之后能全身而退的,可以说是不多。当年这两个病毒我全都中过,最后的结局是全身而退,把这两个病毒干掉了。同时自己的系统没被破坏,数据全在,没有被毁。那么如果我有这个能力,大家想一想,我最近的这20年我还可以干什么事?我是不是能干更多?当然确实我也干了一些事情,只不过不适合公开说。当初的欢乐时光病毒,这个病毒当年也是很厉害的一个脚本病毒。当年我也是想方设法战胜过它的。旁观神仙打架,就是当年的一些误杀事件,当年的某些杀毒软件误杀微软的系统组件,我在官方通报出来之前已经做出结论了。这个全是爱好导致的。那么我们每个人能力越大,责任越大。我们如果想留下神话,就一定要问自己几个问题。第一,你有没有帮助过他人?后面的对号是我给自己打的评价。第二,有没有做过对人民有益的事?不是针对一个人,而是针对绝大多数人。第三,就是做到现在你是不是无怨无悔?第四,就是你能不能在历史上留下名字?我可以说,我足够做到历史留名。当然这是匿名的,我没有以公开的身份做过留名的事,而是以匿名的身份做的,但是足以留名。这个也不适合在这个公开场合下公开讲。——————————Q&A环节——————————Q:现在技术方向很多,如何做好选择?这是很多人面临的问题。其实咱们这个工程师问出这个问题,我就可以那个看出咱们这个工程师很有可能一是比较年轻,二是可能是受过我们的职业培训。现在我们的职业培训有一个问题就是分的比较细,因为岗位也比较细。这就导致了现在分了更多的岗位,什么前台后台、中台、售前、售后等,然后代码又分了很多种开发方向。但是你要知道,当年我们只有一个计算机专业,“计算机科学与技术”只有这么一个专业,软件、硬件、代码、前端、后端,所有的东西都属于它,在学校里都要学一个基础。当然学校里学的远远不够,经验主要还是靠工作中积累的。那么我们积累的时候,作为一个学习计算机专业的人,我会不会说我只能写前端,写不了后端,我只能做数通,我不能做IT?我经常遇到有人说,我是负责写代码的,你能不能把数据库给我配置好,能不能把操作系统给我装好?提醒大家一下,我们这一批人在上大学的时候,马化腾还在写代码,雷军还在做wps,大家还都是技术员。那个时候我们要想用一台计算机怎么办?从硬件组装开始学习,从基础原理开始学习。自己去搞硬件,自己去做兼容,自己去搞操作系统,自己去搞驱动,然后自己搭建环境再去写代码,最后编译。那个时候我们有人会问,我应该选择什么方向吗?在我们问出这个问题的情况下,咱们的思维就已经被锁死了,对吧?三体人还没来,智子还没到,我们为什么自己把自己的思想锁死呢?不要纠结那些东西,喜欢什么学什么,你学习的任何一个方向,将来都可以成为你的助力。如果你真要问将来应该怎么发展,去看看市场需要什么岗位,看看你想做什么工作,看看现在的岗位都在招什么,然后基于他要求的能力,你去提前学习掌握就可以了,对吧? JDC公开课系列活动主讲人正在火热招募中,快来分享你的专业,与JDC一起成为数字化传播大使,还能赢取丰厚智豆奖励,快点击链接报名吧!
【干货分享】智慧建筑能源优化解决方案
今天跟大家一起分享一个话题:智慧建筑能源管理能源优化的解决方案。大家一定也深有一些感受。就是其实现在我们住的城市里有很多的,比如说楼宇或者是建筑,有一些是新建的,也有一些老旧的这些楼宇。从现在的建筑水平来讲是非常的高。它的智能化,包括它的一些设施都非常的好。但是很多的老旧的楼宇,其实就面临着很多的问题。比如说在八几年的房子,或者是九几年的房子,到了现在,其实从外观到它里面的设施都面临很多的问题,有一些楼宇还面临着拆迁。所以在这样的情况下,有很多楼宇。它到了50年左右,它的寿命基本就差不多了,可能就要拆掉。我觉得如果是一栋楼,它从0~50年,再从50年到100年,如何延长它的寿命?我觉得是一个非常具有未来、有思考空间的一件事情。第二就是我要讲的就是双碳,这两年国家其实一直在出台双碳的很多政策,它的出发点也要实现在2030年到2060年分别要达到碳中和碳达峰这样的目标,旨在还是要解决很多楼宇很多建筑,包括我们周边的环境如何做到节能减排,让大家去有一个非常宜居的这样的环境去生活。所以从这个角度出发。智慧建筑好不好,管理就非常的重要,那么其实也是要解决两个问题,第一个就是延长建筑的寿命,第二要做到很好的碳排放,也是我今天要重点分享的部分。其实大家现在也非常的清楚,每一个城市其实都要做整个智慧城市的建设。那么从政府的角度,从宏观的角度,有一盘棋规划,从整个大的智慧城市要建不同的场景、不同的板块,但是从企业来讲,其实是一个反向的操作。从一栋楼宇、再到一个智慧社区、再到智慧城市,正好是一个从上到下,一个是从下到上,跟政府是一个相反的做法。这就是政府和企业的做法的不同。我们基于从一栋小的楼宇开始做起,从一个从市场高度市场化的一个操作变成一个智能楼宇精细化的那一部分,就是说智慧建筑它如何去做到能耗的优化。刚刚我也大概讲了一下,从国内有很多的不同的政策去支持双碳。从其他的国家,像日本南亚,包括中东的很多国家也会有各种的碳排放或者是关于绿色建筑的一些倡议,目的是让大家都是同样的目标:就是要做到节能。也是智能楼宇的必要性。就是说其实大家做智能楼体的,或者是智能建筑的能源管控。它不是说大家想想这么做。而是的确是面临一个必要性从国内和国际都有这样的一个要求。从目前的建设的痛点来讲,我们的居住的办公环境,有一些新装修的会面临有害气体的排放,包括我们的办公空间是否宜居?包括它整个的一个碳排放是不是达标了?不管是企业还是我们的员工在大楼工作生活,其实都有这样的一个要求。第二个就是整个他大楼实施改造和成本也会很高。因为老的楼宇很多的设备当时建设之初是没有什么太智能的元素。到了今天,它其实面临着要智能化的改造,老的这些设备要做很多的修改,不管是装修还是设备,所以成本就非常的高。涉及到很多的专业,有能源专业,有消防专业,还有楼控等等,其实也是非常的复杂。所以现在对智能楼层对建筑,提出了很多的要求。以前其实设备也都是相对来说比较孤立,暖通系统、电梯系统、照明系统、消防系统基本基本上每一个都是孤立的系统。这也是如果把它打通的话,那么也是需要一个新的系统去把所有的系统集合起来,去做智能化的管控。所以这一些都是很多建设项目面临的一个非常重的痛点。所以从能源管控的角度来讲,要是把所有的原来的一些建筑的子系统就要把它打通。从大家从左侧也可以看到,其实整个不管是楼宇还是建筑,它会有几个十几个甚至更多不同的子系统。比如泵、冷却塔、冷水机组、抽水机,包括还有风机等。这么多的设备,如果是孤立的话,其实是很难去把它综合调度起来。所以中间我认为是有一个综合的管控平台,这个平台其实是要把所有的子系统的数据归集。接入之后进行数据汇聚,依据数聚打造人工智能的模型。其他的系统要基于中间这一侧的部分的数据。把它重新再建立新的应用。这个催生出来新的应用的话,它就不是像原来一些独立的系统,没有办法去协同工作,而是说它可以去做很多。比如说人员管控,比如说还要基于中间的数据。他要做很多可预测性,这里就有很多新的应用程序出现。所以这样的过程从独立的子系统到数据的集成和分析,然后到新的应用,整个过程会把智能管理就做得非常好。传统的建筑和智能的建筑上还是有很多区别。大家也可以从图上可以看到,其实在以前很多大厅的指挥中心,它其实是有很多小的屏幕。我觉得在10年之前至少是这样子的。最近5、6年会有很多的改善。到了今天突破就更多了。左侧就是现在的组件,大家会怎么样去做?那右侧的这些小的面板,比如说原来是5×6或者是6×9这样的一些面板。或者是电视机,那么已经变成了一个我可以去用一个非常大的一个屏幕。那么这个屏幕其实就完全不需要这个5×6或者6×5,而是一个非常大的一个屏幕。它可以去通过手去滑动或者鼠标去滑动。可以上下左右前后,可以看到整个智能楼宇里面外面。包括上下他都能看得到,所以这就是在整个它的指挥控制上的一个突破,这是传统和智能建筑的一个非常显著的区别。第二个就是一个非常大的区别,就是可预测性。就是我们做了很多的事情,其实并不是说当下的问题发生了我们把它总结,这是已经发生的。其实我觉得更重要的是要做到未来的可预测性,就是说我们今天可能不知道明天这个楼宇它可能会发生情况,通过模型的推演、预测到未来这个楼宇要发生什么事情,比如说明天楼宇的某一个层可能某一个配电箱的电流会超高。所以这种可以通过很多的历史数据,包括结合人工智能模型去把它分析出来。那么在今天就可以预防明天可能在这个时间段我要采取什么样的措施。比如提前调整它的负荷,或者是调整它的用电的一些参数。这样我认为是智能楼宇和现在传统楼宇的一个区别。再就是我们其实现在可以利用数字孪生将整个楼1:1的还原,这种好处其实也可以解决很多设备宕机的问题,就比如说过去可能楼宇遇到一个问题通常是派人到现场去维修。那么如今现在有了数字孪生可以直接能看到每一层的管道和建筑的每一个细微的管线和设备。发现问题之后从可视化层面可以看到到底哪里出了问题。这个时候再派人去现场,可以大节省宕机时间。除此以外,整个楼宇其实还要有api,楼宇也要每一个系统之间打通,api网关用于数据去汇聚。第二个,还要做数字孪生做到可预测性。当然这些也是作为人工智能的优化的基础。第三是把所有的楼宇的每一个部分桌椅、板凳,包括水电、暖通、风、水电,这些全部1:1的还原,也是为了精细化的去管理楼宇的每一个部分。这样无论是做能源的优化可以去到每一个部件。至一第四个是物联网的管理系统,其实这里也就涉及到比如我们需要把所有的楼宇的风火水电的设备会以ba或者是bms系统这样的形态去跟楼宇的管控系统去做一个打通。所以在这里硬件或软件要遵循统一的net协议或者是modbus这样协议去对接。楼宇的硬件和软件就可以去做很多数据上的交互。这里其实大家也可以看到,整个楼宇要基于模型互联起来。每一个楼基本都有dwg或者是BIM数据,用数字孪生原生把楼宇以及管线构建起来,可以看到每一层。结合现在的大模型你可以对模型去说一句话,比如说我要看到10楼的102房间,那么其实可以把BIM的每一层的部件全部呈现看到到底有什么问题,哪里会产生告警,其实也是为了方便资产管理也为了未来做能耗的优化,或者是能源的管控也非常清楚,会看到哪里出了问题。这里你看到的其实是一张非常乱的一张图,其实就是把每一层的位置已经切割了,每一层都会把它打通,把它切开它的管线其实也都会看得非常清楚,你可以把它放大。它这条管道如果是出现告警,那么它其实在这个面板上会出现一个红色。第二部分我想更多还是要提到双碳或者降碳。因为整个楼宇其实现在的楼宇基本电会占大概70~80%的能源的消耗。我记得我昨天的时候去跟一个地方政府的工作人员在聊天,他说当地图书馆现在都不敢开空调了,如果不开空调,群众会投诉,如果是开一天的话大概2万块钱的电费,楼宇也一样,基本耗电最多的就是这些暖通的设备。所以从能碳从节碳的角度来讲,就是把电能耗降下来。整个能源的管控也就有很大的改善。首先是要从管理体系构建,包括碳核查,第二部分从设备的角度就怎么老旧设备上进行一些改造。第三个是可再生能源,就是光伏储能。做一些碳抵消。同时要跟电网去合并,来抵消楼宇产生的一些二氧化碳。整个能源优化还要基于一些条件。 因为每一个楼宇它的条件是不一样的。有的有一些楼宇设备是比较先进,它有一些智能化或者物联网的板块,有一些老旧的楼宇不具备这样的条件,就要对它进行一定程度的改进。比如加装群控装置或者支持PLC可编程控制器把设备和我们的楼宇的软件做一个打通。PLC要支持wifi要支持网络,只要是PLC和它联通的设备和软件系统的协议保持一致。就可以去把设备上的数据汇聚到楼宇都软件平台里面,如果没有PLC控制器的话,就需要把楼宇的设备都集成到BMS系统或者是BA系统。中间可能还需要一个转换器处理数据的清洗工作,确保数据的分析或做模型的数据质量, plc是在控制终端设备,然后通过网络把软件和硬件打通,把数据拿过来。基于数据去做汇聚,做分析,做能源的调控和优化. 有很多楼宇原来是中央空调,如果中央空调没有任何的物联网模块。除了我刚才说的加PLC可控制编辑器之外,还要加一些智能电表收集电梯、消防设备耗电量。耗电量的一个计量就是要通过电表。智能电表也会开放API接口。有很多冷水机还要有温控设备或变频设备。包括温度、温湿度的传感器。智能电表,就是它的一个载体。冷机系统也有物联网的模块去监控它的温度压力。出口的流量。  这里还有一个能效的一个管理,所有的设备接入进来要知道它的能耗是怎样的,能耗比是多少,能耗比:比如说冷机,你可以控制冷耗量,比如说1000瓦,然后冷机消耗200瓦,风机或者是冰机或者是其他的冷耗要消耗量80w,能耗比是1000除以280,大概是3.57是它的能效。能效越高。能耗其实越低,能源消耗多的设备有能耗的优化策略。通过plc的可控制编辑器发放指令。根据策略和指令去集中控制。策略优化还是要基于过去的历史数据,还有线路的一些场景。比如说有很多的大厦有很多个区域,人流是非常稀疏。或者是说在某一个时间段,它的肯定是多的。那么基于这样的数据,可以在某一个时间段,它的人流并不是很多的情况下,对暖通空调进行调整。同时可以结合监测到的天气的温湿度,比如明天可是一个非常冷的天气。那么提前在第二天上班前对整个大楼做提温。能耗其实最大的用电量。有的场景比如可能要下午两点多开会,但是有很多的场景是大家到了会场才当场把这个空调打开。其实完全可以对整个的楼宇的管控系统或者是能源管控系统,提前有这样的输入参数:若下午两点开会。那么其实系统接入到这样条件之后,会根据人数的多少去调控开放一个合适的空调的温度。总结:整个思路第一要把所有设备的子系统的数据汇聚过来。无论是通过运营系统还是电站系统。然后基于数据去做模型,去调优,向设备发送指令,调控温度。当然这些根据很多的模型去学习,因为有很多的天气因素,人流元素,历史的数据,未来可以有一些新的场景要结合。这些结合要结合很多因素去调控。所以我觉得这是一个大的思路。
【干货分享】华为云赋能高校教学实践
《“云”赋能--重塑高校教学新实践》 各位专家、老师和朋友,大家晚上好!很高兴今天晚上有这样一个机会,和大家共享交流和共同探讨这样一个话题《“云”赋能--重塑高校教学新实践》。我最早1988年在南京航空学院大学毕业后在中国XXXXX研究院从事科研工作约10年,1999年西工大研究生毕业后加入到华为公司,从事于华为ICT技术相关的技术服务、市场销售以及研发测试等工作,更多的是技术培训这样一个工作。2017年在华为退休后,退而不休继续在杭州和西安等地的科技高校从事于大学教育培养工作。这是我的一个简单的介绍。接下来我们就回到我们今天的正题,云赋能重塑高校教学新实践这样一个话题。 今天晚上讨论这个话题来是“科技+教育”领域。各位专家老师可能来自各行各业,有交通的、能源的、医疗的、教育行业的等。好,那今天呢我们简单先几个专业术语,简单介绍一下。第一个是”云“,大家知道这个,云是天上蓝天白云的云,云是在天上它虚无飘渺。这里这个“云”指的是科技里面的“云计算的云平台“。那么云它能赋能?这个云是有能量的,它可以赋能,指的是在云平台里面的云实验。这是科技的一个术语。另外一个,那么从事于教育行业都知道,高校教育来它分为理论教学和实践教学这两个,理论教学呢,就是上课上理论课。那么实践教学呢,就是我这里面写的胶片上机实践,就是上机实验和操作。我们说实践是是检验的唯一标准,光上理论课没有实践课,无法培养出应用型的人才。所以今天我们这个一个核心的理念呢,就是用新技术”云平台云实验“赋能实现高校教学新实践。 云赋能高校教学实践实践教学有四个方面的话题,先讲第一个:一是高校教学实际的挑战。高校教学实践就是高校里面这个实验室实验的装备设备它有什么呢? 有什么样的问题和挑战?第二个是云平台赋能教学实现的一个解析。主要是这个云平台,它如何去赋能高校里面的教学实践,关键词是上机实验这个。第三个,就是云怎么去重塑高校教学新实践这个案例分享。这地方我会通过两个典型的案例。在座的各位,今天晚上共享的各位分享一下我在这个教学实践中用云来赋能的教学真实的案例。第四个,建议和展望。 我们先看第一部分,高校教学实践存在什么样的问题。第一个是实验设备困境问题。困境的现状就是设备超期服务,公办的这个学校可能还好一些,而民办的这个教学的教学实验室,这个困境的困境就比较严重。还有专业设备研重缺口,特别是新技术,像云计算、人工智能,这些专业的设备。很多高校的实验设备跟不上。还有人机实验时机,这个上机的时间问题,学生的这个上机实验一般是16个课时,那么没办法保证这个上级实验这个教学的要求。那么是什么原因呢?主要是硬件更新,周期太长,一般的是硬件更新了,大概是五天。导致个技术先行而实践落后,跟不上学的新知识,实践它跟不上。第二个,实践设备服用率比较低。像原来这个计算机,它可以做c语言sql server这样一些  高校的上机实践和实验培训。那么云计算、大数据、人工智能这几个课程,它需要专用的设备,利用率相对来说低,那么还有维护成本比较大,这些这个设备一般都比较贵重。特别是民办大学的这方面影响是更为严重实验设备的问题。那么这地方我举了一个典型的案例,是一所高校的,它有六台GPU, 其支撑200名学生。学生排队时间比较长,那这地方这个高校有GPU还不错,那么大部分学校呢,它的服务器都是CPU,不是GPU满足不了这个现在这个新技术学生上机实践的要求。  第一个是设备方面的欠缺。第二个,新型技术教学手段的一个比较滞后。教学手段,那包括了这个新技术课程的实践教学,它跟不上,在这个智能化、数字化这样一个时代,大部分学校来缺乏这个教学实践。 特别是高校有云计算、大数据以及人工智能这样一些新一代ICT基础的课程来实验设备是跟不上的理论课程讲完以后。老师要指导学生实践操作,那么缺夯实际的硬件环境来,没办法培养应用型的人才。还有大规模数据处理的痛点。那么现在我从事这个学校来是个民办陪办学校。那么学生呢基本上都是CPU,那么装一个数据库。云计算这个服务,还有这些个大数据,一些软件来讲,根本就跑不动。那么还有人工智能训练的重点,我们学校也有这个课,那么很多学校也会开这样的一个课。 那么2025年的智能时代也已经来到了deepseek代表的通用大模型, 那么都要以这个高性能低成本,这样来开展一些教训和实践的工作。那么这个AI训练的模型搞科技的也不知道,那么需要CPU GPU处理,甚至是NPU。提供算力这方面的一些支持,教学实用手段这方面的。第三个,高校存在的挑战,就是人才培养质量的危机,一个是岗位适配率现状来相对来说败。就是说这个培养出我们要培养应英型的人才,你光上来理论没有实践。学生出来以后找工作相对来说呢是不太比较困难的。很多的企业要有工作经验的,要有这个实践操作的,或者有项目经验的。那么企业在培训的成本它会增加你这个在学校里面没培养。好到企业的话,他会再次培养。那么增加企业的这样一个成。人才培养质量这样一个的一个危机。 那么我们讲通过一些大数据的一些研究,来专家诊断出来,这个结果来也是这样的。云化的实验平台成为弥补惨教,就是企业用人单位和我们教例子教学这方面鸿沟的一个关键桥梁。云化的实验。这个平台,所以我们说云它具有不能重塑这样一个功能。那么这是第一部分的这个高校教学实践,这地方主要是实践里。挑战,主要是那个设备的问题,设备的问题,还有一个教学工具的。还有这有还有人才培养这个质量,这方面要校企合作,这方面培养出了人才,来满足了企业的要求。所以现在加上现在工作又很难做。所以我们学校来各个学校来都培养,希望培养出来是应用型的人才出去能为企业去工作和干活的。  企业才给你发一份薪水,然后这样的话才探求的可以。第一个给高校这个在教学实践方面的一个挑战。那么第二个问题嘞,看到这个云平台了,我们教学的实践。这个云呢,刚才说它是天上比较。他怎么能去赋能个教学实践,来弥补高校教学实践这样一个。这样一个短板来,我可以简单来解析一下。 我们云平台这个云实验,我们简单介绍一下,在我所在的这个高校的实,我们用的这个云平台的实验室用的codelae这样云实验的这样一个。键是华为云官方实验的一个平台,它可以一键去创建这个实验文件。我们的语文课的上机的学生来可以通过实验手册快速体验这个云。在云端实现云实现这个云服务的这个实践,还有调测验证。它是一个轻量级的。 那么对学校来说,它是一个轻量级的投资,有一个华为的云账号。那么只要有学校,只要有这样一个教育,这个网络,学生老师都可以通过这个网络一及,通过这个账号然后登录到这个华为云实验平台上去进行实验。对学校来说,它是一个轻资产的一个操作,而且不需要去备顾。这是云平台,这是一个实际的一个截图。那这个云平台这个云实际上有什么优势呢?我们说它是零硬件的,对学校来说,对学生来说都是零社会的零硬件的图。免去了这个维护的成本,那么24h随时远程可以访问,而且是在真实的云环境中操作。 那么还有一个智能检测这个实验记录,可以生成这个实验报告,智能问答还可以在线去问答。一个T验来帮助大家快速到云上去,完成教学实践的这样一个T验。这地方提出一个秒级构建环境。当你一键进去以后,它会发现这个服务会生成一个华为,也是用这个云计算的虚拟机这样一个技术。增成一个虚拟机这样一个秒级,这个环境中可以快速的去构建。还有这个弹性来可以去伸缩,这是都是云计算的一些特性。那么在华为云实验室上是可以实现的。嘿。  那么云实验因为告求这个教学教境、环境服务,还有一种模板,只能看法。I小助手这个云实验平台上都可以去实施。那么语音实验用一个教学的流程,实验流程可以再造老师引导学生去实践。学生可以启动这样一个实验,而且可以生成这样一个实验。那么云实验与传统实验一个对比来。这样的话我简单总结了一句,它解决了大学高校缺乏实验设备的这个配件。如果在座的有我们高校里面的,不管是民办还是。民办特别是民办严重缺乏这样一个新科技的一些实验设备也跟不上了。那么它可以解决这个实训学生实训实验设备这样一个出细的投入。那么传统的实验设备投入比较多,准备的周期也比较长,资源的利用率相对来说比较低,而且投入这个设备,它要跨课程c语言学习java语言要学习。那么云计算、大数据、人工智能这些课程来它也要用,还有跨课程及支持,还有维护成本。这地方我就不细说了,维护的时间大概也是八个小时。就是一主要是解决了大小高小缺,夯实验室被这里。语音赋能这个实验成本简单进行了一个分享,缺乏资金投入到实际物理设备周期的民办大学,特别喜欢这样一个华为的云实践云实验平台,它是个低头。高产出的这样一个结果,这是解读了一下云平台,为啥能赋能教学实践这样一个话题。这是我们今天晚上介绍第二部分内容。那么接下来呢,用前面这个困境挑战,还有我们这个云赋能教学实验上机这样一个解读来。我喜欢的两个这个案例,云则去重塑,这地方是重塑,重塑相对于传统的那种上级实验来说。好,我们还是新实践,不能重塑高校教学新实践这一个案例的一个分享。一起来。这个地方就语音平台来。我们如果你是搞科技,没有从这里教育的话,简单还要说一下这个华为st学院呢,它是一个企业,这就是你所在处的。产业企业公司,那么这边是一个高校,这个华为ict学院这个平台,它是一个桥梁,能够。怕能够穿透这样的企业,高校产生一个校企融合、财教融合的这样一个效果。那这个有了这个华为IT学院,华为这个云平台过来有这样一个条件以后呢,我们接下来我们举两个例子,第一个是我在实际的教训。是物联网工程专业的云计算这样一门课这个实践教训。看看华为这个云实验云平台,怎么怎样实现了云计算这样一个实践教训。我们使用新的技术就是领云平台重塑教学实验课程的一个教学改革。为此来我在我们学校来做了一个云ICT云平台云实验来。 然后赋能云计算课程这样一个教改项目,也是这个实验。这个平台也可以对我们的老师来说呢,也可以做一些教学改革的一些项目。好,那这地方我设的是23/05/18,西安的地法大学华为华北正式获得了学校。过道优先级华为ICT学院这样一个授牌,有了这样一个华为ict学院的授牌的话就可以使用。在华为这个连续资源证明,这次说可以是这样一个词语。那么2023年我也在这地方上课,原有的这个环境来这个云计算的环境来自有计算机,实验室,自有计算机没有。服务器更没有交换机口和武器,这些方法是a那么这个云实验来这个云计算实验室。打错了,你只有一台服务器,这台计算机是八g内存的。那么严重制约这个教学的时间。那么我们获得这个华为优选,其实st学院这个牌子也过来,就可以技术用这个云平台来重塑。教学实践。那么23年我们就获得这个华为at学院这个授牌。那我本人来获取这个华为HCIA这个证书,还有这个华为的教师这个证书,同时我们培养了30个超过30个人的证书,这样一个学生的获得华为这样一个证书。然后我们就获得了这个a这个华为SA学院这样一个授牌,有这个资源,以后可以带领学生,那么。202024年就开始用华为云平台进行云计算的实验学生能够更加贴近这种原生的开发环境,学生也感到非常的满意。这是我的一个ai的局限和这个重塑教学实践一个表述。下面我们看一下这个实验现场。这是物联网云计算实践课程的一个实验现场。那么学校生来用自己的电脑,用自己的电脑,然后通过这个账号,然后。到我华为云平台上去做相关的实验,这是云平台14~11个效果。好,那么这是真实实的这个实验。现场好,实验完成率呢也提升了学生的复杂问题,也提升了学生通过这个云平台做完实验也可以参加。来把ict打散,因为同学来获的是陕西省三个将。那么物联网这个云计算实验来教资实践的一个见证。这是华为原营是个实际地方。这里面的这些实验都可以去做云平台的颠覆性来。那么有位老师提到,华为云物联网平台,让我们用了10分c的预算,建成了原来不敢想象的。这个实验室这样见证了云平台对实施建设的重大的一响。这是物联网专业在云计算这个课程上的教学实践。那么第二个案例就是智能专业,实际教是本科好几个专业,智能专业。那么人工智能技术这门课。 它的实践的一个教学,那么理论教学类课堂,这地方把图片因为涉及到个人隐私,这里三处的比。现场的一些实际的照片,还有上机实验学生的一些作品。在这地方他学完这个理论课以后,然后到华为这个平台上去进入华为人工智能相关的那个实验室,可以做得非常好。这个作品也表现的非常好。那么其中有一个实验是去年底从人工智能课智教流实践学,从上机实验的这样一个我们用我这个amp decuter脸谱风格图生图这样。代个实现这个图,这个实验呢是基于还源的这个平台上,通过这个学生来能够掌握modeus原开发平台上进行代码开放的调试。这个实验这个地方可以按照这里删除的。现场实际的照片,学生上级实验兴趣和积金非常高。  因为它是一个原土生土的,我要求他拿一本书对着自己,然后他生腾。跟一个卡通式的非常有意思的这样一个图片,相当于自己的学生上级的时间兴趣、积极性非常的高,对自己的实际的作训也非常的满意。好juern学校教训了大刀。         
【干货分享】数字文旅大数据解决方案
背景介绍:       说到文旅,我相信朋友们都喜欢出游,或者是有过旅游的经历。文旅作为我们国家的生产服务业,在2023年才逐渐恢复常态,恢复到一个比较好的趋势。在过去,从2018年我们国家文旅部做了一个融合,现在已经是文旅融合这样的一个大的趋势。我们在给地方政府文旅局去做信息化项目的时候,也会发现很多的问题。今天,借着JDC这个平台跟大家分享。分享内容:       近几年,我们帮助地方文旅局利用大数据去发现文旅行业所面临的很多的问题。比如某些地方,我们会在有很多游客聚集的位置标成红色,因此这些地方就需要我们文旅局的决策者更加注意。一、智慧旅游大数据平台解决方案      很多地方文旅还是作为政府发展经济的一个抓手。但是在这个过程当中,其实我们还是能发现很多问题,比如如果我们去到华东地区,最烂俗的产品是什么?是古镇。去北方最烂俗的是什么?是玻璃栈道。我们去很多地方都能看到这两个景点,作为旅游的吸引物出现。有些玻璃栈道为了吸引游客,他也会在游客在上面走过去的时候,故意会出现玻璃破碎的声音来吓唬游客。这种效果后来被很多地方模仿,这其实就是一个品牌定位出现了问题,大家都去效仿,其实你的吸引力就没有那么强了。所以这是景区面临的一个同质化的问题。所以我认为大家对于品牌的目的地的认知可能还没有达到一个很高的水平。       游客的拥堵其实也是很大的一个问题,包括我之前在安徽黄山这个景区,游客非常的爆满,后来临时采取限流措施。所以如果有大数据,就可以很好的去帮助地方旅游的决策者解决游客的疏导问题。所以我认为大数据更主是要有预知未来的能力,不是说游客到了之后,已经发生拥堵了,我们再去解决,而是说我们提前,在游客出行之前,我们就已经在2~3天已经知道大概有多少游客即将到达景区。所以这是我认为大数据有魅力的地方,也是我们现在已经做了很多地方的一个经验。当然,我觉得除了游客的疏导,其实还要提供导游导览导购导航这样一些基础的功能,这样的话游客他能知道我如果是去了景区我该怎么走?那我以什么样的路径为之快,这些是我们针对游客提供的一些服务。       所以大数据,其实我们做了很多应用场景,在这里,也跟大家简单说一下它的这个简单的逻辑:每一位其实都会有手机,在手机上也下载了很多的APP应用,会允许获取位置和轨迹信息。那么我们就可以知道游客到底从哪里来去了哪里,这也是我们做旅游分析非常重要的数据源。特殊说明一下,就是我们尊重个人隐私保护,我们非常看重数据安全,会对数据进行脱敏。       当然,很多游客特别喜欢去某一个目的地,但是这个目的地又比较拥堵,那怎么办?这时候我们要把很多的游客疏导到相对冷门的景区,所以通过大数据,如下图红色的部分就是人流比较多,我们发现这个问题之后,景区就会提前部署。那么比如说通过接驳车或者是门票的优惠,或者是其他的营销活动,把游客去疏导开,这样保持我们的游客在峰值的时候没有超过最大承载量。而游客去了冷门的景区,相对冷门的景区之后在承载量下来之后它又返回来去可以继续去旅游。所以这是也是有一个热门路线规划,也可以给管理部门提供一个供给侧让他们去去调整路线。       还是要有针对性,文旅局会针对60后、70后、80后、90后年龄不同的人,有不同的喜好,所以要做到有的放矢。我们会找一些已经来过这景区的一些游客,把它作为种子用户,来分析他们的性别、年龄、偏好等等,再把我们这些基础数据作为种子包,进而通过我们的dmp的数据平台。再去找到跟他有相似喜好的同类人群,把同类吸引过来,针对这批人群,可以做有针对性的一些营销活动。        那么针对这批人群,可以做有针对性的一些营销活动,所以这是大数据在旅游营销中非常典型的一个应用。当然这些也是有很多的游客画像,比如刚刚我提到的性别、年龄、喜好,当然还有驻留时间。那为什么要分析驻留时间?就像我们购物去买东西一样,如果是你去了商场,你站在一个商品之前久久不愿离去,或者一直徘徊看了很多遍,那么其实,就证明游客对于它会有非常强烈的兴趣。所以我们认为这样一批潜在的客户,就要针对他做一些数据营销。所以,我们要做一些驻留时间的分析。当然,文旅其实还有很多它的,就是地方政府会关注文旅的招商引资,那么它的文旅也会有上游下游产业链,那么去通过招商去把补足它的产业产业链上的不足。二、智慧景区平台解决方案       面向景区也会有很多的解决方案。那其实大家也都非常清楚,比如说VR导览、云旅游,那么其实云旅游,在之前非常火。就是人们可以通过手机身临其境得好像是到了景区。这种方式就非常新奇。再就是无接触购票的人脸识别,这些就非常常规了。三、游客服务平台解决方案       以前互联网没有那么发达的时候,我要想去旅游,我可能会去旅行社,可能问比如说哪里好玩,,我会问他多少钱,他会告诉我,然后旅行社带我去。现在的景区不一样了,现在我可能直接会去线上自行搜索,自行去研究一下攻略。所以,现在大家旅游的方式,也发生了很多的变化。在线上可以也可以有导游、导览、导购以及导航这些基础的功能,甚至还会包括语音讲解。——————————Q&A环节——————————Q1:多个的文化旅游平台能否实现这个数据共享?大数据或者是大模型,怎么利用巨量的数据获取有价值的信息?(社区昵称:gyng 提问)答:我们在做信息化的时候都面临到数据共享和数据交换,我认为是整个数据管理的一个非常核心的一个问题。那么我们在做地方信息化的时候,从文旅的角度,除了一方数据,两方数据,还有三方数据,政府数据,企业自有数据,包括还有很多的数据。采集过来的数据,既包含了个人的数据,还包括很多很多的数据。那么这些数据,如何去把它形成一个有价值的东西?我们其实也有自己的数据管理平台,叫数据中心。大量的数据汇聚过来之后,我们还要做很多的工作,比如要做数据的质量管理,很多数据过来我们要剔除重复的数据,做数据的挖掘,那么还有一些数据要做融合。Q2:文旅大数据如何和AIGC联动,然后实现更多的大模型? (社区昵称:Shuhow 提问)答:除了知识搜索,就是解决游客旅行过程当中需要的信息,然后可以跨时空让游客去体验。那么其实还有一个重点就是大模型给地方政府的一些工作人员提供了一个很好的一个工具,一个很好的抓手。因为过去其实很多时候,政府写报告或者是材料,都需要大家去想去琢磨,有了大模型之后,就可以去自动地生成,根据所有当前这个城市的旅游的特色、文化的优点,包括政府自身对于营销、对于品牌,对于它提升游客体验的一些想法......把这些都输入进去,最终会生成一个非常好的策划文件。所以,大模型在这方面也发挥了很多的作用。Q3、大数据方案就是如何提高这个安全性的保护个人隐私?(线上用户提问)答:其实我们做了很多的处理,国家在2016年的发布了人隐私的保护法。所以,我们遵从隐私保护法的一个精神。我们自己本身采集了很多的数据,数据拿过来之后,我们要做很多的处理。那么我们首先拿到的就是大家的手机号。这个手机号,我们要脱敏,通过加密手段把它变成一个另外的标识,这个标识可能让人只知道这是一个设备,但不知道具体是哪一个人的。然后大数据其实也对数据分析做了一个约束,就是只能允许对个人、对群体进行分析,不允许针对某一个人去做分析。所以这两者,其实也从一定程度上去规避了安全问题。另外一个,我们要做很多标签化处理,就是把很多的数据拿过来之后,我们要分门别类,比如说它是属于男性的,或是属于女性的,他的偏好是怎样的,要做很多标签化。在这个过程当中,其实又把很多的数据做了很多的清洗,所以整体数据的处理,我觉得还是非常规范的。Q4、各地文旅的突出痛点主要包括哪些?(用户昵称:大道至简 提问)答:我认为每一个城市遇到的问题都不太一样。有的地方希望有更多的游客到我的城市来玩,有的地方可能觉得我的品牌、我的地方明明有很好的旅游产品和好玩的地方,但是大家确实又不知道。比如我前年的时候去了这个L市,我就有非常深的一个感触,L市其实它文旅口号是说:大圣故里西游圣地,就是花果山的一个原型。其实就在这个L市,我还特意问了当地的朋友,说这个城市这么好玩,我说去不去一起玩一玩?人家说你不用去了,我说为什么?他说这个山上都没有猴子。所以我认为这就是暴露了当地它文旅的一个问题,就是说可能你有这个品牌,但是你的后端服务又跟不上。所以,我觉得有很多地方可能确实有好玩的地方,但是客流又没有那么多,所以吸引客流过来是一个非常强烈的需求。还会出现一个品牌认知的问题,就是大家不知道去品牌营销以及如何去让品牌去触达更多的用户。所以我认为利用数据,其实就能很好的解决问题。就比如说那我要有这个有这个航空的数据,我就知道哪一些城市的人,他乘坐飞机来我的城市会比较多,那我就要在飞机上面,做一些营销的活动。同样的包括高铁、公共巴士,其实都可以做很多的营销策划。 JDC公开课系列活动主讲人正在火热招募中快来分享你的专业,与JDC一起成为数字化传播大使,还能赢取丰厚智豆奖励👉快点击此处报名成为主讲人吧!👈 往期干货分享:【JDC公开课第1期】海涛2《医疗行业新兴技术4大创新应用案例分享》👉点此跳转
【干货分享】教育行业售前工程师看Wi-Fi 7
▲从四个Contents 介绍Wi-Fi 7 一、为什么需要Wi-Fi 7■数字化带来新场景新应用,对网络的要求进一步提高随着业务的数字化深入,越来越多的新场景,新应用新场景不断涌现,这些新的应用对网络都提出了更高的要求; 首先是元宇宙的应用正在加速,全球许多知名公司都在进行元宇宙相关产品的设计,但是元宇宙需要的带宽比普通带宽大很多,需要100M带宽,同时时延不能大于20ms, 如果达到50ms, 互动延迟明显,也会出现眩晕,类似的场景还有AR/VR眼镜。  在智能制造领域,AOI(自动光学检测)检测被广泛使用,一个站点包含若干个AOI高清摄像头,每站点需要7-8Gbps的极高带宽; 同时在高校学术报告厅场景,极限场景下需要满足每AP下100+用户同时看直播及台上互通的需求,在大学的高通量基因测序实验室,为了满足异地协同测序,一个实验室需要10Gbps超大带宽,小于20ms的时延。 ■体验建网时代,园区网络升级面临的三大挑战(1)无线体验差:传统Wi-Fi仅作为有线网络补点,网络断点多,业务不连续;据某大学学生反馈,从宿舍走到洗衣房、再走到图书馆移动过程中,微信视频通话经常卡顿甚至中断。(2)应用无保障:终端数量多,应用种类多,多业务并发时体验易受损;某互娱员工反馈,在多员工、多终端密集办公场景,视频会议、云盘业务、代码上传下载 卡顿严重。(3)运维靠人堆:无线网络不可视,投诉无感知,生产上云,SLA无法保障:瑞士邮政,无线体验很差,经常掉线,找网络管理员,网络管理员来回排查,未能解决问题 ■WLAN进入Wi-Fi 7时代,标准、生态、市场加速发展(1)标准已成熟,69个国家已发放6G Hz频谱:2024年1月,Wi-Fi 联盟月启动了Wi-Fi 7认证,这也标志了Wi-Fi 7标准足够成熟,终端与AP的互联互通已无障碍;(2)华为标准贡献第一:在Wi-Fi 7标准化的过程中,华为积极贡献了22.9%的标注份额,这个排名全球第一;(3)30+款Wi-Fi 7手机电脑终端,20+种Wi-Fi 7芯片: 为了让Wi-Fi 7尽快为企业提供更好的服务,产业链各个环节都在加速各自的产品化;首先,主流的芯片公司如inter,高通,博通以及华为都发布了支持Wi-Fi 7的芯片,截止2024年1月份, 目前笔记本/手机 能支持Wi-Fi 7的款型已经超过30家,预计到2024年手机电脑PAD, wi-fi 7将会成为标配; (4)根据IDC的统计,2027年Wi-Fi 7的占比会高达65%,同时,由于Wi-Fi 7的拉动,多速率交换机在2024年也将达到70%。 二、Wi-Fi 7 标准及能力介绍■Wi-Fi 7新增6GHz频段,为用户提供干净(更低干扰)、丰富的无线频谱■EHT320和4096 QAM技术,最大传输速率提升至2.4倍( vs Wi-Fi 6 )■创新的Multi-RU,极大地提高了无线资源的利用率 ■创新Multi-Link Operation,让Wi-Fi数据传输更快更可靠在Wi-Fi 7中使用MLO的好处:它通过聚合不同频段/通道的多个链路来提高数据速率(或吞吐量)。 它使用负载平衡来改善延迟,从而减轻一条链路上的拥塞。它通过在多个链路上复制数据包来提高可靠性。它允许网络流量在干扰或拥塞情况下无缝流动。它支持流量分离/区分,将不同的流量流分离到不同的链路。使用MLO的缺点:使用更宽和更多的通道会消耗更多的功率,这在移动设备开发中具有挑战性。MLO导致更宽信道中的帕普罗(峰均功率比)增加。不同的子信道上存在不同的干扰级别和特性,使得处理起来更加复杂。Wi-Fi 7目前正在开发中,其标准计划在2024年完成整顿。为了跟上对带宽和数据速度不断增长的需求,采用MLO技术的Wi-Fi将准备好提供更高的WiFi速度、更稳定的WiFi和更低的延迟,确保不浪费带宽。Wi-Fi 7多链路操作(MLO)优势:MLO机制帮助Wi-Fi 7在理想环境中将吞吐量提高到Wi-Fi 6的三倍MLO EMLSR在密集环境中提供80%的吞吐量增强MLO EMLSR在大流量中平均减少85%的延迟■Wi-Fi 7全新升级,进一步释放联接潜力,满足新场景新应用要求随着业务的诉求不断更新,Wi-Fi代际也随之升级。Wi-Fi6 以及Wi-Fi6E的唯一区别就是增加了6GHz, 他们使用相同的协议。 而到了Wi-Fi 7时代,Wi-Fi 7新增了的单射频带宽提升到了23Gbps, 频宽从以前的最大160MHz提升到了320MHz, 调制方式也从1K QAM提升到了4K QAM,为了提升并发效率,Wi-Fi 7多RU技术,能够解决之前Wi-Fi 6 信道资源浪费的问题,在Wi-Fi 7时代,能够充分“利用每一个车道”传送信息。 相比以前的代际,Wi-Fi 7还可以使用多链路同时上行,一台手机可以同时使用2.4G+5G。 三、Huawei Wi-Fi 7 能力介绍■积极参与Wi-Fi标准制定,引领新产品商用■无线体验升级:华为Wi-Fi 7领先业界一代,带宽↑4倍,并发↑4倍,可靠性↑10倍,0窃听过去几年,每用户的终端数从一个提升到了2-3个,视频会议激增,80%的流量为音视频会议流量。柔性生产助力生产智能化,越来越多的工厂采用无线化生产; 作为最新的WI-FI标准,将给无线办公带来极致的无线体验升级;华为领先1年推出Wi-Fi 7,目前已经得到了广大客户认可,商用部署了100+客户,根据Tolly测试报告,华为Wi-Fi 7单用户可以测试到4.3Gbps,带宽提升4倍, 单AP可以支持高达120路高清视频会议,比Wi-Fi 6高了4倍。Wi-Fi 7可以实现双发选收,可靠性提升至5个9,一年中断小于5分钟。■4倍带宽:华为Wi-Fi 7 带宽性能比Wi-Fi 6提升4倍游戏开发:20GB游戏大包下载,从60分钟➡️5分钟某研发人员每天早上到公司的第一件事情就是要从服务器下载20G左右的游戏大包进行编译,晚上下班前最后一件事是把当天编译好的大包再上传服务器,下载和上传各要花费1个小时的时间。智能汽车生产:数据加载50GB/车,从4小时➡️10分钟新能源汽车的操作系统从过去的5G增加到了50G,每辆车加载系统软件就要耗时4个小时,降低了汽车生产效率。 华为创新研发了动态变焦智能天线,并应用在了Wi-Fi 7 AP上,使得同等位置下的终端,信号强度提升一倍,同时有Wi-Fi 7的多链路聚合技术和SBS滤波技术的加持,使得华为Wi-Fi 7的带宽比Wi-Fi 6高了4倍,单终端实测的速率高达4.3Gbps,即使高密场景下,也有数百兆的带宽,下载20G的游戏大包只需要5分钟即可。 ■4倍并发:120路1080P高清视频并发 VS 业界Wi-Fi 6支持30路某大学的“草棚大礼堂” ,每到大型活动,礼堂会拥入近千听众,传统的Wi-Fi 网络此时要么连不上,要么联上无数据,经过Wi-Fi 7的改造,上千听众可以同时刷视频,进行直播互动;类似的还有某大学体育馆,可容纳6千观众,之前每次跨年演唱会体育馆内发送跨年祝福的文字都无法发出;经过Wi-Fi 7的改造,6000师生可以现场边直播边互动,送祝福,抢红包; 而这些都得益于华为Wi-Fi 7的独家融合调度技术,可以实现空域、频域、时域、应用 的融合调度,这好比在拥挤的早高峰,通过立交桥,多车道,多用户拼车等方式的联合调度,高效的把流量传送到目的地,提升了50%的并发效率; AP间部署相互之间存在干扰,华为AP间智能协同+逐包定制发射功率,提升了整网100%并发性能。■10倍可靠:99.999%高可靠,一年中断小于5分钟据统计华为人忙碌的一天需要开很多会议,每月有8万场视频会议,但是用户在会议过程中去打印室打印或者去茶水间的过程中会议容易断线影响办公效率; 通过华为Wi-Fi 7的AI漫游技术,漫游成功率从原先的50%提升至98.5%;立景创新拥有国内知名的智能工厂,无线生产得到了大量的应用。 传统Wi-Fi 由于只能连接一个无线射频,当此频段受到干扰就会造成数据丢失,严重时影响设备停机; Wi-Fi 6时代通过AP与CPE的双发选收来实现,但是由于Wi-fI 6 无标准的双发选收极致,导致AP和CPE需要严格适配,降低了部署和使用效率。 而Wi-Fi 7的MLO技术,实现AP与CPE的双发选收,提升可靠性质99.999%。■超高安全:华为独有Wi-Fi密盾,0窃听,0破解,守护园区网络安全网络安全成为人们日益关注的话题。有些用户在使用银行APP的时候,不敢联接公共Wi-Fi,担心自己的账号信息泄露;2022年某厂商的Portal页面遭到攻击,被境外势力植入了不当内容,引发了广泛的不良社会反响;这些是因为有些黑客可以利用WLAN的空口信息抓包获取通信数据,进行暴力破解。华为Wi-Fi 7通过独家的Wi-Fi 密盾技术,非法用户抓包智能抓到没用的噪声包,抓不到用户的真实业务包,从而组织了通过Wi-Fi 数据进行窃听和破解,守护园区网络安全。四、Wi-Fi 7 案例介绍某大学是中央直管、国家“双一流”、“985工程”、“211工程”重点建设高校。作为国家“985工程”、“211工程”重点建设大学之一,以及世界一流大学建设A类高校,对网络质量有较高的要求。 其体育馆设有总坐席数4486个,固定席2990个,活动席1468个,主席台28个,体育馆承接了学校体育赛事、招聘、庆典等功能,当前的无线网络建设比较久远(Wi-Fi 4的AP)、无线覆盖不全(当前无线是壁挂在体育场馆的四周,离AP比较远的场馆中央区域,前排的座椅经常无信号),学生反馈网络体验不佳,时常连接不上无线网络,连上之后经常断线,基本不可使用。 为了解决无线覆盖不全的问题,将增加AP布放到座位下面,当前体育场馆只有东西两侧有机房,为了改善部线的美观度,需要网线沿着阶梯座位里侧走线,如果要兼顾美观的情况下连接AP的网线很容易的超过100m;还有体育场馆的高度超过20m,只有体育场馆顶层的马道能走线,AP要吊顶安装时走线的长度容易超过100m,传统的布线方案很难搞定。 基于上述的网络问题,华为高品质Wi-Fi 7园区网络解决方案依托先进的建网理念赢得了其大学的青睐: 首先,业界首款商用Wi-Fi 7 AP的部署实现了全场景无线覆盖无死角,AP之间无缝漫游;有线部分采用CloudEngine S8700-6,提供2.5G以太全光接入,满足AP大带宽接入需求。实现了网络部署的先进性,可以说是网络建成即领先 其次,框式高密度光电混合主机+光电混合缆的组合,1台CloudEngine S8700-6就能满足体育场馆所有AP的供电和数据传输,实现1台设备管理整个体育馆;通过光电混合缆提供2000m超远POE能力,解决AP超距布线的问题,兼顾了布线的美观和安全。减少了管理节点,简化了运维,投资成本降低30%。 Holly_Chen二零二五年二月十八
《JDC公开课》系列活动邀您来主讲啦!
JDC成立九年至今,社区已经汇聚了来自各行各业有着多年资深经验的技术专家,大家非常积极在线上参与有奖话题探讨,为社区贡献了许多有价值的产品建议。在一次次的访谈交流及线下活动中,我们也更加深入接触了很多用户,发现很多用户都是分布在各个领域的高手。为了更好地让社区用户互相认识,也为了让更多用户学习其他同行人的实战经验,我们决定招募有料、有分享意愿的用户带头在JDC社区围绕自己擅长的技术领域展开分享,共同营造社区积极互动交流技术的氛围。为此我们特别策划了“ 《JDC公开课》”系列活动,诚邀各位自愿报名来主讲,特别是各位VIP朋友!!我们永远鼓励热爱分享知识的传道者,期待大家带头毛遂自荐!也让更多的同行能听到你的声音。 报名方式:如果你有兴趣成为分享者,参与下方回帖报名,并提交身份认证(详见公告),我们会从中筛选合适的主题来排期分享。如被选中分享,分享者需提前一周提交分享材料,分享时间在20分钟左右,内容可以围绕自己擅长的技术主题展开,并结合实战经验、行业案例给大家展开分享,分享将以线上视频的形式展开,会对社区所有用户开放,邀请大家一起围观互动提问。 参与细则:被选中的分享者可以自行在社区创建公开课报名帖,帖子内需包含分享主题、提纲、内容亮点以及公开课微信群二维码(由管理员提供微信群二维码),本报名帖将会对全社区开放,其他用户均可选择回帖报名,分享者可以自行拉上亲友团为自己的公开课打call、攒人气。JDC社区也会提供宣传支持,如在JDC首页上线公开课活动banner、JDC各行业微信群等多渠道宣传本次公开课内容。 参与奖励:1、根据分享内容的受欢迎程度(线上在线听课人数及互动评论数、公开课报名帖回帖评论人数、线上课程点赞数),社区会在10个工作日内发放1000-10000不等的智豆奖励。2、针对不同主题的分享,后续社区也会周期性地发起“优秀分享者评选活动”,并给予一定的奖励。请各位分享者尽情地亮出自己的“杀手锏”吧! 注意事项:1、请确保分享内容适合在线传播,避免涉及违反国家法律及平台规定的信息。2、分享者需自行承担分享内容的版权责任,确保不侵犯任何知识产权。3、同意由管理员对分享内容进行适度编辑和整理共享到社区,供社区用户学习。4、本次活动解释权归华为产品定义社区JDC所有。
《JDC公开课》系列活动邀您来主讲啦!
JDC成立九年至今,社区已经汇聚了来自各行各业有着多年资深经验的技术专家,大家非常积极在线上参与有奖话题探讨,为社区贡献了许多有价值的产品建议。在一次次的访谈交流及线下活动中,我们也更加深入接触了很多用户,发现很多用户都是分布在各个领域的高手。为了更好地让社区用户互相认识,也为了让更多用户学习其他同行人的实战经验,我们决定招募有料、有分享意愿的用户带头在JDC社区围绕自己擅长的技术领域展开分享,共同营造社区积极互动交流技术的氛围。为此我们特别策划了“ 《JDC公开课》”系列活动,诚邀各位自愿报名来主讲,特别是各位VIP朋友!!我们永远鼓励热爱分享知识的传道者,期待大家带头毛遂自荐!也让更多的同行能听到你的声音。 报名方式:如果你有兴趣成为分享者,参与下方回帖报名,并提交身份认证(详见公告),我们会从中筛选合适的主题来排期分享。如被选中分享,分享者需提前一周提交分享材料,分享时间在20分钟左右,内容可以围绕自己擅长的技术主题展开,并结合实战经验、行业案例给大家展开分享,分享将以线上视频的形式展开,会对社区所有用户开放,邀请大家一起围观互动提问。 参与细则:被选中的分享者可以自行在社区创建公开课报名帖,帖子内需包含分享主题、提纲、内容亮点以及公开课微信群二维码(由管理员提供微信群二维码),本报名帖将会对全社区开放,其他用户均可选择回帖报名,分享者可以自行拉上亲友团为自己的公开课打call、攒人气。JDC社区也会提供宣传支持,如在JDC首页上线公开课活动banner、JDC各行业微信群等多渠道宣传本次公开课内容。 参与奖励:1、根据分享内容的受欢迎程度(线上在线听课人数及互动评论数、公开课报名帖回帖评论人数、线上课程点赞数),社区会在10个工作日内发放1000-10000不等的智豆奖励。2、针对不同主题的分享,后续社区也会周期性地发起“优秀分享者评选活动”,并给予一定的奖励。请各位分享者尽情地亮出自己的“杀手锏”吧! 注意事项:1、请确保分享内容适合在线传播,避免涉及违反国家法律及平台规定的信息。2、分享者需自行承担分享内容的版权责任,确保不侵犯任何知识产权。3、同意由管理员对分享内容进行适度编辑和整理共享到社区,供社区用户学习。4、本次活动解释权归华为产品定义社区JDC所有。
【干货分享】向量数据库的原理与大模型适配应用
简介       随着人工智能技术的飞速发展,特别是大语⾔模型( LLM)的兴起,我们处理的数据类型正从结构化表格向海量的文本、图像、音频等非结构化数据转变。 如何⾼效地存储、管理和检索这些数据,成为了⼀个核心挑战。向量数据库,作为专为AI时代设计的“新物种”, 正是在这⼀背景下应运而生,成为现代AI应用不可或缺的基础设施。⼀、 理论基础: 向量嵌⼊与向量数据库从数据到向量:AI的“通⽤语⾔”       在计算机的世界里,所有数据最终都需转化为数字。但对于“你好”和“早上好”这类离散的文本,计算机本身无法理解它们在语义上的相近性。为了解决这个问题,我们引入了“向量化”(Embedding)技术。通过深度学习模型(如BERT、阿⾥Qwen等),我们可以将这些复杂的非结构化数据映射到⼀个⾼维度的数学空间中,形成⼀个由浮点数组成的数值向量,例如⼀个768维或⾼达4096维的向量。       这个向量就像是数据在AI世界里的“⾝份证”,它不仅包含了数据本身的信息,更重要的是编码了其语义和上下文。例如,“搜索”、“检索”和“查询”虽然字⾯不同,但它们的向量在空间中的位置会非常接近,因为它们的语义是相似的。这种特性使得机器能够“理解”并比较不同数据之间的相似性。向量数据库 vs. 传统数据库向量数据库的核⼼任务就是存储和查询这些⾼维向量。 它与我们熟知的MySQL等传统关系 型数据库在数据模型、 查询⽅式和索引机制上有着本质区别:            ⼆、 核⼼算法深度剖析:ANN的实现原理      向量数据库的魔⼒在于其⾼效的相似度搜索能⼒ ,这背后依赖于相似度度量和⾼效的ANN 索引算法。 暴⼒搜索 ( Brute-force) 的复杂度为O(N*d)         在百万级向量下已不可⾏ , 因此 ANN算法⾄关重要。相似度度量:定义“距离”       衡量向量“相近”程度的标尺是距离度量函数。选择合适的函数对检索的准确性至关重要。       余弦相似度 (Cosine Similarity):  cos(θ) = (A·B) / ( ||A || · ||B ||)。它关注向量的方向而非大小,值越接近1表示方向越⼀致,语义越相似。这是文本相似度计算中最常用的⽅法。      欧氏距离 (Euclidean Distance):  d(p,q) = √Σ (pi - qi) ²。它反映了向量在空间中的绝对几何距离,适用于对数值差异敏感的场景,如图像处理。      内积 (Inner Product):  A ·B = ΣAi · Bi。在向量归⼀化后,内积等价于余弦相似度。某些模型直接优化内积,可以简化计算。索引算法:⼤海捞针的艺术1. HNSW (分层可导航⼩世界)      HNSW (Hierarchical Navigable Small World) 是⼀种基于图结构的算法,它构建了⼀个多层级的导航网络,实现了速度与精度的优异平衡。其灵感来源于跳表(Skip Lists)和可导航小世界( NSW)图。      结构原理: HNSW构建⼀个多层图。顶层图最稀疏,节点间的连接(边)跨度很大,像“⾼速公路”;底层图最密集,连接了所有数据点,像“城市小道”。这种分层结构使得搜索可以从顶层开始,快速“跳跃”到目标区域,然后逐层下降,进行更精细的查找。      搜索过程: 搜索从顶层的入口点开始,在当前层使用贪心算法寻找最接近查询向量的节点。当找到局部最优解后,将该节点作为下⼀层的入口点继续搜索,直到达最底层。这个过程的平均时间复杂度可以达到 O(log N)。      关键参数:M(每个节点的最大连接数)、 efConstruction (构建索引时的邻居候选集大小)和ef(查询时的邻居候选集大小)是影响性能的关键。增加这些值可以提⾼召回率,但会增加索引构建时间和查询延迟。2. IVF (倒排⽂件索引)      IVF (Inverted File Index) 采用“先聚类 ,再搜索”的策略。它首先通过K-Means等算法将所有向量分成nlist个“簇”(cluster),每个簇有⼀个中心点(centroid)。      结构原理: 索引由两部分组成:所有簇的中⼼点和每个簇内向量的倒排列表。每个向量被分配到离它最近的中心点所在的列表中。      搜索过程: 查询时,首先计算查询向量与所有nlist个中心点的距离,选出最近的nprobe个簇。只在这nprobe个簇对应的倒排列表中进⾏精确搜索,从⽽将搜索范围从N缩小到约N * nprobe / nlist。      IVF-PQ (乘积量化): 为了进⼀步降低内存占用,IVF常与PQ( Product Quantization)结合。PQ将⾼维向量切分为多个低维子向量,并对每个子空间独立进行量化,用⼀个短码(如8位整数)来表示句子向量。这是⼀种有损压缩技术,能将内存占用减少⾼达97%,但会牺牲⼀定的精度。                                                            3. 混合搜索 (Hybrid Search)      纯粹的向量搜索可能⽆法处理精确匹配或罕见词查询。因此混合搜索应运而生,它结合了基于关键词的稀疏向量检索(如BM25)和基于语义的密集向量检索。 有些向量数据库(如Milvus)已原生支持此功能,通过对两路召回结果进行重排序( Rerank),可以显著提升搜索的召回率和精度。三、 主流产品架构与性能对⽐架构对⽐      Milvus: ⼀款功能强⼤的开源向量数据库,采⽤存算分离的分布式架构。 它由接⼊层、协调服务、⼯作节点和存储层四个独⽴的组件构成,具有⾼可⽤ 、⾼可扩展的特性,专 为⼤规模⽣产环境设计。      Pinecone: ⼀款全托管的Serverless向量数据库。它为⽤户屏蔽了底层复杂的运维工作,通过API提供服务,并能根据负载⾃动扩缩容,适合追求快速上线和低运维成本的团队。      Faiss: 由Facebook AI Research开发,它是⼀个专注于⾼效相似度搜索的底层库,而非⼀个完整的数据库系统。Faiss性能极致,是许多其他向量数据库产品的核⼼引擎 ,但直接使⽤它需要自行处理数据管理、API封装和分布式扩展等问题。      ChromaDB: ⼀款轻量级的开源向量数据库,主打“开发者友好”,非常适合用于快速原型验证和中小型项目。易于部署和使用,是许多开发者入门向量数据库的⾸选⼯具。性能基准(Benchmark)      性能对⽐通常关注QPS(每秒查询数)、延迟和召回率( Recall)三项指标。 根据VectorDBBench等公开基准测试,在不同数据集和硬件配置下,各数据库表现各有千秋:      Milvus 在⼤规模数据集(如10亿级别)上展现出强⼤的⽔平扩展能⼒和⾼吞吐量,其性能随集群规模扩⼤近乎线性增⻓。      Pinecone的p2(性能优化)实例在低延迟查询⽅⾯表现出⾊,即使在⾼负载下也能保持毫秒级响应,但其召回率可能略低于精度优化的配置。      Faiss 作为底层库,在单机性能上通常是标杆,尤其是在GPU加速下。但要达到同等的系统级性能,需要⼤量的⼯程优化。四、RAG⾼级优化与⼯程实践                             ⼤语⾔模型虽然强⼤,但存在知识截⽌⽇期和模型幻觉两⼤痛点。检索增强⽣成(RAG)通过为LLM外挂⼀个包含实时、专业知识的向量数据库,完美地解决了这些问题。然⽽⼀个基础的RAG流程在⽣产环境中往往效果不佳。为了提升RAG系统的性能,需要采⽤⼀系列⾼级优化技术。1. 检索前优化(Query Rewriting)      ⽤户的原始查询可能存在歧义或过于复杂。通过LLM对查询进⾏改写,可以提升检索的精准度。       HyDE (Hypothetical Document Embeddings): 让LLM针对⽤户问题⽣成⼀个“假设性”的答案,然后⽤这个答案的向量去检索,可以缓解查询与⽂档之间的语义鸿沟。      子查询生成: 将⼀个复杂问题(如“对比Milvus和Pinecone在RAG场景下的优缺点”)分解为多个简单的子查询(“Milvus在RAG中的优点是什么?”、“Pinecone在RAG中的优点是什么?),  分别检索后再汇总给LLM。2. 检索中优化(Advanced Retrieval & Reranking)      句子窗⼝检索(SentenceWindowRetrieval):检索时使⽤更⼩的⽂本单元(如单个句子)进⾏相似度匹配,以提⾼精度。在找到最相关的句子后,将该句子所在的更大文本块(如前后三个句子)作为上下文提供给LLM,确保信息的完整性。      层次化索引:对文档建立两级或者索引:⼀个是对文档摘要的索引,另⼀个是文档内部块的索引。先通过摘要索引筛选出相关文档,再在这些文档内部进行精细检索。      重排序(Reranking):初步检索(如混合搜索)召回Top-K个候选文档后,使⽤更强大的重排序(reranker)模型(如Cross-Encoder)对这K个文档与查询的相关性进行精确打分,选出最终的Top-N个文档。3. 检索后优化(Prompt Compression)    检索到的上下文可能包含噪声或冗余信息,且LLM的上下文窗⼝有限。通过LLM对检索到的内容进行压缩和总结,提取核心信息,可以构建更⾼效、更精炼的prompt,让LLM回答更加贴合场景。4. RAG框架新进展      学术界和⼯业界也在探索更先进的RAG框架,如SELF-RAG(通过⾃我反思判断是否需要检索以及评估检索内容质量)、CRAG(对检索结果进⾏评估,若不佳则触发纠正性检索)、GraphRAG(一种融合知识图谱技术与检索增强生成(RAG)的方案),这些框架赋予了RAG系统更强的⾃主决策和纠错能力。总结      向量数据库不仅是⼀种新型数据库技术,更是连接非结构化数据与AI模型的关键桥梁。从底层的ANN算法原理,到上层的分布式架构设计,再到与RAG结合的复杂工程实践,向量数据库正在构建⼀个全新的、面向AI的数据基础设施生态。在数据驱动的未来,深刻理解并掌握向量数据库的核心技术,将是每⼀位AI⼯程师和架构师的必备技能,也是推动更多颠覆性创新应用诞生的基石。
【干货分享】计算机视觉在机房运维的应用
一、 分享主题       机房管理作为企业信息化基础运维的关键环节,面临着诸多机遇与挑战。本次分享聚焦于在现有机房条件下,如何运用AI新技术提升维护管理效率,开展了基于YOLO神经网络的机房现场巡检实践。剖析从传统管理模式向智能化巡检的转变过程,探讨其中涉及的技术应用、实施、问题分析及改进方向,旨在为同行提供有益的参考与借鉴。二、背景与需求(一)机房现状       前期大部分机房仍依赖传统纸质巡检表进行管理,不仅工作量巨大,而且管理难度颇高,对于巡检人员是否真实到现场执行操作难以有效监督。在实际操作中,可能存在巡检人员未按要求清理设备防尘网,却在纸质表格上虚假填报的情况。而且由于机房数量较多、分布广泛,若要对所有机房进行全量检查,人力成本将成为沉重负担,这使得机房管理在执行效果和成本控制方面面临两难困境。(二)需求分析       基于上述现状,机房管理迫切需要解决两个核心问题。其一,要确保一线巡检人员能够切实按照规定的周期(如季度或半年)对每个机房进行巡检,即保证巡检的数量和覆盖面。其二,在巡检人员到达现场后,需要一种有效的手段来准确判断其是否真正执行了各项巡检操作,以及操作是否符合规范要求,从而实现对巡检质量的有效把控。三、项目部署(一)技术演进       早期探索(2019 年):我们利用机房内现有的安防摄像头,针对指针仪表开展识别工作。通过使用开源的计算机视觉库,成功实现了对倾斜拍摄照片的校正,将其转化为可供准确识别的平面图像,进而对仪表内的字符和指针进行识别。这一早期实践为后续技术升级奠定了基础,证明了在机房现有设备条件下实现一定程度智能化管理的可行性。       新技术应用(2023 年):我们构建了前端小程序与后端识别相结合的技术架构。前端小程序主要负责一线巡检人员在机房现场的打卡操作,以及照片采集工作,为后续的分析提供数据来源,后端使用YOLO计算机视觉承担着复杂的识别任务。       模型训练过程:通过对人工筛选出的 100 多张清晰且符合要求的现场照片进行标注训练,构建模型以实现对机房设备及相关部件的智能识别。对照片中的各类设备及部件,如华为 OTN 设备、防尘网、尾纤、动力端子、ODF 等进行详细标注,使模型能够学习并识别这些元素。当然,训练过程也面临着一些挑战,例如使用普通显卡(2060,8GB 显存)进行训练时,对照片大小有一定限制,否则会出现显存不足的问题,这也提示在实际应用中对于算力平台的选择需要更加谨慎,以满足更高精度和更多模型需求。(二)项目部署       小程序功能设计:开发的小程序集成了全省机房的经纬度等关键信息,通过定位功能确保巡检人员在机房附近(几百米范围内)才能完成巡检打卡操作,有效防止了虚假打卡和照片代传现象。同时,在小程序中明确制定了一系列巡检项目,涵盖 ODF 状态检查、设备标签完整性查看、防尘网清理情况核实等多个方面,为巡检人员提供了详细的操作指南,也为后台的量化评估提供了依据。       存在的问题:在项目执行过程中暴露了一些问题,一方面AI模型识别精度方面存在误识别、漏识别。另一方面AI模型针对场景的训练还不够,比如能够识别出设备防尘网等部件,但对于防尘网是否真正清理干净、尾纤 ODF 是否整齐规范等细节问题难以准确判断。这主要是由于前期样本采集不够全面,对于不同角度、不同状态下的设备部件样本覆盖不足,特别是对于一些特殊情况缺乏足够的缺陷样本进行训练,从而影响了AI模型的效果。四、总结与待改进之处(一)工作阶段回顾        回顾整个机房管理的优化过程,经历了三个重要阶段。第一阶段是从传统的纸质化管理向程序化管理的转变,通过要求地市现场上报巡检情况,实现了一定程度的量化管理,确保了巡检的覆盖面。第二阶段则引入了计算机视觉技术,将智能化手段应用于巡检判断,这是对传统管理模式的重大突破,有望提高巡检质量的评估准确性。然而,目前的方案仍存在诸多不足之处,需要进一步改进。(二)待改进方向        在机房基础管理方面,整体机房的 IT 化程度有待提高,尤其是设备与机房关系的码化管理。目前,机房设备与机房位置关系的记录方式较为传统,未充分利用二维码等现代标识技术实现精细化管理。例如,设备在机柜中的位置、机柜在机房中的位置等信息缺乏有效的数字化标识,这不仅影响了日常管理效率,也制约了智能化技术在机房管理中的深度应用。       在AI视觉模型方面,模型还需要完善与拓展。现有模型在覆盖范围上存在局限性,无法应对机房内一些复杂场景和其他专业相关的检查内容。例如,对于机房地面杂物、设备接地情况、机房设施如蓄电池等方面尚未纳入模型,导致这些潜在问题无法通过智能巡检及时发现。这需要进一步扩大样本采集范围,涵盖更多类型的设备状态和机房场景,以提升模型的泛化能力,使其能够适应多样化的机房环境和管理需求。       在AI 技术融入生产流程方面,目前仍存在较大差距。虽然小程序巡检已切入流程量化,但 AI 识别结果尚未完全纳入考核体系,主要原因是误检和漏检情况时有发生。例如,因照片拍摄不清晰导致防尘网清理情况识别错误,影响了考核的公正性和准确性。未来需要进一步优化算法,提高识别精度,同时建立更加完善的异常处理机制,确保 AI 识别结果能够真实可靠地反映巡检情况,从而实现全流程的智能化管理与考核。       在制度建设方面,机房管理涉及多个专业领域,跨专业协同存在明显壁垒。不同专业之间信息共享不畅,各自为政,如传输专业在进行设备 AI 巡检时,无法及时与动力专业共享设备温度等信息,导致无法实现空调等设备的协同调整。此外,公司制度在如何有效应用 AI 识别结果进行现场考核方面缺乏明确规定,这在一定程度上限制了新技术在提升机房管理效率方面的作用发挥。因此,需要从公司层面加强跨专业协作的统筹规划,建立统一的信息共享平台,打破专业壁垒,同时完善相关制度,明确 AI 识别结果在考核中的地位和应用方式,以推动机房管理向更加高效、智能的方向发展。        综上所述,本次计算机视觉模型在机房运维的应用实践,在提升维护管理效率方面取得了一定进展,但也面临着诸多挑战。未来需要在AI模型优化、流程改进、跨专业协同和制度建设等多个方面持续努力,以实现机房管理的全面数字化、智能化转型,为企业信息化基础设施的稳定运行提供坚实保障。
【干货分享】基站节能,竭尽所能
一、分享主题介绍:本次分享主要从在运营商负责无线基站节能自身的工作出发,浅谈一下当前运营商无线基站的节能情况。分享主要包括无线基站节能的背景、现网是如何节能的、以及节能过程遇到的一些问题矛盾,最后谈一下个人对基站节能的一些未来思考。关键的结论有以下几个方面:1.基站节能面临多重压力,包括国家双碳站点战略、上级的考核要求和自身成本压力,促使运营商在节能方面采取了多种措施,如极简改造、主设备软硬关断、空调远程智慧节能、老旧设备拆除和高能耗设备更换等等。   2.目前运营商面临的主要问题包括空调节能导致的故障率增高、客户投诉和安全风险,需要在不影响安全和减少客户影响的前提下,优化节能措施。   3.未来节能方向包括智能控制、场景优化、联合研究和准确的节能评估体系,以解决当前受限条件下的节能问题。二、基站节能的背景近年来,运营商对于基站节能的要求越来越高,主要的背景来源于几个方面:1、国家双碳战略:虽然运营商不在双碳战略的主要行业,但对于总体战略上,国家有一些要求,如下:(1)到2025年,新建5G基站站址共享率不低于80%;(2)5G基站能效提升20%以上;(3)积极探索利用可再生能源,如加大绿色能源推广使用。2、上级考核要求对于国家战略的要求,加上5G大规模应用后电量的急剧增长带来的压力,以及公司本身的成本压力,运营商可以说自上而下加码要求落地节能措施。这一点目前主要体现在主设备节能和总体能耗的要求。(1)厂家软关断节能开启比例:一开始只是节能动作要求,全网要开启节能,但是节约多久,什么效果没有具体的要求;(2)节能时长的要求:进一步,在节能参数开启的基础上,增加了节能时长的要求,比如4G要全网达成日均1小时以上,5G要达到3小时以上,这样就要求在闲时必须要执行节能;(3)能耗压降的要求:再进一步,只是时长还不到位,总体能耗趋势可能不受控,所以要求针对比如不同频段,要求有不同的能耗压降;今年又增加了针对整个机房的总体能耗压降要求,就针对的不只是主设备,还有配套的电源空调等等,以及电价涵盖进去。3、成本压力深圳基站电费成本缺口较大。虽然基站的总体用电成本逐年要求下降,但目前25年可能是最难的,以后可能更难;像深圳目前电费缺口大概5%-10%,千万级的。所以在国家战略指引,上级考核要求的基础上,电费自驱力节能也更高了,因此有了标题的竭尽所能,做好基站节能。三、现网基站节能手段目前无线基站方面,节约电费的主要从电价和电量两个角度出发,主要有以下几个方面:1、电费角度(1)业主电费谈判;因为深圳目前较多的是转供电,需要通过管理手段,协商业主,降低电价;可能会影响租金;(2)转供电改直供电;目前直供电和转供电差价较大,且深圳直供电比例较低,因此需通过外电整改和物业协商,对现有站点直供电改造,对新建站点要求必须直供电,以电价差节能。需要以投资换取电费;(3)峰谷电价差的评估更改:针对直供电站点,通过统计分析,确认平价和峰平谷电价对于站点哪种更节能,与供电局更改电费计量方案;(4)光伏储能改造:通过对基站天面增加光伏,在机房内增加储能电池,将削峰填谷做到更节约电费;目前广东规模应用的是光伏,因安全考虑和分成模式未批量纳入储能;2、电量角度(1)极简站点改造:去机房化,节约空调电费;同时节约租金;(2)主设备软关断节能+硬关断节能;通过对闲时关闭主设备,节约电量;(3)空调远程智慧节能;通过加装远程控制器或者FSU控制,对空调在温度允许范围内,自动启停节约空调电费;(4)老旧设备拆除退网(2G设备、直放站、WLAN、UPS等);针对老旧的设备下电退网节约电费;(5)高能耗设备更换(开关电源、空调等);通过更换新设备,提升能耗转换效率,节约能源;(6)新风系统改造;通过机房改造,将新风系统与空调联动,在允许情况下,切换新风系统节约电费;(7)其它我们还试点了带电清洗开关电源提升能效、液冷板空调节能、浸泡BBU节能等,但没有规模化应用。接下来具体点讲一下最主要的极简改造和主设备节能:1、基站极简改造:投资换电量    主要针对高租金高电费的站点优先极简,包括铁塔站点,先节约空调电费。CRAN(C-RAN)基于集中化、协作化处理,通过电源、传输和空调集中化或室外化,减少设备能耗,节省电费。    实际极简改造需要增加较多的传输投资和后继的传输维护成本,且节能效果和退租谈判不是特别乐观。2、主设备软硬关断节能:    具体节能参数包括参数的基本功能、参数如何配置。目前网络支持的节电策略,主要分为以下六类。其中主设备厂家5类,另外硬关断是远程增加开关断电节能。(1)硬关断:硬关断需要在基站近端安装某厂家的设备,物理上对射频单元进行断电。这个可以简单理解为定时开关电源。——节能效果100%;(2)极致休眠(需要License和设备支持):相当于定时开关机,一旦生效,不到结束时间,无法唤醒。极致休眠生效后整个AAU关停,AAU所带4/5G小区均受影响,所以如果同站没有其他频段,可能会出覆盖问题,故要慎重进行极致休眠!——节能效果95%以上;(3)深度休眠(又分定时休眠+基于负载的休眠):深度休眠生效后,系统会自动设置小区状态为禁止接入,用户无法接入。——节能效果40%-80%(4)载波关断-4G/浅层休眠-5G(系数0.5,基于负载)小区级载波关断,24小时都可以触发;载波关断生效后,系统会自动设置小区状态为禁止接入,用户无法接入。基于负载的判决门限同深度休眠。——节能效果20%-40%;(5)通道关断(不算节电时长)比如64TR降为32TR,节能生效后,业务性能会打折,不影响小区用户接入使用。(6)符号关断(不算节电时长)节能生效后,业务性能会打折,不影响小区用户接入使用。备注:硬关断需增加硬件投入,投资或者成本换电费,软关断无本经营,牺牲性能和流量。3、老旧拆除替换节能:以成本换电量主要针对2G的主设备、直放站设备、WLAN设备进行拆除退网,直接节约电费;针对UPS设备,当前备电时效,存在安全隐患,一般直接拆除更改电路,减少能耗损失;4、针对现网超期服役的配套设备更换:以投资换成本主要通过投资等,更新换代电源、空调和拆除UPS设备,其中电源、空调焕新后,能耗提升,节约电费;5、空调智慧节能——成本或者投资换电量通过增加空调远程控制器和温感设备,设置策略来自动启停空调(当前28-35度实施节能);6、新风系统改造通过增加新风系统,与空调切换,减少空调功耗。四、节能所遇到的问题矛盾前期空调节能导致安全和设备节能导致故障、指标问题和投诉。本身节能不影响安全隐患是前提,同时尽量减少客户影响和。但实际操作中,因为考核指标一刀切,那执行节能一般也是统一规则,针对个性需求会有影响。1、因为当前上级考核时长的要求,大多节能措施是一刀切的时间和门限,导致每天都有客户投诉;2、因为空调当前基于温度启停,部分35℃门限可能设备已高温;且空调频繁启停影响性能,增加故障率;3、设备频繁启停导致设备性能和寿命影响;4、前期试点新风系统,发现在类似广东地区,不实用;5、储能、光伏包括节能等措施,主要限制的能源合同管理的谈判分成限制。 五、未来节能的一些思考在节能实际操作后,为解决上述遇到的问题,在节能和性能、安全获取平衡,更好的评估节能,有以下的思考:1、基于场景研究参数优化在全网统筹确定标准参数后,分场景研究各类场景的个性化门限和时间范围,给出最终应开尽快的节能设置;基于目前厂家参数部分互斥(极致和深度只能24小时一次)、极致影响夜间工程等,与厂家协同改进参数设置;针对现在参数调整复杂且涉及较多,与省公司和厂家协同优化流程,在安全的前提下,建立灵活的流程体系;基于电费选点更新规则;2、基于iSDU、硬关断研究软硬结合与华为在深圳进一步小批量试点ISDU,将软参数设置和上下电结合,最大限度节能;针对现有的硬关断设备,与软参数交叉确认,通过最终参数执行时间,优化硬关断时间;通过代维调整极致支持设备与硬关断设备,扩大高效果的硬关断和极致休眠数量,建议优化体系。3、基于FSU等空调控制研究联合研究当前空调设备的节能下探,与主设备节能、前期的新风系统等结合,通过后台判断、调整空调位置、更换能耗低空调和调整节能参数联动设置,提升空调节能效果‌。结合后记安装的FSU监控设备,将环境、设备节能时间、空调节能设置结合,给出全机房节能优化方案。4、基于网管和电表研究效果统计当前参数调整与能耗效果实际可能存在误差,计划针对厂家网管和现场电表测量对比确认找出各节能参数真实能耗对应,可以有效预估实际节能效果‌。针对基站总体能耗降幅情况,与物业联合研究电表、机房、设备的对应关系和节能参数关联性,给出评估体系建议。总体目标:解决受限条件,竭尽所能节能1、解决合同能源管理模式:包括储能、光伏、新风、液冷等等节能手段才能大规模应用;2、要以高电量高电费引导节能措施;3、横向学习其它行业,纵向要求合作方。以上就是我这几年针对基站节能的一些分享,其实节能走到现在,最主要的还是压力的促进,从运营商本身,开始是没有驱动力的,财大气粗。但实际节能确实与安全、性能和客户感知关联,我们在面对节能的时候,缺少了规划统一,并且受制于审计等问题,很多节能规模化的方案没有被应用,也希望能借鉴其它行业的先进经验,推广应用。
【干货分享】未来新能源有哪些关键需求
背景介绍:新能源、数字化和AI大模型都很热门,但是他们之间的关系是什么呢?今天我在这里从另外一个视角跟大家讨论一下未来的新能源有哪些关键需求,主要是从以下三个方面:新能源发展面临的问题、未来新能源在关键领域的需求、新能源的集中管控安全区的划分方式展开分享。一、新能源的发展及面临的问题2023年我国的发电装机容量达到29亿KW,同比增长13.9%。其中光伏增长最快,从去年4个多亿KW增长到6.1亿KW的高水平,同比增长55.2%,其次风电同比增长20.7%,说明新能源在整个发电的结构占比越来越大,但随着比重的增大也带来了一些问题。再看另一组数据,新能源发电的各个区域并不平衡,从松辽、冀北到新疆、金沙江和雅砻江,无论风电还是光伏都有比较大的发展。右边列出了前十大发电集团的发电容量,除了五大发电集团外,还有三峡、中广核、华润电力、国投电力和中核集团。整个发电装机容量增加了13%,但是这些增长也带来了问题。以下是中电联在二月份给出的一个预测,新能源的总装机超过了煤电,发电装机增加了13.5%,但用电量仅增长了6%,从这个差距可以看出,无论光伏还是风电利用小时数比较低,此外也都没有百分百的消纳,许多地区还存在着大量弃风、弃光现象。出现这种情况的原因是风电、光伏会受到天气和环境的影响,存在波动性和随机性,使得风电和光伏发电的功率表现出不稳定和不确定性。如下三张图,最左边的图是全国的风光发电装机容量(新能源装机),2013-2022年间整个装机平均增长27%。第二张图是整个发电过程中风速的波动性带来的发电量变化,从最右边的图可以看出,风力的发电功率随着风速的变化具有比较强的不确定性,如此一来给我们的调度控制带来了一定的困难和挑战。第二个问题是能否想办法将不确定的东西变成确定性的内容,或者说是对未来的发电的功率进行一个预测,这样可以在发电计划里对波动进行预判,使得发电更平稳,可再生能源更多地被消纳,所以需要与现在的AI应用相结合。二、功率预测与未来AI应用功率预测是提高新能源发电与消纳的重要利器。对风电场和光伏电站的发电功率进行准确预测,可以更多地安排需求侧响应以缓解电力系统调峰调频的压力,提高新能源消纳能力。同时风电功率的预测还可以指导风电场的检修计划,可以更多地提高风能的利用率,提高风电场的经济效益。新能源发电功率的预测对电网制定调度计划、安排备用容量、保证电网的安全运行都有着重要意义。同时,对发电企业也具有重要的意义。从发电的波动性和电力现货的交易价格来讲,2023年9月份,国家发改委和能源局印发了电力现货市场的基本规则,进一步规范电力现货市场的运营和管理。从下图可以看出,在风电大发的时候,会出现一个负电价。原因是电力系统对可再生能源进行消纳的时候,电网会放弃气风和气光(风力比较大或者光伏比较强)。如何能够准确预测风电的功率,满足电力交易市场对风电的要求?可以提前利用价格杠杆的信息传达给消费者和负荷侧,使得发电和负荷基本平衡,帮助发电企业在市场的交易当中有更强的竞争力。基于AI的气象大模型是为解决风电和光伏功率预测产生的关键需求。解决这个业务痛点问题就可以帮助新能源发电企业发更多的电,并达到电网对发电企业有比较严格的考核要求,以避免由于预测不准而导致每年几十万到几百万不等的罚款。AI大模型利用高精度的气象数据对发电功率进行更准确的预测,颗粒度从过去的几十公里提高到现在的3公里左右,对风电或者光伏的发电功率预测更准确了,预测的结果在传统数值的预测方法之下,RMSE小于1.4。三、集中管控与安全区划分在功率预测准确的情况下,集中控制调控和安全分区息息相关,接下来讨论在新能源集中管控的条件下,安全分区如何划分。发电集团的新能源集中管控平台的功能架构是什么?以海上风电场为例,整个新能源集中管控系统有一个比较全面的考虑,除了考虑气象条件,还需要考虑各设备资产健康的情况和安全作业的情况进行全面的感知。在这个基础上,还需要使用通用的服务,包括状态的感知、数据中台、算法中台等,为新能源发电的集中管控提供了基础的支撑。下面的新能源分层管控的数据流图显示,每一个风电厂或者光伏厂都通过电网的调度来进行发电生产。同样,在整个发电生产过程中,发电集团也希望通过一个集团级的管控平台对新能源的各个场站进行管控。对场站进行管控不仅仅是为了发电生产,还需要考虑检修运维、检修计划、物资调度、基于工业互联网情况下如何使发电的功率最大,安全的检修工期最短以及发电的效益更好。下图是光伏电站生产的环网,包括一次系统和感知后的二次系统以及安全区的一区和二区。安全区的一区与电网的调度系统直接相关联,另外要通过安全区的二区和电力专线,使得数据收集上来后提供给区域的管控中心使用。如果考虑到未来的分布式能源,特别是分布式新能源,如果区域管控中心要管控的话,需要在一区建立一定的装置,比如实时数据库、单向的隔离装置,使得数据能从二区采集上来,功率预测基本都是放在二区。每个新能源场站的升压站的监控系统也与电网调度系统相关联,除了调度系统外,还有站控层的保护测控和其他的一些数据单元。把这些数据采集上来通过集控系统,可以实现从过程层到间隔层再到站控层的全面管控。下图是升压站监控系统典型组网结构图,从图上可以看出,站控层里面实际用到了大量的工业交换机,从上面的站控层到安全区二区都会使用工业交换机。——————————Q&A环节——————————Q1:生产控制层的硬软件基础设施是否有更高的要求来适应新能源环境?回答:新能源电厂的规模比较小,比较分散。如果按照原来电厂的规模配置,每个厂都将需要许多人运行维护,会导致成本很高,所以许多的场站是无人值守,尤其是光伏,这样的话对集控系统提出了比较高的要求。集控系统和场站之间是通过光纤通讯,数通产品以及工业交换机是新能源数字化的关键需求。Q2:使用AI进行功率预测是否实践中已经有应用?还是说电力行业还处于研讨环节。回答:目前已经有应用,实际上华为公司和九天在盘古大模型上做了许多专业的开发,形成了一些专业的应用。Q3:关于计算数据中心的基础设施,电力行业是否有相关的标准?回答:电力行业是有标准的。随着大模型火了之后,对算力的需求越来越大,带来了耗能需求的剧增,发电企业在做用绿色的电力支撑绿色的算力,能更好地为大模型提供源源不断的清洁算力。相关标准实际上是IDC机房的标准,主要是电网公司在主导,因为他们的ITC机房最多,我们这边是电力行业信息化标委会在组织这方面标准的起草。Q4:虚拟电厂和新能源应用场景中,工业交换机是否对安全有更高的要求?回答:工业交换机之所以加上工业两个字是因为工业交换机对安全,特别是可靠性的要求比普通交换机高很多。所以在使用交换机的过程中,一旦出现安全问题或者意外宕机的话会造成巨大的损失。Q5:大模型分功率和复合的现状是怎样的?盘古大模型在这方面的应用情况如何?回答:一个月前我参加了华为公司的伙伴大会,九天和华为公司推出了盘古气象大模型,其中就有新能源领域方面的应用。盘古气象大模型应用到未来像新能源场站的选址和做发电计划的参照。如果分功率预测或者发电新能源的发电功率预测,真正把它融入到这个发电系统里面的话,我觉得还是需要一定的时间。Q6:电力行业这几年在不断发展,从传统电厂一下变成虚拟电厂,老师是否也在不停地跟进学习?目前这个发展阶段,虚拟电厂的难点在哪里?回答:在发电过程中能够聚合原本分散式的各个不同形式发电的电源虚拟成一个电厂,也是电网通过复合的平移虚拟一个电厂。在这里面,电网的中调起到了一个决定性的作用,并不是一个企业想做虚拟电厂就可以做到的。虚拟电厂的难点主要在于安全区一二区的互相隔离,要实现虚拟电厂就需要打通一二区的分隔。现在也有把一区和二区融合在一起的,像深圳等比较开放的地区在做这方面的尝试。Q7:虚拟电厂在安全方面有什么新模型和标准?回答:虚拟电厂在安全方面的标准与原来电力系统的安全标准一致,但虚拟电厂本身有自己的标准。目前国家电网和南方电网正在起草关于虚拟电厂的标准,已经到了送审稿阶段。Q8:国内的供电行业跟国外是否有差距?或者说我们有什么优势或者劣势?回答:我们有优势也有劣势。优势在于我们有大一统的电网,能够发挥集体的力量,所以在很多自然灾害的情况,南方电网和国家电网都能够及时地赶到现场把损坏的供电设施很快恢复。劣势在于分布式能源系统建立不如国外,例如德国的储能是每家每户的储能,户储占到85%左右,多发的点可以存储起来,不像国内电网集中输送,把多发的电发散掉了。Q9:传统电厂如果进行数字化改造的话主要做哪些?回答:传统电厂做数字化过程中能花钱买到的东西都好办,最难的是数据治理。过去许多的数据是一个个信息孤岛,如何把信息孤岛的数据集中起来,怎样在没有关注数据结论的情况下收集这些数据并整理好变成企业的数据资产,这个过程往往比购买软硬件更重要,更具有考验。Q10:您一般通过什么方式去更新知识储备?推荐哪些大家需要关注的内容或看的书?回答:要看清电力系统一定要跳出电力系统这个圈子,电力系统是为老百姓,为千千万万企业服务的,他们需要的是电能而不是从管理的角度去管住谁。跳出圈子后看看整个工业体系是怎样发展,IT技术怎样发展,不要只关心我们身边的东西。我们要向互联网公司学习,向头部企业学习。比如数据治理,数据治理方面我推荐一本较好的书,就是保险公司写的数据,去看下是怎样转变过去传统的模式,怎样能够把原来的数据质量提高。推荐一本我比较看好的书《浪潮之巅》,这本书是讲数字化历史的,也讲了很多的趣事,同时也给了我们许多启示,告诉我们如何应对未来的变化。 JDC公开课系列活动主讲人正在火热招募中,快来分享你的专业,与JDC一起成为数字化传播大使,还能赢取丰厚智豆奖励,快点击链接报名吧!