随着医疗健康与养老行业数字化进程的加速,数据孤岛、标准不统一、语义不一致等问题日益突出,严重制约了数据价值的释放和智能化应用的发展。本文提出了一种基于本体论的实体数据空间构建方法,通过以实体为中心重构数据组织方式,建立统一的语义框架和数据模型,实现多源异构数据的融合与互通。文章详细阐述了实体数据空间的核心概念、理论基础、技术架构和关键特性,并结合医疗健康与养老领域的实战案例,展示了实体数据空间在临床科研、患者招募、慢病管理、养老服务等场景中的应用价值。实践表明,实体数据空间能够显著提升数据治理效率,降低数据应用门槛,为医疗健康与养老行业的智能化转型提供强有力的数据支撑。 关键词: 实体数据空间;本体论;医疗健康;智慧养老;数据治理;数字孪生一、引言在数字经济时代,数据已成为核心生产要素。医疗健康与养老行业作为数据密集型行业,积累了海量的结构化、非结构化和半结构化数据。然而,这些数据分散在不同的业务系统中,存在标准不统一、语义不一致、互操作性差等问题,形成了一个个 "数据孤岛"国家数据局。传统的数据仓库和大数据平台虽然能够实现数据的集中存储,但在处理跨领域、跨系统的数据融合和语义理解方面仍存在明显不足,难以满足医疗智能化对高质量、高时效性数据的需求。近年来,欧洲率先提出了健康数据空间的概念,并在德国、法国、卢森堡等国家开展了实践探索国家数据局。我国也在《可信数据空间发展行动计划(2024—2028 年)》中明确提出,要加快建设行业、城市和企业三类可信数据空间,推动数据要素安全有序流通和价值释放国家数据局。在此背景下,我们基于本体论思想,结合医疗健康与养老行业的业务特点,研发了数象实体数据智能平台,并在多个城市和医疗机构开展了落地实践,取得了显著成效。二、实体数据空间的概念与理论基础2.1 实体的定义在数据空间中,实体是指物理世界中真实存在的服务提供者、服务使用者、服务监管者等对象在数据空间中的动态数字孪生。例如,患者、医疗机构、老人、养老机构等都可以被定义为实体。实体具有以下特征:唯一性:每个实体都有唯一的标识符动态性:实体的属性和状态会随时间变化关联性:实体之间存在各种复杂的关系完整性:实体包含了其所有相关的数据信息 2.2 本体论与实体数据空间的关系本体论是实体数据空间的 "语义骨架",为数据空间提供了统一的语义基础和概念框架,确保了不同数据源之间语义的一致性和可理解性。数据空间则是本体论的 "血肉载体",承载着具体的、多样化的数据实例,将本体论定义的抽象概念和关系具体化、实例化。二者结合实现了 "语义统一、数据互通、智能可及"。本体论的核心构成包括五元组:类 (Classes)、属性 (Attributes)、关系 (Relations)、实例 (Individuals) 和公理 / 规则 (Axioms/Rules)。其中,实例与我们定义的实体概念最为接近,类和属性则为实体提供了分类和描述的标准。2.3 领域实体数据空间的定义领域实体数据空间是一个面向特定业务领域(如健康医疗、养老)的数据价值化逻辑数据空间。它通过通用数据模型、标准、治理机制和数据处理智能平台,整合公共数据资源,构建以实体为中心的领域数据集,为科研、创新、政策制定和监管活动提供可信、易用的数据再利用环境。领域实体数据空间的核心价值在于建立了信任管控流、数据资源流和服务价值流,为上层应用活动提供了一个更高效率的支撑环境。三、医疗健康领域实体数据空间的构建3.1 构建的必要性医疗健康领域构建实体数据空间主要基于以下两个方面的需求:业务需求方面:医疗健康业务涉及医院、民政、公卫、人社等多个行业,数据来源复杂缺乏权威统一的数据标准,跨行业术语差异与编码冲突严重个人无法有效掌握和授权自己的健康数据应用需要以实体为核心的高质量数据集技术需求方面:以实体为中心重构数据组织,为个人数据授权提供必要条件统一语义和标识,解决数据标准和术语差异问题实时预处理和加工特征数据,为数据价值化产品提供工具提供行业预定义数据产品,实现应用快速落地3.2 欧洲健康数据空间的经验借鉴欧洲健康数据空间计划由德国和法国牵头,SAP、西门子等 22 家创始企业参与运营。其核心目标是把来源各异、编码不一的观察性健康数据转换成同一张大表,实现:用同一套分析代码跑所有数据支持跨国、跨库的真实世界研究、药物警戒和疗效比较让监管、科研、产业共享结果而无需交换原始敏感数据 目前,德国的 HEALTH-X dataLOFT 项目和卢森堡的 Dataspace4Health 国家级项目已经取得了良好的应用效果。3.3 我国医疗健康数据空间的实践框架我国医疗健康数据空间的数据来源主要包括:个人:患者、居民的健康数据健康服务方:医疗机构、养老机构、体检机构等监管方:卫健、医保、民政、药监等政府部门创新企业:生命科技、药械、AI 创新企业、商业保险等 通过构建医疗健康实体数据空间,我们可以将这些分散的数据整合起来,形成一个统一的数据价值化生态链,支撑临床试验患者招募、不良事件监测、AI 模型训练、商业健康险快赔等多种应用场景。 四、养老领域实体数据空间的实践4.1 养老数据空间的构成养老实体数据空间的数据来源更加广泛,除了传统的医疗数据外,还包括:养老数据:养老机构信息、服务记录、补贴发放等人口数据:老年人基本信息、家庭结构等养老保险数据:参保信息、待遇领取等服务设施数据:养老床位、社区服务中心等政策法规数据:养老政策、财政补助等4.2 养老数据空间的核心能力养老实体数据空间通过构建实体关联模型、标签体系和全息档案,实现了以下核心能力:个性化服务:根据老年人的标签及全息档案,提供定制化的健康管理和生活照料服务精准监管:对养老服务机构进行监管和评估,精准识别符合补贴条件的老年人资源优化:利用标签数据分析预测老年人未来服务需求,优化养老资源配置风险预警:建立风险预警模型,实时监测老年人健康状况和生活安全五、实体数据智能平台的技术架构与特性5.1 平台总体架构实体数据智能平台是一个跨领域实体数据分析与服务平台,它包括五大核心模块:实体数据服务:提供数据检索、查询、统计等基础服务实体数据产品开发:支持标签、画像、全息档案等数据产品的开发多域融合统一实体数据模型:构建跨领域的统一数据模型安全可信合规可控体系:保障数据安全和隐私保护数智大脑:提供 AI 驱动的智能分析和决策支持 5.2 关键技术特性5.2.1 以实体为中心的跨域数据模型平台结合 OMOP-CDM 国际标准和我国实际业务情况,构建了以实体为中心的健康医疗和养老行业跨域数据模型。通过固定表结构和统一词汇表,将碎片化的数据变成统一数据,实现了跨系统、跨领域的数据互通。 5.2.2 多源数据融合的行业标签体系平台将分散、庞杂、难懂的原始数据转变为易获得、易理解、易分析的标签信息。在医疗健康领域,构建了包括基本信息、过敏测试、病史、疾病诊断等多个维度的标签体系;在养老领域,依据国家标准设计了 224 个预定义标签,覆盖了老年人能力评估、健康档案管理等多个方面。 5.2.3 实体画像与全息档案平台基于标签体系构建了多维度的实体画像,从多个数据维度展现实体状态。同时,通过融合来自不同数据源的多源异构数据,形成了实体的全息档案,实现了 "一人一档一码"。 5.2.4 多种分群方式平台支持多种实体分群方式,包括特征创建、患者特征创建、规则创建、智能创建和群体间复合计算创建,能够适配不同精细度的实体数据查询需求,为服务撮合提供数据支撑。六、典型应用案例与成效6.1 高端医院医疗数据价值化解决方案案例背景:某国家儿童区域医疗中心建设高质量数据集项目,入选 "国家数据基础设施建设第二批先行先试" 项目。解决方案:构建全量数据中心 + 智算服务平台 + 专病数据库 + 高质量数据集 + 科研合作 + 成果转化的全栈解决方案。应用成效:已建成 10 个左右专病数据库,计划到 2027 年完成 70 个支撑了脑疾病、情感障碍、乳腺癌等多个领域的科研合作实现了临床、科研、运营管理和患者服务能力的全面提升 6.2 "互联网 + 重点疾病全周期管理"案例背景:某医科大学第一医院构建线上线下一体化、专病全周期管理新模式。解决方案:以患者为中心,以疾病为链条,构建 24 个专病数据库,覆盖 34 个病种。应用成效:实现了筛查入组、精准分群、诊疗路径、动态评估、患者服务和个案管理全流程智能化成为区域标杆示范项目,得到了省卫健委的高度认可有效降低了医疗费用支出,提高了患者健康水平 6.3 三甲医院智算服务平台案例背景:某三甲医院面临数据集成治理难、数据加工处理难、数据分析建模门槛高等问题。解决方案:围绕 "探索多模态医学人工智能平台 + 飞标医学影像标注平台" 双核心,构建覆盖 "数据管理 - 加工处理 - 建模分析 - 标注赋能 - 成果管理" 的全链路闭环。应用成效:医师科研时间有效释放,将更多精力投入到医学问题研究零代码建模降低了 AI 应用门槛,实现了 AI 能力普惠全流程可视化操作,提升了科研效率和结果可靠性 6.4 健康医疗智能体应用案例背景:南京某区希望提升基层医生诊疗能力,支撑分级诊疗。解决方案:部署 HAIAs 健康医疗智能体,提供辅助决策、病历生成和内涵质控等功能。应用成效:模型支持 10,549 个 ICD 病种,Top5 诊断推荐精度达 91.5%医生主动使用频率达 2 次 / 天有效提升了基层医疗服务的一致性和质量6.5 6.5临床试验患者招募案例背景:传统临床试验患者招募周期长、成本高、效率低。解决方案:基于实体数据空间,结合标签和大模型技术,实现精准人员筛选。应用成效:为拜耳、恒瑞、北肿等多家知名药企和医疗机构提供服务将患者筛查时间从几个月缩短到几天显著降低了新药研发成本,加速了新药上市进程七、挑战与未来展望7.1 面临的主要挑战尽管实体数据空间在医疗健康与养老领域取得了显著成效,但在实践过程中仍面临一些挑战:数据质量和治理:前期数据治理工作量大,数据质量参差不齐行业业务理解:需要深入理解行业业务知识,才能构建出有价值的数据模型统一标识和语义:跨领域、跨系统的统一标识和语义定义仍然存在困难数据价值变现:如何通过实体数据空间构建出创新的应用场景和商业模式7.2 未来发展方向未来,实体数据空间将朝着以下几个方向发展:多模态数据融合:进一步加强文本、影像、语音等多模态数据的融合处理能力AI 深度赋能:利用大模型技术提升数据标注、语义理解和智能分析的自动化水平跨区域数据流通:推动城市间、区域间的数据空间互联互通,实现更大范围的数据价值共享隐私计算技术应用:结合联邦学习、差分隐私等技术,在保护数据隐私的前提下实现数据价值释放标准化建设:加快制定行业数据标准和技术规范,促进实体数据空间的健康发展八、结论实体数据空间作为一种新型的数据组织和管理范式,为解决医疗健康与养老行业的数据孤岛问题、释放数据价值提供了一条有效途径。通过以实体为中心重构数据组织方式,建立统一的语义框架和数据模型,我们能够实现多源异构数据的融合与互通,为临床科研、医疗服务、养老服务和政府监管提供高质量的数据支撑。实体数据智能平台在多个城市和医疗机构的成功实践表明,实体数据空间能够显著提升数据治理效率,降低数据应用门槛,加速医疗健康与养老行业的智能化转型进程。未来,随着技术的不断进步和标准的逐步完善,实体数据空间必将在数字经济发展中发挥更加重要的作用。 参考文献[1] 国家数据局。可信数据空间发展行动计划(2024—2028 年)[EB/OL]. 2024.[2] 全国数据标准化技术委员会。可信数据空间 技术架构 [EB/OL]. 2025.[3] European Commission. European Health Data Space [EB/OL]. 2022.[4] OMOP Common Data Model. Observational Medical Outcomes Partnership [EB/OL]. 2026.[5] 东软集团。城市级智慧养老综合服务平台白皮书 [R]. 2025.[6] 清华大学。中国城市养老服务需求报告 [R]. 2025.