北方健康入选国家数据局首批行业高质量数据集建设先行先试

大众报业·齐鲁壹点 昨天17:29

8月28日,在2025中国国际大数据产业博览会上,国家数据局公布了首批行业高质量数据集先行先试试点名单。北方健康申报的“‘百病千万例’生命队列高质量数据集”项目成功入选。这是继入选国家数据基础设施建设先行先试后,北方健康连续获得的第二个国家级先行先试项目。

行业高质量数据集建设先行先试名单(部分)

当前,数据已成为驱动各行业发展的核心生产要素,高质量数据集更是模型训练的基石和核心稀缺要素。为贯彻落实党的二十届三中全会关于建设和运营国家数据基础设施,促进数据共享的改革任务,国家数据局组织开展了行业高质量数据集建设先行先试工作,支持企事业单位构建行业高质量数据集建设技术和方法,建设一批产业亟需、规模庞大、模态丰富、质量过硬、富有行业特色的行业高质量数据集,丰富高质量数据集应用场景,探索行业高质量数据集基础设施化,赋能人工智能纵深发展。

作为国家健康医疗大数据中心(北方)(简称“北方中心”)授权运营企业,通过工程化治理破解多源异构、质量参差等瓶颈,建设我国的医疗高质量数据集,是北方健康肩负的历史使命。经过5年多的探索,北方健康依托北方中心已建成国内规模最大的健康医疗数据合规运营平台,具备了数据采集、存储、治理、共享等全流程技术能力,构建了全维度标准化、高适配性的医疗数据治理体系。

目前,北方健康已汇聚治理了山东1亿人口、超2000亿条数据,数据关联性达 100%,诊断与手术归一率分别提升至93.82%、97.55%,加工形成18类重点疾病数据集、33 个应用数据集,开发了医药科研、人工智能等十类场景的数据产品。其中,“人群流行病学分析报告”产品实现了全国卫生健康领域首笔数据场内交易,商保两核风控场景已实现百万人群级商业应用。

在“百病千万例”生命队列高质量数据集试点工作中,北方健康将联合百余位顶尖临床专家,聚焦100种重大疾病,整合电子病历、医学影像、基因组学等多模态数据,构建每个病种规模不少于 100万例的国家级生命队列高质量标准数据集;打造集数据采集治理、分析挖掘、模型研发与服务应用于一体的数据治理与AI研发平台,高效支撑高质量数据集的生产和模型验证;构建多方协同、价值驱动的健康医疗数据协同运营模式,确保数据集科学、合规、可持续发展;并与医院、科研机构、医药企业、人工智能企业等合作共创,共同推动医疗健康领域智能化转型,加速 AI 模型在临床诊疗、重疾/慢性病管理、医药真实世界研究、中医智能化等方面的场景应用和产业化落地,助力医疗健康服务提质增效,赋能医学人工智能快速迭代升级和产业化推广应用。

未来,北方健康将以试点建设为契机,持续聚焦健康医疗行业高质量数据集建设,加强与合作伙伴的紧密合作全面践行“人工智能+”行动,共同打造数据共享、流通、应用的新模式,赋能大健康产业数智化转型升级,为数字中国、健康中国建设注入源源不断的数据力量。

责任编辑:张晓丽

AI小壹

我是齐鲁晚报的AI机器人小壹,快来向我报料新闻线索吧~

微信扫码进入小程序 微信扫码
进入小程序
我要报料

热门评论 我要评论 微信扫码
移动端评论

暂无评论

微信扫码
移动端评论