全国医保流行病学研究
(National Insurance Claim for Epidemiology Research, 简称“NICER”)
背景
“全国医保流行病学研究”(National Insurance Claims for Epidemiology Reserach,简称 “NICER” )是从2017年发改委一项重大工程项目中(“医保基金风险防控大数据平台建设及应用”项目)进行科研转化而来的队列,是RESCUER团队与医保相关机构合作,为开展公共卫生、流行病学、卫生经济学研究而设计的成果。
图1. NICER 发展历程
科研成果
NICER丰富的科研成果得益于其底层海量的医保数据、针对流行病学对医保数据库架构进行的重新设计。在过去的7年里,基于NICER发表的文章数不胜数,其中心血管领域也有众多成就。如柳叶刀子刊上发表的关于“中国城市主动脉夹层的发病率和生存率”的文章,首次研究并发布了中国主动脉夹层的发病率,并且对其地域特征进行了详细的分析。
图2. NICER成果:柳叶刀子刊-中国城市主动脉夹层的发病率及生存率
尽管队列是围绕着进行流行病学研究而设计的,但将NICER与其他领域的大数据进行结合,同样也能产出高质量的研究成果。例如仍旧在柳叶刀子刊上发表的“股票波动与心血管疾病住院“的研究,清晰的揭示了2008年中国股灾与心血管疾病住院之间的相关性,告诫人们股市玩的就是心跳;再例如在欧洲心脏病学杂志上发表的”臭氧污染与心血管疾病住院“的文章,从环境与健康的角度阐述了习大大提出的“绿水青山就是金山银山”。
图3. NICER成果:柳叶刀子刊-股票波动与心血管疾病住院
及 欧洲心脏病学杂志 - 臭氧污染与心血管疾病住院
队列介绍
这些卓越的科研成果都是基于NICER庞大的队列资源而产出的。NICER是一个横跨5年(2013 - 2017),覆盖全国31个省,300多个统筹区,人口覆盖约7.4亿的流行病学队列数据库。主要数据维度分为地域信息、疾病信息、费用信息以及个人信息(性别年龄等用于流行病学分组研究,不含个人姓名及ID等隐私信息)。由于其庞大的人群基数,NICER数据库可用于众多罕见病的流行病学研究。但NICER也不是万能的,由于其建立年限已经超过10年,且缺乏检验检查结果及用药等明细数据,因此想要进行除流行病、卫生经济之外的研究,需要更多与临床相关的数据才能完成。
图4. NICER数据资源简介
技术架构
虽然NICER队列只能够支撑以流行病为主的研究,但在这些研究过程中,团队积攒的各项经验是不可估量的宝藏。例如在对大数据的处理上,我们学习并应用了互联网三层架构的框架来处理医保海量的数据,这大大提升了数据的质量,数据处理的速度,已经科研应用的便捷性。同时,我们积攒了大量的知识库以及数据标准化处理的算法,这为我们现在建立RESCUER队列的数据库打下了坚实的基础。
图5. NICER数据平台架构
算法专利
此外,我们还针对医保数据研发了不同的数据处理的算法,并申请了多项国家发明专利,这些算法同样适用于RESCUER队列研究数据的处理。
图6. NICER平台国家发明专利
总结
虽然RESCUER项目组现在的工作重心已经从NICER转向,但我们感谢NICER带给我们的无尽宝藏,也希望所有的研究者们仍旧能够继续使用NICER资源,发挥其在科研上的价值,带给我们更多的成果!