目的:针对临床数据数量庞大和质量差的现状,本研究旨在以建立淋巴瘤研究数据库为例,探索高质量研究数据库的建立路径以及在真实世界研究的作用。方法:汇总研究领域专家意见,参考相关指南和标准,建立标准医学知识库;回顾性抽取2005年2月-2021年12月期间就诊于北京大学肿瘤医院淋巴瘤患者电子诊疗数据,采用深度学习、自然语言处理等方式,搭建"基于电子病历系统的淋巴瘤数据库-生物样本信息库-延伸遗传信息库"的动态智能信息整合与处理系统。结果:研究数据库在满足了临床科研人员的研究需求的同时,实现医院病历数据和生物样本信息数据的申请、审批、溯源和分析全过程留痕管理。数据库中核心科研变量总数为668个,结构化变量占46.0
作者:米岚;吴梦;冯非儿;杜婷婷;热依扎·努尔苏力坦;林梦梦;牛明芳;宋玉琴;谢彦;朱军
来源:中华医学科研管理杂志 2023 年 36卷 1期