目的 为提高中医药临床随机对照试验(RCTs)文献中数据信息的利用率,本研究对纳入文献中存在的结构化信息进行自动化提取并对提取到的信息进行评价.方法 对 1986 年 1 月至 2020 年 12 月中国知网、万方数据库和维普网中糖尿病、类风湿性关节炎、肥胖、膝骨关节炎、小儿腹泻、结直肠癌 6 个病种的中医药临床RCTs文献进行检索及梳理,随机纳入 5 506 篇,运用光学字符识别技术对可携带文档格式的文献进行识别,转化成文本格式,并使用正则表达式对文献信息进行提取.从信息的提取率和准确率两方面进行评价.结果 研究发现"资料""方法 ""试验参与者总数""试验参与者年龄""试验参与者例数""疗程天数""排除标准""纳入标准"和"基金"9 个字段的提取率分别为 96.60%、93.30%、92.60%、42.23%、28.29%、80.20%、62.60%、46.00%、21.10%,9 个字段的准确率分别为97.9%、98.9%、89.7%、100.0%、100.0%、94.5%、97.3%、89.0%、94.7%.结论 中医药临床RCTs文献可以通过自动化方式对文献结构化信息进行完整性的识别与判断,提取出的结构化信息可以为中医药临床RCTs网络体系搭建提供数据支撑,在此基础上提出了中医药临床RCTs文献结构化写作设想.
作者:张雨楠;刘鹤源;黄哲;窦智丽;韩东燃
来源:中国医药导报 2023 年 20卷 11期