深麦咨询
内容阅读

介绍一个罕见病临床试验知识图谱:RCTKG

1
发表时间:2024-07-26 15:46作者:马学海

每年二月的最后一天是国际罕见病日(Rare Disease Day)。

有关罕见病的界定目前并不统一。按照世界卫生组织(WHO)给的定义,罕见病为患病人数占总人口的0.65‰~1‰的疾病。实际上各个国家和地区又有各自的标准。例如,美国是按患病人数<20万(或发病人口比例小于1/1500)来界定,欧盟是按患病率<0.5‰,日本是按患病人数<5万,澳大利亚是按患病人数≤0.2万。

再比如我国台湾地区,是按患病率<1/10000界定(一般还要经罕见疾病及药物审议委员会审议认定)。中国大陆则是有专门的罕见病名录,前后发布了两次,共207种(2018年《第一批罕见病目录》121种,2023年《第二批罕见病目录》86种)。

在全球范围内,目前已确认的罕见病约在10,000 种,其中90%没有有效的治疗方法。由于罕见病的受试者数量有限,招募的患者群体较小,其药物开发极具挑战性。临床试验成本高、成功率低,这些都意味着对现有临床试验进行深入分析十分必要。通过分析,可以了解孤儿药的临床开发现状,为开展新试验提供新思路。

不久前,我在第19届世界医疗与健康信息学大会(MedInfo 2023)论文集里看到一篇来自NIH(美国国立卫生研究院)的文章《以用户为中心的罕见病临床试验知识图谱(RCTKG)》(User Centered Rare Disease Clinical Trial Knowledge Graph - RCTKG)。文章介绍的这个RCTKG,是一个由NCATS/NIH资助的知识图谱开发项目,它以语义和标准化的形式整合了美国遗传性疾病与罕见病信息中心GARD项目公开的罕见病临床试验数据,供公众使用。
(GARD:Genetic and Rare Diseases)

RCTKG有2,216,062个节点和 8,437,108条边,包括了2,086种GARD罕见病与一项或多项临床试验的关联。基于RCTKG,我们就可以通过编程的方式,获取临床试验信息,从而支持罕见病研究。需要说明的是,该知识图谱还在不断完善中,目前只有来自 ClinicalTrials.gov 的少量属性被纳入,这些属性是由专家根据三种不同类型的用户(患者、临床医生和信息学家)选择的。未来的拓展将包括纳入更多临床试验属性,引入 SNOMED CT 和 RxNorm 术语标准等,以便进一步整合数据。

RCTKG是基于Neo4j开发的,可通过以下链接公开访问。我试了一下,可用:

http://54.205.155.56:7474/browser/

举个例子。比如我想查一下血友病(Hemophilia)相关的临床试验,可运行下面这条Cypher语句:


MATCH p=(n:Condition{Condition:'Hemophilia'})<-[:investigates_condition]-() RETURN p


结果显示和血友病(蓝色节点)相关的有107个临床试验ClinicalTrial节
点(橙色),点击其中一个,就可以在右侧看到的该临床试验的各项属性信息(下图):

图片

更多操作不再一一举例,有兴趣的可以自己去试。

最后,顺便推荐一个罕见病检索平台:PubCaseFinderhttps://pubcasefinder.dbcls.jp)。这个平台已经发布6年多了,是一个基于病例报道的表型驱动型罕见病鉴别诊断系统,由日本生命科学综合数据库中心(DBCLS)的藤原丰文(Toyofumi Fujiwara)负责开发。它通过对病例报道文献进行挖掘提取罕见病疾病与表型的关系,是对目前Orphanet罕见病知识库和人类表型术语集HPO的重要补充。

图片


文献链接
User Centered Rare Disease Clinical Trial Knowledge Graph (RCTKG)
Jeremy Parker Yang, Devon Leadman, Richard M. Ballew, Eric Sid, Yanji Xu, Ewy A. Mathé, Qian Zhu
https://doi.org/10.3233%2FSHTI230934


分享到: