工程的博客

利用NLP检测不良事件提高药物安全性

分享这篇文章

不要错过我们即将与约翰·斯诺实验室进行的虚拟研讨会,用NLP提高药品安全,以了解更BOB低频彩多有关药物不良事件检测的联合NLP溶液加速器。

世界卫生组织定义药物警戒作为"与检测、评估、理解和预防不良反应或任何其他药物/疫苗相关问题有关的科学和活动"。换句话说,药物安全。

药物警戒:现实世界中的药物安全监测

虽然所有药物和疫苗在临床试验中都经过严格的安全性和有效性测试,但只有当这些产品被更大、更多样化的患者群体(包括患有其他并发疾病的患者)使用时,某些副作用才可能出现。

为了支持持续的药物安全,生物制药制造商必须向监管机构报告药物不良事件(ADEs),如美国的美国食品和药物管理局(FDA)和欧盟的欧洲药品管理局(EMA)。药物不良反应或事件是在药物治疗或治疗过程中发生的医疗问题。值得注意的是,ADEs与治疗并不一定有偶然的关系。但总的来说,不良事件的主动报告是用于确保药物安全的信号检测系统的关键部分。

不良事件检测需要正确的数据基础

随着收集到的数据越来越多,监测患者安全变得越来越复杂。事实上,只有不到5%的ade是通过官方渠道报告的,绝大多数都是通过自由文本渠道获得的:给患者支持中心的电子邮件和电话,社交媒体帖子,临床医生和制药公司销售代表之间的销售对话,在线患者论坛等等。

强有力的药物安全监测要求制造商、制药公司和药物安全组织监控和分析来自各种专业术语、格式、渠道和语言的非结构化医疗文本。为了有效地做到这一点,组织需要一个现代的、可扩展的数据和人工智能平台,可以提供科学严谨、接近实时的见解。bob体育客户端下载

前进的道路始于Databricks湖屋这是一个现代数据平台,它将数据仓bob体育客户端下载库的最佳元素与云数据湖的低成本、灵活性和规模相结合。这种新的简化架构使医疗保健提供商和生命科学组织能够将所有结构化数据(如emr中的诊断和程序代码)、半结构化数据(如临床记录)和非结构化数据(如图像)整合到一个单一的高性能平台中,用于传统分析和数据科学。bob体育客户端下载

Databricks和John Snow Labs架构,用于使用NLP工具分析非结构化医疗保健文本数据。

在这些功能的基础上,Databricks已与医疗保健自然语言处理(NLP)领域的领导者John Snow Labs合作,为医疗保健文本量身定制了一套强大的NLP工具。这是至关重要的,因为用于不良事件检测的大部分数据都是基于文本的。你可以在我们之前BOB低频彩的博客中了解更多关于我们与约翰bob体育外网下载·斯诺的合作,自然语言处理在大规模卫生文本中的应用

药物不良事件检测溶液加速器

为了帮助组织监控药品安全问题,Databricks和John Snow实验室建立了一个ADE的解决方案加速器笔记本使用NLP。正如我们在上一篇博客中所演示的,通过利用Databricks Lakehouse平台,我们可以使用预先训练好的NLP模型从非结构化文本中提取高度专业化的结bob体育客户端下载构,并为不同的角色构建强大的分析和仪表板。在这个解决方案加速器中,我们将展示如何使用预先训练的模型来处理对话文本,提取不良事件和药物信息,并为药物警戒构建一个Lakehouse,为各种下游用例提供动力。

Databricks和John Snow Labs从非结构化文本中提取药物不良事件的端到端工作流程,用于药物警戒。

解决方案加速器遵循4个基本步骤:

  1. 大量摄入非结构化的医学文本。
  2. 使用预训练的NLP模型提取有用的信息,如不良事件(如肾损伤),药物名称和事件的时间接近实时。
  3. 将不良事件与药物实体联系起来以建立关系。
  4. 测量事件的频率以确定重要性。

中包含的工作流的简要摘要笔记本

药品不良事件检测工作流程概述

从原始文本数据开始,我们使用一个由已知ADE状态的20,000文本组成的语料库(4200个包含ADE的文本),并应用一种方法预训练生物机器人模型来检测ADE状态,并根据地面真相和分配准确性的置信水平评估模型的特异性和敏感性。此外,我们结合使用ner_ade_clinical和ner_posology模型,从对话文本中提取ADE状态和药物实体。

Databricks和John Snow Labs解决方案使用ner_ade_clinical和ner_posology模型的组合,从对话文本中提取ADE状态和药物实体。

通过简单地在管道中添加一个阶段,我们可以检测ADE的断言状态(当前、缺席、过去发生等)。

用于此解决方案的Databricks和John Snow Labs NLP管道可以检测ADE的断言状态。

为了推断ADE与临床实体之间的关系状态,我们使用预训练的模型(re_ade_clinical),该模型检测临床实体(在本例中为药物)与推断ADE之间的关系。

Databricks和John Snow Labs解决方案使用预训练的模型(re_ade_clinical),该模型检测临床实体(在本例中为药物)与推断出的ADE之间的关系。

sparknlp_display库能够显示原始文本之间的关系以及它们之间的语言关系和依赖关系,如下所示。

使用Databricks和John Snow Labs解决方案,sparknlp_display库能够显示原始文本上的关系以及它们的语言关系和依赖关系,如下所示。

在ADE和药物实体数据处理和关联之后,我们可以构建强大的仪表板来实时监控ADE和药物实体对的频率。

在ADE和药物实体数据经过处理和关联后,用户可以构建强大的仪表板来实时监控ADE和药物实体对的频率。

开始在Databricks上使用NLP分析药物不良事件

有了这个解决方案加速器,Databricks和John Snow Labs可以轻松分析大量文本数据,帮助进行实时药物信号检测和安全监测。要使用此解决方案加速器,可以预览笔记本电脑并直接导入到您的Databricks帐户。笔记本包括安装相关的John Snow Labs NLP库和许可密钥的指导。

您也可以访问我们的行业页面,以了解更多关于我们的BOB低频彩医疗保健而且生命科学解决方案。

免费试用Databricks
看到所有工程的博客的帖子