跳转到主要内容
bob体育客户端下载平台的博客

大规模应用自然语言处理医疗文本

发现病人见解埋在医疗文本与约翰·斯诺实验室解决方案和砖
分享这篇文章

这是合著的文章写在与莫里茨斯特勒合作,AI传道者,约翰·斯诺实验室。看我们的随需应变的车间,提取与NLP的真实数据,了解更多BOB低频彩关于我们的NLP医疗解决方案。

2015年,HIMSS估计美国的医疗行业生产12亿个临床文档。这是一个大量的非结构化的文本数据。从那时起,数字化医疗只有每年增加临床文本生成的数据的数量。数字形式,门户网站,pdf报告、电子邮件、短信和聊天机器人提供现代医疗的骨干通信。文本生成的在这些渠道的数量太庞大的测量和综合为人类消费。因为这些数据是结构化的,他们不容易可分析的,经常保持孤立。

这对所有医疗组织构成风险。锁定在这些实验报告中,提供者笔记和聊天记录是有价值的信息。当结合病人的电子健康记录(EHR),这些数据提供了一个更完整的病人的健康。在人口层面,这些数据集可以通知药物发现,治疗途径,和现实世界的安全评估。

揭示小说健康见解和自然语言处理

有好消息。进步在自然语言处理(NLP) -人工智能的一个分支,使计算机能够理解书面,口头或文字形象——能够从文本中提取出的见解。使用NLP方法、非结构化临床文本可以提取,将下游分析并存储在一个结构化的格式和美联储直接进入机器学习(ML)模型。这些技术正在推动重大创新研究和护理。

在一个用例、Kaiser Permanente最大的非营利性卫生计划和医疗服务提供者在美国,使用NLP处理数以百万计的急诊分诊指出预测医院床位的需求,护士和医生,最终改善病人的流动。另一项研究NLP用于分析非标准文本消息从移动支持团体对hiv阳性的青少年。分析发现很强的相关性之间的参与,提高药物依从性与社会支持的感觉。

妨碍医疗NLP是什么?

所有这些不可思议的创新,它回避了为什么没有更多的医疗组织利用临床文本数据吗?在我们的经验中,使用一些最大的纳税人,提供者和制药公司,我们看到三个关键挑战:

NLP系统通常不用于医疗保健。临床文本是自己的语言。数据不一致是由于各种各样的源系统(例如EHR,临床指出,PDF报告),最重要的是,临床专业语言有很大的不同。传统的NLP技术不是用来理解独特的词汇,语法和医学文本的意图。例如,在下面的文本字符串,NLP模型需要理解阿奇霉素是一种药物,500毫克剂量,发出呜咽声是一个临床缩写“气短”病人相关条件肺炎。同样重要的是推断病人不是呼吸急促,,他们还没有采取药物,因为它只是规定。

大多数NLP工具无法正确地编写医疗文本。火花NLP的医疗目的是建立算法旨在理解领域特定语言。
大多数NLP工具无法正确地编写医疗文本。火花NLP的医疗目的是建立算法旨在理解领域特定语言

僵化的传统医疗数据架构。文本数据包含各种新闻信息,但只提供一个镜头到病人的健康。真正的价值来自于将文本数据与其他病人的健康数据创建一个全面的视图。不幸的是,遗留数据架构建立在数据仓库缺乏支持非结构化数据(如扫描报告,生物医学图像,基因组序列和医疗设备流,从而无法协调患者数据。此外,这些架构是昂贵和复杂。一个简单的临时分析大型语料库的健康数据可以运行几小时或几天。太长,当病人需要实时调整等。

缺乏先进的分析功能。绝大多数医疗组织已经建立了他们的分析数据仓库和商务智能平台。bob体育客户端下载这些是伟大的描述性分析,计算使用的病床数量上周,但缺乏AI /毫升功能来预测未来医院病床上使用。组织通常投资于AI把这些系统看作是孤立的,补强的解决方案。这种方法需要对要复制的数据在不同的系统导致不一致分析和time-to-insight缓慢。

解锁的力量医疗NLP砖和约翰·斯诺实验室

砖和约翰·斯诺实验室——开源的创造者火花NLP库,火花NLP卫生保健火花OCR——兴奋地宣布我们的新套解决方案专注于帮助卫生保健和生命科学组织的大量文本数据转换成小说病人的见解。我们共同解决方案结合最佳医疗NLP工具和一个可扩展的平台,你所有的数据,分析和人工智能。bob体育客户端下载

解锁医疗NLP的力量与砖Lakehouse平台和约翰·斯诺实验室。bob体育客户端下载
解锁医疗NLP的力量与砖Lakehouse平台和约翰·斯诺实验室。bob体育客户端下载

作为基础砖Lakehouse平台bob体育客户端下载现代数据架构,结合数据仓库的最佳元素与低成本、灵活性和云数据规模湖。这个简化的、可伸缩的架构使医疗系统汇集他们所有的数据结构,半结构化和unstructured-into单一、高性能科学传统的分析和数据平台。bob体育客户端下载

砖Lakehouse平台的核心是Apache SparkTM和三角洲湖,一个开源bob体育客户端下载存储层带来的性能,可靠性和管理您的数据。医疗组织可以土地所有的数据,包括原始提供者笔记和PDF实验报告,进一层铜摄入的三角洲湖。这保存真理的来源在应用任何数据转换。相比之下,与传统的数据仓库,转换发生在加载数据之前,这意味着所有从非结构化文本中提取结构化变量断开本机文本。

建立在此基础上约翰·斯诺实验室的火花NLP的医疗保健,最广泛使用的NLP图书馆卫生保健和生命科学行业。软件无缝地提取、分类和结构与最先进的临床和生物医学文本数据准确性。这样做是使用工业生产、可伸缩和可训练的实现最近healthcare-specific深度学习和转移学习技术,连同200 + pre-trained和定期更新模型。

约翰·斯诺实验室的软件的显著功能库包括:

  • 开箱即用的命名实体识别超过100的临床和生物医学实体——从症状和药物解剖学、社会因素、实验室、成像和基因
  • 解决实体术语的语义上的代码包括SNOMED-CT ICD-10-CM, ICD-10-PCS, RxNorm,卢瓦,uml,网状,HPO。
  • Pre-trained关系提取模型检测30 +关系类型:医疗事件之间,治疗和药物、基因和表型,和其他人。
  • 可定制的检测、de-identification和困惑的敏感信息自由文本,PDF文件,扫描报告,以及DICOM图像。
  • Healthcare-specific单词,和句子嵌入块不是可用的其他地方和定期更新新的术语和内容。
ohn雪实验室的火花NLP医疗库提供了一个最坚实的自然语言处理功能和模型。
约翰·斯诺实验室的火花NLP医疗库提供了一个最坚实的自然语言处理功能和模型。

我们共同解决方案汇集的力量引发NLP的医疗协作分析和人工智能能力的砖。信息学团队可以直接摄取原始数据成砖,过程数据规模与火花NLP医疗、并使其可为下游SQL分析和ML,都在一个平台。bob体育客户端下载培训和推理过程中直接运行砖;除了速度和规模的好处,这也意味着,数据是不会发送给第三方,一个至关重要的隐私和合规要求在处理敏感的医疗数据。最重要的是,砖是建立在Apache SparkTM,使其运行引发应用程序最好的地方像火花NLP的医疗保健。

一个端到端的工作流程进行处理、分析和建模所有数据包括临床文本数据砖和约翰·斯诺实验室。
一个端到端的工作流程进行处理、分析和建模所有数据包括临床文本数据砖和约翰·斯诺实验室

开始使用大规模医疗自然语言处理

免费试着砖

相关的帖子

看到所有bob体育客户端下载平台的博客的帖子