工程博客

释放健康数据电源现代数据湖

迈克尔欧特加
迈克尔桑基
阿米尔库尔米
分享此文章

单病人生产约80兆字节医学数据年复一年乘以上千名病人一生中, 你正在查看包含宝贵洞察力的 病人数据小节解锁这些洞察力可帮助精简临床操作,加速药研发并改进病人健康结果数据需要准备 下游解析和AI可惜大多数医保和生命科学组织花太多时间收集、清理和整理数据

健康数据指数增长,单病人每年生成80兆字节以上数据
健康数据指数增长,单病人每年生成80兆字节以上数据

挑战数据分析 保健和生命科学

数据编译、解析和AI对保健行业组织构成挑战的原因很多,其中许多都与数据仓库遗留数据架构投资相关以下是四大常见挑战 行业:

挑战#1(Volume):扩展快速增长的健康数据

基因组学或许是保健数据量爆炸性增长的单一最佳例子第一批基因组序列耗资超过1B早期努力(还有许多努力)专注于基因组学, 即寻找个人基因组极小部分中特定变异的过程, 通常约0.1%。进化成全Exom定序部分 覆盖基因组的蛋白编码部分 仍然不足全基因组的2%公司现在提供全基因组定序直接对消费者测试,30xWGS小于300人口层次上,英国生物库发布超过20万个全基因组供今年研究使用。它不光是基因组学成像、可穿戴设备和电子医疗记录也大增

规模游戏名像人的健康解析和药物发现可惜许多遗留架构建房并设计顶峰容量这种方法导致低使用期间闲置计算功率(最终浪费美元),当需要升级时也不快速缩放

挑战#2(Various):分析各种健康数据

保健和生命科学组织处理大量数据多样性问题,每个组织都有自己的细微差别。众所周知,超过80%的医疗数据不结构化,然而大多数组织仍把注意力集中在为结构化数据设计的数据仓库和传统SQL解析非结构化数据包括图像数据,这对诊断和测量肿瘤学、免疫学和神经学(成本增速最快领域)和诊断注解文本等领域疾病增量至关重要,这对于理解完全病人健康和社会历史至关重要。忽略这些数据类型或置入侧面非选项

令问题更加复杂的是,保健生态体系正变得更加互连性,需要利益攸关方处理新数据类型举例说,提供商需要索赔数据来管理并裁定分担风险协议,支付者需要临床数据支持流程,如事前授权和驱动质量度量bob体育客户端下载这些组织往往缺数据架构和平台支持这些新数据类型

一些组织投资数据湖支持非结构化数据和高级解析,但这产生新问题组在这种环境中,数据团队现在需要管理两个系统-数据仓库和数据湖-数据拷贝跨嵌套工具生成数据质量和管理问题

挑战3(可行性):处理流数据实现实时病人洞察

在许多环境里 保健问题生死攸关条件可以非常动态化,批量数据处理 -- -- 即使是每日处理 -- -- 往往不够好。获取最新到秒信息对成功干预护理至关重要流数据供医院和国家卫生体系使用,从预测败血症到实时预测ICU床需求

数据速度是医疗数字革命的重要组成部分个人比以往任何时候有更多的信息并能够实时影响他们的护理工作。举例说,可穿戴设备-像连续甘蔗监视器提供Livongo流实时数据进移动应用提供个性化行为建议

尽管早期取得了一些成功,但大多数组织没有设计数据架构以适应流数据速度可靠性问题和挑战整合实时数据历史数据抑制创新

挑战4(弹性):建立对保健资料和AI的信任

最后但并非最不重要的是,临床和管理标准要求保健方面数据最精度保健组织有高公共卫生达标要求,必须满足组织内部数据民主化需要治理

组织需要良好的模型治理,将人工智能和机器学习带入临床环境bob体育客户端下载可惜多数组织有数据科学流单平台,与数据仓库脱机这对于努力建立AI驱动应用的信任和可复制性造成严重挑战

解锁健康数据湖屋

湖屋架构帮助保健和生命科学组织克服这些挑战,现代数据架构将云湖低成本可扩缩性与弹性与数据仓库性能和治理相结合组织可以存储各种数据和电源 各类解析和ML

提供所有医疗和生命科学数据解析使用案例

Lakehouse为医疗保健和生命科学组织提供下列福利:

  • 组织所有健康数据尺度bob体育客户端下载核心Databricks湖屋平台三角湖开源数据管理层,为数据湖提供可靠性和性能三角洲湖与传统数据仓库不同,支持所有类型结构化非结构化数据,并方便摄取健康数据,Databricks为电子医疗记录和基因组等域别数据类型搭建连接器连接器与行业标准数据模型打包成组快速启动加速器。此外,三角洲湖提供内置优化数据缓存和索引化以大大加速数据处理速度以这些能力,团队可以把所有原始数据归并到单处,然后整理成全局观察病人健康
  • 驱动所有病人解析和AI以所有数据集中湖中,团队可直接用数据构建强容解析和预测模型Databricks提供协作工作空间全套解析和AI工具并支持广套编程语言-如SQL、R、Python和Scala增强各类用户的能力,如数据科学家、工程师和临床信息学家等,协同分析、建模和可视化所有健康数据
  • 提供实时病人洞察力湖屋为流和批量数据提供统一架构不需要支持两个不同的架构 或争取可靠性问题bob体育客户端下载组织通过运行LakehouseDatabricks架构访问云型平台这使得很容易取流数据并混合历史数据小节,以近实时洞察人口规模
  • 交付数据质量和遵规性解析数据真实性,湖屋包括从传统数据湖缺失的能力,如系统化执行、审核、版本整理和精密访问控件湖屋的一个重要好处是有能力同时使用同值可信数据源执行解析和ML此外,Databricks提供ML模型跟踪和管理能力,方便团队跨环境复制结果并帮助达标所有这些能力都提供到符合HIPAA分析环境

湖屋管理医保和生命科学数据 最优架构组织通过将这一架构与数据机能结为一体,可支持从药物发现到慢性病管理程序等各种高影响使用案例

开始搭建湖中保健生命科学

如上所述,我们乐于提供一系列解决方案加速器帮助保健和生命科学组织开始建湖满足其具体需求求解加速器包括样本数据 预建代码 和分步指令 内Databricks笔记本

  • 新建求解加速器:湖屋实战证据现实世界数据为制药公司提供新知识 患者健康和药效加速器帮助你搭建湖中数据库实战证据并使用OMOP公共数据模型构建数据 并大规模分析像调查药方模式

查查Lakehouse实战证据笔记本.

  • 即来者湖人民健康.保健支付人和提供者需要实时深入了解病人以作出更知情决策加速器中,我们将展示如何很容易取出数据bricksHL7数据并构建强ML模型供预测病人疾病风险等案例使用

BOB低频彩深入了解全局保健生命科学解决之道

免费试数据键
全部见 工程博客 员额设置