客户的故事

人工智能如何改变药物研发

数百万

来自数千个来源的数据点

工业:生命科学

解决方案:推荐引擎

bob体育客户端下载平台用例:三角洲湖数据科学机器学习ETL

云:AWSAzure

背景图像

“通过使用Databricks,我们看到了一个数量级的性能提升。”

——Eliseo Papa,阿斯利康计算生物学家

阿斯利康为世界上一些最严重的疾病发现、开发并商业化了开创性药物。新创新的最大障碍是无法比新数据的速度更快地利用所有可用的科学信息。他们需要一个平台,使他们能够bob体育客户端下载建立可扩展的、高性能的数据管道,为机器学习模型提供数据,这些模型旨在帮助科学家做出有针对性的决策。借助Databricks,他们能够利用数据和机器学习建立一个推荐引擎,使科学家能够更容易、更快、更便宜、更有效地发现新的新药。

太多的数据会减慢决策速度

众所周知,新类型药物的发现、开发和商业化可能需要10-15年的时间,研发投资超过50亿美元,但只有不到5%的药物能够进入市场。阿斯利康认识到这种创新速度是不够的,因此转向了数据驱动的方法,以提高药物发现的成功率和更安全的临床试验管理。

然而,他们的科学家仍然无法利用手头所有可用的科学信息迅速做出明智的决定。他们努力处理公司内部和外部公共数据库中互不关联的数据。此外,随着新的科学研究继续以快速的速度发布,几乎不可能跟上科学发现的步伐。

  • 基础设施复杂性:找到允许灵活性但不需要持续维护的基础设施。
  • 大量互不关联的数据:负责从100多个数据源(包括内部数据源和公共数据源(包括技术文献、公共数据库等)中摄取、解析和分析数百万个数据点。
  • 努力扩展操作,以支持开源Python笔记本的数据科学工作。bob下载地址

更快的数据管道推动ML创新

阿斯利康利用Databricks Lakehouse平台来帮助建立一个生物学见解和事实的知识图bob体育客户端下载谱。该图表为推荐系统提供了动力,使阿斯利康科学家能够利用所有可用数据,为任何疾病生成新的目标假设。

  • 全管理平台:简化集群管理和大bob体育客户端下载规模分析资源的维护。
  • 构建规模化、高性能的数据管道:能够跨巨大的科学文献库和数据源利用NLP进行下游分析。
  • 加速机器学习创新:数据科学家被授权建立和训练模型,提供排名预测,帮助他们做出更明智的决策。

用人工智能改变药物的发现方式

自从迁移到Databricks,阿斯利康现在能够更容易地处理来自数千个来源的数百万数据点。消除规模障碍使他们能够更可靠地提取有意义的见解,从而产生旨在帮助人们过上更健康生活的新型药物。

  • 提高运营效率:集群管理和集群自动伸缩等功能改进了从数据摄取到管理整个机器学习生命周期的操作。
  • 更好的数据科学生产力:支持多种语言的共享笔记本环境提高了团队工作效率。
  • 更快的time-to-insight:由Databricks提供支持的推荐引擎提高了他们做出更明智假设的能力,使他们能够加快新药物和药物的上市时间。