数千のデタソスから数百万のデタポントを処理
創薬には10 ~ 15年の長期間を要し,研究開発投資は50億ドルを超えるにもかかわらず,実際に市場に出る医薬品はそのうちの5%未満であることは広く知られています。アストラゼネカ社は,創薬の成功率を高め,臨床試験をより安全に実施すべく,データ駆動型のアプローチに移行しました。
しかし,社内外の公開データベースに分散するデータの扱いは困難であり,また,急速に変化する化学的知見を常に把握して自社の創薬研究に取り入れていくことは事実上不可能な状況でした。アストラゼネカ社のサイエンティストは,データに基づいた意思決定の効率化を阻む,次のような課題を抱えていました。
ンフラの複雑さ:柔軟性があり,か,定期的なメンテナンスが不要なンフラを必要としていた。
分散した膨大な量のデ,タ:社内データソースや,技術文献,パブリックデータベースなどの公開ソースを含む,100年以上のデータソースにわたって,数百万ものデータポイントの取得,解析,分析が必要だった。
スケ,ラビリティの欠如:オープンソースのPythonノートブックを使用していたが,データサイエンスの取り組みをサポートするためのスケーリングが困難だった。
阿斯利康利用Databricks Lakehouse平台来帮助建立一个生物学见解和事实的知识图bob体育客户端下载谱。该图表为推荐系统提供了动力,使阿斯利康科学家能够利用所有可用数据,为任何疾病生成新的目标假设。
全管理平台:简化集群管理和大bob体育客户端下载规模分析资源的维护。
大規模で高性能なデ:ンの構築:科学文献とデータソースの膨大なライブラリ全体でNLPを活用し,ダウンストリーム分析が実行可能になった。
機械学習:データサイエンティストは,よりスマートな意思決定を行うのに役立つランキング予測を提供するモデルを構築し,トレーニングできるようになった。
アストラゼネカ社は,砖を導入して以来,数千ものデータソースからの数百万を超えるデータポイントの処理をより簡単に実行できるようになりました。このスケールの障壁を取り除いたことで,人々の健康的な生活を支えるために設計された新薬を生み出すことができる有意義な洞察をより確実に引き出すことを実現しました。
提高运营效率:集群管理和集群自动伸缩等功能改进了从数据摄取到管理整个机器学习生命周期的操作。
更好的数据科学生产力:支持多种语言的共享笔记本环境提高了团队工作效率。
更快的time-to-insight:由Databricks提供支持的推荐引擎提高了他们做出更明智假设的能力,使他们能够加快新药物和药物的上市时间。