Témoignage de客户端

人工智能如何改变药物研发

Des数百万

De points De données traités, provenant De milliers De sources

工业:生命科学

解决方案:推荐引擎

bob体育客户端下载平台用例:三角洲湖数据科学机器学习ETL

云:AWSAzure

图像d 'arriere-plan

“通过使用Databricks,我们看到了一个数量级的性能提升。”

——Eliseo Papa,阿斯利康计算生物学家

阿斯利康découvre, développe et commercialise des médicaments révolutionnaires pour lutter contre des maldies comptant parmi les plus graves au monde。我存在一个巨大的障碍à创新:l'impossibilité d'exploiter toutes les information scientifiques mises à la disposition du laboratoire au ththme auquel elles到达。Il fallait donc une platformme permettant de créer des pipelines de données évolutifs et performants afin d'alimenter des modèles de机器学习conçus pour aider les scientifiques à prendre des décisions ciblées。Databricks permis d'exploiter les données et le机器学习pour créer un moteur de推荐grâce auquel les scientifiques découvrent de nouveaux médicaments avec davantage de simplicité, de rapidité, de rentabilité et d'efficacité。

Un excès de données ralentit la prise de décision

关于sait aujourd'hui que la découverte, le développement et la商业化de nouvelles classes médicaments peuvent prendre de 10 à 15 ans et représenter加上de cinq milliards de dollars d'investissements en R&D - sachant qu'un peu moins de 5% des médicaments seront finement commercialisés。倾注阿斯利康,ce rythme d'innovation n'était索赔pas suffant。Le laboratoire est donc passé à une approche axée sur les données afin d'augmenter son taux de réussite dans la découverte de médicaments et assureune gestion + sûre des essais cliniques。

Pourtant, ses chercheurs ne parvenaient toujours pas à prendre rapidement des décisions éclairées malgré tououtes les information doesn ' s disaient。Ils rencontraiment des problèmes avec les données résidant danans des sources disparates, à la fois au sein de l ' enterprise and danans des base de données publiclies externes。那么快,那么快,那么快,那么快,那么快,那么快,那么快,那么快,那么快,那么快,那么快。

  • Complexité de l'infrastructure:阿斯利康avait besoin d'une基础设施灵活mais ne nécessitant pas une维护恒定。
  • Des quantités massives de données disjointes: il faut importer, lire et analyzer Des millions de points de données provenant de centaines de sources internet et publices -文档技术,base de données publices等。
  • Avec des notebooks Python开bob下载地址源,l'équipe ne parvenait pas à faire évoluer les opérations suffisamment vite pour les besoins de la数据科学。

Des pipeline de données + rapides accélèrent l'innovation ML

阿斯利康利用Databricks Lakehouse平台来帮助建立一个生物学见解和事实的知识图bob体育客户端下载谱。该图表为推荐系统提供了动力,使阿斯利康科学家能够利用所有可用数据,为任何疾病生成新的目标假设。

  • 全管理平台:简化集群管理和大bob体育客户端下载规模分析资源的维护。
  • 管道de données性能à大échelle: possibilité d'utiliser le NLP sur une vaste bibliothèque de littérature scientifique et de sources de données en vue d'analyses en aval。
  • Accélération de l'innovation avec le机器学习:les数据科学家créent et entraînent des modèles qui fournissent des prévisions de classement afin de prendre des décisions + avisées。

变压器la découverte de nouveaux médicaments avec l'IA

Depuis l'adoption de Databricks, AstraZeneca parvient à traiter + facility des million de points de données provenant de milliers de sources。En éliminant les。

  • 增益d'efficacité opérationnelle:Des fonctionnalités comme la gestion et la mise à l ' échelle automatique Des clusters ont amélioré les opérations, de l ' ingestion de données à la gestion de l ' ensemble du cycle de vie du机器学习。
  • Davantage de productivité dans la数据科学:La productivité de l'équipe a beaucoup profité de l' environment de notebook partagés qui prend en charge différents languages。
  • Délai d’analyze réduit:le moteur de推荐alimenté par Databricks accroît la capacité du laboratoire à formula des hypothèses plus éclairées, ce qui a un impact direct sur le délai de commercialisation des nouveaux médicaments。