고객 사례

Ai로한신약개발과정변화

수백만달러

수천개의소스에서
데이터포트처리

배경이미지

“Databricks로이동한덕분에성능이몇배로개선되었습니다。”

- Eliseo Papa,阿斯利康컴퓨팅생물학자

阿斯利康는세계적으로가장치료가어려운난치병에대한혁신적인치료제를발견하여개발및상용화합니다。새로운혁신을하는데가장큰장애물은새로운데이터가들어오는속도에비해모든과학적정보를활용하는능력이부족하다는것입니다。阿斯利康는과학자들이선별적인결정을내리는데도움이되도록설계한머신러닝모델을제공하면서도적절한성능을내는확장형데이터파이프라인을구축할수있는플랫폼이필요했습니다。砖를사용하고나서는데이터와머신러닝을활용해서과학자들이더욱빠르고,저렴하고,효과적으로새로운약물을더욱쉽게발견할수있는추천엔진을구축할수있었습니다。

지나치게많은데이터로해의사결정속도둔화

새로운약물을발견하여개발하고상용화에이르기까지는10 ~ 15년이상이걸리고研发에50억달러이상을투자하더라도5%도안되는약물만이시장에출시된다는것은잘알려진사실입니다。阿斯利康는이런혁신속도로는부족하다는것을깨닫고약물발견의성공률을높이고임상시험을안전히관리할수있는데이터기반전략으로바꾸었습니다。

阿斯利康하지만의연구자들은활용가능한모든과학적정보에따라신속하게결정을내리기어려웠습니다。데이터가회사내에산재하는소스와외부공개데이터베이스에저장되어있었기때문입니다。게다가새로운연구결과가빠른속도로공개되고있기때문에과학적발견속도를따라가기란사실상불가능했습니다。

  • 프라복잡성:유연하지만지속적유지관리가필하지않은프라를찾아야합니다。
  • 곳곳에산재된방대한데이터:내부데이터소스,기술문서등의공개소스,공개데이터베이스등을비롯한수백개의데이터소스에서수백만개의데이터포인트를수집하여파싱,분석해야합니다。
  • 오픈소스Python노트북으로데이터사이언스활동을지원할수있을만큼운영을확장하기어려웠습니다。

데이터파이프라lm가속화로ml혁신지원

阿斯利康는砖레이크하우스플랫폼을사용하여생물학적인사이트및정보의지식그래프를구축합니다。阿斯利康의모든연구자는이그래프를기반으로하는추천시스템을사용하여모든질병에대한새로운타겟가설을생성하고,그에따른모든데이터를활용할수있습니다。

  • 완전관리형플랫폼:클러스터관리및대규모분석리소스의유지관리를단순화했습니다。
  • 적절한성능의확장형데이터파이프라인구축:방대한과학문헌라이브러리및데이터소스에서NLP를활용하여다운스트림분석을실행합니다。
  • 머신러닝혁신가속화:데이터사이언티스트는더욱현명한결정을내리는데도움이되는순위예측을제공하는모델을구축,훈련할수있습니다。

Ai를활용한약물발견혁신

阿斯利康는砖로이동한후,수천개의소스에서수백만개의데이터포인트를더욱손쉽게처리할수있게되었습니다。확장의장애물을제거한덕분에의미있는인사이트를훨씬안정적으로추출하여,사람들이더욱건강한삶을영위할수있는신약을개발할수있습니다。

  • 운효율개선:클러스터관리,클러스터자동확장등의기능을통해데이터수집에서전체머신러닝수명주기관리에이르기까지모든운영이개선되었습니다。
  • 데이터사이언스생산성향상:여러가지언어를지원하는공유된노트북환경으로팀생산성이향상되었습니다。
  • 사이트추출시간단축:砖의추천엔진은더욱정보에입각한가설을세우도록지원하여,신약및치료제를출시하는시간을단축합니다。