跳到主要内容
公司博客上

レ▪クハウスによるデ▪タの民主化がアムジェンの医薬品開発▪提供を加速

2022年3月22日 導入事例

分享这篇文章

この記事は,アムジェン(Amgen)社のプロダクトオーナーJaison多米尼克氏と,ディスティングイッシュドソフトウェアエンジニアKerby约翰逊氏によるゲスト執筆記事です。

世界最大の独立系バ▪▪オテクノロジ▪▪企業であるアムジェンは,長い間,。40年にわたり,新しい医薬品製造プロセスを開拓し,命を救う医薬品を開発し,世界中の何百万人もの人々の生活にプラスの影響を及ぼしてきました。患者さんに最高のサービスを提供するという使命を果たし続けるために,私たちは最近,完全なデジタル変革という新たなイノベーションのジャーニーに乗り出しました。

研究開発の生産性向上からサプライチェーンや商品化の最適化まで,ビジネス全体の成果を上げるためのデータ活用を再考する過程で,データチームが解決しようとしている問題の種類がここ数年で劇的に変化していることがすぐに明らかになりました。さらに,これらの問題は,もはやスキルセットや部門,機能によって隔離されているわけではありませんその代わりに,最も影響力のある問題は部門横断的であり,異なる独自の専門知識を持つ人々を集めて,斬新な方法で問題を解決することが必要でした。近代化を目指す私たは,デジタル変革のジャニの基盤としてレ▪▪クハウスプラットフォ▪▪ムを選びました。その結果,さまざまな組織でデータの潜在能力を引き出し,業務効率を合理化し,創薬を加速させることができました。

今日,私たちは,他の人々が私たちのジャーニーから学び,自らのビジネス戦略に活かしてくれることを願い,そのサクセスストーリーを分かち合います。

デタウェアハウスからデタレクへ—その中の課題

アムジェン社の臨床試験,製造,商業化という3つのコアバーティカルには,貴重なデータが豊富に存在します。しかし,デ,タ量の増加により,そのデ,タを実際に効率的に利用することが課題となっていました。

私たちは,ビジネスのさまざまな側面を真に結びつけることができず,社内と顧客数の両方が拡大するにつれて,業務効率に影響を及ぼしていました。重要なのは,データへのアクセスと処理を容易にするだけでなく,データに対して異なる視点を持つペルソナを結び付け,部門を超えたコラボレーションを可能にするコネクテッドデータファブリックを実現することでした。もしあなたが1つか2つの視点からしか見ていないなら,他の人からの貴重なキーポイントを見逃すことになるでしょう。

例えば,次のような質問を考えてみましょう。どのように需要をきめ細かく予測すれば,必要としている患者さんに適切な量の治療薬を提供することができるでしょうか吗?

サプラチェンと製造の観点から答えを見ている場合,商業販売予測デタが不足しています。一方,販売予測を必要な生産量の福音と見なしたくはないでしょう。なぜなら,もし販売予測が大外れで,製造に必要な生産量を過小評価していたとしたらどうでしょう。

安进如何精确预测需求,为有需要的患者生产适量的治疗药物。

今日の問題を解決するために,企業は同じデータを複数のレンズから見ることができるように,さまざまなデータの関係や接続に注目する必要があります。しかし,どうすればこれを可能にできるのでしょうか?アムジェンは、現代のデータ要件の基礎を以下のように分解しています。

  • デ,タは整理され,使いやすくなっている必要があります。
  • デ,タを共有し,自然な形で他者のデ,タを再利用することが必要です。
  • アナリティクスは,信頼できるデ,タの共有ビュ,から操作できるようにする必要があります。
  • 記述的分析(BI)から予測的分析(ML)まで,さまざまな形式の分析が,1つのバージョンのデータで新しい発見や予測を促進するのに役立ちます。
  • データは,新しい種類のものが入ってきたり,あるシステムから別のシステムに変わったり,新しいドメインが追加されたりするたびに進化していく必要がありますが,全ての核心は一貫している必要があります。

しかし,各チームがそれぞれ異なるデータを所有し,管理し,整理しているため,データを共有しようとすると別のプロジェクトが必要になるなど,直感的でないプロセスを持つ企業にとっては特に難しいことでした。私たちも,数年にわたり,使い道がないほど多くのデータを蓄積してきただけでなく,誰もが同じデータで仕事ができるようにするためのプロセスやインフラの欠如に苦労してきました。

初期のデータニーズに対応するため,数年前にレガシーテクノロジーのインフラからHadoopベースのデータレイクに移行しました。Hadoopデータレイクでは,構造化データと非構造化データを一箇所に集めることができましたが,技術面でもプロセス,コスト,組織面でも,データに関する大きな課題が残りました。共有クラスタは“吵闹的邻居”問題を引き起こし,拡張が困難でコストがかかるという問題がありました。

プラットフォームのプロダクトオーナーである私の役割としては,単一の共有クラスターを管理することは悪夢でした。例えば,あるグループには高いストレージと低いコンピュート,別のグループには高いコンピュートと低いストレージというように,コストを分散して課金する方法を考えなければなりませんでした。

また,このアプローチでは,各グループのニーズを満たすためにさまざまなツールを組み合わせる必要があり,コラボレーションに大きな課題がありました。また,他の多くの企業と同様に,エンドユ,ザ,がデ,タを利用する方法もさまざまでした。Spotfire Jupyter笔记本,R工作室,画面など,エンドユーザーがデータを利用する方法はさまざまで,データを必要とする人がすぐに利用できるようにすることは,複雑さと課題をさらに増やすことになったのです。

レクハウスアキテクチャが私たの問題をどのように解決するか

砖レイクハウスプラットフォームを採用したことで,さまざまなチームやペルソナがデータをより有効に活用できるようになりました。この統一されたコラボレーションプラットフォームにより,あらゆるタイプのユーザーとその好みのツールが単一の環境で利用できるようになり,一貫したデータセットに裏打ちされたオペレーションを維持することができるようになりました。

安进与Databricks Lakehouse的统一数据分析架构。

私たちは,三角洲湖を活用して,酸コンプライアンス,ヒストリカルルバック,そして開発者がコーディングを始める際の障壁を下げ,データアナリストやデータサイエンティストが同様にサプライチェーンの最適化やオペレーション改善にデータを活用できるよう共通のデータレイヤーを提供しています。また,AWS胶を利用して異なる砖環境を接続することで,データが1つのAWSアカウントに保存されているか,10個の異なるアカウントに保存されているかを問わず,1つのデータレイクとなります。すべてながっているのです。

これにより,データと分析のためにApache火花™を標準化しながら,様々なニーズに対して十分な柔軟性を提供することができました。レイクハウス内の統一されたデータレイヤーにより,アムジェン社はあらゆる種類とサイズのデータを確実に処理することができ,同時にアプリケーションチームにはビジネスを前進させる柔軟性を提供することができます。

欲しいクラスタの大きさは?予算は?レポ,トを1時間早く出すことが重要なのか,それともコストを削減することが重要なのか?このような判断は,個々のチ,ムでもできるようになりました。このようにツールや言語を標準化し,データサイエンティスト,アナリスト,エンジニアのためのシングル・ソース・オブ・トゥルースを実現することで,コネクテッド・チームの実現が可能になったのです。

現在のデータアーキテクチャは,Amazon S3をすべてのデータのシングルソースとして,三角洲湖を共通のデータレイヤーとして,胶水データカタログを砖の集中メタストアとして,麋鹿スタックをKibanaでモニタリングに,气流をオーケストレーションに,アナリストやデータサイエンティストの消費はすべて砖レイクハウスプラットフォームから操作するようになっています。

この共通データアーキテクチャとアーキテクチャパターンの統合により,プラットフォームのメンテナンスから,ビジネスが実際に何を求めているか,ユーザーが何に関心を持っているかを深く掘り下げることへと,私たちのフォーカスを移行することができました。重要なのは,レイクハウスアプローチを活用して,さまざまなデータチーム間でデータを統一しながら,ビジネス目標に沿うことができるようになったことです。

データをすぐに利用できるため,エンジニアリングからデータサイエンス,アナリストまで,さまざまなデータチームがデータにアクセスし,コラボレーションを行うことができます。砖のコラボレーションノートブックは、彼らが選択したプログラミング言語をサポートし、簡単にデータを探索し、ダウンストリーム分析や ML への活用を開始することができます。砖的SQLを使い始めると,アナリストはデータをデータウェアハウスに移動することなく,最新かつ新鮮なデータを見つけて探索できるようになります。パフォーマンスを犠牲にすることなくクエリを実行し,内蔵のビジュアライゼーションやダッシュボード,または社内のビジネスパートナーが主に使用する画面など,選択したツールで簡単に結果を可視化することができます。

当社のデタサエンティストも,Databricks机器学习を使用してmlのあらゆる側面を簡素化することで利益を得ています。砖ML は Delta Lake と MLflow を含むレイクハウス基盤上に構築されているため、当社のデータサイエンティストはデータエンジニアリングのサポートに依存せずに、データの準備と処理、チーム間のコラボレーションの効率化、実験から生産までのライフサイクルの標準化を行うことができます」。このようなML管理アプローチの改善は、臨床試験の登録にかかる時間の短縮に直接的な影響を及ぼしました。

コネクテッドデ,タとチ,ムによる患者転帰(アウトカム)の改善

砖レイクハウスプラットフォームの導入は,現代社会で患者にサービスを提供し,医薬品開発のライフサイクルを改善するという当社の目標を達成し続けるために,最終的に役立っています。データの取り込み率が大幅に向上し,処理時間が75%短縮された結果,ビジネスへのインサイトを2倍早く提供できるようになりました。

砖を利用することで,技術だけでなく,データ,関係,つながりに着目したモダンなアプローチで,無数のユースケースを実現することができるのです。2017年に数据库と提携して以来,全社的に大規模な成長導入が進んでいます。現在までに,データエンジニアリングからアナリストまで2000人以上のデータユーザーが砖を通じて400 TBのデータにアクセスし,40以上のデータレイクプロジェクトと240のデータサイエンスプロジェクトを支援しています。

在4年多的时间里,在安进,2000多名数据用户(从数据工程师到分析师)通过Databricks访问了400TB的数据,支持了40多个数据湖项目和240个数据科学项目。

実際にどのようなものかというと,使いやすく,見つけやすいデータで,会社全体のさまざまなユースケースを可能にするものです。

  • ゲノムの探索と研究を大規模にゲノムデータの力を活用することで,創薬プロセスを加速することができます。これにより,悲惨な病気を治療するための新薬を見けるチャンスが大幅に増えるでしょう。
  • 臨床試験デザインの最適化購入データから実際のエビデンスまで,さまざまなデータを取り込み,この多種多様な臨床データからの洞察を活用することで,成功の可能性を高め,数千万ドルのコスト削減を実現できる可能性があるようになりました。
  • サプライチェーンと在庫の最適化製造効率と在庫管理は,すべての製造業にとって課題であり,医薬品製造も例外ではありません。効率的な製造と最適なサプライチェーン管理は,ビジネスに数百万ドルの節約をもたらし,適切な患者に適切な薬を適切なタイミングで届けることに貢献します。

通过与Databrickbob体育外网下载s的合作,安进能够更好地将其数据与需要的团队连接起来,以改善患者和业务结果。

アムジェン社の成功が示すように,古くからある問題に対する斬新な解決策には,ビジネスのプラットフォーム,ツール,イノベーションの方法を一新することが必要です。アムジェン社での採用が進むにつれ、私たちは、Delta Sharing のようなツールを使って、コラボレーションと透明性を促進する湖水型アプローチを活用する新しい方法を探っていきます。また、Delta Live Tables は、ETL の開発と管理をさらに簡素化し、下流のデータ消費者に利益をもたらす可能性のある、魅力的なツールです。最終的には、Databricks のおかげで高度な分析のスタートラインに立つことができ、治療を必要とする患者のためになる問題解決により多くの時間を費やし、それを可能にする基盤インフラの再構築に時間をかけずに済むようになりました。

次のステップ

数据库無料トラ电子词典アル

関連記事

工程的博客

最新の数据湖屋で健康デ,タの力を解き放

患者1人に対して年間およそ80 MBの医療デ,タが生成されるといわれています。数千人規模の患者の生涯に換算すると,貴重な知見の源となるペタバイト級の患者データが生成されることになります。膨大なデータから知見を抽出することで,臨床業務の効率化,創薬研究の加速,患者の転帰の改善が図れます。これを可能にするためには,デ,タを収集するだけでなく,準備段階として,デ,タの前処理が必要です。ダウンストリムの分析やaiで利用できるよう,収集したデタのクリニングや構造化を行います。ヘルスケア・ライフサイエンス組織のほとんどが,この準備段階に多大な時間を消費しているのが実情です。業界におけるデータ分析の課題ヘルスケア・ライフサイエンス業界の組織が抱える,データ準備,分析,AIにおける課題には数多くの理由が存在しますが,そのほとんどは,データウェアハウス(DWH)上に構築されたレガシーなデータアーキテクチャへの投資に関係するものです。この業界における4の主要な課題は次のとおりです。課題1 -ボリュム
看到所有導入事例的帖子