Témoignage de客户端

Mettre la santé des patients au premier plan avec les données et l'IA

6 x

Amélioration dans le traitement des données

20.

Des millions d' enregistrations importés 20分钟

客户healthdirect
行业医疗保健
解决方案临床健康数据湖
bob体育客户端下载平台用例三角洲湖数据科学机器学习ETL
AWS

«数据分析的四种方法,法院délais我们在一起marché我们在一起opérationnel我们在一起répondre部门的新紧急情况santé。»

——Peter James,澳大利亚健康直接公司首席架构师

国家卫生服务目录(NHSD), Healthdirect exploite des téraoctets de données - les transactions de santé horodatées basées sur l'activité - afin d'améliorer les Services, les offres de soin等关系客户端。Confrontée aux exigences de gouvernance, au cloisonnement des équipes et à un système hérité difficile à faire évoluer, l'équipe a choisi Databricks。Elle a ainsi accéléré le traitement des données pour le machine learning en aval tout en améliorant leur sécurité, afin de répondre aux exigences HIPAA。

Qualité et gouvernance des données,筒仓et impossibilité d'évolution

Pour répondre aux pressions réglementaires, Healthdirect Australia a entrepreneur d'améliorer la qualité global des données et de mettre en place un niveau de governance supérieur。Mais l' enterprise a rapment rencontré des défis en matière de stockage et d 'accès aux données。plusiieurs筒仓données faisaient également障碍à la préparation效率des données在vue d'analytique en aval。cessources de données disparates affectaient la cohérence des lectures en raison de désynchronisations fréquentes entre les différents systèmes de la pile technologique。错误qualité des données était过失责任élevés等过失'efficacité du叛国。赛特建筑fragmentée engendrait des frais opérationnels important et empêchait d'obtenir une vue complète du patient。

Il fallait en oute importer + d'un milliard de points de données, du fait de l ' évolution du paysage de la demand des clients: réservations, rendez-vous, prix, activité de transaction de santé connectée等- soit plus de 1 To de données。

«Nous avions beaucoup de difficultés avec les données。Nous n'arrivions pas à les traiter avec suffisamment d'efficacité。智力不足,智力不足。Il devenait clair qu ' un délai de 24 heures n ' était pas optimal pour pouvoir fournir des données et des services de santé»,Peter James, architecte en chef de Health Direct Australia。

Healthdirect a compris qu'il fallait moderniser l'intégralité de son processus et de sa pile technologique pour soutenir correction son activité。

现代化l 'analytique avec Databricks et Delta Lake

Databricks fournit à Healthdirect Australia une plateforme d 'analytique de données unifiée qui simplfie le数据工程et accélère l 'innovation en数据科学。环境手册永久修改内容manière contrôlée,无avoir à exécuter des tâches sur测度à chque fois。

«Databricks a été un véritable moteur pour nos équipes et nos opérations de données»,肯定彼得·詹姆斯。«Les分析travaillent方向avec Les équipes des opérations de données。Ils complissent les mêmes tâches, ensemble, dans des délais deux fois + courts qu'auparavant。Parallèlement à新巴黎合作,nous constatons une accélération massive de notre capacité à fournir un service。»

Avec Delta Lake, l'équipe a créé des zones de données loggiques: arrivée, brute, préparation et or。Dans ces différentes zones, l'équipe stocke ses données«telles quelles»,structurées ou non, Dans des tables du Delta Lake。Elle applique ensuite un schéma de métadonnées et conserve les données dans une结构imbriquée au sein de la table。Grâce à知情人,elle peut traiter uniformément les données provenant de toutes les sources。Cela simplifie également le映射de données aux différentes应用程序很有用。

Dans le même temps, grâce à结构化流媒体,l'équipe a converti toutes tâches ETL groupées en tâches ETL de flux capables de desservir plusieurs applications de façon homogène。全球化,l'introduction de Spark Structured Streaming, de Delta Lake et de la plateforme d'analytique unifiée de Databricks apporte des améliorations essentielles à l'architecture, qui se traduisent par une hausse des performance, une réduction des frais et des processus plus effessus。

Des pipeline de données加上rapides pour Des soins de santé de meleure qualité axés sur le patient

Les gains de performance obtenus avec Databricks et l'amélioration de la fiabilité des données acquise grâce à Delta Lake ont porté leurs fruits: l'algorithme de correspondance近似de noms de Healthdirect Australia, qui affichait une précision inférieure à 80% avec vérification manuelle, atteint désormais 95% de précision sans aucune干预。

L'amélioration des performance du tritement, obtenue grâce à Delta Lake et à Structured Streaming, permet à L 'entreprise de traiter plus de 30000 mise à jour automatisées par mois。先进的数据,il fallait 'appuyer sur des tâches groupées peu fiables et iniant un effort manuel important pour trititer en six mois le même nombre de mises à日月,日月,trititement des données a donc été divisé par six。

L'équipe a également atteint un taux de charge des données d'un million d' enregistrations par minute: il faut en effet 20分钟pour charger ses 2000万d' enregistrations。先驱者采用数据,谬论加上24小时的交易。倒les分析家,il était donc impossible de prendre des décisions rapides Pour obtenir des résultats。

德尼耶点:la sécurité des données, essentielle au vu des exigences de conformité, a été considérablement renforcée。Databricks fournit des accréditations de sécurité标准,parmi lesquelles HIPAA。Healthdirect a pu utiliser Databricks pour répondre aux exigences de sécurité australiennes。Cela一considerablement reduit les cout de l商会兜售en fournissant联合国mecanisme继续de数据保证汽车兜售使受监视和跟踪:les修改带来了辅助特权d 'acces像莱斯德角色变化,les修改安全范围层面des metadonnees les果实de数据等。

«数据分析的四种方法,法院délais我们在一起marché我们在一起opérationnel我们在一起répondre部门的新紧急情况santé。詹姆斯怒斥道。

Un avenir radieuse profile à l'horizon pour Healthdirect Australia。数据助手,企业prouvé données分析价值,démontrant商业影响。L'accès透明aux données,同类traçabilité et d'une qualité bien documentées,一个considérablement démocratisé leur利用par différents groupes commerciaux et d' analyses。Les équipes extraient + facility et + rapidement de la valeur des données, pour améliorer la santé de tous。