Amélioration dans le traitement des données
Des millions d' enregistrations importés 20分钟
Pour répondre aux pressions réglementaires, Healthdirect Australia a entrepreneur d'améliorer la qualité global des données et de mettre en place un niveau de governance supérieur。Mais l' enterprise a rapment rencontré des défis en matière de stockage et d 'accès aux données。plusiieurs筒仓données faisaient également障碍à la préparation效率des données在vue d'analytique en aval。cessources de données disparates affectaient la cohérence des lectures en raison de désynchronisations fréquentes entre les différents systèmes de la pile technologique。错误qualité des données était过失责任élevés等过失'efficacité du叛国。赛特建筑fragmentée engendrait des frais opérationnels important et empêchait d'obtenir une vue complète du patient。
Il fallait en oute importer + d'un milliard de points de données, du fait de l ' évolution du paysage de la demand des clients: réservations, rendez-vous, prix, activité de transaction de santé connectée等- soit plus de 1 To de données。
«Nous avions beaucoup de difficultés avec les données。Nous n'arrivions pas à les traiter avec suffisamment d'efficacité。智力不足,智力不足。Il devenait clair qu ' un délai de 24 heures n ' était pas optimal pour pouvoir fournir des données et des services de santé»,Peter James, architecte en chef de Health Direct Australia。
Healthdirect a compris qu'il fallait moderniser l'intégralité de son processus et de sa pile technologique pour soutenir correction son activité。
Databricks fournit à Healthdirect Australia une plateforme d 'analytique de données unifiée qui simplfie le数据工程et accélère l 'innovation en数据科学。环境手册永久修改内容manière contrôlée,无avoir à exécuter des tâches sur测度à chque fois。
«Databricks a été un véritable moteur pour nos équipes et nos opérations de données»,肯定彼得·詹姆斯。«Les分析travaillent方向avec Les équipes des opérations de données。Ils complissent les mêmes tâches, ensemble, dans des délais deux fois + courts qu'auparavant。Parallèlement à新巴黎合作,nous constatons une accélération massive de notre capacité à fournir un service。»
Avec Delta Lake, l'équipe a créé des zones de données loggiques: arrivée, brute, préparation et or。Dans ces différentes zones, l'équipe stocke ses données«telles quelles»,structurées ou non, Dans des tables du Delta Lake。Elle applique ensuite un schéma de métadonnées et conserve les données dans une结构imbriquée au sein de la table。Grâce à知情人,elle peut traiter uniformément les données provenant de toutes les sources。Cela simplifie également le映射de données aux différentes应用程序很有用。
Dans le même temps, grâce à结构化流媒体,l'équipe a converti toutes tâches ETL groupées en tâches ETL de flux capables de desservir plusieurs applications de façon homogène。全球化,l'introduction de Spark Structured Streaming, de Delta Lake et de la plateforme d'analytique unifiée de Databricks apporte des améliorations essentielles à l'architecture, qui se traduisent par une hausse des performance, une réduction des frais et des processus plus effessus。
Les gains de performance obtenus avec Databricks et l'amélioration de la fiabilité des données acquise grâce à Delta Lake ont porté leurs fruits: l'algorithme de correspondance近似de noms de Healthdirect Australia, qui affichait une précision inférieure à 80% avec vérification manuelle, atteint désormais 95% de précision sans aucune干预。
L'amélioration des performance du tritement, obtenue grâce à Delta Lake et à Structured Streaming, permet à L 'entreprise de traiter plus de 30000 mise à jour automatisées par mois。先进的数据,il fallait 'appuyer sur des tâches groupées peu fiables et iniant un effort manuel important pour trititer en six mois le même nombre de mises à日月,日月,trititement des données a donc été divisé par six。
L'équipe a également atteint un taux de charge des données d'un million d' enregistrations par minute: il faut en effet 20分钟pour charger ses 2000万d' enregistrations。先驱者采用数据,谬论加上24小时的交易。倒les分析家,il était donc impossible de prendre des décisions rapides Pour obtenir des résultats。
德尼耶点:la sécurité des données, essentielle au vu des exigences de conformité, a été considérablement renforcée。Databricks fournit des accréditations de sécurité标准,parmi lesquelles HIPAA。Healthdirect a pu utiliser Databricks pour répondre aux exigences de sécurité australiennes。Cela一considerablement reduit les cout de l商会兜售en fournissant联合国mecanisme继续de数据保证汽车兜售使受监视和跟踪:les修改带来了辅助特权d 'acces像莱斯德角色变化,les修改安全范围层面des metadonnees les果实de数据等。
«数据分析的四种方法,法院délais我们在一起marché我们在一起opérationnel我们在一起répondre部门的新紧急情况santé。詹姆斯怒斥道。
Un avenir radieuse profile à l'horizon pour Healthdirect Australia。数据助手,企业prouvé données分析价值,démontrant商业影响。L'accès透明aux données,同类traçabilité et d'une qualité bien documentées,一个considérablement démocratisé leur利用par différents groupes commerciaux et d' analyses。Les équipes extraient + facility et + rapidement de la valeur des données, pour améliorer la santé de tous。