Témoignage de客户端

永恒的永恒à伟大的生命是永恒的

10%

De réduction De la consommation d'énergie

30%

D 'économies sur le coût de l'infrastructure de données

SNCF
Secteur运输
AWSAzure

«Le lakehouse Databricks nous a permis de créer une source unique de vérité et de découvrir加上facility des opportunités d'améliorer l'efficacité de notre infrastructure de transport, afin de réduire considérablement notre impact sur l' environment。»

- Rémi Bihouis, ITNOVEM, SNCF IT合作伙伴

法国国家铁路公司的使命是确保运输流量和耐用的乘客和货物,提供réduisant les émissions碳水和运输工具énergies可恢复的服务de l'avenir mobilité。L' organization s'est fixé comme objective de réduire les émissions de CO₂de 30% d'ici à 2030 (par rapport aux niveaux de 2015) et d'atteindre le zéro émissions nettes en 2050。Mais l' enterprise est freinée dans ses ambition par des systèmes anciens incapacables de traiter les volumes considérables de données IoT générés par ses trains et l'équipement électrique du réseau。De plus, les données sont enfermées dans des silos, empêchant les équipes合作者和临时工作人员réel à l' enterprise。Avec la plateforme lakehouse Databricks, elles peuvent désormais unifier leurs données et accélérer leur traitement pour produire des analyses et des rapports。Forte de ces insights, la SNCF obtient une image précise de la consomation énergétique de ses trains et producit des建议pour la minuer, afin d'atteindre ses objectifs de réduction d'émissions et de coûts。

Surmonter les gros volumes de données et la segmentation des opérations

La maîtrise des coûts est不可或缺的à法国国家铁路公司(SNCF): 33,5亿欧元,27万合作者,世界和réseau 3万公里的国家。L' enterprise a également ambitieux pris des engagement en matière d'ESG, chque members de faisant du développement持久的une priorité。En 2017, la SNCF a lancé un project baptisé EMS (solution de gestion de l'énergie), conçu pour surveillance et optimiser la consommation énergétique de son réseau ferroviaire。

Avec 10000 à 15 000火车循环支票日数,les systèmes de l' enterprise sont confrontés à des volumes considérables de données provenant des capteurs embarqués sur les trains, ce qui représente environ 9000万de lignes par mois。Sur les传统平台de l' organization, le tritement était souvent long and complexe。筒仓数量données, ils组成部分自由的力量à la协作中心équipes。L' enterprise était confrontée à deux défis majeurs: le déploiement et la maintenance。Les architectes cloud de la SNCF savaient qu'il fallait faciliter l'accès aux données pour tous Les utilisateurs - architectes, spécialistes des opérations cloud,数据工程师和分析师- et mettre en place une solution commune pour l'进口,la transformation et le charmges données provenant d'un large éventail de sources。Il fallait également s'保险商que les管道de données seraient suisamment robust et évolutifs。

Une gestion des données加上流体和des性能supérieures grâce au lakehouse

Pour répondre à ces exigences, la SNCF a choisi une architecture de lakehouse Databricks comme couche de données公社Pour tous ses besoins en traitement et en BI。Le lakehouse a simplifié l'architecture de données de la SNCF: c'est aujourd'hui une source unique de données, accessible aux ingénieurs comme aux analyes。Le résultat: un gain d'efficacité有形的et des coûts réduits。Pour la SNCF, l'expérience de migration vers le lakehouse Databricks été rapide et efficiency。Elle a permis de simplifier l'architecture analytique en intégrant la couche BI au workflow en tout transparency。量化à la couche de données centralisée,选型capacités de协作,elle a amélioré l'efficacité opérationnelle et la productivité des équipes。La mise en euvre du lakehouse便利le partage et l' analysis des données avec Power BI。Le lakehouse évite également d'avoir à dupliquer les données ou à créer une couche de présentation intermédiaire。La沟通和协作entre les équipes se sont considérablement améliorées。Elles peuvent désormais travailler ensemble en toute transparente sur la même plateforme à l'aide de notebooks collaboratifs。

Dans cette建筑云simplifiée, les données sont stockées Dans Delta Lake, où elles sont ingérées, transformées, et présentées au sein d'une seule vue unifiée。三角洲湖répond à la fois aux besoins en matière de Big Data et de BI。En évitant la duplication des données, il accroît l'efficacité de la gestion des données, réduit le nombre de composants et les coûts, et accélère le développement de nouveaux as d'usage。地理位置优越:法国équipes数据保证données松冻à日。Les données qui étaient auparavant actualisées une à双鹅双鹅双肉rafraîchies双鹅双肉。Avec une source unique de vérité, les données sont systématiquement à jour et la réplication n'est + nécessaire。Surtout, Delta Lake offre à la SNCF un accès direct aux données en SQL, sans base de données intermédiaire。

Pour les opérations de données de la SNCF, la performance et l'évolutivité sont crucales。Grâce à la simplicité des functions d'autoscaling et de gestion des集群du lakehouse Databricks, les data engineers de la SNCF créent des clusters de computation à la volée pour gérer les charge ETL et produire des analyses utiles à l'entreprise。

Des opérations ferroviaires加上效力倒unavenir加上持久

Grâce aux增益d'efficacité permis par le choix de l'architecture lakehouse, le coût de l'infrastructure de données mise en place par la SNCF pour soutenir son projet de gestion énergétique a été réduit de 30%。L'intégration aux systèmes existants s'est faite avec souplesse, sans perturber les procsus ni dégrader la qualité des données。Le temps de développement a également beaucoup baissé, en particulier du côté des opérations。Les opérations de数据工程和云计算的影响,parfois même双fois moins。Et ce n'est pas un hasard: Databricks accélère le déploiement avec le passage en unclic du développement à la réception Et à la production。

Aymeric François,数据分析师chez SNCF Voyageurs, l'肯定:«Avec 1400万乘客等à 15 000列火车,la SNCF avait besoin d'une解决方案稳健等évolutive有能力的données印象,démultiplier notre productivité et renforcer la performance de notre architecture existante。»

Grâce au lakehouse Databricks, la SNCF parvient aujourd'hui à测量avec précision la consommation énergétique de chaque train sur des interles de cinq minutes seurtion, en exploles transmises par les capteurs de borte。cesinformation sont agrégées avec les estimations de train dépourvus de capteurs, puis synthétisées au sein de rapports visuels à l'intention des actor clés de l'ensemble du groupe。cesdonnées ne permettent pas selement aux différentes branch d'activité d'évaluer le consommation d'énergie, elles apportent également une grande transparence sur les coûts de la SNCF。L' enterprise peut aussi exploiter ces information pour identifier des leviers de lutte contre le gaspillage d'énergie, comme L 'arrêt des trains la nuit ou la modification des schémas de conduite。Grâce à ces données, elle a déjà éliminé 10% de conmation无效。

Aymeric François追求:«Avec une production énergétique年度三亿欧元与6 TWh - an, soit équivalent d'une centrale nucléaire, l'introduction de Databricks nous rend déjà un巨大的服务与协助à生产与协调extrêmement précis和工具à toute l' enterprise。精神上的信念,精神上的帮助à精神上的标识符gérer和améliorer精神上的利用réseau精神上的目标développement持久的精神上的帮助années。»
À法院术语,l'un des principaux objectifs de la SNCF est d'介绍数据库SQL倒优化器子代码等流态器encore la协作entre les ingénieurs et les分析。il pourront en effet travailler simultanément sur les mêmes données, en bénéficiant de mises à jour daildienes et meilleures绩效分析。Le tout avec des coûts réduits。