数据+ AI世界巡回赛巴黎
Le Lakehouse s'impose rapidement comme la nouvelle normme en matière d'architecture de données, mais chque région a ses propres historires et ses propres challenges。
欢聚巴黎conférence en présentiel à巴黎,entièrement conçue pour vous apporter des pistes de réflexion à vos problématiques data les plus complex。
Les keynote et ateliers techniques seront présentés par大卫·迈耶,ainsi que par nos équipes globales et locales d'experts Data & IA et nos clients de Databricks France。
看点播
Conferenciers
大卫·迈耶
高级副总裁、产品
砖
皮埃尔•哈达德
现场工程经理
砖
迈克尔Harlaut
现场工程经理
砖
阿纳斯塔西娅Prokaieva
高级专家解决方案工程师
砖
塞德里克Kassi
Responsable Socles大数据,分析和机器学习
法国安盛保险
Achraf哈米德
数据科学家
数字原生角
Frédérique马丁·圣阿加特
高级客户成功经理
砖
Gautier Loveiko
首席数据科学家
数字原生角
莱昂蒂芬妮
首席数据工程师
数字原生角
Florian奥布里
CTO &联合创始人
数字原生角
阿克塞尔瑞奇
数据工程经理
数字原生角
胺Majdoubi
首席技术官
数字原生角
议程
8 h00
9 h00
Les mondes données, de l'analytique et de l'IA étant de plus en plus interconnectés, le besoin d'une platforme permettant d'unifier Les sources de données, Les cas d' use et Les workload se fait de plus en plus sentir。Le数据湖屋最高les barrières qui séparent les商业分析师des数据科学家,les données structurées du streaming en temps réel et la商业智能de l'IA。Ce话语d'ouverture explore评论l'approche simple, ouverte et multicloud du Lakehouse simplifie la gestion des données, unifie les équipes data et permet de produire davantage d'initiatives。
Au travers d'une démonstration, cette keynote montrera要求评论数据工程,数据仓库,数据科学等工作原理orchestrés dans l'architecture de la plateforme Lakehouse de Databricks。
- Le Lakehouse pour casser les silos de données et de gouvernance
- 莱克豪斯的数据工程
- 湖屋数据仓库
- 莱克豪斯的机器学习
- enmarche vers une数据架构安盛湖屋法国
Le data lakehouse représente l'avenir pour les équipes data modernes qui cherchent à innovver avec une architecture qui simplfie les负载de données,便利la协作和节约la flexibilité et l'ouverture pour rester敏捷à mesure que l' enterprise évolue。La plateforme Lakehouse de Databricks concrétise cette idée en uniant les负载d'分析,数据工程,机器学习等流de données au travers des différents云,sur une seule platform de données simple et ouverte。Dans cette session, découvrez comment la plateforme Lakehouse de Databricks peut répondre à vos besoins avec des examples réels d'applications de clients, des architectures de référence et des démonstrations pour montrer comment vous pouvez créer vos propres solutions de données modernes。
La plupart des企业开发couramment leurs activités avec des architectures de données complex sur le cloud qui cloisonnent les applications, les utilisateurs et les données。En conséquence, il n'exist pas de source unique de vérité des données pour l'analytique, et la plupart des analyses sont effectuées avec des données périmées。倒résoudre ces défis, le lakehouse a émergé comme la nouvelle norme Pour l'architecture de données, avec la promesse d'unifier les données, l'IA et les负载分析en un seul endroit。dan cette session, nous allons expliquer pourquoi le lakehouse est le prochain meilleur数据仓库。no experts partageront des historires de réussite, des cas d'usage et les meilleures pratiques apprises sur le terrain。Découvrez评论le数据湖屋ingère, stocke等gouverne les données批评à l'échelle pour ainsi构建un数据湖curatif pour les工作负载de数据仓库,de SQL et de BI。Vous学徒également评论Databricks SQL peut Vous aider à réduire vos coûts et à démarrer en quelques secondes grâce à un计算无服务器SQL instantané et élastique。Nous vous montrerons aussi comment chque ingénieur分析et chque analytique et chque analyste peut ainsi trouver et partager rapidement de nouvelles信息à l'aide de ses outtils de BI et SQL préférés, tell que Fivetran, dbt, Tableau ou Power BI。
Découvrez les dernières innovations de Databricks qui peuvent vous aider à constrire et à rendre opérationnelle la prochaine génération de solutions de机器学习。Cette session se penchera sur Databricks机器学习,une platform d'IA centrée sur les données qui couvre l'ensemble du cycle de vie du Machine Learning - de l' estion des données et de la formation des modèles aux MLOps de production。你découvrirez我们的原则fonctionnalités我们的剥削者在行动中没有使用和生产。Vous entendrez aussi指示评论数据ML est utilisé pour maximiser la logistique de la chaîne d'approvisionnement et maintenir des millions de producits可口可乐人造丝。
参与à cette会议pour découvrir评论la plateforme Lakehouse数据与人工智能à être compétitif dans le monde du大数据与人工智能。知识présenterons大数据理论与解释les rôles et les compétences clés à研究知识与解释les équipes数据。理性的审查员également评论la plateforme lake数据库的peut辅助选民组织à合理化的工作流程,à éliminer筒仓和à tierrer le meilleur parti de vos données。
12 h00
13 h10
Les data engineers ont la tâche difficile de nettoyer des données complex et variées et de Les transformer en une source utilable pour pilot l’analyse de données, la data science et le machine learning。Ils doivent connaître en profondeur la plateforme d'infrastructure de données, conconire des requêtes complex dans différents languages et les assembler pour la production。参与者à cette会话倒découvrir评论Delta Live Tables (DLT) simplfie la complexité de la transformation des données et de l’etl。DLT est le premier框架ETL à utiliser des pratiques modernes d'ingénierie logicielle pour fournir des pipelines de données fiables et sûrs à n' importte quelle échelle。Découvrez评论les分析et les数据工程师创新快速grâce à un développement et une维护简单des管道et评论供应商la complexité opérationnelle en automatisant les tâches行政管理et en obtenant une visibilité sur les opérations des管道。Nous vous montrerons également评论les contrôles de qualité et la surveillance intégrés garantissent la précision de la BI, de la data science et du ML. Enfin, découvrez评论le batch et le streaming simplifiés peuvent être mis en eure vre avec des pipelines de données auto-optimisants et auto-scaling。
De nombreuses organizations se standard sur le lakehouse。始凡特,新建筑提出的挑战autour du moteur d'exécution de requêtes苏jacent pour accéder aux données structurées et non structurées。Le moteur d'exécution doit offrir les性能d'un数据仓库et la scalabilité des数据湖。Pour garantir des性能优化,la platforme Lakehouse de Databricks提出光子。cemoteur d'exécution de requêtes vectorielles de nouvelle génération超越les datawarehouse existants dans les负载SQL et met en eure un cadre d'exécution加上général pour un traitement efface des données avec la prise en charge de l'API Apache Spark™。Avec Photon, les requêtes analytiques voient leur vitesse augmenter de 3 à 5 fois, Avec une réduction de 40% des heures de计算pour les工作负载ETL。Dans cette session, nous allons plonger Dans Photon, décrire son intégration avec la plateforme Databricks et les runtimes Apache Spark™,parler des cas d' uses de clients et montrer comment vos workloads SQL et DataFrame peuvent bénéficier des performance de Photon。
À企业措施déploient le ML de manière systématique, les préoccupations opérationnelles devient la principale source de complexité。Les opérations de机器学习(MLOps) sont apparues comme une pratique permettant de gérer cette complexité。Chez Databricks, nous voyons指示评论les客户développent leurs approches MLOps dans une grande variété d'équipes et d' enterprises。
Dans cette session, nous allons partager comment Databricks résout ce problème de manière unique en uniant les aspects clés de MLOps, à savoir DataOps, ModelsOps et DevOps, sur une plateforme unifiée au travers du Lakehouse,渗透une production ML plus rapide et plus fiable。montrerons评论选民组织在实践现场测量MLOps manière incrémentale。知识暴露的原则généraux qui peuvent guide les décisions de votre organisation en matière de MLOps, en présentant les architectures cibles les plus courantes que Nous observons chez nos clients。
14 h05
Le streaming est l'avenir de tous les pipeline de données et de toutes les applications。Il permet aux企业de prendre + rapidement des décisions数据驱动et de réagir + vite, de développer des应用程序数据驱动considérées auparavant comme不可能,et de proposer des expériences nouvelles et différenciées aux客户。Cependant, de nombreuses enterprises n'ont pas exploité tout le potentiel du streaming, car il les oblige à redévelopper entièrement leurs pipeline de données et leurs applications sur des stacks technques nouvelles, complex, propriétaires et dissociée。
L'orchestration et la gestion des pipeline de production de bout-en-bout constituent un goulot d'étranglement pour de nombreuses organizations。Les équipes数据临时转发器à汇编人员tâches du管道和à gérer和监测人员编制过程和应用的外部编制解决方案的资源spécifiques au cloud,新生事物的来源données。Dans cette session, nous vous présentons Databricks工作流程:un service d'orchestration entièrement géré pour toutes vos données,分析et IA,构建Dans la plateforme Lakehouse de Databricks。在新天地里畅快地畅快地畅快地畅快地畅快地畅快地畅快地畅快地畅快地畅快地畅快地畅快地畅快地畅快地畅快地畅快地畅快地畅快地畅快地畅快。你们apprendrez克里尔等实行des工作流de生产可靠、蒙古包等一个监视ces工作流的方式centralisee等设置œuvre des行动de恢复告诉la补偿et l 'execution,其他依照ainsi新式fonctionnalites。
15 h00
Les clients du monde entier conaissent un succès considérable en migrants des old ennes architectures Hadoop on-premise vers le Lakehouse de Databricks, une platform forme modern dans le cloud。Chez Databricks, nous avons mis au point une méthodologie de migration qui aide les clients à franchir aisément le cap de la migration。我们的课程présentation,我们的知识éléments clés最小风险和简化迁移过程数据,和知识présenterons我们的知识和应用程序。
Les assets de données modernes prennent de nombreuses formes:对画面的影响,对画面的影响,modèles ML et des données non structurées comme des vidéos et des images,对画面的影响être régis et gérés管理问题的解决方案données traditional。参与者à cette session pour découvrir comment les équipes data peuvent utiliser Unity Catalog pour gérer de manière centralisée toutes les données et les actifs d'IA avec un modèle de gouvernance commun basé sur le connu SQL ANSI, garantissant des performance natives et une sécurité bien meilleures。Le lignage automatisé et intégré des données offre une visibilité de about en bout sur la façon don les données circulent de la source à la consommation, afin que les organisations puissent identifier et diagnostiquer l'impact des changements de données。统一目录offre la flexibilité nécessaire pour exploiter les catalogde données et les solution existantes et établir une gouvernance centralisée à l'épreuve du temps, sans coûts de migration élevés。Il克里族并非对des怎样d 'audit detailles倒拉公司et des数据安全炸药,兜售en garantissant你们装备费用des数据peuvent很快decouvrir等参考数据倒les阵痛de BI费用,依照ainsi d与et de ML,触媒le temps de维持价格。
Tout le monde veut réduire le temps nécessaire pour transformer les données en信息可利用。Cela implque souvent l'intégration de plusieurs outils de données dans ce que l'on applle la Modern Data Stack (MDS)。Mais la plupart des approach ne se sont concentrées que sur la moitié du problème en enracinant le MDS dans le数据仓库。Une véritable MDS devrait résoudre tous les problèmes modernes en s'attaquant à l'IA et au streaming en plus du reporting et de la BI。Dans cette démonstration, nous vous montrons à quel point il est facile d'intégrer la plateforme Lakehouse de Databricks Dans votre Modern Data Stack pour connecter tous vos outils de données à遍历SQL, AI/ML等流,et découvrir de nouvelles méthodes pour débloquer des insights plus rapidement。
16 h00