Les différentes étapes

Votre数据仓库
N 'est + adapté au monde d'aujourd'hui

Au même titre que le CD, l'appareil photo jetable, la disquette et la plupart des innovations qui ont plus de 40 ans, le数据仓库a eu ses heures de glory。新事物的使用engendré新技术的幻影。这是一个持续不断的音乐。莱斯服装照片银渗透pas de partager des照片。我们的碟片没有竞争对手,我们的库存无穷无尽。让我们的数据仓库不受国际机场的影响。

我们正在接近的时间simplifiée

L'IA est une priorité pour tout les organizations。Mais l'infrastructure existante, complexe et dépassée, ne peut pas tenir les promeses de l'IA。Il est temps qu'une nouvelle architecture de données réponde à vos besoins aujourd'hui et qu'elle soit prête pour l'avenir。

Decouvrir
Lakehouse
Avènement杜湖屋

C'est une nouvelle ère de données et d'IA qui s' vre

数据湖屋和结构données数据仓库和数据湖。

Desormais,你们可以储料器所有vos数据相关的数字结构,半结构化或者非结构——的数据公开湖,兜售beneficiant de la质量,des表演,de la安全炸药et de la gouvernance瞿des数据数据仓库是一个用香熏fournir。Ainsi le lakehouse est la seule architecture de données qui prend en charge sur une seule platform la Business Intelligence, l'analytique SQL, les applications de données en temp réel, la data science et le machine learning。

《解剖湖屋》

Une seule plateforme pour tous les cas d'usage

三角洲湖

Les ingrédients essentiels

Delta Lake est un项目开源qui bob下载地址assure la fiabilité, la sécurité et la性能de votre数据湖,ce qui est essentiel à l'ajout d'une架构Lake house aux systèmes de stockage existants tels que Amazon S3, Azure数据湖存储et谷歌云存储。

Delta Lake est stocké dans un format de données ouvert, ce qui vous permet d'éviter le verrouillage des données par des formats propriétaires et d'accéder à un vaste écosystème开bob下载地址源。Aujourd'hui, de milliers d' enterprises tritent des exaoctede données chalque mois avec Delta Lake。


En savoir + sur Delta Lake→

hex-bg

湖屋表演

Les lakehouses ont plus de fonctionnalités que Les warehouse

Lakehouse va au-delà des limites du数据仓库汽车测试conçu pour gérer tous les types de données et prendre en charge à la fois les charges de travail du数据仓库传统的机器学习en mode natif。Il ajoute toutes ces fonctionnalités à votre数据湖存在,ce qui permet de créer un système ouvert unique pour à la fois gérer l'ensemble de vos données et prendre en charge tous les cas d'usage。

数据仓库 Lakehouse
格式de données
格式de données 公开
类型données
类型données 结构* Tous les类型données
可伸缩性
可伸缩性 于* * Hautement evolutif
成本
成本 $ $ $
ca d 'utilisation
ca d 'utilisation BI、SQL BI, SQL, ML,临时应用程序réel
Accès aux données
Accès aux données Réservé au SQL 使用SQL、R、Python和其他语言直接访问文件的开放api
可靠性
可靠性 Des données fiables et de haute qualité avec Des transactions ACID Des données fiables et de haute qualité avec Des transactions ACID
Gouvernance
Gouvernance 表的行/列级的细粒度安全性和治理 表的行/列级的细粒度安全性和治理
性能
性能

*Prise en charge limitée des données semi-structurées
**Le coût de la mise à l'échelle est prohibitif

Le père de l'entreposage des données est bien d'accord。

作为比尔·英蒙新贵的典范,构建数据湖屋。

Couverture du livre

湖屋转换选民数据湖

Les Lakehouses permeent de surmonter Les problèmes fondamentaux qui ont transformé Les数据湖和数据沼泽。Ils apportent de la qualité à选民数据湖在约站des fonctionnalités clés d'entreposage de données telles que les transactions, les schémas et la gouvernance。Par ailleurs, ils利用différentes技术d'优化des性能pour permettre des分析rapides。Grâce à ces优化de la gestion des données et des performance du data lake ouvert, les lakehouses peuvent, en mode natif, prendre en charge des applications de BI et de ML。

数据湖 Lakehouse
格式de données
格式de données 公开 公开
类型données
类型données Tous les类型données Tous les类型données
可伸缩性
可伸缩性 Hautement evolutif Hautement evolutif
成本
成本
ca d 'utilisation
ca d 'utilisation 毫升 BI, SQL, ML,临时应用程序réel
Accès aux données
Accès aux données Hautement evolutif 使用SQL、R、Python和其他语言直接访问文件的开放api
可靠性
可靠性 质量低,数据沼泽 Des données fiables et de haute qualité avec Des transactions ACID
Gouvernance
Gouvernance Mauvaise gouvernance car la sécurité doit être appliquée aux fichiers 表的行/列级的细粒度安全性和治理
性能
性能

Le père de l'entreposage des données est bien d'accord。

作为比尔·英蒙新贵的典范,构建数据湖屋。

Couverture du livre

Le lakehouse de Databricks

La première et La seule platform de lakehouse au monde dans le cloud

Fournie et gérée en tant que service sur AWS, Microsoft Azure ou encore谷歌Cloud, La plateforme Lakehouse de Databricks met à disposition toutes les données de votre data lake pour un nombre illimité de cas d'usage data-driven。

Les ingénieurs en données peuvent créer des pipelines de données rapides et fiables。Les business analysts peuvent faire de la BI en exécutant des requêtes SQL plus rapidement que la plupart des数据仓库。数据科学家比理性化家更有说服力。Et lorsque toutes vos équipes de données sont sur une plateforme公社,vous pouvez réduire considérablement les coûts d'infrastructure, augmenter la productivité des équipes de données Et accélérer l'innovation。

BI和SQL
数据湖上的分析方向

Databricks apporte une analytique de données à votre数据湖,fournissant des performance de数据仓库aux coûts d’un数据湖。
Grâce à l'utilisation de标准开源渗透d'évibob下载地址ter le verrouillage des données, la plateforme Lakehouse de Databricks offre la fiabilité, la qualité et la performance don les data lakes sont privés dans leur forme native ainsi qu'un rapport prix / performance 6 fois supérieur à celui des数据仓库云传统。

数据
工程
Des données récentes et fiables en toute simplicité

Databricks fournit une解决方案的数据工程de摄入,特征和平整- qui自动化的方向根据un数据湖la complexité de la création等德拉维护管道等'exécution des费用de劳动ETL。Les ingénieurs en données巴黎巴黎巴黎集中qualité et la fiabilité pour obtenir de précieux见解。

特性决定流量
tritement en continuu simple, évolutif et tolérant aux errors

Avec Databricks, les équipes de données peuvent extrire des insights exploitables à partir de données illimitées Avec un traitement ininterrompu dans le but fournir des garanties de service à un coût larage inférieur。L'utilisation de Databricks pour des cas d'usage en streaming permet aux équipes de données de créer des应用程序数据驱动临时réel à故障延迟,évolutives et tolérantes aux错误。

数据科学等ML
循环de vie complete du机器学习

数据平台complète et ouverte pour la数据科学和机器学习。En offrant联合国acc des管道数据de高级质量非常高性能,依照ainsi瞿萨那des capacites皇冠德机器学习,数据砖可以辅助装备数据et de ML de collaborer关于plateforme unifiee,依照ainsi触媒勒周期de vie完整du机器学习,des fonctionnalites de l 'engineering la生产。

Sécurité et管理公社
数据湖
Sécurité et管理公社

砖门生vos数据还l 'aide de d 'acces ultra-precis et de la capacite d展开facilement拉安全炸药恩典des政治安全范围cloud-natives et des系德行为des identites existants倒认为des工作区私人肖像,符合隔离。Les administrateurs peuvent facility gérer l'expérience de la plateforme de bout en bout et contrôler Les dépenses dans tous Les workspaces。

特质,问题和统治données
数据湖
特质,问题和统治données

优雅联合国ETL使自动化等可靠,联合国分配数据公开,securise萨那一个approche uniformisee de la gouvernance qui s 'etend辅助fournisseurs德云,砖合理化la行为数据等形式拉基础用品lakehouse出租ultra-evolutif。

Ouvrir数据湖
数据湖
Des données fiables et de haute qualité

Votre数据湖大陆déjà la grande majorité de vos données structurées, semi-structurées et non structurées。Associez désormais l' verture et la flexibilité de votre数据湖à une fiabilité et une qualité固体倒répondre aux besoins de tous les cas d' use analytiques à grande échelle。

Devouvrir

Passez la souris pour explorer les沙发d'un lakehouse建筑sur Databricks。

数据湖上的分析方向

Databricks apporte une analytique de données à votre数据湖,fournissant des performance de数据仓库aux coûts d’un数据湖。
Grâce à l' use de standard开源渗透d'évibob下载地址ter le verrouillage des données, la plateforme Lakehouse de Databricks offre la fiabilité, la qualité et la performance don les data lakes sont privés dans leur forme native ainsi qu'un rapport prix / performance 6 fois supérieur aux data仓库de cloud traditionnelles。

数据湖上的分析方向

Databricks apte une analytique de données à votre data lake et fournit des performance de data warehouse aux coûts d’un data lake。
Grâce à l'utilisation de标准开源渗透d'évibob下载地址ter le verrouillage des données, la plateforme Lakehouse de Databricks offre la fiabilité, la qualité et la performance don les data lakes sont privés dans leur forme native ainsi qu'un rapport prix / performance 6 fois supérieur à celui des数据仓库云传统。

Des données récentes et fiables en toute simplicité

Databricks fournit une解决方案的数据工程de摄入,特征和平整- qui自动化的方向根据un数据湖la complexité de la création等德拉维护管道等'exécution des费用de劳动ETL。Les ingénieurs en données巴黎巴黎巴黎集中qualité et la fiabilité pour obtenir de précieux见解。

Avec Databricks, les équipes de données peuvent extrire des insights exploitables à partir de données illimitées Avec un traitement ininterrompu dans le but fournir des garanties de service à un coût larage inférieur。L'utilisation de Databricks pour des cas d'usage en streaming permet aux équipes de données de créer des应用程序数据驱动临时réel à故障延迟,évolutives et tolérantes aux错误。

循环de vie complete du机器学习

数据平台complète et ouverte pour la数据科学和机器学习。En offrant联合国acc des管道数据de高级质量非常高性能,依照ainsi瞿萨那des capacites皇冠德机器学习,数据砖可以辅助装备数据et de ML de collaborer关于plateforme unifiee,依照ainsi触媒勒周期de vie完整du机器学习,des fonctionnalites de l 'engineering la生产。

三角洲湖砖门生vos数据还l 'aide de d 'acces ultra-precis et de la capacite d展开facilement拉安全炸药恩典des政治安全范围cloud-natives et des系德行为des identites existants倒认为des工作区私人肖像,符合隔离。Les administrateurs peuvent facility gérer l'expérience de la plateforme de bout en bout et contrôler Les dépenses dans tous Les workspaces。

三角洲湖优雅联合国ETL使自动化等可靠,联合国分配数据公开,securise萨那一个approche uniformisee de la gouvernance qui s 'etend辅助fournisseurs德云,砖合理化la行为数据等形式拉基础用品lakehouse出租ultra-evolutif。

Données fiables et de haute qualitéVotre数据湖大陆déjà la grande majorité de vos données structurées, semi-structurées et non structurées。Associez désormais l' verture et la flexibilité de votre数据湖à une fiabilité et une qualité固体倒répondre aux besoins de tous les cas d' use analytiques à grande échelle。
Le succès dans Le monde réel

湖畔之行,世界之行