拉Lakehouse de Databricks平台简化considérablement le streaming de données pour fournir de l'analytique, du machine learning et des applications en temps réel sur une seule et même platform。
Donnez à vos équipes data les moyens de créer des劳动费用流avec les languages et les outils qu'elles conaissent déjà。简化le développement et les opérations en automatisant les phase de production associées à la création et à la maintenance des charges de données en temps réel。Éliminez les silos en unified les données en streaming et en batch sur une même plateforme。
Créez加上快速des管道分流等应用程序
Utilisez les languages et les outils que vous maîtrisez déjà avec des API unifiées de traitement batch et streaming dans SQL et Python。将l 'analytique,勒毫升et莱斯应用程序En temps réel au service de l'ensemble de votre organisation。
Simplifiez les opérations grâce à外部自动化
Déployez facility vos管道和应用程序临时réelEn production et bénéficiez d'une gestion simplifiée。Les outils automatisés简化编曲des tâches, la tolérance aux pannes et le rétablissement,自动化性能优化des contrôles et de l'évolutivité。
评论ça marche ?
摄取和转换de données de流
分析,ML等临时应用réel
Outils opérationnels automatisés
新特性的流动génération
统一管理与储备
摄取和转换de données de流
简化摄取和使用管道données en streaming avecDelta活动表.Exploitez une approach déclarative简单的du工程数据pour permettre à vos équipes d'utiliser les languages et les outils qu 'elles maîtrisent déjà, comme SQL et Python。Créez et exécutez des管道par batch et en streaming en un seul enroit avec des paramètres de rafraîchissement contrôlables et automatisés, ce qui permet de gagner du temps et de réduire la complexité opérationnelle。这是我们的故事où你prévoyez使者données,在我们的网络上工作的时间données野兽在créant在数据平台上的输油管。
“越来越多的业务单位以自助服务的方式使用该平台,这在以前是不可能的。bob体育客户端下载Databricks对哥伦比亚大学的积极影响,我怎么说都不为过。”
- Lara Minor, Columbia Sportswear公司高级企业数据经理
分析,ML等临时应用réel
浏览données, améliorez immédiatement la précision分析选民和挖掘潜力的选民。Pour votre enterprise, les insights en temps réel découlent direcement des pipeline de données en streaming。Que ce soit pour effectuer del 'analytique SQL欧德斯。怎样的BI,倒entraîner des modèles de ML欧克里尔des应用operationnelles临时工卷,exploitez les数据+最近倒联合国三圣俸:des信息临时工卷,des > +精确等一个撬acceleree德的决定。
«美好的世界données les + récentes et les + précises à nos partenaires commerciaux, sans quoi ils perdent confc dans les insights…Le lakehouse Databricks a rendu extrêmement简单ce qui était auparavant不可能。»
- Guillermo Roldán, Responsable de l'architecture, LaLiga Tech
Outils opérationnels automatisés
Lorsque vous créez et déployez des pipelines de données en streaming, Databricks automatise une很大一部分des tâches opérationnelles complex需要pour le passage en production。La plateforme gère notamement La mise à l'échelle基础设施自动化系统,l'orchestration des dépendances du pipeline, La gestion et La correction des error, l'optimisation des performance等。L 'autoscaling ameliore优化集群分配自动化资源计算à chque charge de travail。Ces fonctionnalites,完成标准des测试的时候德质量des数据等一个行为异常,reduisent le temps necessaire la创建一个洛杉矶等维护des outils operationnels倒你们permettre de你们集中于一点苏尔德沃斯的数值数据。
新特性的流动génération
勒流式structuré Sparkest la technology fondamentale à la base du streaming de données sur la plateforme lakehouse de Databricks。Il fournit une API unifiée pour le traitement en batch et en streaming。La plateforme lakehouse de Databricks estla meilleure façon d'exécuter vos收费de travail Apache SparkAu sein d 'UN service géré affichant UN taux de disponibilité prouvé de 99, 95%。沃斯的费用de阵痛火花sont安可accélérées par光子, le moteur lakehouse de nouvelle génération兼容avec les API Apache Spark。我提供表演记录浇子coût et peut évoluer automatiquement Pour prendre en charge des millers de nounuds。
统一管理与储备
Avec le streaming de données sur Databricks, vous bénéficiez des composants fondamentaux de laplateforme Lakehouse:统一目录和三角洲湖。沃斯données野兽sont optimisées avec三角洲湖, le seul框架de库存开源conçu de A à Z bob下载地址pour les données en streaming et en batch。统一目录intègre une gouvernance détaillée pour toutes vos données et resources d'IA。Il fournit un modèle cohérent pour la découverte, l'accès et le partage des données sur tous les clouds。统一目录fournit également une prise en charge本地de三角洲分享, le premier protocole ouvert du secur pour UN partage de données simple et sécurisé avec d ' aures organisations。
集成
Offrez un maximum de flexibilité à vos équipes de données: appuyez-vous sur合作伙伴联系Et notre écosystème departenaires technologiques倒intégrer de manière transparente les outils les加上répandus de streaming。
流式de données
Témoignages de clients
«Nous utilisons Databricks pour nos données en mouvement à haut débit。Grâce à美丽的平台,聪明的头脑considérablement augmenté聪明的头脑à美丽的头脑répondons病人的眼睛,聪明的头脑。Nous gérons actuellement une douzaine d'initiatives, qui reent toutes sur les données de Databricks。»
«Désormais, nous détectons la fraude en temps réel。有一个能长久生存的法国骗子déjouer法国système,法国déverrouillages illégaux,法国机器人和SMS,法国'identité。»
En savoir +
Contenu associe
电子书等démonstrations
博客
- 管道de données en streaming à故障延迟avec Delta Live Tables et Apache Kafka
- 简化的l'摄取de données de流丹斯三角洲湖
- 流式structuré Apache Spark et filigranes
- Vos项目à la vitesse de la lumière: le traitement de flux加上rapide et加上简单avec Apache Spark
- Un aperçu de toutes les nouvelles fonctionnalités de streaming structuré développées en 2021 pour Databricks et Apache Spark - le blog Databricks