Databricks为其行业领先的数据湖屋平台推出了新的创新bob体育客户端下载

2022年6月28日
分享这篇文章
  • 先进的数据仓库和数据治理功能突出了现代数据堆栈的未来
  • Databricks Marketplace和Data Cleanrooms功能加速了公司对开放和协作数据共享的愿景
  • 新的数据工程优化以最具成本效益的方式自动执行批处理和流数据管道
  • 整个机器学习生命周期的增强从根本上简化了生产规模的mlop

旧金山- 2022年6月28日-Databricks是一家数据和人工智能公司,也是数据湖屋模式的先驱,该公司今天在年度大会上向满座的观众展示了Databricks湖屋平台的演变bob体育客户端下载数据+人工智能峰会在旧金山。新功能包括一流的数据仓库性能和功能,扩展的数据治理,新的数据共享创新,包括用于安全数据协作的分析市场和数据洁净室,ETL操作的自动成本优化,以及机器学习(ML)生命周期的改进。

“我们的客户希望能够在一个平台上进行商业智能、人工智能和机器学习,他们的数据已经驻留在一个平台上。bob体育客户端下载这需要一流的数据仓库功能,可以直接在数据湖上运行。基准测试Databricks的联合创始人兼首席执行官Ali Ghodsi说:“我们已经一次又一次地证明,Databricks Lakehouse平台在一个简单、开放和多云的平台上为数据团队提供了最好的两个世界。bob体育客户端下载”“今天的公告是推进我们Lakehouse愿景的重要一步,因为我们比以往任何时候都更快、更容易地实现数据价值的最大化,无论是在公司内部还是在公司内部。”

最好的数据仓库是Lakehouse

等组织安进公司美国电话电报公司(AT&T)美国西北相互而且沃尔格林因为它能够同时提供结构化和非结构化数据的分析。今天,Databricks在其平台中推出了新的数据仓库功能,以进一步增强分析工作负载:bob体育客户端下载

  • Databricks SQL Serverless,可在AWS上预览,提供即时、安全、完全管理的弹性计算,以较低的成本提高性能。
  • 光子这款lakehouse系统的查询引擎将在未来几周内在Databricks workspace上全面上线,进一步扩大了Photon在整个平台上的覆盖范围。bob体育客户端下载自Photon发布以来的两年时间里,它已经处理了eb级的数据,运行了数十亿次查询,提供了比传统云数据仓库高出12倍的基准价格/性能。
  • bob下载地址Go、Node.js和Python的开源连接器现在让从操作应用程序访问湖屋变得更加简单。
  • Databricks SQL命令行现在允许开发人员和分析人员直接从本地计算机运行查询。
  • Databricks SQL现在提供查询联合会,提供了查询远程数据源的能力,包括PostgreSQL、MySQL、AWS Redshift等,而不需要首先从源系统提取和加载数据。

数据治理被强调为Unity Catalog高级功能的首要任务

统一目录,未来几周在AWS和Azure上普遍可用,为所有数据和人工智能资产提供集中治理解决方案,具有内置搜索和发现,所有工作负载的自动化沿袭,具有任何云上湖屋的性能和可扩展性。此外,砖介绍了数据沿袭这个月早些时候发布了Unity Catalog,极大地扩展了lakehouse上的数据治理能力,并为企业提供了整个数据生命周期的完整视图。通过数据沿袭,客户可以了解其湖屋中的数据来自何处、谁在何时创建了数据、随着时间的推移如何修改数据、如何在数据仓库和数据科学工作负载中使用数据等等。

由Databricks Marketplace和Cleanrooms提供增强的数据共享

作为第一个所有数据和人工智能的市场,将在未来几个月推出,砖的市场提供一个开放的市场来打包和分发数据和分析资产。Databricks Marketplace超越了简单提供数据集的市场,它使数据提供商能够安全地打包并货币化大量资产,如数据表、文件、机器学习模型、笔记本电脑和分析仪表板。数据消费者可以轻松发现新的数据和人工智能资产,快速启动分析,并更快地从数据中获得见解和价值。例如,他们可以选择简单地订阅已经提供必要分析的现有仪表板,而不是获取数据集的访问权限并投入自己的时间来开发和维护仪表板以报告数据。Databricks Marketplace由Delta Sharing提供支持,允许数据提供商共享他们的数据,而无需从云存储中移动或复制数据。这允许提供商从单一来源向其他云、工具和平台交付数据。bob体育客户端下载

Databricks还帮助客户跨组织边界共享和协作数据。无尘室,将在未来几个月推出,它将提供一种跨组织共享和连接数据的方式,具有安全的托管环境,不需要数据复制。例如,在媒体和广告的背景下,两家公司可能希望了解受众重叠和活动覆盖范围。现有的洁净室解决方案有局限性,因为它们通常仅限于SQL工具,并存在跨多个平台复制数据的风险。bob体育客户端下载使用Cleanrooms,组织可以轻松地与任何云上的客户和合作伙伴协作,并为他们提供使用SQL和基于数据科学的工具(包括Python、R和Scalbob体育外网下载a)运行复杂计算和工作负载的灵活性,并具有一致的数据隐私控制。

MLflow 2.0简化并加速了大规模生产机器学习

随着MLflow 2.0的推出,Databricks继续引领MLOps创新的道路。将机器学习管道投入生产需要建立基础设施,而不仅仅是编写代码。这对于新用户来说很困难,对于大规模的每个人来说都很乏味。MLflow管道,由MLflow 2.0实现,现在可以为用户处理操作细节。用户可以简单地在配置文件中定义管道的元素,而不是设置笔记本的编排,MLflow pipeline自动管理执行。除了MLflow之外,Databricks还添加了无服务器模型端点,以直接支持生产模型托管,以及内置的模型监控仪表板,以帮助团队分析真实模型的性能。

Delta Live Tables包含业界首个用于数据工程管道的性能优化器

Delta Live Tables (DLT)是第一个使用简单的声明性方法来构建可靠数据管道的ETL框架。以来发射今年早些时候,Databricks继续扩展DLT的新功能,包括引入新的性能优化层,旨在加快执行速度并降低ETL的成本。此外,新的增强型自动伸缩专门用于随着流工作负载的波动智能地扩展资源,以及用于缓慢变化维度的更改数据捕获(CDC) - Type 2,可轻松跟踪源数据的每一个更改,以实现合规性和机器学习实验目的。

要了解BOB低频彩更多关于Databricks Lakehouse平台的信息,请访问:bob体育客户端下载//www.neidfyre.com/product/data-lakehouse.更多数据+人工智能峰会主题演讲请在虚拟世界收听在这里注册免费的,沉浸式的在线体验。

对砖
Databricks是一家数据和人工智能公司。全球超过7000家组织,包括康卡斯特、Condé Nast、H&M和超过40%的财富500强,都依赖Databricks Lakehouse平台来统一他们的数据、分析和人工智能。bob体育客户端下载Databricks总部位于旧金山,在全球各地设有办事处。Databricks由Delta Lake、Apache Spark™和MLflow的最初创建者创建,其使命是帮助数据团队解决世界上最棘手的问题。想要了BOB低频彩解更多,请在Twitter、LinkedIn和Facebook上关注Databricks。

安全港声明

提供此信息是为了概述Databricks的一般产品方向,仅供参考。购买Databricks服务的客户应仅根据当前可用的服务、特性和功能来做出购买决定。前瞻性声明中描述的未发布的特性或功能可能会根据Databricks的判断进行更改,并且可能无法按计划交付或根本无法交付。

联系人:(电子邮件保护)

最近新闻公报

Databricks扩大在印度的业务,任命Anil Bhasin为国家经理
读到现在
Databricks为其Lakehouse平台实现扩展FedRAMP®授权bob体育客户端下载
读到现在
Databricks任命Samuel Bonamigo为EMEA高级副总裁兼总经理
读到现在
Databricks在Data + AI峰会上宣布对旗舰开源项目的主要贡献bob下载地址
读到现在
Databricks为其行业领先的数据湖屋平台推出了新的创新bob体育客户端下载
读到现在
查看所有

资源

联系

新闻界查询:

(电子邮件保护)

保持联系

通过我们的时事通讯、社交媒体渠道和博客RSS订阅与我们保持联系。
订阅时事通讯

得到的资产

如果您想使用Databricks的资料,请与我们联系 (电子邮件保护) 并提供以下资料:

你的姓名和头衔
公司名称及所在地
请求说明
查看品牌指南