三角洲湖是什么?
三角洲湖是唯一开放的格式存储层,可以自动和跨开放格式的即时翻译。三角洲湖结合事务的所有数据类型,用例分析和人工智能的框,支持流媒体和批处理操作。三角洲湖提供行业领先的性能和成本效益的基础,高度可伸缩的lakehouse。
开放和广阔的生态系统
与三角洲湖通用格式(制服),您将能够使用您最喜爱的冰山或Hudi端来阅读你的三角洲表通过统一目录端点。
三角洲湖3.0简化了连接器的生态系统。三角洲内核提供了一个稳定的API库,方便三角洲连接器将新特性没有更改代码。
闪电般的表现
砖提供大规模和三角洲湖速度查询,数据加载和运行1.7 x的速度比其他存储格式。
AI-driven最佳性价比
三角洲湖与统一目录和光子提供最好的价格/性能的没有手工调优。砖Lakehouse使用人工智能模型与数据存储解决共同的挑战,所以你获得更快的性能,而无需手动管理表,即使他们随时间变化的。
预测更新的I / O优化您的查询计划和数据布局为峰值性能,智能地平衡读与写性能。得到更多的从你的数据,而不需要像即写即拷和merge-on-read决定之间的策略。
液体聚类提供的性能调优,well-partitioned表没有的传统头痛分区,如担心是否你可以分区的高聚合度列或昂贵的重写时改变分区列。结果是闪电般的,well-clustered表以最小的配置。
预测优化自动优化您的数据最好的性能和价格。它可以从您的数据使用模式,构建正确的优化执行计划,然后运行这些优化hyper-optimized serverless基础设施。
安全与治理的规模
三角洲湖降低风险数据治理,通过支持细粒度的访问控制功能和数据湖泊通常是不可能的。你可以快速、准确地更新数据等数据湖遵守法规GDPR通过审计日志记录和维护更好的数据治理。这些功能是本地集成和增强砖的一部分统一目录,第一个multicloud lakehouse数据目录。
用例
BI在你的数据
立即做出新的,实时数据用于查询数据分析师立即见解在您的业务通过运行商业智能工作负载直接在您的数据。三角洲湖允许您操作multicloud lakehouse架构,提供了数据仓库的性能数据湖经济学长达6 x SQL工作负载更好的价格/性能比传统的云数据仓库。
统一批处理和流
运行批处理和流媒体操作在一个简化架构,避免复杂,冗余系统和运营挑战。在三角洲湖,一个表是一批表和流源和下沉。流媒体数据摄取、批历史回填和交互式查询所有的工作,直接与火花结构化集成流。
满足监管的需要
三角洲湖删除数据摄入挑战畸形,对合规困难删除数据,修改数据变化数据捕获问题。支持ACID事务数据湖,湖三角洲确保每个操作完全成功或完全中止后重试,而无需创建新数据管道。此外,三角洲湖湖记录你所有过去的交易数据,所以很容易访问和使用以前版本的数据符合合规标准如GDPR和CCPA可靠。
数据摄取网络
本地数据连接器容易摄取到三角洲湖快速和可靠的应用程序,数据库和文件存储。
客户
“砖上市时间以及所需的分析和运营提升,我们为了能够满足医疗保健行业的新要求。”
——彼得•詹姆斯首席架构师,Healthdirect澳大利亚
“通过利用砖和三角洲湖,我们已经能够在民主化数据规模,同时降低运行成本的生产工作负载60%,节省数百万美元。”
——史蒂夫•Pulec YipitData首席技术官
“三角洲湖提供酸功能,简化数据管道操作增加管道的可靠性和数据一致性。同时,功能,如缓存和自动索引支持高效、高性能访问数据。”
——高级企业数据经理劳拉小哥伦比亚运动服装
“三角洲湖已经创建了一个精简的管理方法的数据管道。这导致减少运营成本,加快time-to-insight下游分析和数据科学。”
助理副总裁——Parijat戴伊的数字转换技术,Viacom18