Itai韦斯

信息解决方案架构师,Databricks

    拥有超过20年经验的信息解决方案架构师。在数据管理,大数据,信息系统,数据治理以及过程和项目管理方面有广泛的背景。跨一系列不同架构(包括IBM、Oracle、开源和数据仓库设备)实现众多解决方案。bob下载地址数据库设计,DBA,数据集成,安全,大数据,商业分析和高级分析经验。开源软件的实现,包括Hadoop(和bob下载地址外围组件),Spark, R, Python, RDBMS和NoSQL技术。在政府、电力、金融、制造、技术、医疗保健和保险领域具有广泛的行业经验。长期的成功记录,并在时间和预算内交付。管理多达12名不同岗位的团队成员。从不可知论的角度看待每项任务,为手头的挑战提供最佳的整体解决方案。

    过去的会议

    2021年峰会 更改Delta中的数据提要

    2021年5月28日太平洋时间上午11:05

    Change Data Feed是Delta Lake在Databricks上的一个新特性,自DBR 8.2以来已作为公开预览版提供。该特性支持新的ETL工作负载类别,例如增量表/视图维护和更改审计,这在以前是不可能的。简而言之,用户现在将能够在Delta表的不同版本之间查询行级更改。

    在这次演讲中,我们将深入了解更改数据提要的工作原理,以及如何将其与现有的ETL作业一起使用以使其更高效,并介绍它可以启用的一些新工作负载。

    在本节中请注意:
    Rahul Mahadev,软件工程师,Databricks
    Itai Weiss, Databricks的信息解决方案架构师
    Jose Torres, Databricks软件工程师

    (daisna21-sessions-od)

    2020年欧洲峰会 ESG,其次是AMA

    太平洋时间2020年11月17日下午04:00

    金融的未来与社会责任、环境管理和企业道德齐头并进。为了保持竞争力,企业越来越多地披露有关其环境、社会和治理(ESG)表现的信息。

    在这个免费的演示中,我们将演示如何使用机器学习来提取年度PDF报告中传达的关键ESG计划,并将这些与新闻分析数据中的实际媒体报道进行比较。随后,FinServe技术总监Antoine Amend将回答有关此解决方案或任何其他金融服务分析用例的问题。

    讲者:Antoine Amend和Itai Weiss

    2020年峰会 使用Delta Lake简化灾难恢复

    2020年6月25日下午05:00 PT

    在容灾场景中,需要为Delta表开发恢复流程。云多区域同步是异步的。这种类型的复制不能保证目标(DR)区域中文件的时间顺序。在某些情况下,我们可以预期大文件比小文件晚到达。对于Delta Lake,这可以在DR站点的破裂点上创建一个不完整的版本。假设Primary (Prod)站点不可达,因此需要识别和修复Delta Lake表的不完整版本。类似的场景也发生在RDBMS复制中,它们依靠日志将数据库恢复到稳定版本,并运行恢复或重新加载过程。本文档将解决这一需求,并寻找一个可以与客户共享的解决方案。