丹尼李

开发人员提倡,砖

    丹尼·李是一个开发人员提倡在砖。他是一个实际的分布式系统和数据科学工程师网际网路规模的基础设施发展的丰富经验,对本地数据平台,和预测分析系统和云环境。bob体育客户端下载他也有硕士从俄勒冈健康与科学大学生物医学信息学,有强大的数据架构和实现解决方案的企业医疗客户。他目前的技术主要包括分布式系统、Apache火花,深度学习,机器学习,基因组学。

    过去的会议

    2021年峰会 三角洲共享而马泰Zaharia和砖的工程师

    2021年5月26日,下午03:15 PT吗

    在数字经济数据共享已成为重要的企业希望容易和安全地交换数据与客户,合作伙伴和供应商,但到目前为止,数据共享的解决方案已经与一个供应商或商业产品。bob体育外网下载今天,砖公布“三角洲分享”——的行业首个开放协议数据共享——使它简单的共享数据与其他组织无论在哪里生活的数据。加入砖联合创始人兼首席技术专家马泰Zaharia砖工程师和产品经理迈克尔·时常要和托德Greengstein对三角洲的问我任何会话共享。是否你想深入阅读技术,或一个更好的理解的场景,这是会话,你可以问你的问题!

    在这个会话表:
    马泰Zaharia计算机科学助理教授;最初的创造者Apache火花& MLflow砖
    托德·格林斯坦产品团队,砖
    杰出工程师迈克尔•Armbrust砖

    (daisna21-sessions-od)

    Apache火花™3.0在Meetup潜水

    2020年11月17日下午内PT

    朱尔斯Damji和丹尼·李从砖开发者关系将回顾一些主题突出,并且每个将简要介绍会议的个人选择,产生了共鸣。接下来,Jacek拉斯科夫斯基,一个独立的顾问,将谈论火花3.0内部,和为什么Twilio的斯科特·海恩斯,inc .)将讨论结构化流microservice架构。这个编码会话和技术深度潜水是不容错过的!

    加入这个聚会

    拉斯科夫斯基Jacek幻灯片

    斯科特·海恩斯的幻灯片

    峰会的欧洲2020 深入三角洲湖:开箱事务日志

    2020年11月17日下午内PT

    事务日志是理解三角洲湖,因为它是关键的主线,贯穿许多最重要的功能,包括ACID事务、可扩展的元数据处理,时间旅行等等。在这个会话中,我们将探索三角洲湖事务日志是什么,它是如何工作的文件,以及它提供了一个优雅的解决方案问题的多个并发的读和写。

    在这个技术你将学会谈论:

    • 三角洲湖事务日志是什么
    • 事务日志是用来做什么的?
    • 事务日志是如何工作的呢?
    • 回顾三角洲湖事务日志文件级别的
    • 处理多个并发的读和写
    • 三角洲湖事务日志如何解决其他用例包括时间旅行和数据沿袭和调试

    演讲者:丹尼李和Burak•

    2020年峰会 在星巴克实施大规模机器学习

    2020年6月25日凌晨5点PT

    ML-driven创新推动的自助服务功能在企业数据和分析平台,团队面临着一个重要的进入障碍和生产力问题从poc操作ML-powered应用在生产规模。bob体育客户端下载这个演讲是一个团队的旅程在星巴克使用人工智能基本能力EDAP部署、管理和运营毫升模型作为安全的和可伸缩的认知服务用例的潜力推动网际网路规模的推论和应用程序。

    2020年峰会 使用机器学习来优化COVID-19预测

    2020年6月25日凌晨5点PT

    与当前COVID-19流行影响我们生活的很多方面,理解周围的数据和模型COVID-19数据更重要。理解潜在病例数影响周围的指导我们的政策(需要更多医院加护病房的床上,当缓解呆在家里订单,何时开放学校,等等)。在这次会议中,我们将关注一些探索性数据分析来理解这些模型的准确性。我们将使用机器学习模型来改进它们。

    2020年峰会 机器学习数据沿袭MLflow和三角洲湖

    2020年6月25日凌晨5点PT

    许多组织使用机器学习所面临的挑战存储和版本控制复杂的ML数据以及大量的模型生成的数据。为了简化这个过程,组织倾向于开始构建定制的ML平台。bob体育客户端下载”然而,即使这样的平台仅限于只有少数支持算bob体育客户端下载法和他们往往是强加上公司的内部基础设施。MLflow,一个开源项目,旨在规范和统一的机器学习过程中,和三角洲湖,一个开源存储层带来了可靠性数据湖泊。都起源于砖,可以一起使用提供完整可靠的数据沿袭通过不同的机器学习生命周期。

    在这次演讲中,我们将详细介绍两种流行的特点:MLflow模型注册表和三角洲湖时间旅行,以及它们如何一起工作来帮助创建一个完整的数据血统在机器学习管道。

    MLflow模型注册为组织提供了一套api和直观的用户界面来注册和共享新版本的模型以及对现有执行生命周期管理模型。是无缝集成与现有MLflow跟踪组件,允许它被用来追溯模型工件的原始运行以及生成的源代码版本运行,给一个完整的家族生命周期的模型。也可以结合现有的ML管道模型的最新版本部署到生产。

    三角洲湖时间旅行的能力自动版本的大数据存储在你的数据如表或目录编写成三角洲湖。您可以访问任何历史版本的版本号或时间戳数据。这个时态数据管理简化你的数据管道便于审计、回滚数据以防意外坏写或删除,和繁殖实验和报告。

    将提供现场演示如何从MLflow上述特性,三角洲湖可以一起工作来帮助创建一个完整的数据沿袭通过生命周期的一个机器学习管道。

    2020年峰会 医学翻译模型管理视觉通信的一个例子

    2020年6月24日凌晨5点PT

    西雅图儿童致力于提供最好的医疗服务可以通过策略包括研究者和临床医生和彼此一起工作来提高我们对儿科疾病的理解。完全实现这种关系需要系统和流程设计,使捕获,知识和信息的发现和有效的沟通。那么我们如何使翻译的知识和专业技能,由我们的科学家和临床医生,改善病人护理?

    在这次演讲中,我们将讨论我们如何构建松散耦合的框架由MLflow、Vega-lite,和其他开源工具的一部分知识获取、管理和传播策略。bob下载地址我们将演示如何利用MLFlow模型注册表来捕获可视化的方式使得临床医生发现和共享。

    2020年峰会 大数据实施大规模管道

    2020年6月23日凌晨5点PT

    运行一个全球性的,世界级的业务与数据驱动的决策需要摄取和处理不同的数据集在巨大的规模。一个公司如何实现这一目标,同时保证数据的质量和尊重自己的承诺负责任吗?本阶段将详细说明星巴克已经接受了大数据,如何构建健壮的、高质量的管道进行更快的见解推动世界级的客户体验。

    2020年峰会 火花Meetup——酿造和AI对社会美好

    2020年6月21日凌晨5点PT

    启动你的火花+人工智能与砖开发者峰会本周丹尼和朱尔斯!虽然戏说着一些啤酒,他们将(1)看一眼一个即将到来的几首歌曲,作为这个虚拟和全球会议的一部分,(2)给出一个快速更新发展三角洲湖,Apache火花,考拉,和MLflow,和(3)展示如何参与作为一个贡献者三角洲湖,Apache火花,考拉,MLflow。劳伦斯从TensorFlow将谈论TensorFlow 2中的最新进展。x,如何分析和分类图像,特别是,如何TF - 2。x可用于糖尿病性视网膜病变的图像进行分类。

    峰会的欧洲2019 增加机器学习与数据砖实验室AutoML工具包

    2019年10月16日凌晨5点PT

    而不是更好的理解和优化他们的机器学习模型,数据科学家花了大部分的时间训练和遍历不同的模型甚至在这种情况下,数据是可靠的和干净。创建一个毫升模型的重要方面包括(但不限于)数据准备、工程特点,确定正确的模型,培训和继续培训和优化模型。这个过程可以(通常是)费力而耗时的。

    在这次会议中,我们将探索这一过程,然后展示AutoML工具包(从砖实验室)可以极大地简化和优化机器学习。我们将展示所有的金融贷款风险数据与代码片段和笔记本免费下载。

    2019年峰会 简化分布式TensorFlow培训快速图像分类在星巴克

    2019年4月24日凌晨5点PT

    除了许多数据工程计划在星巴克,我们还开发了许多有趣的科学数据项业务。我们所涉及的业务场景深度学习项业务包括(但不限于)planogram分析(我们的商店的布局为高效的合作伙伴和客户流)预测产品配对(如购买焦糖machiato也许你喜欢焦糖巧克力蛋糕)通过使用图卷积网络的产品组件。

    对于这次会议,我们将关注如何运行分布式Keras (TensorFlow端)训练来进行图像分析。这将是结合MLflow展示科学数据生命周期以及砖+ MLflow简化它。

    丹尼李