劳伦·里奇

数据库软件工程师

    Lauren Richie是Databricks工作空间团队的软件工程师,在那里她的工作是使交互式数据科学和工程工作流协作和扩展。在加入数据库之前,她从事野生动物保护工作,并拥有耶鲁大学森林与环境研究学院的环境管理硕士学位。

    过去的会议

    2020年峰会 2020年Spark + AI峰会:周四上午主题演讲

    2020年6月24日下午05:00 PT

    Clemens Mewal - Next Generation Data Science Workspace (Databricks) - 9:06
    Lauren Richie -演示:下一代数据科学工作空间(Databricks) - 17:55
    Matei Zaharia - MLflow社区和产品更新(数据)- 27:40
    苏安洪-演示:MLflow(数据)- 42:57
    Rohan Kumar -负责ML(微软)- 51:52
    Sarah Bird -演示:负责ML(微软)- 1:00:21
    Anurag Sehgal -数据和AI(瑞士信贷)- 1:12:58


    介绍下一代数据科学工作空间
    阿里·高德西,克莱门斯·梅瓦尔德和劳伦·里奇

    数据驱动的洞察和决策在任何公司的战略中都是至关重要的,以跟上当今的快速变化步伐并保持相关性,这已经不再是一个秘密。虽然我们认为这是理所当然的,但我们仍然处于使数据团队实现他们的承诺的非常早期的阶段。其中一个原因是,我们还没有为这个职业配备他们应得的现代工具包。

    现有的解决方案给数据团队留下了不可能的权衡。让数据科学家在他们的笔记本电脑上自由使用任何开源工具,并不能为生产和治理提供一条清晰的道路。bob下载地址简单地在云中托管这些相同的工具可能会解决一些数据隐私和安全问题,但不会提高生产力和协作。另一方面,大多数健壮的和可扩展的生产环境会减慢数据科学家的速度,从而阻碍创新和实验。

    在这次演讲中,我们将推出下一代Databricks数据科学工作空间:为现代数据团队提供开放和统一的体验,专门用于解决这些困难的权衡。我们将介绍利用您所熟悉的开源工具的新功能,为您提供类似笔记本电脑的体验,提供实验的灵活性和创建可靠bob下载地址且可重复的生产解决方案的健壮性。


    使用MLflow简化模型开发和管理
    Matei Zaharia和Sue Ann Hong

    随着组织不断发展他们的机器学习(ML)实践,能够处理整个机器学习生命周期的健壮可靠的平台对于成功的结果变得至关重要。bob体育客户端下载构建模型很难一次性完成,但是由于依赖于参数、环境以及数据和业务需求的不断变化的性质,以可重复、敏捷和可预测的方式将它们部署到生产环境中更加困难。

    MLflow由Databricks于2018年推出,是用于管理ML整个生命周期的最广泛使用的开源平台。bob下载地址bob体育客户端下载PyPI每月下载量超过200万次,贡献者超过200人,来自开发人员社区的日益增长的支持表明,需要一种开源方法来标准化ML生命周期中涉及的工具、流程和框架。bob下载地址MLflow极大地简化了标准化mlop和生产ML模型的复杂过程。在这次演讲中,我们将介绍MLflow中的新特性,包括简化实验跟踪、改进模型格式以提高可移植性的新创新、管理和比较模型模式的新特性,以及更快地部署模型的新功能。


    负责任的机器学习——为数据科学带来责任
    Rohan Kumar和Sarah Bird

    负责任的ML是目前人工智能中最受关注的领域。随着ML的重要性日益增加,对我们来说,开展合乎道德的AI实践并确保我们创建的模型达到包容性和透明度的最高标准就变得更加重要。加入Rohan Kumar,他将讲述微软如何将前沿研究带到客户手中,使他们对自己的模型更负责任,并对人工智能的使用更负责任。对于AI社区来说,这是一份公开的邀请,邀请大家合作并为塑造负责任的ML的未来做出贡献。


    瑞信如何利用开源数据和人工智能平台推动数字化转型、创新和增长bob下载地址bob体育客户端下载
    Anurag Sehgal

    尽管人们越来越多地接受大数据和人工智能,但大多数金融服务公司仍然在数据类型、隐私和规模方面面临着重大挑战。瑞信正在通过标准化开放的基于云的平台(包括Azure Databricks)来克服这些障碍,以提高运营的速度和规模,并在整个组织中实现ML的民主化。bob体育客户端下载现在,瑞信通过成功地利用数据和分析来推动数字化转型,更快地将新产品推向市场,并推动业务增长和运营效率,处于领先地位。