考拉,熊猫在Apache引发欧盟

下载幻灯片

在本教程中我们将考拉,我们宣布一个新的开源项目的火花+人工智能峰会4月。bob下载地址考拉是一个开源的Python包实现大熊猫API之上的Apache火花,使熊猫API可伸缩的大数据。使用考拉,数据科学家可以从一台机器到分布式环境中,而不需要学习一个新的框架。

我们将演示考拉的新功能最初版本以来,讨论其路线图,以及我们认为考拉可能成为大规模数据科学的标准API。

你将学习:

  • 如何开始使用考拉
  • 容易从熊猫考拉在Apache火花
  • 相似性熊猫和考拉api DataFrame转换和工程特性
  • 单台机器熊猫和考拉的分布式环境

先决条件:

  • 充足的笔记本电脑(8-16GB内存)Chrome和Firefox
  • Python 3和pip预装
  • 皮普从PyPI安装考拉
  • 登记,砖Community Edition
  • 考拉读文档

试着砖
看到更多的火花+人工智能峰会欧洲2019个视频


«回来
对蒂姆•亨特

荷兰银行(ABN AMRO)

蒂姆·亨特是荷兰银行一位高级人工智能专家。他是一个早期的软件工程师在砖和Apache火花MLlib项目作出了贡献,他参与创建了这个考拉,GraphFrames TensorFrames和深度学习管道库。他拥有一个博士学位从加州大学伯克利分校的机器学习,他一直与火花以来建立分布式机器学习系统版本发布之前火花是一个Apache软件基金会项目。

布鲁克身上
关于布鲁克身上

布鲁克身上是导演,机器学习实践。她领导的一组数据的科学家们为客户开发大规模机器学习管道,以及教课程在分布式机器学习的最佳实践。她是一个作者学习的火花,第二版,co-instructor分布式计算的火花SQL Coursera课程,和搭档的数据酿造播客。她收到了一个女士在加州大学洛杉矶分校计算机科学关注分布式机器学习。她汉语说得很流利,喜欢骑自行车。(daisna21-speakers)

关于尼尔Turbitt

尼尔Turbitt高级数据科学家在机器学习实践团队在砖。他与砖的客户合作,构建和部署机器学习解决方案,以及提供培训课程专注于机器学习与火花。他收到他的女士在都柏林大学的统计数据和经验构建可伸缩数据科学解决方案在一系列领域,从电子商务供应链和物流。