数据分析研讨会系列
介绍Apache火花
车间细节
这个车间是我们介绍的最后一部分为有抱负的数据科学家工作室系列数据分析。
本研讨会讨论Apache火花的基本面,最受欢迎的大数据处理引擎。在这个车间,您将学习如何摄取数据与火花,分析引发的UI,并更好地了解分布式计算。我们将使用由《纽约时报》发布的数据(https://github.com/nytimes/covid-19-data)。不需要先验知识的火花,但Python经验是强烈推荐。
你需要什么:报名参加Community Edition在这里和访问车间演示材料和样本的笔记本在这里。
虽然不需要准备工作,我们所做的推荐基本的python知识。看第一部分,介绍了Python学习Python。
教练:凯利奥马利,解决方案工程师砖
凯利奥马利是一个砖方案工程师,她帮助初创企业架构师和实现大数据管道。加入砖之前她做过软件工程师在国防工业编写网络代码。她在加州大学洛杉矶分校计算机科学完成了她的废话。外的科技世界,凯利喜欢烹饪,diy项目,和花时间在海滩上。
视频记录
这是我们四车间系列的第四部分,介绍数据分析为有抱负的数据科学家。今天的研讨会是介绍Apache火花。