跳转到主要内容
工程的博客

Apache 2.0火花:文选的技术资产

2016年6月1日 工程的博客

分享这篇文章

老选集整理一批来自不同作者theme-bounded然后杂志或期刊。新选集包含多个expressions-digitized情态动词现在电子书或者一个博客。两者都提供一个博览会主题任何事他们的形式。

在这个选集,我总结了一组视频,技术博客,笔记本,网络研讨会,播客,和关注的新闻文章Apache 2.0现在火花一般可用。

你可以试试Apache 2.0版本火花从两个地方:


火花峰会东主旨:Apache 2.0火花
砖的CTO马泰Zaharia感谢社区的贡献和预览Apache火花2.0的三个主题:简单,速度和统一。

构建火花:DataFrames、数据集和流
Apache火花提交者和砖的工程师迈克尔Armbrust为什么结构奠定了基础,应用数据,是相关的,以及它如何影响DataFrame的设计和数据集的api和流在Apache 2.0火花。

做事投入在结构化流在Apache 2.0火花
砖的火花提交者如来佛Das技术讨论了结构化流是如何工作的,。

Apache 2.0:火花更容易、更快和更聪明
Apache火花提交者和砖雷诺的首席建筑师鑫和火花社区传道者朱尔斯s Damji预览Apache 2.0和火花展示在砖笔记本的运行特征2.0预发布的火花

介绍Apache火花2.0现在通常用于砖
更深入版本的网络研讨会,马泰Zaharia雷诺新,和迈克尔三thrusts-speed时常要阐述,简单的结构化streaming-behind Apache 2.0火花,笔记本上运行数据砖。

近似算法在Apache火花:HyperLogLog分位数
砖的工程师蒂姆•亨特·侯赛因·Falaki,约瑟夫·布拉德利展示两个近似算法来近似计算分位数不同的元素和在一个大数据使用Apache 2.0火花的预发布预览数据砖。

Apache火花作为编译器:在你的笔记本上加入十亿行
Apache火花已经很快,但我们可以让它快10倍吗?雷诺鑫,Sameer Agarwal,戴维斯刘解释钨的舞台代码生成。

现代硬件有效编制高效的查询计划
艾德里安•科伊尔SpringSource前CTO,探讨影响和重要的主题在计算机科学的世界晨报

与钨更加明亮火花
佩奇罗伯茨(Syncort)冠瘿碱钨是一个巨大的飞跃,Apache火花,特别是在性能的面积,和写它是如何工作的,以及为什么它提高火花的性能。

结构化流到Apache 2.0火花
O ' reilly的首席数据科学家Ben Lorica坐下来和迈克尔Armbrust谈论生活和结构化流。

火花的结构化流到底是什么意思
离子指针(信息世界的贡献者)提倡DataFrames为什么在火花引发流的最佳选择2.0,为什么结构化流是有意义的。

Apache火花2.0预览版:机器学习模型持久性
砖的工程师约瑟夫·布拉德利股票的好处持久性火花2.0预览版机器学习模型,以及如何保存和加载毫升管道跨多个语言火花。

如何使用数据集处理物联网数据api
砖Community Edition的笔记本展示Apache火花2.0数据api。

SQL子查询在Apache 2.0火花
砖的刘工程师戴维斯和范龙佩(Herman van Hovell提供实践标量和谓词类型子查询的例子

一个故事三个Apache火花api:抽样、DataFrames和数据集
砖的火花社区传道者朱尔斯s Damji告诉的故事三个火花api:何时以及为什么使用它们

火花2.0 -数据集和case类
丹尼尔•佩普分析工程师codecentric探索和解释了数据集的类型安全特性api通过一些代码示例使用Scala case类

连续应用:发展流在Apache 2.0火花
砖的联合创始人兼首席技术官马泰Zaharia股他的愿景的端到端流媒体应用程序称为连续应用程序使用结构化流api在Apache 2.0火花

结构化流在Apache火花2.0:一个新的流媒体的高级API。
Messrs马泰Zaharia如来佛Das,雷诺鑫和迈克尔Armbrust解释写端到端的流媒体应用程序称为连续应用程序的挑战和复杂的结构化流为什么以及如何使它简单。

如何使用SparkSessions在Apache 2.0火花
砖的火花社区传道者朱尔斯s Damji探索SparkSession火花2.0功能。

接下来是什么?

在未来的几周内,我们将发布一系列的帖子引发2.0版本,将会更新这个选集。您可能想要收藏本页!

免费试着砖
看到所有工程的博客的帖子