虚拟化Apache Spark

下载幻灯片

这篇演讲解释了为什么在当今快速发展的数据科学和数据工程的实验世界中,在内部或其他地方虚拟化Spark是一种需求。不同的团队希望“快速”启动一个Spark集群,以进行一些研究并快速回答业务问题。他们不关心服务器硬件的可用性,也不关心其他团队当时可能在服务器硬件上做什么。虚拟化提供了在您自己的沙盒中工作的方法,以尝试新的查询或机器学习算法。深入的性能测试结果将展示Spark和ML程序在虚拟机上的表现,就像本地实现一样。本文早期介绍了在执行此操作时应该遵循的最佳实践。如果时间允许,将给出一个简短的演示,创建一个短暂的、单一用途的Spark集群,在该集群上运行ML应用程序测试程序,并在完成时关闭它。



«回来
关于贾斯汀·默里

贾斯汀·默里(Justin Murray)是VMware的技术营销经理。Justin创建技术材料,并为客户和VMware现场组织提供指导,以促进VMware vSphere平台上大数据工作负载的虚拟化。bob体育客户端下载Justin与VMware的合作伙伴isv(独立软件供应商)密切合作,以确保他们的产品在vSphere上运行良好,并随着大数据客户基础的扩大,继续将最佳实践带到该领域。