Splice Machine对Apache Spark和MLflow的使用

下载幻灯片

Splice Machine是Apache Spark上的一个ANSI-SQL关系数据库管理系统(RDBMS)。它已被证明具有pb级的低延迟事务处理(OLTP)和分析处理(OLAP)。它使用Spark进行所有分析计算,并利用HBase实现持久性。

这次演讲重点介绍了一个新的原生Spark数据源——它可以在Spark数据帧和Splice Machine表之间实现无缝数据移动,而无需序列化和反序列化。这个Spark数据源使机器学习库(如MLlib)本机用于Splice RDBMS。Splice Machine现在已经将MLflow集成到其数据平台中,创建了一个以RDBMS为核心的灵活的数据bob体育客户端下载科学工作台。Splice Machine的事务处理功能与大量与dataframe兼容的库和MLflow功能集成在一起,管理着从数据到洞察到行动的完整实时工作流。

在本次演示中,我们将演示Splice Machine的数据科学工作台,以及它如何利用Spark和MLflow在集成平台上创建强大的全周期机器学习功能,从事务更新到数据争论、实验和部署,然后再返回。bob体育客户端下载

试着砖
请参阅2019年旧金山Spark + AI峰会视频


«回来
关于Gene Davis

Gene是Splice Machine公司的产品管理副总裁。加入Splice Machine之前,Gene负责Clio Music、SeeSaw Networks、Blue Martini Software、Fogbreak Software和TeaLeaf Technology的产品开发;担任仁科集团工程副总裁。吉恩是红辣椒高级规划系统的原始架构师。在加入红辣椒之前,他曾为美国宇航局工作,在那里他是载人飞行太空奖的获得者和太空法案奖的共同获得者。Gene拥有斯坦福大学的音乐学士学位和化学工程学士学位,以及多伦多大学的计算机科学硕士学位