哈维尔Luraschi

工程师,RStudio

    Javier是“用R掌握Spark”、sparklyr、mlflow和许多其他用于深度学习和数据科学的R软件包的作者。他拥有数学和软件工程师双学位,并拥有数十年的行业经验,专注于数据分析。他目前在RStudio工作,之前在微软研究院和SAP工作。

    过去的会议

    2019年欧洲峰会 使用R的现代ML堆栈简介

    2019年10月15日下午05:00 PT

    我们提供了R和更广泛的机器学习生态系统交集的最新发展。这些软件包集合使R用户能够在现有工作流程中利用最新的大数据分析和深度学习技术,并促进多学科数据科学团队之间的协作。涉及的主题包括:MLflow:使用改进的依赖管理管理ML生命周期和更多的部署目标- TensorFlow: TF 2.0更新和TensorFlow Probability的概率(深度)机器学习- Spark:最新的改进和扩展,包括SparkNLP的大规模文本处理

    2019年峰会 在Spark上使用Apache Arrow运行R at Scale

    2019年4月23日下午05:00 PT

    在本次演讲中,您将学习如何在Apache Spark上使用R轻松配置Apache Arrow,这将使您获得速度提高并扩大数据科学工作流程的范围;例如,通过使数据在本地环境和Apache Spark之间有效传输。本次演讲将展示在Apache Spark上大规模运行R的用例。

    它还将介绍Apache Arrow项目和最近的开发,这些开发使得在Apache Spark上使用Apache Arrow运行R能够显著提高性能和效率。我们将通过讨论这个领域的性能和最近的发展来结束这次演讲。

    2017年峰会 Sparklyr:概述,更新和用例(续)

    2017年6月6日下午05:00 PT

    2017年峰会 Sparklyr:概述、更新和用例

    2017年6月6日下午05:00 PT

    本课程将首先概述sparklyr是什么,以及如何使用它从R在Spark中分析、可视化和执行机器学习。我们将通过安装、配置、使用SQL或dplyr进行数据整理、在MLlib或H2O中建模,并通过从R调用Scala函数或编写R可访问的Scala模块来扩展sparklyr。然后您将获得sparklyr新特性的详细更新。在去年向CRAN发布sparklyr 0.4之后,RStudio发布了0.5,它实现了值得回顾的新连接、特性和架构更改。最后,我们将讨论R生态系统中相关的用例。用例将演示如何使用R生态系统中的流行框架对数据建模,在Spark和R之间使用sparklyr进行无缝交互。
    会议标签:#SFdd8

    BOB低频彩了解更多:

  • 使用sparklyr和Microsoft R Server为Spark扩展R API