可伸缩的贝叶斯推理与火花,SparkR, R和微软服务器

统计学家R已成为事实上的语言。有近10000包可供选择的统计推断,可视化和机器学习。然而,R是背负着无数的基地凹口实现可伸缩性挑战:单线程和内存有界的一个节点。在这次演讲中,我将总结一些最近的进步R api的火花,并展示他们如何可以合并与微软R服务器火花来创建一个可扩展的机器学习平台。bob体育客户端下载特别是,我将展示一个R用户可以创建功能管道进行火花DataFrames和RevoScaleR XDFs(外部DataFrames)进行贝叶斯推理在规模,如评估集群成员在高斯混合模型,使用变分共识蒙特卡罗大型主题建模与随机变分推理,最后,贝叶斯神经网络估计与随机梯度哈密顿蒙特卡洛。所有的例子都将开发完全R,我将描述的最佳实践表现和再现性。



«回来
关于阿里。扎伊迪

阿里是语言理解数据科学家团队在微软AI研究。他每天努力使研究人员和工程师的工具来分析大量的语言有效地在云里的数据和集群。阿里研究统计和机器学习在多伦多大学和斯坦福大学。