埃琳娜Boiarskaia

H2O.ai数据科学家

    作为H2O的高级解决方案工程师。艾琳娜热衷于帮助客户解决高级数据科学问题,同时最大化业务价值。Elena拥有多样化的定量背景,她在伊利诺伊大学香槟分校(University of Illinois at Urbana-Champaign)获得了博士学位,论文专注于使用机器学习在加速度计数据中寻找模式并预测健康结果。此前,Elena在Databricks工作期间与各种客户数据科学用例合作,并在美国金融行业监管局(FINRA)担任首席数据科学家,构建机器学习模型以识别美国市场中的操纵活动。在业余时间,埃琳娜练习巴西柔术和跳古典芭蕾。

    过去的会议

    2021年峰会 使用AutoML和MLflow加速您的ML管道

    2021年5月27日下午03:15太平洋时间

    构建ML模型是一项耗时的工作,需要全面了解特征工程,选择有用的特征,选择合适的算法,并执行超参数调优。需要进行广泛的实验,以达到一个健壮和性能的模型。此外,跟踪已经开发和部署的模型可能很复杂。解决这些挑战是成功实现大规模端到端ML管道的关键。

    在这次演讲中,我们将在Databricks笔记本电脑中展示自动化机器学习的无缝集成,从而为数据科学家和业务用户提供真正统一的分析生命周期,提高速度和效率。bob体育亚洲版具体来说,我们将展示一个应用程序,它可以生成和执行Databricks笔记本电脑,用H2O的无人驾驶AI自动训练ML模型。生成的模型将被MLflow自动跟踪和管理。此外,我们将展示几个部署选项,用于在Databricks集群或外部REST服务器上对新数据进行评分,所有这些都在应用程序中。

    在本节中请注意:
    Elena Boiarskaia, H2O.ai的数据科学家
    Eric Gudgion, H2O.ai的数据科学家

    (daisna21-sessions-od)

    2019年欧洲峰会 利用机器学习检测大规模金融欺诈

    2019年10月16日下午05:00 PT

    考虑到需要筛选的大量数据、不断发展的技术的复杂性以及欺诈行为的实际示例非常少,大规模检测欺诈模式是一项挑战。在金融领域,额外的安全问题和解释如何识别欺诈行为的重要性进一步增加了任务的难度。遗留系统依赖于难以实现和大规模运行的基于规则的检测。由此产生的代码非常复杂和脆弱,很难更新以跟上新的威胁。

    在本次演讲中,我们将讨论如何将基于规则的金融欺诈检测程序转换为在Spark上使用机器学习作为可扩展的模块化解决方案的一部分。我们将研究如何识别适当的特征和标签,以及如何创建一个反馈循环,使模型能够随着时间的推移而发展和改进。我们还将研究如何在整个实验跟踪和模型部署过程中利用MLflow。

    具体来说,我们将讨论:
    如何创建欺诈检测数据管道
    -如何利用框架从大型数据集中构建功能
    如何创建模块化代码来重用和维护新的机器学习模型
    -如何为给定的欺诈检测问题选择合适的模型和算法