检测与机器学习大规模金融欺诈

下载幻灯片

大规模检测欺诈模式是一个挑战的大量数据筛选,不断发展的技术的复杂性,实际数量非常小的欺诈行为的例子。在金融领域,增加了安全问题和解释欺诈行为被确认的重要性进一步增加了任务的难度。遗留系统依赖于基于规则的检测,很难实现大规模和运行。生成的代码非常复杂和脆弱,很难更新跟上新的威胁。

在这次演讲中,我们将复习如何将基于规则的金融欺诈检测程序来使用机器学习作为一个可伸缩的一部分,火花模块化解决方案。我们将研究如何确定合适的特性和标签和如何创建一个反馈回路,将允许模型发展和改善加班。我们也会看看MLflow可能杠杆为实验跟踪和模型部署在这一努力。

具体地说,我们将讨论:
——创建一个欺诈监测数据管道
——利用从大型数据集构建功能的框架
——创建模块化的代码重用和维护新的机器学习模型
——选择合适的模型和算法对于一个给定的欺诈监测问题



«回来
对埃琳娜Boiarskaia

H2O.ai

作为一个高级解决方案工程师和水。ai,埃琳娜热衷于帮助客户解决高级的数据科学问题,而商业价值最大化。来自不同定量背景,埃琳娜,她从伊利诺伊大学香槟分校博士论文集中在使用机器学习加速度计数据中发现模式和预测健康结果。之前,埃琳娜与各种客户数据科学的用例在砖,以及构建机器学习模型来识别控制活动在美国市场领先数据科学家金融业监管局(FINRA)。在她的空闲时间,埃琳娜列车巴西九Jitsu古典芭蕾舞和舞蹈。