公司博客上

使用您的数据来阻止信用卡欺诈:Capital One和其他最佳实践

通过Fahmid Kabir

2021年7月13日 公司博客上

分享这篇文章

欺诈是一个代价高昂且日益严重的问题研究据估计,每1美元的欺诈行为会给公司带来3.36倍的退款、更换和运营成本。加重了疼痛专家们,目前还没有足够的法规来保护小企业免受退款和欺诈造成的损失.尽管信用卡诈骗有了很大的进步,风险管理技术也有所改进,欺诈者仍然能够找到漏洞并利用系统。对于信用卡公司来说,欺诈性信用卡使用的威胁是持续的,这导致需要精确的信用卡欺诈检测系统。所有组织都面临欺诈和欺诈活动的风险,但这种风险对金融服务机构来说尤其沉重。Capital One的数据工程和机器学习主管巴德里什•达维表示:“威胁可能来自内部或外部来源,但其后果可能是毁灭性的——包括消费者信心的丧失、涉案人员的入狱,甚至公司的倒闭。”CNBC报告美国是世界上信用卡诈骗最猖獗的国家。

使用机器学习进行欺诈检测
不过,也不全是坏消息。随着现代技术的进步,企业能够通过利用数据和机器学习领先于威胁。这是最近的一次科技演讲的一部分数据+人工智能峰会我们得以一窥Capital One是如何利用数据和人工智能(AI)解决欺诈问题的。来自Capital One的Badrish Davay分享了我们如何利用最先进的ML算法来领先于攻击者,同时不断学习系统被利用的新方法。“为了更动态地检测欺诈交易,可以在数据集上训练ML模型,包括信用卡交易数据,以及持卡人的卡片和人口统计信息。Capital One使用Databricks来实现这一目标。”

Capital One分析了所有的欺诈活动,以了解在信用卡欺诈中应该注意什么。Davay提出了他们提出的6个W问题什么,谁,何时,何地,为什么,如果?-用于揭露欺诈活动的趋势。Davay强调了卡片信息可能被泄露的各种场景,以及数据如何帮助异常检测和识别欺诈。例如,他分享了地理空间数据如何检测出在实际位置以外使用的被盗信用卡信息,以及时间数据如何确定欺诈行为。

Davay还解释说,当客户实际丢失了一张卡,但没有通知组织时,上下文信息(例如工作时间、消费习惯等)可以帮助确定交易是正常的还是异常的。Davay的一个重要启示是,我们应该能够将多个独立信号结合在一起,围绕牵引力和人口统计数据获得更广泛的背景。随着数据的可用性和机器学习的进步,欺诈预防是机器学习改变工作流程和结果的关键领域,使组织能够领先于技术日益先进的犯罪分子。

加速信用卡欺诈检测的深度6-W分析。

如今,企业面临着一个日益复杂的敌人,攻击、反应和改变策略的速度都非常快。由于欺诈的动态性,组织需要人工智能不断适应不断变化的行为和模式。人工智能带来了规则无法带来的灵活性。借助数据分析和机器学习,企业可以领先于威胁。以下是ML适用于欺诈的一些关键原因:

  • 欺诈行为隐藏在海量数据之下:检测欺诈最有效的方法是观察最终用户的整体行为。光看交易或订单是不够的——我们需要跟踪交易前和交易后的事件。这最终形成了大量的结构化和非结构化数据,而检测如此大量欺诈的最佳方法是ML和AI。
  • 欺诈发生得很快:当ML系统实时更新时,这些知识可以在几毫秒内用于更新欺诈检测模型并防止攻击。
  • 欺诈行为总是在变化:欺诈者不断调整他们的策略,使他们难以被人类发现,而基于规则的静态系统则不可能被发现,因为它们不会学习。然而,ML可以适应不断变化的行为。
  • 欺诈从表面上看很好:在人眼看来,欺诈性交易和正常交易并没有什么不同。ML有一种更深入、更细致的查看数据的方式,这有助于避免误报。

Davay讨论了mls如何使用统计模型,如分类器和逻辑回归来查看过去的结果和异常来预测未来的结果。机器学习系统可以实时学习、预测数据并做出决策。在他的演讲中,Davay概述了一个良好的欺诈预防模型需要具备的条件:

  • 为用户提供训练模型和编排执行的一站式商店
  • 实时检测
  • 通过利用强大的ML工具(如深度学习和神经网络)进行深度分析和建模如果数据分析和测试新的假设
  • 遵守公司安全政策和合规要求
  • 通知服务,立即通知持卡人的可疑活动
  • 与企业系统无缝集成

MLflow预防欺诈
Davay强调了Databricks和MLflow在他们防止欺诈的努力中。他谈到了这个平台,以及不同的数据和欺诈团bob体育客户端下载队如何与使用Databricks的团队合作开发和运行实验。Davay说:“即使他们在团队内部协作共享实验和数据,我们也可以实施严格的安全措施,以尊重数据隐私,并且每个实验都可以有自己的计算环境和要求。”他将Databricks称为“为所有(他们的)数据科学和模型提供一站式服务的商店,使其成为数据科学项目的完美选择。”当团队确定了用于预测交易是否欺诈的特征时,他们将这些数据点传递给Databricks的托管环境,在那里他们可以执行特征工程、数据预处理并将数据分割为测试集和训练集。然后,他们使用各种监督或无监督ML算法,如SVM、决策树和随机森林,来训练模型。他们确定并使用性能最佳的模型Databricks湖屋平台bob体育客户端下载直接从平台内部解决欺诈问题。bob体育客户端下载湖屋是一个有利于欺诈检测的环境,您可以从我们的解决方案加速器了解更多BOB低频彩在这里

Capital One信用卡检测ML工作流,利用Databricks Lakehouse平台。bob体育客户端下载
Davay提到“Databricks生态系统中的MLflow是我们可以使用的一个很好的特性,因为它在无缝开发ML工作流管道方面有很多优势。”MLflow允许Capital One在整个ML模型生命周期中从端到端跟踪他们的ML实验。在演讲中,Davay提到他们可以直接从GitHub运行实验,而不需要通过代码,并且可以通过序列化直接部署和训练模型,同时利用Python的pickle模块、Apache Spark和MLflow等包。然后,他们部署序列化模型,并利用MLflow将其作为API提供服务。

通过MLflow, Capital One可以直接从GitHub上运行反信用卡ML实验。

MLflow和微服务
Davay还谈到了微服务,以及为什么它们在MLflow中很有用。微服务是应用程序特定功能方面的网关。随着时间的推移,它帮助像Capital One这样的团队以标准化一致的方式开发应用程序。微服务允许Capital One独立部署应用程序的功能。它有助于抽象功能,同时使团队能够构建可重用的和统一的与应用程序交互的方式。此外,它还允许团队通过将各种其他微服务组合在一起来组成复杂的行为。从本质上讲,它使公司能够在后端使用任何技术堆栈,同时保持前端的兼容性。

Capital One的原始数据存储在Amazon S3中,他们可以通过Databricks无缝集成S3和框架之间的交互,并可以通过MLflow大规模扩展ML模型训练、验证和部署管道。他们的团队在AWS中的自定义集群上训练和验证模型,并使用MLflow api通过SageMaker直接部署模型。MLflow不仅限于AI,还可以嵌入任何业务逻辑(如Databricks Rules + AI加速器中提到的),因此,作为微服务,它受益于E2E治理和交付原则。

Databricks信用卡欺诈检测微服务控制流程

把它们放在一起
Davay分享了Databricks如何允许Capital one在AWS生态系统中使用MLflow api时查询和部署模型,并管理和清理部署。此外,它们还可以通过AWS SSO确保安全和有条件访问。

根据Capital One和许多其他客户的观察,使用数据和人工智能来预防欺诈有几个好处,包括:

  • 减少手工审查的需要。ML自动化了可以在个人层面学习行为并检测异常的过程。
  • 在不影响用户体验的情况下防止欺诈的能力。人工智能无缝地实现了流程自动化,并在不给用户带来负担的情况下提前防止欺诈。
  • 比其他方法更低的运营成本。通过减少人工工作和自动化,数据和人工智能需要更少的资源,并先发制人地防止与欺诈相关的损失。
  • 腾出团队时间,专注于更有战略意义的任务。大多数公司都不从事欺诈检测业务,而ML欺诈预防流程可以帮助他们专注于核心活动。
  • 迅速适应。再加上人类的才能和经验,数据和AI一起工作,不断学习和调整新的用户行为和趋势。

当涉及到运营数据和人工智能以建立客户关系并推动更高的股本回报率时,欺诈应被视为重中之重。遏制欺诈性信用卡交易的欺诈或恶意行为是减轻负面收入影响的关键。为了更动态地检测欺诈交易,Capital One使用ML和信用卡交易信息,以及卡和人口统计信息,以获得全面的视图,以识别异常情况。Capital One等数据驱动型创新者正在为欺诈检测铺平道路,并提供了一个成功的模式,以保护客户和业务。

在Databricks中开始欺诈预防

从我们的预构建代码和指南开始欺诈解决方案加速器

看我们所有的金融服务解决方案

免费试用Databricks

相关的帖子

看到所有公司博客上的帖子