工程的博客

使用信用卡交易的银行和金融科技的超个性化加速器

Lakehouse for Financial Services作为战略平台,加速零售银行的数字化转bob体育客户端下载型

2022年3月3日 工程的博客

分享这篇文章

就像Netflix和特斯拉颠覆了媒体和汽车行业一样,许多金融科技公司正在改变金融服务行业,通过个性化服务、承诺更安全的无数信用卡和无摩擦的全渠道体验,赢得了数字活跃人群的心。NuBank的一家成立8年的初创公司成为拉丁美洲最有价值的银行,这并非个案;超过280个fintechs独角兽也愿意颠覆整个支付行业。正如金融市场行为监管局(FCA)所指出的那样研究”,有迹象表明,由于创新、数字化和消费者行为的改变,大型银行的一些历史优势可能开始减弱“面对颠覆或被颠覆的选择,像摩根大通这样的许多传统金融服务机构最近宣布了重大战略投资利用数据和人工智能(AI)在云上与金融科技公司展开竞争。

考虑到驱动高级个性化所需的数据量,从实验(概念验证/POCs)到企业级数据管道操作AI的复杂性,再加上在云基础设施上使用客户数据的严格数据和隐私法规,莱克豪斯金融服务公司已迅速成为许多颠覆者和在职者的战略平台,以加速数字化转型,并为数百万客户提bob体育客户端下载供个性化的见解和增强的银行体验(看看是如何做到的汇丰银行正在用人工智能重塑手机银行)。

在我们之前的解决方案加速器,我们展示了如何从信用卡交易中识别品牌和商家。在我们新的解决方案加速器(灵感来自2019研究根据我们与全球零售银行机构合作的经验),我们利用这项工作建立了一个现代的超个性化数据资产策略,该策略可以全面了解消费者,超越传统的人口统计、收入、产品和服务(你是谁),扩展到交易行为和购物偏好(你如何银行)。作为一种数据资产,同样可以应用于许多下游用例,例如在线银行应用程序的忠诚度计划、核心银行平台的欺诈预防或“现买后付”(BNPL)计划的信用风险。bob体育客户端下载

事务上下文

虽然任何分割用例的通用方法都是一个简单的聚类模型,但只有少数现成的技术。或者,当从原始原型转换数据时,可以使用更广泛的技术,这些技术通常会产生意想不到的结果。在这个解决方案加速器中,我们将原始的卡交易数据转换为图形范式,并利用最初为自然语言处理(NLP)设计的技术。

将卡片交易表示为二部图

与NLP技术(单词的含义由其周围上下文定义)类似,商家的类别可以从其客户群和消费者支持的其他品牌中学习。为了构建这个上下文,我们通过模拟顾客从一个商店走到另一个商店,在我们的图结构中上下移动来生成“购物旅行”。我们的目标是学习“嵌入”,这是我们网络中客户所携带的上下文信息的数学表示。在这个例子中,两个上下文上彼此接近的商人将被嵌入到数学上彼此接近的大型向量中。由此类推,两个表现出相同购物行为的顾客在数学上彼此很接近,为更高级的顾客细分策略铺平了道路。

商人嵌入

Word2Vec由Tomas Mikolov等人在谷歌开发,使嵌入的神经网络训练更有效,现已成为开发预训练词嵌入算法的事实上的标准。在我们的解决方案中,我们将使用来自Apache Spark™ML API的默认wordVec模型,该模型是针对前面定义的购物旅行进行训练的。

pyspark.ml.feature进口Word2Vecmlflow.start_run (run_name =“shopping_trips”作为运行:
              word2Vec_model = Word2Vec() \.setVectorSize (255) \.setWindowSize (3.) \.setMinCount (5) \.setInputCol (“走”) \.setOutputCol \(向量).fit (shopping_trips)mlflow.spark.log_model (word2Vec_model“模型”

快速验证我们的方法的最明显的方法是观察其结果并应用领域专业知识。在像“Paul Smith”这样的品牌例子中,我们的模型可以发现Paul Smiths最接近的竞争对手是“Hugo Boss”,“Ralph Lauren”或“Tommy Hilfiger”。

与保罗·史密斯关系密切的商人

我们不是简单地检测同一类别(即时尚行业)的品牌,而是检测价格相似的品牌。我们不仅可以使用客户行为数据对不同的业务线进行分类,而且我们的客户细分也可以由他们购买的商品质量来驱动。这一观察结果证实了Bruss等人的发现。

商业集群

尽管初步结果令人不安,但可能有一些与其他商家或多或少相似的商家群体,我们可能需要进一步确定。找到这些重要的商家/品牌群体的最简单方法是将我们的嵌入式向量空间可视化为3D图。为此,我们应用了主成分分析(PCA)等机器学习技术,将嵌入向量简化为3维。

将商家嵌入表示为3维

使用一个简单的图表,我们可以识别出不同的商人群体。虽然这些商家可能有不同的业务线,乍一看可能不一样,但他们都有一个共同点:他们吸引了相似的客户群。我们可以通过聚类模型(KMeans)更好地证实这一假设。

事务的指纹

word2vec模型的一个奇怪特征是,足够大的向量仍然可以聚合,同时保持较高的预测值。换句话说,一个文档的重要性可以通过对其每个单词组成的向量求平均来了解白皮书Mikolov等人)。同样,顾客的消费偏好也可以通过汇总他们喜欢的每个品牌的向量来了解。两个对奢侈品牌、高端汽车和高档白酒有着相似品味的顾客理论上应该是相近的,因此属于同一细分市场。

Customer_merchants =交易\.groupBy (“customer_id”) \.agg (F.collect_list (“merchant_name”) .alias (“走”))
              customer_embeddings = word2Vec_model.transform(customer_merchants)

值得一提的是,这样一个聚合视图将生成一个对于每个终端用户都是唯一的事务指纹。虽然两个指纹可能具有相似的特征(相同的购物偏好),但这些独特的签名可以用来跟踪独特的个人客户行为。

当一个签名与之前的观察有很大不同时,这可能是欺诈活动的迹象(例如,赌博公司突然感兴趣)。当签名随时间推移而漂移时,这可能预示着生活事件(有了一个新生儿)。这种方法是推动零售银行业务超个性化的关键:根据实时数据跟踪客户偏好的能力将帮助银行提供个性化的营销和服务,例如在各种积极或消极的生活事件中推送通知。

随时间变化的交易指纹

客户细分

尽管我们能够生成一些信号,为客户行为分析提供很大的预测价值,但我们仍然没有解决实际的细分问题。在涉及客户360用例(包括细分、客户流失预防或客户终身价值)时,我们可以借鉴零售业同行的经验,他们通常更先进,我们可以使用不同的方法解决方案加速器从我们的零售湖屋这将带领我们了解一流零售组织使用的不同细分技术。

根据零售业的最佳实践,我们能够将我们的整个客户群划分为5个不同的群体,表现出不同的购物特征。

将我们的客户群划分为5个消费角色

虽然集群#0似乎偏向于赌博活动(上图中的第4类商家),但另一组更集中于在线业务和基于订阅的服务(第6类商家),可能表明年轻一代的客户。我们邀请我们的读者用他们已经了解的关于客户的额外数据点(原始细分市场、产品和服务、平均收入、人口统计数据等)来补充这一观点,以更好地理解每一个行为驱动的细分市场及其对信贷决策、次优行动、个性化服务、客户满意度、债务催收或营销分析的影响。

封闭的思想

在这个解决方案加速器中,我们已经成功地将NLP领域的概念应用到信用卡交易中,以实现零售银行的客户细分。我们还展示了Lakehouse对金融服务的相关性,以解决这一挑战,其中图形分析、矩阵计算、NLP和集群技术必须全部组合到一个安全且可扩展的平台中。bob体育客户端下载与通过SQL轻松解决的传统细分方法相比,细分的颠覆性未来构建了更全面的消费者图景,只能通过数据+人工智能大规模实时解决。

虽然我们只触及了现有模型和数据的表面,但我们证明了客户消费模式可以比人口统计数据更有效地推动超个性化,开辟了一系列令人兴奋的新机会,从交叉销售/追加销售、定价/定位活动到客户忠诚度和欺诈检测策略。

最重要的是,这种技术使我们能够通过利用其他人的信息,向新进入银行的个人或没有已知信用历史的代表性不足的消费者学习。根据世界银行的数据,全球有17亿成年人没有银行账户世界经济论坛根据该机构的数据,2018年,仅美国就有5500万人银行服务不足美国联邦储备理事会(美联储,fed)这样的方法可以为零售银行走向一个更以客户为中心、更具包容性的未来铺平道路。

试试加速器笔记本电脑在Databricks上测试您的客户360数据资产策略联系我们了解更BOB低频彩多关于我们如何帮助有类似用例的客户的信息。

免费试用Databricks

相关的帖子

看到所有工程的博客的帖子