图技术和人工智能相结合,Intuit 利用图特征将欺诈检测提高了 50%
Uri Lapidot,高级产品经理,Intuit
2021 年 7 月 29 日

了解金融软件领导者如何克服关键挑战以实现图的真正优势
基于图的技术是突出显示隐藏的关系、模式和见解的关键。作为 Intuit 向 AI 驱动的专家平台公司转型的一部分,这家拥有38 年历史的公司——为小型企业、个体经营者和消费者提供服务——在图上加倍努力,以最大限度地提高客户信心并降低风险。Intuit 风险团队的主要目标是使该平台成为客户进行金融交易和管理的可信赖场所。
Intuit 的风险和欺诈团队致力于将机器学习与图数据库相结合,以形成一种基于图的 AI 方法,以防止大规模欺诈。换句话说,可以在客户(及其资金)受到影响之前检测到可疑模式。
鉴于 Intuit 转向 AI 驱动的欺诈和风险平台,我们的大部分风险缓解控制都基于 ML 模型。我们实施了一个图数据库系统来反映我们的客户关系并检测可疑活动。具体而言,我们的目标是使用图洞察力将 ML/AI 模型中的欺诈实体联系起来,以加强我们的欺诈和风险控制,减少端到端生态系统中多个检查点的欺诈,并改善客户体验。

图特征+机器学习,提高欺诈预测的准确率
基于图的特征为欺诈预测博弈提供了新的视角。将图特征添加到欺诈检测模型将允许我们检测微妙的欺诈模式。经典的ML特征包括“聚合”,如30天内来自同一设备的付款计数、“比率”——欺诈付款数除以来自同一设备的合法付款数,或“原始数据中的特征“,如IP地址和邮政编码之间的地理位置不匹配。这三个示例中没有一个涉及实体之间的关系,而这正是图特征发挥作用的地方。

一个图特征的例子是“通过六跳链接到欺诈。”其他图特征包括最小链接距离(即使有多条路径,我们也会以最少的跳数定位一条),平均链接距离,到目标的链接数,链接强度和到目标的路径。我们可以从查询图数据库中获得许多见解,这促使我们为模型提供基于图的特征。

在将我们的图目标付诸实践方面——特别是将 ML 模型与基于图的输入相结合——我们预计并计划了两个关键挑战。我们知道,通过 AI/ML 经典模型开发流程,数据科学家可以探索特征并使用 Python 或 SQL 查询关系数据库来开发它们。一旦获得了一个有效的特征,就可以通过计算历史特征值来生成训练数据集。这在经典模型场景中很简单,因为任何给定事件的数据都存在,并且可以计算任何时间点的任何特征值。相反,基于图的特征开发流程更加困难——尤其是最初的两个步骤。
第一个挑战: 如何让数据科学家能够探索和开发基于图的特征,而无需对其进行 GSQL 语法训练?
当您编写基于图的策略时,例如“在最多四跳中找到实体 A 和 B 之间的链接”,这是实现的简单逻辑。但是,当涉及到 ML 模型特征时,您必须允许数据科学家为更复杂的场景开发特征。在我们的案例中,我们需要让数据科学家能够在不使用 GSQL 语法的情况下探索和开发基于图的特征。
问题:如何在无需学习 GSQL 语言的情况下获得 GSQL 的好处?我们的工程团队认识到,虽然 GSQL 不是通用的语法,但 GraphQL 是通用的。该团队实现了一个抽象层,将 GraphQL 语法作为输入,然后将函数转换为 GSQL 代码。一旦数据科学家定义了一个特征,然后使用 GraphQL UI 对其进行测试,他就可以从任何 Intuit 服务进行 HTTP 调用并实时获取特征结果。
第二个挑战:一旦获得了一个有效的特征,如何设计基于时间的关联关系来为模型训练和测试生成可回溯的图特征
Intuit 的图是不断更新和不断变化的。为了使用图特征训练模型,我们需要在任何给定时间点反映每个关系状态。想想时光机。我们希望能够在任何给定时间点模拟关系状态,以使用批处理查询系统生成历史特征值。我们了解到,这种能力不是可有可无,而是必须具备的。如果我们不能计算历史特征值,我们就不能对我们的模型使用图洞察力。
我们将图的变化称为图边的“添加”或“删除”。我们在图中的任何边上实现了开始日期和结束日期。考虑一下这个场景:我们有一个用户 A,他在1月20日把他的银行账户从银行1变为银行2。然后我们看到用户 B 在 1 月 15 日使用银行 2 处理了付款。在这种情况下,B 和 A 没有连接,因为银行 2 是在 1 月 20 日被添加到用户 A 。但是如果在1月21日发生同样的交易,我们就会在用户 A 和用户 B 之间建立一个链接。

为了支持这种基于时间的关联关系,您必须在图中的每条边上应用开始和结束日期。您还必须在 GSQL 查询中实现正确的逻辑。然后,当查询遍历图时,它会引用源实体的日期和时间,同时忽略当时不存在的关系。这个过程解决了可回溯的图特征模拟挑战。

总结
现在这两个挑战都解决了,Intuit 看到了哪些风险管理收益?我们的欺诈检测模型检测到的风险事件增加了 50%,我们的模型精度提高了 50%——其中大部分效果提升归功于基于图的特征。我们与客户进行了多次设计会议,对解决方案进行微调,并根据需要继续迭代、调整和更新。我们认为图是一种改变游戏规则的技术,我们计划在未来开发更多基于图的产品。
点击此处免费下载Intuit成功案例,您也可以查看Intuit在2021年春季Graph+AI全球峰会上带来的精彩分享:
使用图分析技术来增强AI。
热门推荐
TigerGraph 成功入选《Gartner 2022年云数据库管理系统关键能力-分析用例》报告
January 17, 2023
TigerGraph 图期刊 #16期
December 21, 2022
TigerGraph 成功入选 2022 年 Gartner® 全球云数据库管理系统魔力象限™
December 19, 2022
分类
最新帖子
降低AML调查成本的秘诀:利用TigerGraph实现高效反洗钱调查!
December 4, 2023
TigerGraph Cloud 2023年11月更新:解锁数据洞察的全新功能
December 4, 2023
TigerGraph v3.9.3即将发布,再次升级企业级图分析能力
November 8, 2023