统一ID (实体解析)

使用TigerGraph统一ID,解决数据歧义

0 %

营销人员受坏数据影响

0 %

营销预算被浪费

0

实体解析为何如此重要的9个理由

企业为何要统一ID

企业收集的数据正在不断增加,但仍可能给出对现实世界的误导或零散的视图。 例如,由于错别字、姓名更改、不同系统的汇总等原因,一个人可能在同一数据库中出现多次或拥有多个数字实体。 如果我们尝试合并两个数据库,当ID系统可能不同或包含错误时,我们如何匹配实体?
统一ID有助于弄清事实,使数据库中真实实体的歧义消除,是必不可少的数据质量工具。

基于关系型数据库的传统解决方案可行吗?

传统的主数据管理系统是建立在关系数据库上的,关系数据库将诸如客户、联系方式、潜在客户、活动和商机等信息存储在单独的表中,每种类型的业务实体对应一个表。分析师们往往需要连接许多大型表来运行查询,并收集数据,然后进行分析。对于传统的基于关系型数据库的系统,这种查询可能需要数小时甚至数天的时间才能完成。
图分析为统一ID问题提供了一种有效的方法。 TigerGraph图分析平台,具有大量并行计算功能,可以实现毫秒/亚秒级的实时深度分析,是实现统一ID的最佳工具。

TigerGraph如何为企业打造统一ID系统?

基于TigerGraph图分析的统一ID

合并多个数据源的客户数据并非易事。其中统一ID是一个巨大挑战,统一ID用于确定何时不同数据源的多个实体实际代表的是同一个真实实体,然后将它们合并到一个实体中。

比如以下示例,其中存在三个包含以下类型的客户信息的数据源:

  • 来源1(SSN,电子邮件,地址)
  • 来源2(SSN,电话,姓名,年龄)
  • 来源3(电子邮件,电话,性别)

假设SSN,电子邮件和电话都足以唯一地识别一个人(也就是说,它们构成了个人身份信息,即个人识别信息PII)。问题在于不同的源使用不同的标识符,并且各个记录可能缺少某些信息。随着时间的流逝,丢失的客户PII可能会稍后在另一个数据源中显示。

我们的目标是希望使用我们拥有的有关客户的任何PII来查找所有数据源中客户的所有信息(属性),并建立具有以下属性的统一记录:客户(SSN,电子邮件,电话,姓名,年龄,性别,地址)。

TigerGraph图分析是专门为跨多个源连接以创建单个记录而构建的。在这种情况下,TigerGraph为每个客户创建一个客户顶点,并连接到各种PII顶点,例如SSN、电子邮件、电话。接下来,将具有相同SSN、电子邮件和电话号码的多个客户实体或顶点与应用的业务规则合并,以协调字段或属性的不同值。