OpenCorporates & TigerGraph

OpenCorporates使用TigerGraph 升级企业知识图谱

实现成效:

OpenCorporates作为全球最大的公司开放数据库,已经有多年的图数据库应用经验,考虑到数据不断增长,之前的图数据库已无法支撑业务需求。经过调研和测试,非常认可TigerGraph卓越的性能可以帮助OpenCorporates实现之前无法做到的事情。故选择TigerGraph作为其新一代后端图数据库。此举使OpenCorporates可以更好地支持其开放式数据库中的调查查询,该数据库包含超过1.7亿家公司的记录。

OpenCorporates使用一台机器上的1700万个节点和1000万条边的样本集,将TigerGraph与其他图数据库进行了比较。 TigerGraph为以下必备查询要求提供了出色的支持:

  • 分离度:支持具有实时响应时间的实体之间最多5个分离度的查询——这种功能对OpenCorporates越来越难。
  • Siblings:支持具有实时响应时间的Siblings查询,以帮助回答诸如“给定公司的母公司还拥有什么?”之类的问题。
  • 仅上链:使用户可以实时响应地查看仅对任何给定公司上链中存在哪些实体。
  • 时间图搜索:用户可以确定在特定时间范围内是否存在关系。 他们可以搜索从特定日期创建了哪些实体,并从查询中删除所有旧的关系——Neo4j无法实现。
  • 有效与无效的关系:支持在给定网络上进行查询,以查看哪些有效与无效的关系,以便可以从查询中相应地过滤掉每个关系,这是Neo4j所没有的。

面对的挑战:

由于数字转账和付款的泛滥,国际和地区法律的众多以及犯罪者的日趋复杂,犯罪和反社会活动变得越来越难以追踪。OpenCorporates发现,图提供了揭露数据之间的联系以揭示此类活动的理想解决方案。 但是,随着使用最初的技术选择从概念验证(PoC)转到生产过程中,它遇到了关键挑战。

OpenCorporates意识到他们需要一个具有更高性能和可伸缩性的图数据库,并且需要能够支持更深层次的查询——这些查询将进入公司层次结构的五个级别,以为用户提供关键见解。

基于TigerGraph图分析,优化企业知识图谱

OpenCorporates的使命是使全球公司的信息更易于使用和访问,以实现公共利益。 该组织支持基于Web的搜索,并通过其API接口为数据记者提供多种工具,以帮助他们在自动化工作流程中查找、提取和联系大量公司。

TigerGraph提供了世界上最快的图分析平台,无论数据集有多庞大或复杂,它都能实时解决最棘手的数据挑战。 TigerGraph将所有数据源存储在一个统一的多图存储中,该存储可以轻松高效地进行扩展,以探索、发现和预测关系。 与传统的图数据库不同,TigerGraph可以将实时多跳查询扩展到数万亿个关系。

在应用TigerGraph后,用户可以利用自动化来发现OpenCorporates不断扩展的数据集中巨大的隐藏连接,从而大大减少了时间,提高了性能,并且能够进行更深入的分析(多跳)来支持调查任务。

客户评价

“OpenCorporates致力于使公司的信息更有用和更广泛地为公共利益使用,特别是揭露犯罪或反社会活动的实例,例如腐败、洗钱和有组织犯罪。随着我们工作的继续和数据的增长,我们面临着扩展数据以满足业务需求的挑战。 TigerGraph出色的可伸缩性和实时性能使我们能够实现以前无法做到的事情,并在此过程中更好地支持正在进行的调查工作。”

——Chris Taggart,首席执行官,OpenCorporates

客户简介

OpenCorporates是企业界最大的开放数据库,可为全球125个国家/地区中的1.7亿家公司提供免费和开放的数据。 OpenCorporates致力于通过揭露腐败和洗钱等犯罪和反社会活动来改善世界。 它的数据库一直是包括巴拿马文件和大规模洗钱案件在内的整体调查的中心。

OpenCorporates还提供了供财富500强公司使用的企业解决方案,以提供深刻的洞察力和情报。通过过渡到TigerGraph,它能够支持以前不可能实现的必备查询要求。