利用图机器学习在互联数据上进行更好、更快的预测

TigerGraph 机器学习工作台 (ML Workbench)

TigerGraph的机器学习工作台加速了图增强机器学习的开发,以更快地交付更准确的ML模型。

特别适合数据科学家、人工智能/机器学习从业者

什么是TigerGraph机器学习工作台?

TigerGraph的机器学习工作台(ML Workbench)是一个基于Jupyter的Python开发框架,使数据科学家能够使用关联数据,快速构建强大的深度学习AI模型。由于其准确的预测能力,该机器学习工作台使企业能够基于节点进行预测(如反洗钱)或基于边进行预测(如产品推荐),从而提供更好的见解和更大的业务影响。 TigerGraph机器学习工作台使人工智能/机器学习从业者可以轻松探索图神经网络 (GNN),因为它与 TigerGraph 的数据库完全集成,可实现快速、并行化的图数据处理/操作。
TigerGraph ML Workbench 旨在与您现有的 ML 框架和基础架构一起使用。它与其他流行的 ML 框架兼容,例如PyTorch Geometric、Deep Graph Library (DGL)和TensorFlow等,用户可以灵活地选择其最熟悉的框架。
TigerGraph机器学习工作台还可以即插即用,既可以插入您现有的本地基础设施,也可以在云中使用,如 Amazon SageMaker 和 Google Vertex AI。

图机器学习的开发框架

使数据科学家能够使用生产规模数据创建图神经网络模型和图增强模型。

Python 级别的函数和能力

预安装的Python库用于图数据处理、图特征工程、子图抽样、数据加载和用于数据库外训练的缓存。

与流行的机器学习框架兼容

与市场上最流行的机器学习框架合作,包括PyTorch Geometric、DGL和TensorFlow/Spektral。

即插即用的机器学习

灵活的集成路径,可与您在 Amazon SageMaker、Google Vertex AI 和 Microsoft Azure Machine Learning 上的现有机器学习基础架构协同工作。

“分布式原生属性图是管理企业数据的最佳方式; 然而,为了利用这些数据,我们需要将其与机器学习相结合。 TigerGraph 的 ML 工具是充分利用我们系统的最佳方式。”

——杰出工程师,Fortune Top5 医疗保健公司

ML Workbench的特点

兼容性:
  • 图数据库兼容性:TigerGraph DB v3.2+;
  • 云ML平台兼容性:Amazon SageMaker, Azure ML, GCP Vertex;
  • 机器学习框架兼容性:PyG, DGL,TensorFlow;
内置的Python级别的能力:
  • 图数据分区;
  • 图数据加载和导出(http);
  • 子图抽样;
  • 数据批处理;
  • 图特征生成;
  • GNN:节点预测支持;
  • GNN:异构图支持;
  • GNN:边预测支持;
  • 用实时数据进行GNN推断;
如何部署:
  • 在TigerGraph Cloud上的一键式插件;
  • Docker image;
  • MacOS 和 Linux 安装包;
  • pip install & conda 安装;
企业级功能(开发者版本中不支持以下功能):
  • 通过HTTP和Kafka从图数据库导出数据 →更可靠和高效;
  • 数据导出没有大小限制 →为企业级规模做好准备;
  • 支持分布式并行训练的能力 →缩短学习最佳实践的时间;
  • TigerGraph专业支持

易于训练的图神经网络(GNN)

当数据之间存在明确定义的关系时,GNN 往往优于其它机器学习技术,因为它直接对图数据的连通性进行建模。从最近的研究来看,GNN 已经证明了它在各种业务领域和应用程序中的成功。
借助 TigerGraph ML Workbench,您现在可以轻松探索 GNN 在您的领域中的潜力。TigerGraph机器学习工作台(ML Workbench)设计用于处理企业级数据。由于以下内置功能,用户甚至可以在大型图上轻松训练GNN,而无需强大的机器:

子图抽样

图数据处理,用于准备训练/验证/测试图数据集

GNN训练中的数据批处理

ML Workbench的优势

更大的业务影响力

  • 通过GNN和图特征产生更深入和更好的见解,以提高模型的准确性;
  • 提高数据科学家的生产力;
  • 已在多个行业得到验证。

无缝集成

  • 与 PyG、DGL 和 TensorFlow 兼容;
  • 与您在 AWS、GCP 和 Microsoft Azure 上的现有机器学习基础设施一起协同

易于开发

  • Python级别的开发;
  • 用于基于图的特征生成和数据分区/采样的预安装的Python库函数;
  • 图数据科学算法库。

生产数据规模

  • 数十亿个节点/边的规模;
  • 内置子图抽样提高内存和计算效率;
  • 利用 TigerGraph 分布式、大规模并行图引擎。

免费开始 TigerGraph ML Workbench
通过最新的TigerGraph Cloud 3.8版本,你可以在上面直接配置ML Workbench Jupyter notebook,为你的图数据库和图机器学习开发环境提供一站式体验。初级用户,可以通过TigerGraph Cloud 免费体验我们的入门套餐。本地部署的用户,也可以免费下载TigerGraph ML Workbench 开发者版本,企业级用户,如果想要咨询企业版报价,欢迎联系我们。