• Sage Data Platform
  AI数据治理平台

  产品价值

  大容量

  无缝对接多源异构数据,支持海量数据分布式存储

  高吞吐

  系统支持Hadoop等主流分布式计算框架,百万级别吞吐量,支持水平扩展

  低门槛

  内置多个自研可视化算法工具,配备便捷方案调试的特征追踪工具

  高可用

  内部微服务无状态化,自带网络负载均衡器,系统高可用且可水平伸缩

  企业级

  租户和用户权限隔离、工作区共享,安装部署和运维工具完善

  产品功能

  • 数据集成
   多源异构数据统一接入

   为结构化数据以及图像、文本等非结构化数据提供统一接入引擎,无缝对接主流数据仓库、关系型数据库;支持AI应用场景下的复合数据接入,包括标注图片集、样本和模型。

   时序数据分组管理

   通过数据分片存储技术,可按某个时间字段进行数据分片,时间切片可作为获取数据的依据,实现机器学习场景中对模型所需数据切片的快速定位。

  • 数据治理
   全域数据统一治理

   Data Platform为异构数据提供统一治理框架和元信息管理。同构数据通过数据组整合,借助数据域隔离,支持分业务、分场景管理数据,一横一纵两个维度全面提升大规模AI实践过程中的数据治理水平。

   数据全生命周期定位与追踪

   统一定位符(prn)构建企业数据的全局标识体系,实现快速定位数据以及追踪数据整个生命周期变化。

  • 模型管理
   模型组与模型版本

   通过模型组,解决了自学习过程中一个模型多个版本所带来的管理问题。模型版本管理可帮助定位相同场景的不同模型快照。

   模型生产信息汇总

   模型生产过程中的相关评估报告汇总展示,帮助对模型做出准确、全方位评估。

   模型可视化、可解释

   直观、易懂的模型可视化和可解释功能,不仅可以助力建模工程师对模型进行分析优化,更为业务人员提供了理解模型工作原理的重要渠道,让模型的应用更透明、更可控。

   多种模型格式兼容

   支持开源和第三方模型的导入/导出、版本管理和上线部署等,帮助企业实现一站式模型资产管理,沉淀业务价值,提升管理效率。

  • 企业级特性
   企业级数据权限体系

   租户与用户级别数据隔离,保护企业个体数据空间免受窃取和污染;工作区为单元数据共享,实现跨部门数据复用、知识迁移。

   可视化的任务管理面板

   支持按场景、标签、名称等方式检索任务;集中式标识体系,任务、数据统一定位。

   分布式数据任务调度系统

   分布式任务管理引擎,统一调度数据作业;离线批处理与实时流处理一站管理。

  91福利