En 400-6655-581
0

AI 数据治理

AI 数据治理

让 AI 应用"用数据"更安全

产品介绍

随着企业 AI 应用规模化落地,RAG 知识库、向量数据库、结构化业务数据库等数据资产被 AI 模型大量调用,传统数据治理手段既无法理解非结构化文档的内容语义,也无法感知 AI 生态内的访问意图。AI 数据治理平台以"AI 打标 + 访问控制"为核心,覆盖非结构化 RAG 文档与结构化数据库两类主要数据对象,联动 IAM 身份体系,为企业构建 AI 生态内可信、可控、可审计的数据访问管控底座。

产品功能

AI 数据治理平台基于大模型与 AI 技术,提供企业数据资产的自动分类打标、细粒度访问控制与全链路安全审计能力。平台以非结构化 RAG 文档(知识库、向量数据库、文件系统)和结构化数据库数据为主要管控对象,通过 AI 自动理解数据内容、识别敏感信息并打标入库,结合与 IAM 的深度联动,将"谁能访问哪些数据"的权限决策从人工配置升级为策略驱动的动态管控,帮助企业在 AI 快速迭代的环境下保障数据安全与合规。

  • No.1

    AI 智能数据打标

    利用大模型对非结构化文档(PDF、Word、Markdown、网页切片等 RAG 语料)与结构化数据表进行自动内容理解,识别并标注数据敏感级别、业务分类、合规属性等标签;支持自定义标签体系与规则覆盖,实现海量数据资产的自动分类入库,替代人工逐条打标的高成本方式。

  • No.2

    非结构化 RAG 文档访问控制

    对接知识库、向量数据库与文件存储,在 RAG 检索链路中嵌入权限过滤层;根据文档标签与用户 / Agent 身份动态决策"哪些文档可被检索、哪些片段可被返回",防止敏感知识因 RAG 召回而意外泄露给无权限的用户或 AI Agent。

  • No.3

    结构化数据库细粒度权限管控

    对数据库表、行、列及字段级别实施细粒度访问策略;支持基于数据标签的动态策略(如"标记为'财务敏感'的列对外包角色自动脱敏"),与数据打标能力形成联动,实现标签驱动的权限自动化。

  • No.4

    联动与统一身份授权

    深度对接企业 IAM 平台,将数据访问权限绑定到统一的身份体系(用户、角色、部门、AI Agent);支持基于 ABAC(属性访问控制)策略,根据用户属性、数据标签、访问上下文动态计算授权结果,实现"身份 × 数据 × 场景"三维度联动的精细化授权。

  • No.5

    数据访问审计与风险监控

    全量记录数据访问行为(人类用户 + AI Agent),包括访问主体、访问数据对象、返回内容摘要与时间戳;内置风险识别规则,对大批量导出、越权访问、敏感数据高频调用等异常行为实时告警,支持审计报表导出,满足合规检查与事后溯源需求。

产品特点

AI 原生:理解内容,而非仅管理结构

传统数据治理依赖人工配置分类规则,无法理解文档语义。平台以大模型为打标引擎,能够真正"读懂"文档内容并自动识别敏感信息,让数据治理从结构化元数据延伸到非结构化内容层。

多重打标策略,精准定义数据标签

平台采用多重 AI 打标策略与人工审核机制:先通过智能规则匹配,按行业规范定义数据资产标签;再优化企业 RAG 知识库检索召回策略,适配企业业务数据;最后依托专属 AI 打标引擎,结合 F1 值与人工评分提升打标准确率。

标签驱动,策略自动化

打标结果直接作为权限策略的输入依据——数据标签变更,访问权限自动跟随调整,无需人工二次配置,实现数据安全策略与数据内容状态的实时同步。

与 IAM / PAM 形成完整数据安全闭环

IAM 管理人的身份与认证,PAM 管控特权账号,AI 数据治理平台管控数据层的访问与内容安全,三者协同构建从"人是谁"到"能看什么数据"的完整零信任数据安全体系。

国产化适配,低耦合高兼容

平台基于开源技术自主研发,兼容国产化操作系统与数据库(达梦、OceanBase 等),支持本地化、云化及混合部署,满足信创要求,可架设于现有数据库 / 向量库 / 数据仓库之上,最小化改造成本。

 

应用场景

  • AI 知识库敏感内容访问管控

    企业将内部文档、合同、财务报告等敏感资料导入 RAG 知识库供大模型调用,但缺乏内容级权限控制,存在敏感信息被无权限用户或 AI Agent 召回的风险。平台通过 AI 打标 + RAG 链路权限过滤,确保每次知识检索都在授权范围内进行。

  • 多角色 AI 应用的差异化数据授权

    同一 AI 应用面向内部员工、外包人员、外部合作伙伴等不同角色提供服务,各角色可访问的知识库范围与数据字段不同。结合 IAM 角色体系与数据标签策略,实现同一入口、差异化数据视图,无需为每个角色单独维护数据副本。

  • 结构化数据库的合规访问与脱敏

    业务数据库中包含个人信息、财务数据等高敏感字段,需满足等保、GDPR 等合规要求。平台对标记为敏感的字段自动应用脱敏策略,结合行级权限过滤,在不影响业务查询效率的前提下满足数据最小必要原则。

  • AI Agent 数据访问审计与管控

    AI Agent 代表用户执行任务时会大量调用数据接口,传统审计系统无法区分"人的操作"与"Agent 的操作"。平台对 Agent 身份单独建档,全量记录其数据访问行为,异常访问(如批量拉取、跨业务线访问)实时告警,满足 AI 合规审计需求。

  • 数据资产统一视图与治理底座建设

    企业数据分散在多个系统、多种格式中,缺乏统一的内容分类与安全视图。平台通过 AI 打标自动建立数据资产目录,结合访问行为数据,形成"数据有哪些 → 敏感级别是什么 → 谁在用 → 用得是否合规"的完整治理视图。

产品价值

让 AI 应用"用数据"更安全

在 AI 大规模调用企业数据的新范式下,平台为每次数据调用加上身份验证与内容级权限过滤,确保 AI 生态内的数据流动始终在授权范围内,从根本上防止敏感数据因 AI 调用而泄露。

消除数据治理盲区,统一非结构化与结构化管控

传统数据治理仅覆盖结构化数据库,平台将治理范围延伸至 RAG 文档、知识库等非结构化数据,建立跨数据类型的统一标签与权限体系,彻底消除 AI 时代的数据治理盲区。

 

标签驱动策略自动化,降低人工运维成本

AI 打标 + 策略联动机制,将繁琐的数据分类与权限配置工作从人工操作转变为自动化流程,大幅降低数据安全团队的维护负担,提升数据治理的执行一致性。

满足合规要求,支撑审计与追责

全量访问日志、异常行为告警与合规报表,支撑等保 2.0、行业数据安全监管及内外部审计要求,实现数据使用的全程可见、可控、可追溯。

 

与身份安全体系深度融合,构建数据安全底座

与 IAM、PAM、NHI 平台联动,将数据访问控制纳入统一的零信任安全架构,形成从身份到数据的完整安全链路,为企业 AI 化转型提供可信的数据安全底座。