版本:latest

OGAI 特性文档

可获得性

本特性自 openGauss 7.0-RC3 版本开始引入。

特性简介

OGAI(openGauss AI)是 openGauss 数据库的智能向量化框架插件,提供了一站式的 AI 能力集成方案。通过 OGAI,用户可以在数据库内部直接调用AI模型进行文本向量化、文本生成、文档重排序等操作,无需依赖外部应用层实现,大幅简化了 RAG(检索增强生成)应用的开发流程。

客户价值

  • 开发效率提升:无需在应用层实现复杂的向量化和检索逻辑,所有 AI 能力通过 SQL 函数直接调用
  • 数据一致性保障:文本自动向量化,向量数据与业务数据存储在同一数据库中,通过触发器自动同步更新
  • 多模型支持:支持 OpenAI、Qwen(通义千问)、Ollama、ONNX 等多种模型提供者
  • 灵活的部署方式:支持云端 API 调用和本地模型部署

特性描述

OGAI 以数据库插件(Extension)形式提供,使用前需要通过 CREATE EXTENSION ogai 安装,并创建加密密钥文件用于 API Key 的安全存储。

OGAI 提供以下核心能力:

  • 文本向量化(Embedding):将文本转换为向量表示,支持多种嵌入模型
  • 文本生成(Generate):调用大语言模型生成回答
  • 文档重排序(Rerank):对检索结果进行相关性重排序
  • 文本分块(Chunk):将长文本智能分割为适合处理的片段
  • 自动向量化(Vectorize):自动化管理表数据的向量化任务,支持同步和异步两种模式
  • 向量搜索(Search):基于向量相似度的语义检索
  • 混合搜索(Hybrid Search):结合向量检索与 BM25 全文检索
  • RAG 问答:端到端的检索增强生成问答

详细的系统表、系统函数及使用指导请参考 OGAI 使用指南

特性增强

无。

特性约束

OGAI 特性规格约束如下:

约束类型详细说明
插件安装使用前需要执行 CREATE EXTENSION ogai 安装插件
加密密钥使用前需要通过 gs_guc generate -S XXX -D $GAUSSHOME/bin -o ogai 创建加密密钥文件,用于 API Key 的安全存储
模型依赖使用前需要正确配置模型提供者的 API 地址和密钥
网络要求云端模型调用需要数据库服务器能够访问外网
UPDATE 限制向量化任务不支持 UPDATE 操作触发同步,需使用 DELETE + INSERT 替代
BM25 类型限制启用 BM25 索引时,文本列必须为 TEXT 类型
异步任务使用异步向量化需要开启 enable_async_ogai 参数并重启数据库
行级安全OGAI 系统表启用了行级安全策略,用户只能访问自己创建的模型和任务
分块参数max_chunk_overlap 必须小于 max_chunk_size

依赖关系

向量数据库特性