OGAI 特性文档
可获得性
本特性自 openGauss 7.0-RC3 版本开始引入。
特性简介
OGAI(openGauss AI)是 openGauss 数据库的智能向量化框架插件,提供了一站式的 AI 能力集成方案。通过 OGAI,用户可以在数据库内部直接调用AI模型进行文本向量化、文本生成、文档重排序等操作,无需依赖外部应用层实现,大幅简化了 RAG(检索增强生成)应用的开发流程。
客户价值
- 开发效率提升:无需在应用层实现复杂的向量化和检索逻辑,所有 AI 能力通过 SQL 函数直接调用
- 数据一致性保障:文本自动向量化,向量数据与业务数据存储在同一数据库中,通过触发器自动同步更新
- 多模型支持:支持 OpenAI、Qwen(通义千问)、Ollama、ONNX 等多种模型提供者
- 灵活的部署方式:支持云端 API 调用和本地模型部署
特性描述
OGAI 以数据库插件(Extension)形式提供,使用前需要通过 CREATE EXTENSION ogai 安装,并创建加密密钥文件用于 API Key 的安全存储。
OGAI 提供以下核心能力:
- 文本向量化(Embedding):将文本转换为向量表示,支持多种嵌入模型
- 文本生成(Generate):调用大语言模型生成回答
- 文档重排序(Rerank):对检索结果进行相关性重排序
- 文本分块(Chunk):将长文本智能分割为适合处理的片段
- 自动向量化(Vectorize):自动化管理表数据的向量化任务,支持同步和异步两种模式
- 向量搜索(Search):基于向量相似度的语义检索
- 混合搜索(Hybrid Search):结合向量检索与 BM25 全文检索
- RAG 问答:端到端的检索增强生成问答
详细的系统表、系统函数及使用指导请参考 OGAI 使用指南。
特性增强
无。
特性约束
OGAI 特性规格约束如下:
| 约束类型 | 详细说明 |
|---|---|
| 插件安装 | 使用前需要执行 CREATE EXTENSION ogai 安装插件 |
| 加密密钥 | 使用前需要通过 gs_guc generate -S XXX -D $GAUSSHOME/bin -o ogai 创建加密密钥文件,用于 API Key 的安全存储 |
| 模型依赖 | 使用前需要正确配置模型提供者的 API 地址和密钥 |
| 网络要求 | 云端模型调用需要数据库服务器能够访问外网 |
| UPDATE 限制 | 向量化任务不支持 UPDATE 操作触发同步,需使用 DELETE + INSERT 替代 |
| BM25 类型限制 | 启用 BM25 索引时,文本列必须为 TEXT 类型 |
| 异步任务 | 使用异步向量化需要开启 enable_async_ogai 参数并重启数据库 |
| 行级安全 | OGAI 系统表启用了行级安全策略,用户只能访问自己创建的模型和任务 |
| 分块参数 | max_chunk_overlap 必须小于 max_chunk_size |