DataVec向量引擎参数

hnsw_ef_search

参数说明: 使用HNSW索引扫描时的动态候选集大小。

该参数属于USERSET类型参数,请参考表1中对应设置方法进行设置。

取值范围: 整型,1~1000

设置建议: 使用HNSW索引扫描时,sql结果数量会受限于hnsw_ef_search。并且由于查询时的过滤条件等因素,输出的结果可能会更少。建议将 hnsw_ef_search设置为查询中LIMIT的至少两倍。

默认值: 40

说明:

较高的值会提升查询的召回率,但同时查询速度会下降。

如果需要超过500个结果,请使用IVFFLAT索引。

ivfflat_probes

参数说明: 使用IVFFLAT索引扫描时的动态候选集大小。

该参数属于USERSET类型参数,请参考表1中对应设置方法进行设置。

取值范围: 整型,1~32768

设置建议sqrt(lists)list为IVFFLAT索引构建时的入参,详情请参考向量索引

默认值: 1

说明:

较高的值会提升查询的召回率,但同时查询速度会下降。

enable_hnswpq

参数说明: HNSW索引是否开启PQ。

该参数属于POSTMASTER类型参数,请参考表2中对应设置方法进行设置。

取值范围: 布尔型,on/off

默认值: off

说明:

启用PQ功能前,必须安装libkvecturbo.soPQ加速安装包,并正确配置DATAVEC_HNSWPQ_LIB_PATH环境变量。否则数据库将无法正常启动。

hnsw_earlystop_threshold

参数说明: HNSW索引开启PQ时,在早停策略中设置图搜索的最大连续迭代次数。

该参数属于USERSET类型参数,请参考表1中对应设置方法进行设置。

取值范围: 整型,160~INT32_MAX-1

默认值: INT32_MAX

说明:

默认值实际是不开启早停策略的状态。较低的值可以提升查询速率,但可能会使召回率降低,如果召回率不够高可以适当调大参数值。

意见反馈
编组 3备份
    openGauss 2025-02-05 01:03:04
    取消