File tree Expand file tree Collapse file tree 1 file changed +15
-0
lines changed
Expand file tree Collapse file tree 1 file changed +15
-0
lines changed Original file line number Diff line number Diff line change @@ -79,6 +79,21 @@ CREATE TABLE `t` (
7979PARTITION BY HASH (` sid` ) PARTITIONS 1
8080```
8181
82+ ### 配置
83+
84+ 创建向量索引时支持以下配置项:
85+
86+ - ` type ` :向量索引类型,可以指定为 IVF_PQ、IVF_RQ、HNSW、HNSW_PQ 等任一我们所支持的索引类型。
87+ - ` distance ` :距离函数,可以指定为 l2、cosine、dot。注意,如果选择 RQ 量化,不允许将距离函数设置为 cosine。
88+ - ` num_cells ` :适用于 IVF 类索引,使用 ` num_cells ` 指定向量簇的数量。数量越多,搜索越快,但是构建索引时间更长、召回率越低。默认为 32。
89+ - ` num_sub_vectors ` :适用于 PQ 量化,使用 ` num_sub_vectors ` 指定子向量的个数。数量越多,压缩率越高,但是构建索引时间更长、召回率更低。默认为 32。
90+ - ` num_bits ` :适用于 PQ 量化,使用 ` num_bits ` 指定使用多少个 bits 来表示一个向量子空间中的质心。 ` num_bits ` 越大,压缩率越低、召回率更高,但是构建索引时间更长。目前仅支持设置为 8。
91+ - ` max_level ` :适用于 HNSW 类索引,使用 ` max_level ` 指定 HNSW 层数。层数越大,查询越快,但是构建索引时间更长。默认为 7。
92+ - ` m ` :适用于 HNSW 类索引,使用 ` m ` 指定每个节点可连接的最大邻居数量。 ` m ` 越大,召回率越高,但是索引构建时间更长、查询更慢。默认为 10。
93+ - ` ef_construction ` :适用于 HNSW 类索引,使用 ` ef_construction ` 指定 HNSW 构建过程中考虑连接的候选邻居数量。该参数越高,召回率越高,但是索引构建时间更长。默认为 50。
94+
95+ 我们建议用户根据向量维度、数据集大小来设置以上配置项。
96+
8297## 示例
8398
8499我们提供了一个 Python 脚本,展示如何使用向量索引来加速向量检索。这个脚本执行的步骤如下:
You can’t perform that action at this time.
0 commit comments