@@ -137,7 +137,7 @@ externalLocation ::=
137
137
138
138
``` sql
139
139
externalLocation ::=
140
- ' hdfs://<端点URL >[<路径>]'
140
+ ' hdfs://<端点 URL >[<路径>]'
141
141
CONNECTION = (
142
142
< 连接参数>
143
143
)
@@ -150,7 +150,7 @@ externalLocation ::=
150
150
151
151
``` sql
152
152
externalLocation ::=
153
- ' webhdfs://<端点URL >[<路径>]'
153
+ ' webhdfs://<端点 URL >[<路径>]'
154
154
CONNECTION = (
155
155
< 连接参数>
156
156
)
@@ -177,8 +177,8 @@ externalLocation ::=
177
177
178
178
``` sql
179
179
externalLocation ::=
180
- ' ipfs://<您的IPFS哈希 >'
181
- CONNECTION = (ENDPOINT_URL = ' https://<您的IPFS网关 >' )
180
+ ' ipfs://<您的 IPFS 哈希 >'
181
+ CONNECTION = (ENDPOINT_URL = ' https://<您的 IPFS 网关 >' )
182
182
```
183
183
184
184
</TabItem >
@@ -208,15 +208,15 @@ copyOptions ::=
208
208
[ MAX_FILES = < 数字> ]
209
209
```
210
210
211
- | 参数 | 描述 | 是否必需 |
212
- | --------------------- | -------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | -------- |
213
- | SIZE_LIMIT | 指定单次 COPY 语句加载的最大数据行数。默认为 ` 0 ` ,表示无限制。 | 可选 |
214
- | PURGE | 如果设置为 ` True ` ,命令将在文件成功加载到表中后清除阶段中的文件。默认值:` False ` 。 | 可选 |
215
- | FORCE | COPY INTO 默认通过自动跟踪并防止在默认 12 小时周期内重复加载文件来确保幂等性。可以使用 ` load_file_metadata_expire_hours ` 设置自定义文件元数据的过期时间。<br />此参数默认为 ` False ` ,表示 COPY INTO 在复制数据时会跳过重复文件。如果设置为 ` True ` ,则不会跳过重复文件。 | 可选 |
216
- | DISABLE_VARIANT_CHECK | 如果设置为 ` true ` ,在 COPY INTO 过程中无效的 JSON 数据将被替换为空值。如果设置为 ` false ` (默认),COPY INTO 在遇到无效 JSON 数据时会失败。 | 可选 |
217
- | ON_ERROR | 决定如何处理包含错误的文件:'continue' 表示跳过并继续,'abort' 表示在错误时终止,'abort_N' 表示在错误行数 ≥ N 时终止。默认值为 'abort'。注意:'abort_N' 不适用于 Parquet 文件。 | 可选 |
218
- | MAX_FILES | 设置要加载的未加载文件的最大数量。该值可以设置为最多 15000;任何大于 15000 的值都将被视为 15000。 | 可选 |
219
- | RETURN_FAILED_ONLY | 当设置为 'True' 时,输出中仅包含加载失败的文件。默认值:` False ` 。 | 可选 |
211
+ | 参数 | 描述 | 是否必需 |
212
+ | --------------------- | ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | -------- |
213
+ | SIZE_LIMIT | 指定单次 COPY 语句加载的最大数据行数。默认为 ` 0 ` ,表示无限制。 | 可选 |
214
+ | PURGE | 如果设置为 ` True ` ,命令将在文件成功加载到表中后清除阶段中的文件。默认值:` False ` 。 | 可选 |
215
+ | FORCE | COPY INTO 默认通过自动跟踪并防止在默认 12 小时周期内重复加载文件来确保幂等性。可以使用 ` load_file_metadata_expire_hours ` 设置自定义文件元数据的过期时间。<br />此参数默认为 ` False ` ,表示 COPY INTO 在复制数据时会跳过重复文件。如果设置为 ` True ` ,则不会跳过重复文件。 | 可选 |
216
+ | DISABLE_VARIANT_CHECK | 如果设置为 ` true ` ,在 COPY INTO 过程中无效的 JSON 数据将被替换为空值。如果设置为 ` false ` (默认),COPY INTO 在遇到无效 JSON 数据时会失败。 | 可选 |
217
+ | ON_ERROR | 决定如何处理包含错误的文件:'continue' 表示跳过并继续,'abort' 表示在错误时终止,'abort_N' 表示在错误行数 ≥ N 时终止。默认值为 'abort'。注意:'abort_N' 不适用于 Parquet 文件。 | 可选 |
218
+ | MAX_FILES | 设置要加载的未加载文件的最大数量。该值可以设置为最多 15000;任何大于 15000 的值都将被视为 15000。 | 可选 |
219
+ | RETURN_FAILED_ONLY | 当设置为 'True' 时,输出中仅包含加载失败的文件。默认值:` False ` 。 | 可选 |
220
220
221
221
::: tip
222
222
在导入大量数据(如日志)时,建议将 ` PURGE ` 和 ` FORCE ` 都设置为 True。这样可以确保高效的数据导入,无需与 Meta 服务器交互(更新已复制文件集合)。但需要注意的是,这可能会导致重复数据导入。
@@ -226,7 +226,7 @@ copyOptions ::=
226
226
227
227
COPY INTO 提供数据加载结果的摘要,包含以下列:
228
228
229
- | 列 | 类型 | 可空性 | 描述 |
229
+ | 列 | 类型 | 可空性 | 描述 |
230
230
| ---------------- | ------- | ------ | -------------------------- |
231
231
| FILE | VARCHAR | 否 | 源文件的相对路径。 |
232
232
| ROWS_LOADED | INT | 否 | 从源文件加载的行数。 |
@@ -361,15 +361,6 @@ COPY INTO mytable
361
361
362
362
此示例从 IPFS 上的 CSV 文件加载数据:
363
363
364
- ``` sql
365
- COPY INTO mytable
366
- FROM ' ipfs://<hash>'
367
- FILE_FORMAT = (type = CSV);
368
- ```
369
-
370
- </TabItem >
371
- </Tabs >
372
-
373
364
``` sql
374
365
COPY INTO mytable
375
366
FROM ' ipfs://<your-ipfs-hash>'
@@ -611,4 +602,4 @@ SELECT * FROM t2;
611
602
│ 5 │ {" k" :" v" } │
612
603
│ 6 │ null │
613
604
└──────────────────────────────────────┘
614
- ```
605
+ ```
0 commit comments