|
1 | 1 | ---
|
2 |
| -title: Databend Community |
| 2 | +title: Databend 社区 |
3 | 3 | sidebar_position: 4
|
4 | 4 | ---
|
5 | 5 |
|
6 | 6 | import Tabs from '@theme/Tabs';
|
7 | 7 | import TabItem from '@theme/TabItem';
|
8 | 8 |
|
9 |
| -Databend 是一个开源、弹性且工作负载感知的云数据仓库(Data Warehouse),使用 Rust 构建,是 Snowflake 的经济高效替代方案。它专为分析世界上最大数据集而设计。 |
| 9 | +Databend 是一个开源、弹性、工作负载感知的云原生数据仓库(Data Warehouse),使用 Rust 语言构建,旨在提供高性价比的 Snowflake 替代方案。它专为分析全球最大规模的数据集而设计。 |
10 | 10 |
|
11 | 11 | <Tabs groupId="whydatabend">
|
12 | 12 | <TabItem value="Performance" label="性能">
|
13 | 13 |
|
14 |
| -- 在对象存储上进行极速数据分析。 |
15 |
| -- 利用数据级并行和指令级并行技术实现[最佳性能](https://benchmark.clickhouse.com/)。 |
16 |
| -- 无需构建索引(Index),无需手动调优,无需确定分区(Partition)或分片数据。 |
| 14 | +- 在对象存储上实现极速数据分析 |
| 15 | +- 利用数据级并行和指令级并行技术实现[最佳性能](https://benchmark.clickhouse.com/) |
| 16 | +- 无需构建索引、手动调优或处理分区/分片 |
17 | 17 |
|
18 | 18 | </TabItem>
|
19 | 19 |
|
20 | 20 | <TabItem value="Data Manipulation" label="数据操作">
|
21 | 21 |
|
22 |
| -- 支持原子操作,如 `SELECT`、`INSERT`、`DELETE`、`UPDATE`、`REPLACE`、`COPY` 和 `MERGE`。 |
23 |
| -- 提供高级功能,如时间回溯(Time Travel)和多目录(Apache Hive / Apache Iceberg)。 |
24 |
| -- 支持[摄取半结构化数据](/guides/load-data/load),格式包括 CSV、JSON 和 Parquet。 |
25 |
| -- 支持半结构化数据类型,如 [ARRAY、MAP 和 JSON](/sql/sql-reference/data-types/)。 |
26 |
| -- 支持类似 Git 的 MVCC 存储,便于查询(Query)、克隆和恢复历史数据。 |
| 22 | +- 支持 `SELECT`、`INSERT`、`DELETE`、`UPDATE`、`REPLACE`、`COPY` 和 `MERGE` 等原子操作 |
| 23 | +- 提供时间回溯(Time Travel)和多目录(Apache Hive / Apache Iceberg)等高级功能 |
| 24 | +- 支持以 CSV、JSON 和 Parquet 格式[加载半结构化数据](/guides/load-data/load) |
| 25 | +- 支持 [ARRAY、MAP 和 JSON](/sql/sql-reference/data-types/) 等半结构化数据类型 |
| 26 | +- 支持类 Git 的 MVCC 存储,便于查询、克隆和恢复历史数据 |
27 | 27 |
|
28 | 28 | </TabItem>
|
29 | 29 |
|
30 | 30 | <TabItem value="Object Storage" label="对象存储">
|
31 | 31 |
|
32 |
| -- 支持各种对象存储平台。点击[这里](../10-deploy/01-deploy/00-understanding-deployment-modes.md#supported-object-storage)查看支持平台的完整列表。 |
33 |
| -- 允许即时弹性扩展,使用户能够根据应用需求进行扩容或缩容。 |
| 32 | +- 支持多种对象存储平台,点击[此处](../10-deploy/01-deploy/00-understanding-deployment-modes.md#supported-object-storage)查看完整列表 |
| 33 | +- 支持即时弹性伸缩,按需调整资源规模 |
34 | 34 |
|
35 | 35 | </TabItem>
|
36 | 36 | </Tabs>
|
37 | 37 |
|
38 |
| -Databend 的高级架构由`元服务层`、`查询层`和`存储层`组成。 |
| 38 | +Databend 的高层架构由 `meta-service layer`(元服务层)、`query layer`(查询层)和 `storage layer`(存储层)组成。 |
39 | 39 |
|
40 | 40 | 
|
41 | 41 |
|
42 | 42 | <Tabs groupId="databendlay">
|
43 |
| -<TabItem value="Meta-Service Layer" label="元服务层"> |
| 43 | +<TabItem value="Meta-Service Layer" label="元服务层(Meta-Service Layer)"> |
44 | 44 |
|
45 |
| -Databend 通过其元服务层高效支持多租户,该层在系统中发挥关键作用: |
| 45 | +Databend 通过元服务层高效支持多租户架构,该层在系统中承担关键职能: |
46 | 46 |
|
47 |
| -- **元数据管理**:处理数据库、表、集群、事务(Transaction)等的元数据。 |
48 |
| -- **安全性**:管理用户身份验证和授权,确保安全环境。 |
| 47 | +- **元数据管理**:处理数据库、表、集群、事务(Transaction)等元数据 |
| 48 | +- **安全性**:管理用户认证与授权,保障环境安全 |
49 | 49 |
|
50 |
| -在 GitHub 的 [meta](https://github.com/databendlabs/databend/tree/main/src/meta) 中了解更多关于元服务层的信息。 |
| 50 | +在 GitHub 的 [meta](https://github.com/databendlabs/databend/tree/main/src/meta) 目录中了解更多元服务层信息 |
51 | 51 |
|
52 | 52 | </TabItem>
|
53 |
| -<TabItem value="Query Layer" label="查询层"> |
| 53 | +<TabItem value="Query Layer" label="查询层(Query Layer)"> |
54 | 54 |
|
55 |
| -Databend 中的查询层处理查询计算,由多个集群组成,每个集群包含多个节点。 |
56 |
| -每个节点是查询层的核心单元,包括: |
| 55 | +查询层(Query Layer)负责处理查询计算,由多个集群组成,每个集群包含若干节点。每个节点作为核心计算单元包含: |
57 | 56 |
|
58 |
| -- **规划器**:使用[关系代数](https://en.wikipedia.org/wiki/Relational_algebra)元素为 SQL 语句开发执行计划,结合投影、过滤和限制等操作符。 |
59 |
| -- **优化器**:基于规则的查询优化器(Query Optimizer)应用预定义规则,如“谓词下推”和“未使用列的剪枝”,以实现最佳查询执行。 |
60 |
| -- **处理器**:根据规划器指令构建查询执行管道,遵循拉取和推送方法。处理器相互连接,形成可跨节点分布的管道以提高性能。 |
| 57 | +- **Planner(规划器)**:基于[关系代数](https://en.wikipedia.org/wiki/Relational_algebra)元素制定 SQL 执行计划,包含 Projection、Filter 和 Limit 等算子 |
| 58 | +- **Optimizer(优化器)**:应用"谓词下推"和"未使用列裁剪"等预定义规则的基于规则优化器 |
| 59 | +- **Processors(处理器)**:按 Pull&Push 模式构建分布式查询执行 Pipeline(流水线) |
61 | 60 |
|
62 |
| -在 GitHub 的 [query](https://github.com/databendlabs/databend/tree/main/src/query) 目录中了解更多关于查询层的信息。 |
| 61 | +在 GitHub 的 [query](https://github.com/databendlabs/databend/tree/main/src/query) 目录中了解更多查询层(Query Layer)信息 |
63 | 62 |
|
64 | 63 | </TabItem>
|
65 |
| -<TabItem value="Storage Layer" label="存储层"> |
| 64 | +<TabItem value="Storage Layer" label="存储层(Storage Layer)"> |
66 | 65 |
|
67 |
| -Databend 采用 Parquet(一种开源列式格式),并引入自己的表格式来提升查询性能。主要特性包括: |
| 66 | +Databend 采用 Parquet 列式存储格式并引入专属表格式提升性能,关键特性包括: |
68 | 67 |
|
69 |
| -- **二级索引**:加速跨各种分析维度的数据定位和访问。 |
70 |
| -- **复杂数据类型索引**:旨在加速复杂类型(如半结构化数据)的数据处理和分析。 |
71 |
| -- **段**:Databend 有效地将数据组织成段,提高数据管理和检索效率。 |
72 |
| -- **聚簇**:在段内采用用户定义的聚簇键(Cluster Key)来简化数据扫描。 |
| 68 | +- **二级索引**:加速多维度数据定位与访问 |
| 69 | +- **复杂数据类型索引**:优化半结构化数据处理效率 |
| 70 | +- **Segments(段)**:高效数据组织单元 |
| 71 | +- **聚簇(Clustering)**:通过用户定义聚簇键(Cluster Key)优化数据扫描 |
73 | 72 |
|
74 |
| -在 GitHub 的 [storage](https://github.com/databendlabs/databend/tree/main/src/query/storages) 中了解更多关于存储层的信息。 |
| 73 | +在 GitHub 的 [storage](https://github.com/databendlabs/databend/tree/main/src/query/storages) 目录中了解更多存储层(Storage Layer)信息 |
75 | 74 |
|
76 | 75 | </TabItem>
|
77 |
| -</Tabs> |
| 76 | +</Tabs> |
0 commit comments