|
1 | 1 | ---
|
2 |
| -title: Databend 社区版 |
| 2 | +title: Databend Community |
3 | 3 | sidebar_position: 4
|
4 | 4 | ---
|
5 | 5 |
|
6 | 6 | import Tabs from '@theme/Tabs';
|
7 | 7 | import TabItem from '@theme/TabItem';
|
8 | 8 |
|
9 |
| -Databend 是一个用 Rust 构建的开源、弹性且具有工作负载感知能力的云数仓,是 Snowflake 的经济高效替代方案。它专为世界上最大数据集的复杂分析而设计。 |
| 9 | +Databend 是一个开源、弹性且工作负载感知的云数据仓库(Data Warehouse),使用 Rust 构建,是 Snowflake 的经济高效替代方案。它专为分析世界上最大数据集而设计。 |
10 | 10 |
|
11 | 11 | <Tabs groupId="whydatabend">
|
12 | 12 | <TabItem value="Performance" label="性能">
|
13 | 13 |
|
14 |
| -- 在对象存储上实现极速数据分析。 |
15 |
| -- 利用数据级并行和指令级并行技术来实现[最佳性能](https://benchmark.clickhouse.com/)。 |
16 |
| -- 无需构建索引,无需手动调整,也无需确定分区或分片数据。 |
| 14 | +- 在对象存储上进行极速数据分析。 |
| 15 | +- 利用数据级并行和指令级并行技术实现[最佳性能](https://benchmark.clickhouse.com/)。 |
| 16 | +- 无需构建索引(Index),无需手动调优,无需确定分区(Partition)或分片数据。 |
17 | 17 |
|
18 | 18 | </TabItem>
|
19 | 19 |
|
20 | 20 | <TabItem value="Data Manipulation" label="数据操作">
|
21 | 21 |
|
22 |
| -- 支持原子操作,例如 `SELECT`、`INSERT`、`DELETE`、`UPDATE`、`REPLACE`、`COPY` 和 `MERGE`。 |
23 |
| -- 提供高级功能,例如时间回溯和多目录(Apache Hive / Apache Iceberg)。 |
24 |
| -- 支持以各种格式(如 CSV、JSON 和 Parquet)[摄取半结构化数据](/guides/load-data/load)。 |
25 |
| -- 支持半结构化数据类型,例如 [ARRAY、MAP 和 JSON](/sql/sql-reference/data-types/)。 |
26 |
| -- 支持类似 Git 的 MVCC 存储,以便轻松查询、克隆和恢复历史数据。 |
| 22 | +- 支持原子操作,如 `SELECT`、`INSERT`、`DELETE`、`UPDATE`、`REPLACE`、`COPY` 和 `MERGE`。 |
| 23 | +- 提供高级功能,如时间回溯(Time Travel)和多目录(Apache Hive / Apache Iceberg)。 |
| 24 | +- 支持[摄取半结构化数据](/guides/load-data/load),格式包括 CSV、JSON 和 Parquet。 |
| 25 | +- 支持半结构化数据类型,如 [ARRAY、MAP 和 JSON](/sql/sql-reference/data-types/)。 |
| 26 | +- 支持类似 Git 的 MVCC 存储,便于查询(Query)、克隆和恢复历史数据。 |
27 | 27 |
|
28 | 28 | </TabItem>
|
29 | 29 |
|
30 | 30 | <TabItem value="Object Storage" label="对象存储">
|
31 | 31 |
|
32 |
| -- 支持各种对象存储平台。单击[此处](../10-deploy/01-deploy/00-understanding-deployment-modes.md#supported-object-storage)查看支持平台的完整列表。 |
33 |
| -- 允许即时弹性,使用户能够根据其应用程序需求进行扩展或缩减。 |
| 32 | +- 支持各种对象存储平台。点击[这里](../10-deploy/01-deploy/00-understanding-deployment-modes.md#supported-object-storage)查看支持平台的完整列表。 |
| 33 | +- 允许即时弹性扩展,使用户能够根据应用需求进行扩容或缩容。 |
34 | 34 |
|
35 | 35 | </TabItem>
|
36 | 36 | </Tabs>
|
37 | 37 |
|
38 |
| -Databend 的高层架构由 `meta-service layer`、`query layer` 和 `storage layer` 组成。 |
| 38 | +Databend 的高级架构由`元服务层`、`查询层`和`存储层`组成。 |
39 | 39 |
|
40 | 40 | 
|
41 | 41 |
|
42 | 42 | <Tabs groupId="databendlay">
|
43 |
| -<TabItem value="Meta-Service Layer" label="Meta-Service Layer"> |
| 43 | +<TabItem value="Meta-Service Layer" label="元服务层"> |
44 | 44 |
|
45 |
| -Databend 通过其元服务层有效地支持多租户,该层在系统中起着至关重要的作用: |
| 45 | +Databend 通过其元服务层高效支持多租户,该层在系统中发挥关键作用: |
46 | 46 |
|
47 |
| -- **Metadata Management**:处理数据库、表、集群、事务等的元数据。 |
48 |
| -- **Security**:管理用户身份验证和授权,以确保安全的环境。 |
| 47 | +- **元数据管理**:处理数据库、表、集群、事务(Transaction)等的元数据。 |
| 48 | +- **安全性**:管理用户身份验证和授权,确保安全环境。 |
49 | 49 |
|
50 |
| -在 GitHub 上的 [meta](https://github.com/databendlabs/databend/tree/main/src/meta) 中了解有关元服务层的更多信息。 |
| 50 | +在 GitHub 的 [meta](https://github.com/databendlabs/databend/tree/main/src/meta) 中了解更多关于元服务层的信息。 |
51 | 51 |
|
52 | 52 | </TabItem>
|
53 |
| -<TabItem value="Query Layer" label="Query Layer"> |
| 53 | +<TabItem value="Query Layer" label="查询层"> |
54 | 54 |
|
55 | 55 | Databend 中的查询层处理查询计算,由多个集群组成,每个集群包含多个节点。
|
56 |
| -每个节点都是查询层中的核心单元,由以下部分组成: |
| 56 | +每个节点是查询层的核心单元,包括: |
57 | 57 |
|
58 |
| -- **Planner**:使用[关系代数](https://en.wikipedia.org/wiki/Relational_algebra)中的元素(包括 Projection、Filter 和 Limit 等运算符)为 SQL 语句制定执行计划。 |
59 |
| -- **Optimizer**:基于规则的优化器应用预定义的规则,例如“谓词下推”和“删除未使用的列”,以实现最佳查询执行。 |
60 |
| -- **Processors**:根据 planner 指令构建查询执行管道,遵循 Pull&Push 方法。处理器相互连接,形成一个可以跨节点分布的管道,以提高性能。 |
| 58 | +- **规划器**:使用[关系代数](https://en.wikipedia.org/wiki/Relational_algebra)元素为 SQL 语句开发执行计划,结合投影、过滤和限制等操作符。 |
| 59 | +- **优化器**:基于规则的查询优化器(Query Optimizer)应用预定义规则,如“谓词下推”和“未使用列的剪枝”,以实现最佳查询执行。 |
| 60 | +- **处理器**:根据规划器指令构建查询执行管道,遵循拉取和推送方法。处理器相互连接,形成可跨节点分布的管道以提高性能。 |
61 | 61 |
|
62 |
| -在 GitHub 上的 [query](https://github.com/databendlabs/databend/tree/main/src/query) 目录中了解有关查询层的更多信息。 |
| 62 | +在 GitHub 的 [query](https://github.com/databendlabs/databend/tree/main/src/query) 目录中了解更多关于查询层的信息。 |
63 | 63 |
|
64 | 64 | </TabItem>
|
65 |
| -<TabItem value="Storage Layer" label="Storage Layer"> |
| 65 | +<TabItem value="Storage Layer" label="存储层"> |
66 | 66 |
|
67 |
| -Databend 采用 Parquet(一种开源列式格式),并引入了自己的表格式以提高查询性能。主要功能包括: |
| 67 | +Databend 采用 Parquet(一种开源列式格式),并引入自己的表格式来提升查询性能。主要特性包括: |
68 | 68 |
|
69 |
| -- **Secondary Indexes**:加速跨各种分析维度的数据定位和访问。 |
| 69 | +- **二级索引**:加速跨各种分析维度的数据定位和访问。 |
| 70 | +- **复杂数据类型索引**:旨在加速复杂类型(如半结构化数据)的数据处理和分析。 |
| 71 | +- **段**:Databend 有效地将数据组织成段,提高数据管理和检索效率。 |
| 72 | +- **聚簇**:在段内采用用户定义的聚簇键(Cluster Key)来简化数据扫描。 |
70 | 73 |
|
71 |
| -- **Complex Data Type Indexes**:旨在加速复杂类型(如半结构化数据)的数据处理和分析。 |
72 |
| - |
73 |
| -- **Segments**:Databend 将数据有效地组织成段,从而提高数据管理和检索效率。 |
74 |
| - |
75 |
| -- **Clustering**:在段内采用用户定义的聚类键来简化数据扫描。 |
76 |
| - |
77 |
| -在 GitHub 上的 [storage](https://github.com/databendlabs/databend/tree/main/src/query/storages) 中了解有关存储层的更多信息。 |
| 74 | +在 GitHub 的 [storage](https://github.com/databendlabs/databend/tree/main/src/query/storages) 中了解更多关于存储层的信息。 |
78 | 75 |
|
79 | 76 | </TabItem>
|
80 | 77 | </Tabs>
|
0 commit comments