1
1
---
2
- title : " TPC-H Benchmark: Databend Cloud vs. Snowflake"
3
- sidebar_label : " TPC-H SF100 Benchmark "
2
+ title : " TPC-H 基准测试: Databend Cloud vs. Snowflake"
3
+ sidebar_label : " TPC-H SF100 基准测试 "
4
4
---
5
5
6
- ## Quick Overview
6
+ ## 快速概览
7
7
8
8
### TPC-H
9
9
10
- The TPC-H benchmark 是一个用于评估决策支持系统的标准,专注于复杂查询和数据维护 。在此分析中,我们使用 TPC-H SF100( SF1 = 6 Million Rows) 数据集比较 Databend Cloud 和 Snowflake,该数据集包含 100GB 的数据和大约 6 亿行,涵盖 22 个查询。
10
+ TPC-H 基准测试是评估决策支持系统的标准,侧重于复杂的查询和数据维护 。在此分析中,我们使用 TPC-H SF100( SF1 = 6 百万行) 数据集比较 Databend Cloud 和 Snowflake,该数据集包含 100GB 的数据和大约 6 亿行,涵盖 22 个查询。
11
11
12
12
:::info Disclaimer
13
- The TPC Benchmark™ and TPC-H™ are trademarks of the Transaction Processing Performance Council ([ TPC] ( http://www.tpc.org ) ). Our benchmark, while inspired by TPC-H, is not directly comparable to official TPC-H results.
13
+ TPC Benchmark™ 和 TPC-H™ 是事务处理性能委员会 ([ TPC] ( http://www.tpc.org ) ) 的商标。我们的基准测试虽然受到 TPC-H 的启发,但与官方 TPC-H 结果不具有直接可比性。
14
14
:::
15
15
16
- ### Snowflake and Databend Cloud
16
+ ### Snowflake 和 Databend Cloud
17
17
18
- - ** [ Snowflake] ( https://www.snowflake.com ) ** : Snowflake 以其先进的功能而闻名,例如分离存储和计算 、按需扩展计算、数据共享和克隆功能。
18
+ - ** [ Snowflake] ( https://www.snowflake.com ) ** : Snowflake 以其先进的功能而闻名,例如存储和计算分离 、按需扩展计算、数据共享和克隆功能。
19
19
20
20
- ** [ Databend Cloud] ( https://www.databend.com ) ** : Databend Cloud 提供与 Snowflake [ 类似的功能] ( https://github.com/databendlabs/databend/issues/13059 ) ,作为一个云原生数仓,它也将存储与计算分离,并根据需要提供可扩展的计算。
21
- 它由开源 [ Databend project ] ( https://github.com/databendlabs/databend ) 开发而来,定位为 Snowflake 的一种现代 、经济高效的替代方案,尤其适用于大规模分析。
21
+ 它由开源 [ Databend 项目 ] ( https://github.com/databendlabs/databend ) 开发而来,定位于 Snowflake 的现代 、经济高效的替代方案,尤其适用于大规模分析。
22
22
23
- ## Performance and Cost Comparison
23
+ ## 性能和成本比较
24
24
25
- - ** Data Loading Costs ** : 与 Snowflake 相比,Databend 在数据加载方面实现了 ** 67% 的成本降低** 。
26
- - ** Query Execution Costs ** : Databend 在查询执行方面的成本比 Snowflake 大约 ** 低 60%** 。
25
+ - ** 数据加载成本 ** : 与 Snowflake 相比,Databend 在数据加载方面实现了 ** 67% 的成本降低** 。
26
+ - ** 查询执行成本 ** : Databend 的查询执行成本比 Snowflake 大约 ** 低 60%** 。
27
27
28
28
:::info Note
29
29
30
- 对于此 benchmark,没有应用特殊的 tuning 。Snowflake 和 Databend Cloud 都使用了它们的默认设置 。
30
+ 对于此基准测试,未应用任何特殊调整 。Snowflake 和 Databend Cloud 均使用其默认设置 。
31
31
请记住,** 不要只相信我们的话 - 我们鼓励您自己运行并验证这些结果。**
32
32
:::
33
33
34
- ### Data Loading Benchmark
34
+ ### 数据加载基准测试
35
35
36
36
![ Alt text] ( @site/static/img/documents/tpch1.png )
37
37
@@ -49,7 +49,7 @@ The TPC Benchmark™ and TPC-H™ are trademarks of the Transaction Processing P
49
49
| ** Total Cost** | ** $0.77** | ** $0.25** | |
50
50
| ** Storage Size** | ** 20.8GB** | ** 24.5GB** | |
51
51
52
- ### Query Benchmark: Cold Run
52
+ ### 查询基准测试:冷启动
53
53
54
54
![ Alt text] ( @site/static/img/documents/tpch2.png )
55
55
@@ -80,87 +80,87 @@ The TPC Benchmark™ and TPC-H™ are trademarks of the Transaction Processing P
80
80
| ** Total Time** | ** 207s** | ** 166s** |
81
81
| ** Total Cost** | ** $0.23** | ** $0.09** |
82
82
83
- ### Query Benchmark: Hot Run
83
+ ### 查询基准测试:热启动
84
84
85
85
![ Alt text] ( @site/static/img/documents/tpch3.png )
86
86
87
- | 查询 | Snowflake (总计 138 秒,成本 $0.15) | Databend Cloud (总计 124 秒,成本 $0.07) |
88
- | ---------- | ----------------------------------- | ---------------------------------------- |
89
- | TPC-H 1 | 8.934 | 7.568 |
90
- | TPC-H 2 | 3.018 | 3.125 |
91
- | TPC-H 3 | 6.089 | 5.234 |
92
- | TPC-H 4 | 4.914 | 3.392 |
93
- | TPC-H 5 | 5.800 | 4.857 |
94
- | TPC-H 6 | 0.891 | 2.142 |
95
- | TPC-H 7 | 5.381 | 4.389 |
96
- | TPC-H 8 | 5.724 | 5.887 |
97
- | TPC-H 9 | 10.283 | 9.621 |
98
- | TPC-H 10 | 10.368 | 8.524 |
99
- | TPC-H 11 | 1.165 | 1.364 |
100
- | TPC-H 12 | 7.052 | 5.352 |
101
- | TPC-H 13 | 12.829 | 6.180 |
102
- | TPC-H 14 | 3.288 | 2.725 |
103
- | TPC-H 15 | 3.475 | 2.748 |
104
- | TPC-H 16 | 4.094 | 1.124 |
105
- | TPC-H 17 | 4.203 | 13.757 |
106
- | TPC-H 18 | 18.583 | 11.630 |
107
- | TPC-H 19 | 3.888 | 7.881 |
108
- | TPC-H 20 | 6.379 | 5.797 |
109
- | TPC-H 21 | 10.287 | 9.806 |
110
- | TPC-H 22 | 1.573 | 1.122 |
111
- | ** 总时间** | ** 138 秒** | ** 124 秒** |
112
- | ** 总成本** | ** $0.15** | ** $0.07** |
87
+
88
+ | 查询 | Snowflake (总计 138s, 成本 $0.15) | Databend Cloud (总计 124s, 成本 $0.07) |
89
+ | -------------- | ---------------------------------- | --------------------------------------- |
90
+ | TPC-H 1 | 8.934 | 7.568 |
91
+ | TPC-H 2 | 3.018 | 3.125 |
92
+ | TPC-H 3 | 6.089 | 5.234 |
93
+ | TPC-H 4 | 4.914 | 3.392 |
94
+ | TPC-H 5 | 5.800 | 4.857 |
95
+ | TPC-H 6 | 0.891 | 2.142 |
96
+ | TPC-H 7 | 5.381 | 4.389 |
97
+ | TPC-H 8 | 5.724 | 5.887 |
98
+ | TPC-H 9 | 10.283 | 9.621 |
99
+ | TPC-H 10 | 10.368 | 8.524 |
100
+ | TPC-H 11 | 1.165 | 1.364 |
101
+ | TPC-H 12 | 7.052 | 5.352 |
102
+ | TPC-H 13 | 12.829 | 6.180 |
103
+ | TPC-H 14 | 3.288 | 2.725 |
104
+ | TPC-H 15 | 3.475 | 2.748 |
105
+ | TPC-H 16 | 4.094 | 1.124 |
106
+ | TPC-H 17 | 4.203 | 13.757 |
107
+ | TPC-H 18 | 18.583 | 11.630 |
108
+ | TPC-H 19 | 3.888 | 7.881 |
109
+ | TPC-H 20 | 6.379 | 5.797 |
110
+ | TPC-H 21 | 10.287 | 9.806 |
111
+ | TPC-H 22 | 1.573 | 1.122 |
112
+ | ** 总时间** | ** 138s** | ** 124s** |
113
+ | ** 总成本** | ** $0.15** | ** $0.07** |
113
114
114
115
## 重现基准测试
115
116
116
117
您可以按照以下步骤重现基准测试。
117
118
118
119
### 基准测试环境
119
120
120
- Snowflake 和 Databend Cloud 均在类似条件下进行了测试 :
121
+ Snowflake 和 Databend Cloud 均在相似条件下进行了测试 :
121
122
122
- | 参数 | Snowflake | Databend Cloud |
123
- | ------------ | ------------------------------------------------------------------- | ----------------------------------------- |
123
+ | 参数 | Snowflake | Databend Cloud |
124
+ | -------------- | ------------------------------------------------------------------- | ----------------------------------------- |
124
125
| 计算集群大小 | Small | Small |
125
- | vCPU | 16 | 16 |
126
- | 价格 | [ $4/小时] ( https://www.snowflake.com/en/data-cloud/pricing-options/ ) | [ $2/小时] ( https://www.databend.com/plan/ ) |
127
- | AWS 区域 | us-east-2 | us-east-2 |
128
- | 存储 | AWS S3 | AWS S3 |
126
+ | 价格 | [ $4/小时] ( https://www.snowflake.com/en/data-cloud/pricing-options/ ) | [ $2/小时] ( https://www.databend.com/plan/ ) |
127
+ | AWS 区域 | us-east-2 | us-east-2 |
128
+ | 存储 | AWS S3 | AWS S3 |
129
129
130
- - TPC-H SF100 数据集来自 [ Amazon Redshift] ( https://github.com/awslabs/amazon-redshift-utils/tree/master/src/CloudDataWarehouseBenchmark/Cloud-DWB-Derived-from-TPCH ) ,已加载到 Databend Cloud 和 Snowflake 中,未进行任何特定调整。
130
+ - TPC-H SF100 数据集来源于 [ Amazon Redshift] ( https://github.com/awslabs/amazon-redshift-utils/tree/master/src/CloudDataWarehouseBenchmark/Cloud-DWB-Derived-from-TPCH ) ,已加载到 Databend Cloud 和 Snowflake 中,未进行任何特定调整。
131
131
132
132
### 基准测试方法
133
133
134
- 我们对查询执行进行了冷热运行 :
134
+ 我们对查询执行进行了冷启动和热启动两种方式 :
135
135
136
136
1 . ** 冷启动** : 在执行查询之前,数仓被暂停并恢复。
137
- 2 . ** 热启动** : 数仓未暂停 ,使用本地磁盘缓存。
137
+ 2 . ** 热启动** : 数仓未被暂停 ,使用本地磁盘缓存。
138
138
139
139
### 前提条件
140
140
141
- - 拥有一个 [ Snowflake 帐户 ] ( https://singup.snowflake.com )
142
- - 创建一个 [ Databend Cloud 帐户 ] ( https://www.databend.com/apply/ ) 。
141
+ - 拥有一个 [ Snowflake 账户 ] ( https://singup.snowflake.com )
142
+ - 创建一个 [ Databend Cloud 账户 ] ( https://www.databend.com/apply/ ) 。
143
143
144
144
### 数据加载
145
145
146
146
1 . ** Snowflake 数据加载** :
147
147
148
- - 登录您的 [ Snowflake 帐户 ] ( https://app.snowflake.com/ ) 。
148
+ - 登录您的 [ Snowflake 账户 ] ( https://app.snowflake.com/ ) 。
149
149
- 创建与 TPC-H 模式对应的表。[ SQL 脚本] ( https://github.com/databendlabs/wizard/blob/b34cc686d2e43c3e3b0b3311eac5a50e8f68afc9/benchsb/sql/snow/setup.sql#L1-L84 ) 。
150
150
- 使用 ` COPY INTO ` 命令从 AWS S3 加载数据。[ SQL 脚本] ( https://github.com/databendlabs/wizard/blob/b34cc686d2e43c3e3b0b3311eac5a50e8f68afc9/benchsb/sql/snow/setup.sql#L87-L94 ) 。
151
151
152
152
2 . ** Databend Cloud 数据加载** :
153
- - 登录您的 [ Databend Cloud 帐户 ] ( https://app.databend.com ) 。
153
+ - 登录您的 [ Databend Cloud 账户 ] ( https://app.databend.com ) 。
154
154
- 按照 TPC-H 模式创建必要的表。[ SQL 脚本] ( https://github.com/databendlabs/wizard/blob/b34cc686d2e43c3e3b0b3311eac5a50e8f68afc9/benchsb/sql/bend/setup.sql#L1-L84 ) 。
155
155
- 使用类似于 Snowflake 的方法从 AWS S3 加载数据。[ SQL 脚本] ( https://github.com/databendlabs/wizard/blob/b34cc686d2e43c3e3b0b3311eac5a50e8f68afc9/benchsb/sql/bend/setup.sql#L87-L117 ) 。
156
156
157
157
### TPC-H 查询
158
158
159
159
1 . ** Snowflake 查询** :
160
160
161
- - 登录您的 [ Snowflake 帐户 ] ( https://app.snowflake.com/ ) 。
161
+ - 登录您的 [ Snowflake 账户 ] ( https://app.snowflake.com/ ) 。
162
162
- 运行 TPC-H 查询。[ SQL 脚本] ( https://github.com/databendlabs/wizard/blob/b34cc686d2e43c3e3b0b3311eac5a50e8f68afc9/benchsb/sql/snow/queries.sql ) 。
163
163
164
164
2 . ** Databend Cloud 查询** :
165
- - 登录您的 [ Databend Cloud 帐户 ] ( https://app.databend.com ) 。
166
- - 运行 TPC-H 查询。[ SQL 脚本] ( https://github.com/databendlabs/wizard/blob/b34cc686d2e43c3e3b0b3311eac5a50e8f68afc9/benchsb/sql/bend/queries.sql ) 。
165
+ - 登录您的 [ Databend Cloud 账户 ] ( https://app.databend.com ) 。
166
+ - 运行 TPC-H 查询。[ SQL 脚本] ( https://github.com/databendlabs/wizard/blob/b34cc686d2e43c3e3b0b3311eac5a50e8f68afc9/benchsb/sql/bend/queries.sql ) 。
0 commit comments