ReplacingMergeTree
该引擎和 [MergeTree] 的不同之处在于它会删除排序键值相同的重复项。
数据的去重只会在数据合并期间进行。合并会在后台一个不确定的时间进行,因此你无法预先作出计划。有一些数据可能仍未被处理。尽管你可以调用 OPTIMIZE
语句发起计划外的合并,但请不要依靠它,因为 OPTIMIZE
语句会引发对数据的大量读写。
因此,ReplacingMergeTree
适用于在后台清除重复的数据以节省空间,但是它不保证没有重复的数据出现。
建表
CREATE TABLE [IF NOT EXISTS] [db.]table_name [ON CLUSTER cluster]
(
name1 [type1] [DEFAULT|MATERIALIZED|ALIAS expr1],
name2 [type2] [DEFAULT|MATERIALIZED|ALIAS expr2],
...
) ENGINE = ReplacingMergeTree([ver])
[PARTITION BY expr]
[ORDER BY expr]
[SAMPLE BY expr]
[SETTINGS name=value, ...]
有关建表参数的描述,可参考 [创建表]。 ReplacingMergeTree 的参数
ver
— 版本列。类型为UInt*
,Date
或DateTime
。可选参数。 在数据合并的时候,ReplacingMergeTree
从所有具有相同排序键的行中选择一行留下:- 如果
ver
列未指定,保留最后一条。 - 如果
ver
列已指定,保留ver
值最大的版本。 子句
创建 ReplacingMergeTree
表时,需要使用与创建 MergeTree
表时相同的 [子句]。
已弃用的建表方法
注意
不要在新项目中使用该方法,可能的话,请将旧项目切换到上述方法。
CREATE TABLE [IF NOT EXISTS] [db.]table_name [ON CLUSTER cluster]
(
name1 [type1] [DEFAULT|MATERIALIZED|ALIAS expr1],
name2 [type2] [DEFAULT|MATERIALIZED|ALIAS expr2],
...
) ENGINE [=] ReplacingMergeTree(date-column [, sampling_expression], (primary, key), index_granularity, [ver])
除了 ver
的所有参数都与 MergeTree
中的含义相同。
ver
- 版本列。可选参数,有关说明,请参阅上文。 来源文章
文章列表
- ClickHouse表引擎-随机数生成
- ClickHouse表引擎-设置
- ClickHouse表引擎-视图
- ClickHouse表引擎-表引擎
- ClickHouse表引擎-自定义分区键
- ClickHouse表引擎-缓冲区
- ClickHouse表引擎-用于查询处理的外部数据
- ClickHouse表引擎-版本折叠MergeTree
- ClickHouse表引擎-日志引擎系列
- ClickHouse表引擎-文件(输入格式)
- ClickHouse表引擎-数据副本
- ClickHouse表引擎-折叠树
- ClickHouse表引擎-字典
- ClickHouse表引擎-合并
- ClickHouse表引擎-分布
- ClickHouse表引擎-内存表
- ClickHouse表引擎-关联表引擎
- ClickHouse表引擎-URL(URL,格式)
- ClickHouse表引擎-TinyLog
- ClickHouse表引擎-SummingMergeTree
- ClickHouse表引擎-StripeLog
- ClickHouse表引擎-ReplacingMergeTree
- ClickHouse表引擎-ODBC
- ClickHouse表引擎-Null
- ClickHouse表引擎-MySQL
- ClickHouse表引擎-MergeTree
- ClickHouse表引擎-MaterializedView
- ClickHouse表引擎-Log
- ClickHouse表引擎-Kafka
- ClickHouse表引擎-JDBC表引擎
- ClickHouse表引擎-HDFS
- ClickHouse表引擎-GraphiteMergeTree
- ClickHouse表引擎-AggregatingMergeTree