ClickHouse

刘超 昨天 ⋅ 980 阅读   编辑

  最近调研一下ch是否能满足我们的场景需求

一、官网

二、介绍

  1、MergeTree的关系与作用

二、问答

  1、新加入的节点,数据怎么自动均衡?

  社区的答复是两个方案,创建新集群,把数据copy过去,或把新加入的节点的权重设置大些。不知道今日头条或阿里他们怎么做的

  2、CK本身不能做到实时,如微秒,应该是准实时,如分钟级;CK小批量数据导入,会产生大量的小文件,导致merge压力大,但是如下想在CK中查询到该数据,那不得不小批量的数据导入,怎么衡量这个指标呢 100000万 or 60秒 

  3、维度表在clickhouse中是保证每台节点都存储一份完整的数据吗?或者是有什么其它方法保证在查询时自动分发到每台节点, 类似hive中的mapjoin?
    单独用个集群,一个分片,n个副本;global jion只是会把一部分中间结果全部拿到一个节点

  4、clickhouse里面的宽表,大家都设置索引吗,一般设置多少个比较合适


注意:本文归作者所有,未经作者允许,不得转载

全部评论: 0

    我有话说: