当前位置： > 工具软件 > 浏览下载 > 文章内容

mycat分库查询(高攻低防cp)

http://www.itjxue.com 2023-02-24 10:10 来源:未知 点击次数:

分表分库与分区的区别及拆分策略

上一篇 MyCat实现读写分离与动态数据源切换

下一篇 MyCat的分片查询原理

b、UUID形式，缺点是不能排序

c、使用雪花算法或redis解决

Mycat 分片规则

在数据切分处理中，特别是水平切分中，中间件最终要的两个处理过程就是数据的切分、数据的聚合。选择合适的切分规则，至关重要，因为它决定了后续数据聚合的难易程度，甚至可以避免跨库的数据聚合处理。

避跨库 join 的很好的方式，但不是所有的业务场景都适合这样的规则，因此本文将讲述如何选择合适的切分规则。

如果业务中有些数据类似于数据字典，比如配置文件的配置，常用业务的配置或者数据量不大很少变动的表，这些表往往不是特别大，而且大部分的业务场景都会用到，那么这种表适合于 Mycat 全局表，无须对数据

进行切分，只要在所有的分片上保存一份数据即可， Mycat 在 Join 操作中，业务表与全局表进行 Join 聚合会优先选择相同分片内的全局表 join，避免跨库 Join，在进行数据插入操作时， mycat 将把数据分发到全局表对应的所有分片执行，在进行数据读取时候将会随机获取一个节点读取数据。

目前 Mycat 没有做全局表的数据一致性检查，后续版本 1.4 之后可能会提供全局表一致性检查，检查每个分片的数据一致性。

全局表的配置如下：

有一类业务，例如订单（order）跟订单明细（order_detail） ,明细表会依赖于订单，也就是说会存在表的主从关系，这类似业务的切分可以抽象出合适的切分规则，比如根据用户 ID 切分,其他相关的表都依赖于用户 ID，再或者根据订单 ID 切分，总之部分业务总会可以抽象出父子关系的表。这类表适用于 ER 分片表，子表的记录与所关联的父表记录存放在同一个数据分片上，避免数据 Join 跨库操作。

以 order 与 order_detail 例子为例， schema.xml 中定义如下的分片配置,order,order_detail 根据 order_id进行数据切分，保证相同 order_id 的数据分到同一个分片上，在进行数据插入操作时， Mycat 会获取 order 所在的分片，然后将 order_detail 也插入到 order 所在的分片。

有一类业务场景是 “主表 A+关系表+主表 B” ，举例来说就是商户会员+订单+商户，对应这类业务，如何切分？

从会员的角度，如果需要查询会员购买的订单，那按照会员进行切分即可，但是如果要查询商户当天售出的订单，那又需要按照商户做切分，可是如果既要按照会员又要按照商户切分，几乎是无法实现，这类业务如何选择切分规则非常难。目前还暂时无法很好支持这种模式下的 3 个表之间的关联。目前总的原则是需要从业务角度来看，关系表更偏向哪个表，即“A 的关系” 还是“B 的关系” ，来决定关系表跟从那个方向存储，未来 Mycat版本中将考虑将中间表进行双向复制，以实现从 A-关系表以及 B-关系表的双向关联查询如下图所示：

当你没人任何字段可以作为分片字段的时候，主键分片就是唯一选择，其优点是按照主键的查询最快，当采用自动增长的序列号作为主键时，还能比较均匀的将数据分片在不同的节点上。

若有某个合适的业务字段比较合适作为分片字段，则建议采用此业务字段分片，选择分片字段的条件如下：

对于非主键分片的 table，填写属性 primaryKey，此时 MyCAT 会将你根据主键查询的 SQL 语句的第一次执行结果进行分析，确定该 Table 的某个主键在什么分片上，并进行主键到分片 ID 的缓存。第二次或后续查询

mycat 会优先从缓存中查询是否有 id–node 即主键到分片的映射，如果有直接查询，通过此种方法提高了非主键分片的查询性能。

通过在配置文件中配置可能的枚举 id，自己配置分片，本规则适用于特定的场景，比如有些业务需要按照省份或区县来做保存，而全国省份区县固定的，这类业务使用本条规则，配置如下：

上面 columns 标识将要分片的表字段， algorithm 分片函数，

其中分片函数配置中， mapFile 标识配置文件名称， type 默认值为 0， 0 表示 Integer，非零表示 String；

所有的节点配置都是从 0 开始， 0 代表节点 1：

本条规则类似于十进制的求模运算，区别在于是二进制的操作,是取 id 的二进制低 10 位，即 id 二进制1111111111 。

此算法的优点在于如果按照 10 进制取模运算，在连续插入 1 -10 时候 1 -10 会被分到 1 -10 个分片，增大了插入的事务控制难度，而此算法根据二进制则可能会分到连续的分片，减少插入事务事务控制难度。

配置说明：

上面 columns 标识将要分片的表字段， algorithm 分片函数，partitionCount 分片个数列表， partitionLength 分片范围列表

分区长度:默认为最大 2^n=1024 ,即最大支持 1024 分区

约束 :

count,length 两个数组的长度必须是一致的。

1024 = sum((count[i] length[i])). count 和 length 两个向量的点积恒等于 1024

用法例子：

如果需要平均分配设置：平均分为 4 分片， partitionCount partitionLength=1024

此分片适用于，提前规划好分片字段某个范围属于哪个分片，

配置说明：

上面 columns 标识将要分片的表字段，algorithm 分片函数，rang-long 函数中 mapFile 代表配置文件路径，defaultNode 超过范围后的默认节点。

所有的节点配置都是从 0 开始，及 0 代表节点 1 ，此配置非常简单，即预先制定可能的 id 范围到某个分片：

此规则为对分片字段求摸运算。

配置说明：

上面 columns 标识将要分片的表字段， algorithm 分片函数，

此种配置非常明确即根据 id 进行十进制求模预算，相比固定分片 hash，此种在批量插入时可能存在批量插入单事务插入多数据分片，增大事务一致性难度。

此规则为按天分片：

配置说明：

columns ：标识将要分片的表字段

algorithm ：分片函数

dateFormat ：日期格式

sBeginDate ：开始日期

sEndDate：结束日期

sPartionDay ：分区天数，即默认从开始日期算起，分隔 10 天一个分区

如果配置了 sEndDate 则代表数据达到了这个日期的分片后后循环从开始分片插入。

此种规则是取模运算与范围约束的结合，主要为了后续数据迁移做准备，即可以自主决定取模后数据的节点分布。

partition-pattern.txt内容如下：

配置说明：

上面 columns 标识将要分片的表字段， algorithm 分片函数，patternValue 即求模基数， defaoultNode默认节点，如果配置了默认，则不会按照求模运算；

mapFile 配置文件路径：

配置文件中， 1 -32 即代表 id%256 后分布的范围，如果在 1 -32 则在分区 1 ，其他类推，如果 id 非数据，则会分配在 defaoultNode 默认节点：

mycat同时操作多个mysql数据库

用户制作数据库的分库分表，Mycat软件压缩包，加压后即可使用。

多数据库安装、mycat部署安装、数据库之读写分离主从复制、数据库之双主多重、数据库分库分表。

数据库集群的方式有多种，前面的介绍的一种是主从复制，读写分离，这一种方式在一般的系统已经够用了，但是对系统可用性要求很高的系统，这样是会有缺陷的，原因是：主只有一个，万一主挂了呢？那系统的所有读操作都将被中断，系统不能提供写服务，当重挂了，系统不同提高读服务，所以无论那一台数据库挂了，系统都会受到影响。对于高可用的系统，那是不行的，比如：电商系统等等。

leftjoin怎么拆成单表

分库分表

打开APP

ActionTech

关注

分布式 | Global 表 Left Join 拆分表实现原因探究原创

2020-06-29 16:53:37

ActionTech

码龄4年

关注

作者：郭奥门

爱可生 DBLE 研发成员，负责分布式数据库中间件的新功能开发，回答社区/客户/内部提出的一般性问题。

本文来源：原创投稿

*爱可生开源社区出品，原创内容未经授权不得随意使用，转载请联系小编并注明来源。

本文关键字：JOIN、原理解析、分库分表

问题

前几天，社区交流群一个小伙伴提出这样一个问题：

小伙伴说：全局表和分片表的左连接能否支持 – 目前测试 mycat 结果不对。

很显然是想要脱坑的 mycat 用户，急需找个替代品，主要的是他也找到了，哈哈哈。

场景重现

首先我们创建一个全局表和一个拆分表，各自设置两个分片节点，全局表在两个节点数据一致，拆分表 id=1、2 的在一个节点，id=5000001 的在另一个节点，其中 id=1 和 id=2 的只有 id 字段值不同、codecontent 字段值都一样。

mycat 场景重现

以上准备工作完成，接下来我们通过 a.id、b.code 将两张表左连接查询，结果如小伙伴所言：mycat 结果不对。

dble 场景重现

以上准备工作完成，接下来我们通过 a.id、b.code 将两张表左连接查询，结果如下所示；显而易见实际得到的结果符合预期想要的结果。

结果探究

根据以上使用 mycat 和 dble 进行 global left join 拆分表查询得到不同的结果，我们尝试着使用 explain 查看同一种类型的查询在执行计划上会有什么不同？

mycat 执行计划

根据上图执行计划，我们简单分析一下。

mycat 会将 sql 原封不动的交由分片配置的所有实例去执行，然后根据执行结果进行合并，这里合并只是简单的对结果进行累加，很显然这样的计划显示 mycat 内部处理逻辑是错误的。因为全局表在每个配置的节点都会存储相同的数据，如果将每个节点和拆分表 left join 的结果进行简单的 union all 合并，会造成数据的重复，不能保证数据的准确性。有些小伙伴可能猜想 union 不是会保证数据不重复吗？如果用 union 是否可行？同样分析一下。

上述结果仍然得不到我们想要的结果，因为 union 只是解决数据重复的问题，不适用于因为分片而导致的数据重复问题；试想一下，如果 DBLE 未来通过某种算法可以对各个节点的结果集做一个准确的合并，那么这样的问题也就迎刃而解，也会性能方面有个整体的提升。

实际上我们想象中的 X 算法还没有一个良好的实现和证明，但现在又要解决查询正确性的问题，那么 dble 是怎么做的呢？下面我们来看下 dble 的执行计划：

从上面执行计划来看，简单分析下流程：

dble 内部对于这种查询作出了一些区分：全局表只会下发一个实例，拆分表都会下发，然后针对结果做合并，这种处理逻辑肯定是没有错误的，只不过执行计划看起来相对复杂一些，这也代表在 dble 内部实现层面上下了不少功夫，但是这也是为了保证数据准确性而作出的一些牺牲吧。

文章知识点与官方知识档案匹配

云原生入门技能树首页概览

8118 人正在系统学习中

打开CSDN，阅读体验更佳

最新发布 clickhouse--join操作汇总【semi、anti、any、asof、global、colocate、cross】

clickhouse--join操作汇总【semi、anti、any、asof、global、colocate、cross】

继续访问

PHP与JSON的一些常用操作

PHP把数据写入JSON文件 ?php // 生成一个PHP数组 $data = array (); $data ["fruit"] = "apple" ; $data ["animal"] = "tiget"; // 把PHP数组转成JSON字符串,写入文件 $json_string = json_encode( $data ); ? PHP读取JSON数据? ?php // 从文件中读取数据到PHP变量 $str = file_get_contents ( 'one

继续访问

clickhouse的left join、any right join、any left join实验

drop table jiakai.testJoin1 CREATE TABLE jiakai.testJoin1( id String , b String ) ENGINE = MergeTree ORDER BY id SETTINGS index_granularity = 8192 CREATE TABLE jiakai.testJoin2( id String , b String ...

继续访问

记住left join最简单的方式

参考简单粗暴如下：表a aid adate 1 a1 2 a2 3 a3表b bid bdate 1 b1 2 b2 4 b4 select * from a left join b on a.aid = b.bid结果 1 a1 b1 2 a...

继续访问

mycat分片JOIN，分片规则

mycat 支持跨分片join，主要有四种方法： 1、全局表字典表（变动不频繁，数据量总体变化不大，数据规模不大很少超过10W条记录）可以做为全局表特性： 1）全局表的插入，更新操作会实时在所有节点上执行，保持各个分片的数据一致性 2）全局表查询只从一个节点获取 3）全局表可以和任何一个表进行JOIN操作配置：不用写rule规则，要在所有节点为执行DDL语句 2、ER

继续访问

clickhouse多表join和子查询的出现错误修复

1，因业务需要，需要对多张表进行join，但是进行子查询是出现问题，通过问题排查，发现在子查询需要把两张表的join进行别名处理。 1.1 错误代码如下： select a.dd,a.sourcetype ,count(distinct a.imei) pv ,countDistinct(a.imei) uv ,countDistinct(a.user_id) uv2 ,countDistinct(case when a.click='是' then a.imei end) pv_click ,cou

继续访问

mysql的join适合拆分_MySQL在LEFT JOIN查询中拆分左表以提高性能

我有以下的MySQL查询：SELECT pool.usernameFROM poolLEFT JOIN sent ON pool.username = sent.usernameAND sent.campid = 'YA1LGfh9'WHERE sent.username IS NULLAND pool.gender = 'f'AND (`location` = 'united states' O...

继续访问

ClickHouse查询分布式表LEFT JOIN改RIGHT JOIN的大坑

ClickHouse查询分布式表LEFT JOIN改RIGHT JOIN的大坑由一个慢查询衍生出的问题我们线上有一个ClickHouse集群, 总共6个服务器, 配置均为16C 64G SSD, 集群配置为三分片两副本有两个表这里称为small_table和big_table. 都是ReplicatedMergeTree引擎(三个分片两个副本). small_table有79w数据, big_table有5亿数据(数据在之后的示例中没有任何变化), 在下文中small_table和big_table都

继续访问

sqlserver leftjoin出现重复数据_分布式 | Global 表 Left Join 拆分表实现原因探究

作者：郭奥门爱可生 DBLE 研发成员，负责分布式数据库中间件的新功能开发，回答社区/客户/内部提出的一般性问题。本文来源：原创投稿*爱可生开源社区出品，原创内容未经授权不得随意使用，转载请联系小编并注明来源。本文关键字：JOIN、原理解析、分库分表问题前几天，社区交流群一个小伙伴提出这样一个问题：小伙伴说：全局表和分片表的左连接能否支持 -- 目前测试 Mycat 结果不对。很显然是想要脱坑的 ...

继续访问

ClickHouse sql优化技巧

1.使用分区 clickhouse的表，走索引和非索引效率差距很大，在使用一个表进行查询时，必须限制索引字段。避免扫描全表确定索引分区字段，可以用show create table default.ods_user，查看本地表的建表语句，partition by 的字段就是分区字段。如果需要限制的时间和分区字段不是同一个字段时，可以扩大分区字段取数区间，然后再过滤 2.distinct 和 group by 优先使用group by，distinct满足不了的情况，可以使用group by，如果c

继续访问

【ClickHouse系列】分布式下的IN/JOIN及GLOBAL关键字

分布式下的IN/JOIN 如果是在单机情况下，涉及到IN/JOIN时是没有什么问题的，但是在分布式情况下就不一样了，ClickHouse是支持多分片多副本的，创建表也提供了友好的ON CLUSTER [name]的方式，所以就是建议使用者将数据进行分片处理增加读的效率，但也随之产生了单节点数据不完整的问题。如果SQL中涉及子查询就不得不有特殊的处理方式。 ClickHouse中的分布式子查询在ClickHouse中为了方便做分布式查询，特意提供了Distributed表引擎，这个表引擎实际上是不存储数据的

继续访问

clickhouse SQL查询语句【译自Github 英文文档】

内容有缩减，原文请点击这里创建数据库CREATE DATABASE [IF NOT EXISTS] db_name创建表CREATE TABLE可以有几种形式。创建一张表，最好指定引擎结构CREATE [TEMPORARY] TABLE [IF NOT EXISTS] [db.]name [ON CLUSTER cluster] ( name1 [type1] [DEFAULT|MATER...

继续访问

Sql中Left Join、Right Join、Inner Join的区别

【原创】猿人谷2019-06-12 10:49:52 left join(左联接)：返回包括左表中的所有记录和右表中联结字段相等的记录 right join(右联接)：返回包括右表中的所有记录和左表中联结字段相等的记录 inner join(等值连接)：只返回两个表中联结字段相等的行举例如下：表A记录如下： aID　aNum 1　a2005011...

继续访问

ClickHouse Join篇

join： 1.Alter table mt drop partition '' 可删除本地分区集群表的分区需要依次删本地表 alter table dwd_dms_msg_detial_di drop partition ('201912','20191226') 2.join 减少列，临时表不能起别名，只能更改字段名避免冲突模糊不清 3.普通join数据发到远程服务器形成右表 gl...

继续访问

Clickhouse 分布式子查询——global in/join(慎用慎用)

@羲凡——只为了更好的活着 Clickhouse 分布式子查询——global in(慎用慎用) 不能一味的追求查询效率，将分布式子查询都改成global in，一定要结合业务逻辑假设：有一个分布式表，字段班级、姓名、年龄，ck集群有两个分片 class name age 102 EEE 10 102 GGG 10 103 DDD 8 103 BBB 9 103 AAA 10 103 CCC 10 103 GGG 11 1、建表语句 CREATE TABLE t

继续访问

【数据库】HIVE SQL -left join (on 和 where条件放置的区别)

在使用left join的过程中，总是遇到一个问题，就是将条件放在on中还是where条件中。在查过一些资料和实际操作后，总结了一下：在多张表连接时，都会生成一张中间表，然后再将这张临时表返回给用户。在用left join中，on和where条件的区别如下：（1）on条件是在生成中间表时使用的条件，它不管on中的条件是否为真，都会返回左表中的记录。...

继续访问

热门推荐数据库多表查询之 where和INNER JOIN

在多表查询中，一些SQL开发人员更喜欢使用WHER...

继续访问

Apache Doris和ClickHouse的深度分析

背景介绍Apache Doris是由百度贡献的开源MPP分析型数据库产品，亚秒级查询响应时间，支持实时数据分析；分布式架构简洁，易于运维，可以支持10PB以上的超大数据集；可以满足多种数据分析需求，例如固定历史报表，实时数据分析，交互式数据分析和探索式数据分析等。ClickHouse是俄罗斯的搜索公司Yandex开源的MPP架构的分析引擎，号称比事务数据库快100-100...

继续访问

SQL 多表查询之 where和INNER JOIN

SQL多表查询之 where和INNER JOIN【基础查询和效率分析】转载Michaelwubo最后发布于2018-07-05 10:40:47阅读数 18057收藏 -...

继续访问

JOIN

mycat 分库之后查询语句怎么写

cat是怎样实现分库分表的？

mycat里面通过定义路由规则来实现分片表（路由规则里面会定义分片字段，以及分片算法）。分片算法有多种，你所说的hash是其中一种，还有取模、按范围分片等等。在mycat里面，会对所有传递的sql语句做路由处理（路由处理的依据就是表是否分片，如果分片，那么需要依据分片字段和对应的分片算法来判断sql应该传递到哪一个、或者哪几个、又或者全部节点去执行）

2. mycat适用于哪些场景？相对于海量存储的Nosql的适用场景又如何？

数据量大到单机hold不住，而

(责任编辑：IT教学网)

复制链接发给好友收藏本文关闭此页

上一篇：深圳学平面设计培训(深圳平面设计培训学校排名)

下一篇：微信满屏表情代码大全Mi(微信满屏表情代码大全2021)

mycat分库查询(高攻低防cp)

分表分库与分区的区别及拆分策略

Mycat 分片规则

mycat同时操作多个mysql数据库

leftjoin怎么拆成单表

mycat 分库之后查询语句怎么写

(责任编辑：IT教学网)

相关浏览下载文章

阅读排行

专题教程

推荐浏览下载文章

最新更新浏览下载

mycat分库查询(高攻低防cp)

分表分库与分区的区别及拆分策略

Mycat 分片规则

mycat同时操作多个mysql数据库

leftjoin怎么拆成单表

mycat 分库 之后 查询语句怎么写

(责任编辑：IT教学网)

相关浏览下载文章

阅读排行

专题教程

推荐浏览下载文章

最新更新浏览下载

mycat 分库之后查询语句怎么写