博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
MySQL复制以及调优
阅读量:5047 次
发布时间:2019-06-12

本文共 2983 字,大约阅读时间需要 9 分钟。

原文:

一. 简介

MySQL自带复制方案,带来好处有:

数据备份。

负载均衡。
分布式数据。

概念介绍:

主机(master):被复制的数据库。

从机(slave):复制主机数据的数据库。

复制步骤:

(1). master记录更改的明细,存入到二进制日志(binary log)。
(2). master发送同步消息给slave。
(3). slave收到消息后,将master的二进制日志复制到本地的中继日志(relay log)。
(4). slave重现中继日志中的消息,从而改变数据库的数据。

下面放一张经典的图片来说明这一过程:

复制原理图

二. 实现复制

实现复制有以下步骤:

1.设置MySQL主库的二进制日志以及server-id

MySQL配置文件一般存放在/etc/my.cnf

# 在[mysqld]下面添加配置选项[mysqld]server-id=1log-bin=mysql-bin.log

server-id是数据库在整个数据库集群中的唯一标示,必须保持唯一。

重启MySQL。
注:如果MySQL配置文件中已经配置过此文件,则可以跳过此步。

2.新建复制账号

在主库里面新建用于从库复制主库数据的账号,并授予复制权限。

mysql> GRANT REPLICATION SLAVE, REPLICATION CLIENT ON *.* TO user_name@'host' IDENTIFIED BY 'password';

3.设置MySQL主库server-id

和第二步配置一样,要注意的地方有两点:

  1. 如果不需要从库作为别的从库的主库的话,则不需要配置二进制日志。
  2. 很多时候复制并不需要复制主库的全部数据库(特别是mysql的信息配置库)。因此可以配置replicate_do_db来指定复制的数据库

4.从库初始化主库的数据

如果数据量不算大的情况下,可以使用mysqldump工具导出主库数据,然后导入到从库里面。

mysqldump --single-transaction --triggers --master-data databasename > data.sql

如果数据量大的情况下应该使用Xtrabackup去进行数据库的导出,此处不做介绍。

可能会有同学问,为什么不直接使用二进制日志进行初始化呢?

  1. 如果我们主库运行了比较长的一段时间,并不太适合使用从库根据二进制日志进行复制数据,直接使用二进制日志去初始化从库会比较耗费时间和性能。
  2. 更多的情况下,主库的二进制日志的配置项没有打开,因此也就不存在以前操作的二进制日志。

5.开启复制

从库执行下面命令

mysql> CHANGE MASTER TO MASTER_HOST='host',-> MASTER_USER='user',-> MASTER_PASSWORD='password',-> MASTER_LOG_FILE='mysql-bin.000001',-> MASTER_LOG_POS=0;

注意最后的两个命令:MASTER_LOG_FILE和MASTER_LOG_POS,表示从库的从哪个二进制文件开始读取,偏移量从那里开始,这两个参数可以从我们导入的SQL里面找到。

导入注意

开启复制

start slave;

这时候就完成了复制,在主库更新一个数据或者新增数据在从库都可以查询到结果。

查看复制
在主库上也可以查询的到复制线程的状态。
线程状态

三. 复制的日志格式

MySQL复制的日志格式有三种,根据主库存放数据的方式不同有以下三种:

复制方式 特点 优点 缺点
row 基于行的格式复制,记录需要修改的每行的数据信息。 如果一个SQL修改了2w行的数据,那么就会记录2w行的日志格式 保证了数据的强一致性,且由于记录的是执行后的结果,在从库上执行还原也会比较快 日志记录数量很多,主从之间的传输需要更多的时间。
statement 基于段的日志格式复制,也就是记录下更改的SQL记录,而不是更改的行的记录。 日志记录量最小。 对于一些输出结果不确定的函数,在从库上执行一遍很可能会出现问题,如uuid,从库根据日志还原主库数据的时候需要执行一遍SQL,时间相对较慢。
mixed 混合上面两种日志格式记录记录日志,至于什么时候使用哪种日志方式由MySQL本身决定。 可以平衡上面两种日志格式的优缺点。

mysql5.7以前默认使用statement格式。

设置方式,可以在配置文件设置(首选):

binlog_format=ROW

或临时设置全局变量(当前mysql连接有效):

查看日志格式mysql > show variables like 'binlog_format';设置日志格式mysql > set binlog_format='row';

由于两个主从服务器一般都会放在同一个机房里面,两者之间同步的速度会会比较快,为保证强一致性,应该首选行的日志格式记录(row),保证传输素速度可以选择混合方式(mixed)。

而行的日志格式有下面三种记录方式:

记录方式 特点
minimal 只记录被修改列的数据
full 记录被修改的行的全部列的数据
noblob 特点同上,只是如果没有修改blob和text类型的列的情况下,不会记录这些列的数据(也就是大数据列)

mysql默认是full,最好修改成minimal。

binlog_row_image=minimal

四. 主从复制延迟

由于主库和从库之间不在同一个主机上,数据同步之间不可以避免地具有延迟,解决的方法有添加缓存,业务层的跳转等待,如果非得从数据库层面去减缓延迟问题,可以从复制时候的三大步骤(主库产生日志,主从传输日志,从库还原日志内容)入手:

1.主库写入到日志的速度
控制主库的事务大小,分割大事务为多个小事务。
如插入20w的数据,改成插入多次5000行(可以利用分页的思路)

2.二进制日志在主从之间传输时间

主从之间尽量在同一个机房或地域。
日志格式改用MIXED,且设置行的日志格式未minimal,原理详见上面的日志格式介绍。

3.减少从库还原日志的时间

在MySQL5.7版本后可以利用逻辑时钟方式分配SQL多线程。
设置逻辑时钟:slave_parallel_type=‘logical_clock’;
设置复制线程个数:slave_parallel_workers=4;

五. 需要注意的地方

  1. 重启MySQL最好切换未MySQL用户再进行操作,不然文件启动后会有权限问题。
  2. 搭建好MySQL的环境后就设置好配置里的log-bin选项,这样以后如果数据库需要从库的复制,就不需要重启数据库,打断业务的进行。
  3. 需要打开主库的防火墙的对应的mysql端口。
  4. 由于从库同步主库的方式,监听主库发送的信息,而不是轮询,因此如果出现通信出现了故障,重新连接后如果主库没有进行数据更改的操作,从库不会同步数据,因此可以通过插入空事务的方式同步数据。

欢迎各位来我博客查看

posted on
2018-01-26 14:57 阅读(
...) 评论(
...)

转载于:https://www.cnblogs.com/lonelyxmas/p/8359553.html

你可能感兴趣的文章
k8s架构
查看>>
select 向上弹起
查看>>
mysql 多表管理修改
查看>>
group by order by
查看>>
POJ 3090 坐标系上的视线遮蔽问题
查看>>
常见的网站服务器架构有哪些?
查看>>
golang 基础知识3
查看>>
心率放大电路分析与仿真
查看>>
利用SETFACL来设置文件或文件夹的访问控制列表ACL
查看>>
当nagios监测http时,会报错“ HTTP WARNING: HTTP/1.1 403Forbidden ~~~“ 解决方案
查看>>
专业术语
查看>>
python自动华 (十五)
查看>>
字符串的encode与decode解决乱码问题
查看>>
static的理解
查看>>
摘要算法---hashlib模块下MD5和SHA的使用
查看>>
一个统计目录文件大小的php函数
查看>>
【自学】大话设计模式控制台
查看>>
拓扑排序的实现DFS
查看>>
买礼物
查看>>
判断链接的最终跳转地址
查看>>