扫二维码与项目经理沟通
我们在微信上24小时期待你的声音
解答本文疑问/技术咨询/运营咨询/技术建议/互联网交流
环境:MySQL 5.6 主从环境(Keepalived架构)
创新互联是一家集网站建设,尼木企业网站建设,尼木品牌网站建设,网站定制,尼木网站建设报价,网络营销,网络优化,尼木网站推广为一体的创新建站企业,帮助传统企业提升企业形象加强企业竞争力。可充分满足这一群体相比中小企业更为丰富、高端、多元的互联网需求。同时我们时刻保持专业、时尚、前沿,时刻以成就客户成长自我,坚持不断学习、思考、沉淀、净化自己,让我们为更多的企业打造出实用型网站。
4000W行大表进行历史数据归档。
方案:为尽量降低对业务影响,决定采取下列方案。
1、在主库建立 2016、2017、2018、2019的4个历史表结构。
2、在从库建立test库,并建立 2016、2017、2018、2019的4个历史表结构,在从库的主表上用insert into语句根据时间字段把数据插入test库的2016、2017、2018、2019的历史表里面。分拆为2016、2017、2018、2019。
3、用Navicat把 2016、2017、2018、2019导出为SQL文件,并生成主表的DELETE语句的TXT文件。
4、用Python脚本把 SQL文件和 TXT文件进行处理,分批导入到 2016、2017、2018、2019的4个历史表,并删除主表的历史数据。
5、对主表进行收缩。
完成归档。
1、在主库建立历史表的表结构。
CREATE TABLE `upload_order_header_2016` (
`id` bigint(22) NOT NULL AUTO_INCREMENT COMMENT '自增id',
`company` varchar(25) DEFAULT NULL COMMENT '货主',
PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8
2、从库建立test库,同样建立 历史表的表结构。
在从库上用insert into语句把2016年的历史数据插入test库的2016年的历史表。
insert into test.upload_order_header_2016 select * from log_db.upload_order_header
where add_time < unix_timestamp('2017-01-01 00:00:00');
insert into test.upload_order_header_2017 select * from log_db.upload_order_header
where add_time >= unix_timestamp('2017-01-01 00:00:00') and
add_time < unix_timestamp('2018-01-01 00:00:00');
3、用 Navicat把 2016导出为SQL文件,举例:
导出的是纯insert的SQL脚本。
导出Delete语句:
4、使用Python脚本批量运行上述脚本。
先insert到目标主库的历史表里,再delete目标主库的历史数据。
Python脚本如下:
load_sql_v1.py:
# coding:utf8
"""
1、更新数据库配置
2、变更待执行文件文件名为SQL.sql
3、执行文件
"""
import pymysql
import time
DB_IP = "192.168.22.10"
DB_USER = "DBA"
DB_PWD = "XXXXXX"
DB_DATABASE = "log_db"
WaitTime = 10
FilePath = [
'2016.sql',
]
for file in FilePath:
f = open(file, mode='r')
print(file)
content=f.readlines()
# 打开数据库连接
db = pymysql.connect(DB_IP, DB_USER, DB_PWD, DB_DATABASE, charset='utf8')
# 使用cursor()方法获取操作游标
cursor = db.cursor()
# 使用execute方法执行SQL语句
cursor.execute("SELECT VERSION()")
# 使用 fetchone() 方法获取一条数据
data = cursor.fetchone()
print("Database version : %s " % data)
for index, sql in enumerate(content):
if index % 10000 == 0:
print('已执行 %d'%index)
if index % 20000 == 0:
time.sleep(WaitTime)
try:
# 执行sql语句
db.ping(reconnect=True)
cursor.execute(sql)
# 提交到数据库执行
db.commit()
except Exception as e:
# Rollback in case there is any error
print(sql)
print(e)
## db.rollback()
f.close()
# 关闭数据库连接
db.close()
5、对主表进行收缩。
用pt-osc工具做。
我们在微信上24小时期待你的声音
解答本文疑问/技术咨询/运营咨询/技术建议/互联网交流