问题定位 | Peronca Xtrabackup 8.0近日踩坑总结 - xtrabackup 2.4和8.0区别
前言
近期在给 radondb/xenon
适配 percona xtrabackup 8.0时,遇到了一些问题,经过多日调研、尝试终于解决,特此分享。
版本信息:
Percona-Server 8.0.19-10
Percona-Xtrabackup 8.0.13
适配过程中遇到的坑
一、MySQL 8.0 + Semi-Sync + 持续写入数据期间执行重建后,change master to && start slave 报错:
Last_Error: Could not execute Write_rows event on table db1.t1; Duplicate entry '28646' for key 't1.PRIMARY', Error_code: 1062; handler error HA_ERR_FOUND_DUPP_KEY; the event's master log mysql-bin.000052, end_log_pos 437
二、MySQL 8.0 + Group Replication + 持续写入数据期间执行重建后,change master to && start group_replication 报错:
2020-08-21T14:51:09.977606+08:00 61 [System] [MY-010597] [Repl] 'CHANGE MASTER TO FOR CHANNEL 'group_replication_applier' executed'. Previous state master_host='<NULL>', master_port= 0, master_log_file='', master_log_pos= 4, master_bind=''. New state master_host='<NULL>', master_port= 0, master_log_file='', master_log_pos= 4, master_bind=''.
2020-08-21T14:51:09.987494+08:00 61 [ERROR] [MY-013124] [Repl] Slave SQL for channel 'group_replication_applier': Slave failed to initialize relay log info structure from the repository, Error_code: MY-013124
2020-08-21T14:51:09.987542+08:00 61 [ERROR] [MY-011534] [Repl] Plugin group_replication reported: 'Error while starting the group replication applier thread'
2020-08-21T14:51:09.987651+08:00 7 [ERROR] [MY-011669] [Repl] Plugin group_replication reported: 'Unable to initialize the Group Replication applier module.'
2020-08-21T14:51:09.987831+08:00 7 [ERROR] [MY-011735] [Repl] Plugin group_replication reported: '[GCS] The member is leaving a group without being on one.'
要解释这个问题,首先要弄清楚xtrabackup 2.4和8.0的区别。
xtrabackup 2.4和8.0区别
google查到xtrabackup 8.0与2.4版本行为有所不同:
- Xtrabackup 2.4 备份后生成的
xtrabackup_binlog_info
文件记录的 GTID 信息是准确的,但是备份恢复后show master status
显示的 GTID 是不准确的。- Xtrabackup 8.0 在备份只有 InnoDB 表的实例时,
xtrabackup_binlog_info
文件记录的 GTID 信息不一定是准确的,但是备份恢复后show master status
显示的 GTID 是准确的。- Xtrabackup 8.0 在备份有非 InnoDB 表格的实例时,
xtrabackup_binlog_info
文件记录的 GTID 信息是准确的,备份恢复后show master status
显示的 GTID 也是准确的。
之前研究过 xtrabackup 2.4 ,其过程大致如下:
- start backup
- copy ibdata1 / copy .ibd file
- excuted FTWRL
- backup non-InnoDB tables and files
- writing xtrabackup_binlog_info
- executed FLUSH NO_WRITE_TO_BINLOG ENGINE LOGS
- executed UNLOCK TABLES
- copying ib_buffer_pool
- completed OK!
问题1:xtrabackup 8.0 的执行过程是什么样?
首先,查看重建期间的general log
:
2020-08-26T16:20:18.136376+08:00 170 Query SET SESSION wait_timeout=2147483
2020-08-26T16:20:18.136439+08:00 170 Query SET SESSION autocommit=1
2020-08-26T16:20:18.136523+08:00 170 Query SET NAMES utf8
2020-08-26T16:20:18.136595+08:00 170 Query SHOW VARIABLES
2020-08-26T16:20:18.138840+08:00 170 Query SELECT COUNT(*) FROM information_schema.tables WHERE engine = 'MyISAM' OR engine = 'RocksDB'
2020-08-26T16:20:18.140203+08:00 170 Query SHOW ENGINES
2020-08-26T16:20:18.140407+08:00 170 Query SHOW ENGINE INNODB STATUS
2020-08-26T16:20:18.141570+08:00 170 Query SELECT PLUGIN_NAME, PLUGIN_LIBRARY FROM information_schema.plugins WHERE PLUGIN_STATUS = 'ACTIVE' AND PLUGIN_TYPE = 'KEYRING'
2020-08-26T16:20:18.142140+08:00 170 Query SELECT CONCAT(table_schema, '/', table_name), engine FROM information_schema.tables WHERE engine NOT IN ('MyISAM', 'InnoDB', 'CSV', 'MRG_MYISAM', 'ROCKSDB') AND table_schema NOT IN ( 'performance_schema', 'information_schema', 'mysql')
2020-08-26T16:20:18.209819+08:00 171 Query SET SESSION wait_timeout=2147483
2020-08-26T16:20:18.209879+08:00 171 Query SET SESSION autocommit=1
2020-08-26T16:20:18.209950+08:00 171 Query SET NAMES utf8
2020-08-26T16:20:18.210015+08:00 171 Query SHOW VARIABLES
2020-08-26T16:20:18.214030+08:00 170 Query SELECT T2.PATH, T2.NAME, T1.SPACE_TYPE FROM INFORMATION_SCHEMA.INNODB_TABLESPACES T1 JOIN INFORMATION_SCHEMA.INNODB_TABLESPACES_BRIEF T2 USING (SPACE) WHERE T1.SPACE_TYPE = 'Single' && T1.ROW_FORMAT != 'Undo'UNION SELECT T2.PATH, SUBSTRING_INDEX(SUBSTRING_INDEX(T2.PATH, '/', -1), '.', 1) NAME, T1.SPACE_TYPE FROM INFORMATION_SCHEMA .INNODB_TABLESPACES T1 JOIN INFORMATION_SCHEMA .INNODB_TABLESPACES_BRIEF T2 USING (SPACE) WHERE T1.SPACE_TYPE = 'General' && T1.ROW_FORMAT != 'Undo'
2020-08-26T16:20:19.533904+08:00 170 Query FLUSH NO_WRITE_TO_BINLOG BINARY LOGS
2020-08-26T16:20:19.543095+08:00 170 Query SELECT server_uuid, local, replication, storage_engines FROM performance_schema.log_status
2020-08-26T16:20:19.543418+08:00 170 Query SHOW VARIABLES
2020-08-26T16:20:19.545383+08:00 170 Query SHOW VARIABLES
2020-08-26T16:20:19.550641+08:00 170 Query FLUSH NO_WRITE_TO_BINLOG ENGINE LOGS
2020-08-26T16:20:20.556885+08:00 170 Query SELECT UUID()
2020-08-26T16:20:20.557118+08:00 170 Query SELECT VERSION()
可见,xtrabackup 8.0默认情况下大致过程如下:
- start backup
- copy .ibd file
- backup non-InnoDB tables and files
- executed FLUSH NO_WRITE_TO_BINLOG BINARY LOGS
- selecting LSN and binary log position from p_s.log_status
- copy last binlog file
- writing /mysql/backup/backup/binlog.index
- writing xtrabackup_binlog_info
- executing FLUSH NO_WRITE_TO_BINLOG ENGINE LOGS
- copy ib_buffer_pool
- completed OK!
注意: 当存在非InnoDB表时,xtrabackup 8.0会执行FTWRL。
从上述步骤可知,xtrabackup 8.0与2.4的步骤主要区别为:
当只存在InnoDB引擎的表时,不再执行FTWRL,而是通过 上述第5步(SELECT server_uuid, local, replication, storage_engines FROM performance_schema.log_status
)来获取LSN、binlog position、GTID 。
手册中对于表 log_status 的描述如下:
The
log_status
table provides information that enables an online backup tool to copy the required log files without locking those resources for the duration of the copy process.When the
log_status
table is queried, the server blocks logging and related administrative changes for just long enough to populate the table, then releases the resources. Thelog_status
table informs the online backup which point it should copy up to in the source's binary log andgtid_executed
record, and the relay log for each replication channel. It also provides relevant information for individual storage engines, such as the last log sequence number (LSN) and the LSN of the last checkpoint taken for theInnoDB
storage engine.
从上述手册描述可知,performance_schema.log_status
是MySQL 8.0提供给在线备份工具获取复制信息的表格,查询该表时,mysql server将阻止日志的记录和相关的更改来获取足够的时间以填充该表,然后释放资源。
log_status 表通知在线备份工具当前主库的 binlog 的位点和 gtid_executed 的值以及每个复制通道的 relay log。另外,它还提供了各个存储引擎的相关信息,比如,提供了 InnoDB 引擎使用的最后一个日志序列号(LSN)和最后一个检查点的 LSN。
performance_schema.log_status
表定义为:
-- Semi-Sync
mysql> select * from performance_schema.log_status\G
*************************** 1. row ***************************
SERVER_UUID: 6b437e80-e5d5-11ea-88e3-52549922fdbb
LOCAL: {"gtid_executed": "6b437e80-e5d5-11ea-88e3-52549922fdbb:1-201094", "binary_log_file": "mysql-bin.000079", "binary_log_position": 195}
REPLICATION: {"channels": []}
STORAGE_ENGINES: {"InnoDB": {"LSN": 23711425885, "LSN_checkpoint": 23711425885}}
1 row in set (0.00 sec)
-- Group Replication
mysql> select * from performance_schema.log_status\G
*************************** 1. row ***************************
SERVER_UUID: 7bd32480-e5d5-11ea-8f8a-525499cfbb7d
LOCAL: {"gtid_executed": "aaaaaaaa-aaaa-aaaa-aaaa-53ab6ea1210a:1-11", "binary_log_file": "mysql-bin.000003", "binary_log_position": 1274}
REPLICATION: {"channels": [{"channel_name": "group_replication_applier", "relay_log_file": "mysql-relay-bin-group_replication_applier.000004", "relay_log_position": 311, "relay_master_log_file": "", "exec_master_log_position": 0}, {"channel_name": "group_replication_recovery", "relay_log_file": "mysql-relay-bin-group_replication_recovery.000003", "relay_log_position": 151, "relay_master_log_file": "", "exec_master_log_position": 0}]}
STORAGE_ENGINES: {"InnoDB": {"LSN": 20257208, "LSN_checkpoint": 20257208}}
1 row in set (0.00 sec)
问题2:performance_schema.log_status
提供的信息是否准确呢?
当写入压力大时,该表中的binlog position与GTID信息不一致。
mysql> select * from performance_schema.log_status\G show master status;
*************************** 1. row ***************************
SERVER_UUID: 6b437e80-e5d5-11ea-88e3-52549922fdbb
LOCAL: {"gtid_executed": "6b437e80-e5d5-11ea-88e3-52549922fdbb:1-448709", "binary_log_file": "mysql-bin.000087", "binary_log_position": 341265185}
REPLICATION: {"channels": []}
STORAGE_ENGINES: {"InnoDB": {"LSN": 33797305275, "LSN_checkpoint": 33433316246}}
1 row in set (0.11 sec)
+------------------+-----------+--------------+------------------+-----------------------------------------------+
| File | Position | Binlog_Do_DB | Binlog_Ignore_DB | Executed_Gtid_Set |
+------------------+-----------+--------------+------------------+-----------------------------------------------+
| mysql-bin.000087 | 343317905 | | | 6b437e80-e5d5-11ea-88e3-52549922fdbb:1-448709 |
+------------------+-----------+--------------+------------------+-----------------------------------------------+
1 row in set (0.01 sec)
问题3:既然log_status中的binlog position不准确,为什么备份恢复后GTID并没有缺失,数据也没问题?
原因是xtrabackup 8.0在第4步FLUSH NO_WRITE_TO_BINLOG BINARY LOGS
之后,在第6步copy last binlog file
,这样备份恢复出的新实例在启动后不仅会读取 gtid_executed
表,还会读取拷贝的那个binlog文件来更新GTID。
$ mysqlbinlog -vv /data/mysql/mysql-bin.000096
/*!50530 SET @@SESSION.PSEUDO_SLAVE_MODE=1*/;
/*!50003 SET @OLD_COMPLETION_TYPE=@@COMPLETION_TYPE,COMPLETION_TYPE=0*/;
DELIMITER /*!*/;
# at 4
#200827 11:26:47 server id 575010000 end_log_pos 124 CRC32 0xb026e372 Start: binlog v 4, server v 8.0.19-10 created 200827 11:26:47
# Warning: this binlog is either in use or was not closed properly.
BINLOG '
9ydHXw/Q9EUieAAAAHwAAAABAAQAOC4wLjE5LTEwAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAEwANAAgAAAAABAAEAAAAYAAEGggAAAAICAgCAAAACgoKKioAEjQA
CgFy4yaw
'/*!*/;
# at 124
#200827 11:26:47 server id 575010000 end_log_pos 195 CRC32 0xad060415 Previous-GTIDs
# 6b437e80-e5d5-11ea-88e3-52549922fdbb:1-465503
SET @@SESSION.GTID_NEXT= 'AUTOMATIC' /* added by mysqlbinlog */ /*!*/;
DELIMITER ;
# End of log file
/*!50003 SET COMPLETION_TYPE=@OLD_COMPLETION_TYPE*/;
/*!50530 SET @@SESSION.PSEUDO_SLAVE_MODE=0*/;
问题定位
坑一:MySQL 8.0 + Semi-Sync 重建问题
xenon原有的重建逻辑是适配于MySQL 5.6、5.7的(重建过程中xenon进程存活),一直无问题:
- 禁用raft,将xenon状态设为LEARNER ;
- 如mysql进程存在,则stop mysql;
- 清空MySQL数据目录;
- 执行
xtrabackup --backup
以xbstream
方式获取对端数据;- 执行
xtrabackup --prepare
应用redo log;- 启动mysql;
- 执行
stop slave; reset slave all
;- 执行
reset master
,以xtrabackup_binlog_info
文件中的GTID为准设置gtid_purged
;- 启用raft,将xenon状态设为FOLLOWER或IDLE;
- 等待xenon自动
change master to
到主节点。- 执行
start slave
。
问题1:为什么在 MySQL 8.0 + Semi-Sync 组合下会出现 Duplicate entry ?
跟踪重建过程中的general log,发现在第6和第7步中间,也就是设置gtid_purged
之前凭空多出了 change master to
和 start slave
操作:
2020-08-24T21:55:22.817859+08:00 8 Query SET GLOBAL rpl_semi_sync_master_enabled=OFF
2020-08-24T21:55:22.818025+08:00 8 Query SET GLOBAL read_only = 1
2020-08-24T21:55:22.818143+08:00 8 Query SET GLOBAL super_read_only = 1
2020-08-24T21:55:22.818323+08:00 8 Query START SLAVE
2020-08-24T21:55:22.824449+08:00 8 Query STOP SLAVE
2020-08-24T21:55:22.824610+08:00 8 Query CHANGE MASTER TO MASTER_HOST = '192.168.0.3', MASTER_USER = 'qc_repl', MASTER_PASSWORD = <secret>, MASTER_PORT = 3306, MASTER_AUTO_POSITION = 1
2020-08-24T21:55:22.833710+08:00 8 Query START SLAVE
2020-08-24T21:55:22.935973+08:00 10 Query BEGIN
2020-08-24T21:55:22.936084+08:00 10 Query COMMIT /* implicit, from Xid_log_event */
......
2020-08-24T21:55:24.701711+08:00 10 Query BEGIN
2020-08-24T21:55:24.701901+08:00 10 Query COMMIT /* implicit, from Xid_log_event */
2020-08-24T21:55:24.816571+08:00 8 Query SET GLOBAL rpl_semi_sync_master_enabled=OFF
2020-08-24T21:55:24.816886+08:00 8 Query SET GLOBAL read_only = 1
2020-08-24T21:55:24.817177+08:00 8 Query SET GLOBAL super_read_only = 1
2020-08-24T21:55:24.817281+08:00 8 Query START SLAVE
2020-08-24T21:55:25.039581+08:00 10 Query BEGIN
2020-08-24T21:55:25.039749+08:00 10 Query COMMIT /* implicit, from Xid_log_event */
......
2020-08-24T21:55:25.152919+08:00 10 Query BEGIN
2020-08-24T21:55:25.153082+08:00 10 Query COMMIT /* implicit, from Xid_log_event */
2020-08-24T21:55:25.389776+08:00 8 Query STOP SLAVE
2020-08-24T21:55:25.392581+08:00 8 Query RESET SLAVE ALL
2020-08-24T21:55:25.407434+08:00 8 Query RESET MASTER
2020-08-24T21:55:25.417292+08:00 8 Query SET GLOBAL gtid_purged='6b437e80-e5d5-11ea-88e3-52549922fdbb:1-102610
'
2020-08-24T21:55:25.419835+08:00 8 Query START SLAVE
2020-08-24T21:55:25.427071+08:00 8 Query SET GLOBAL read_only = 1
2020-08-24T21:55:25.427178+08:00 8 Query SET GLOBAL super_read_only = 1
2020-08-24T21:55:25.427271+08:00 8 Query SET GLOBAL sync_binlog=1000
2020-08-24T21:55:25.427339+08:00 8 Query SET GLOBAL innodb_flush_log_at_trx_commit=1
2020-08-24T21:55:25.427423+08:00 8 Query SHOW SLAVE STATUS
2020-08-24T21:55:25.427600+08:00 8 Query SHOW MASTER STATUS
2020-08-24T21:55:26.817622+08:00 8 Query SET GLOBAL rpl_semi_sync_master_enabled=OFF
2020-08-24T21:55:26.817794+08:00 8 Query SET GLOBAL read_only = 1
2020-08-24T21:55:26.817897+08:00 8 Query SET GLOBAL super_read_only = 1
2020-08-24T21:55:26.817988+08:00 8 Query START SLAVE
2020-08-24T21:55:26.818381+08:00 8 Query SHOW SLAVE STATUS
2020-08-24T21:55:26.818570+08:00 8 Query SHOW MASTER STATUS
2020-08-24T21:55:26.818715+08:00 8 Query STOP SLAVE
2020-08-24T21:55:26.818823+08:00 8 Query CHANGE MASTER TO MASTER_HOST = '192.168.0.3', MASTER_USER = 'qc_repl', MASTER_PASSWORD = <secret>, MASTER_PORT = 3306, MASTER_AUTO_POSITION = 1
2020-08-24T21:55:26.832164+08:00 8 Query START SLAVE
这就是说在设置gtid_purged之前已经启用复制获取了一部分数据,那么 xtrabackup_binlog_info 中的内容就不再准确,之后设置的GTID与实际数据就不一致,实际的数据比设置的GTID要多,引起主键冲突。
问题2:为什么之前MySQL 5.6、5.7从没遇到过这个问题呢?
测试了很多次,发现在 MySQL 5.6 & 5.7 在set gtid_purged
前执行 change master to & start slave
后会报复制错误 Slave failed to initialize relay log info structure from the repository
,而在reset slave all; reset master、set gtid_purged
后再执行 change master to & start slave
就可以正常复制,数据无误。
问题3:xenon中哪块逻辑引起的额外的 change master to 和 start slave ?
问题根源在重建期间 xenon 会设为 LEARNER 角色,而该角色在探测到MySQL Alive后,会 change master 到主节点。正常来说,要等raft状态设为 FOLLOWER 后由 FOLLOWER 的监听线程 change master 到主节点。(代码见 pr104 、pr102 )
坑二:MySQL 8.0 + Group-Replication 重建后无法启动MGR
根据报错信息Slave failed to initialize relay log info structure from the repository
看,应该是xtrabackup重建后的数据目录保留了slave复制信息导致的,尝试在启动组复制前执行reset slave或reset slave all
即可解决。
总结
- Xtrabackup 2.4 备份后生成的
xtrabackup_binlog_info
文件记录的 GTID 信息是准确的,但是备份恢复后show master status
显示的 GTID 是不准确的。- Xtrabackup 8.0 在备份只有 InnoDB 表的实例时,
xtrabackup_binlog_info
文件记录的 GTID 信息不一定是准确的,但是备份恢复后show master status
显示的 GTID 是准确的。- Xtrabackup 8.0 在备份有非 InnoDB 表格的实例时,
xtrabackup_binlog_info
文件记录的 GTID 信息是准确的,备份恢复后show master status
显示的 GTID 也是准确的。- 使用 Xtrabackup 8.0 重建 Semi-Sync 集群节点后,无需执行
reset master & set gtid_purged
操作。- 使用 Xtrabackup 8.0 重建 Group-Replication 集群节点后,启动组复制前需要先执行
reset slave或reset slave all
清除slave信息,否则start group_replication
会失败。
专栏:
欢迎关注我的微信公众号【MySQL数据库技术】。
知乎 - 数据库技术 专栏: https://zhuanlan.zhihu.com/mysqldb
博客:
思否/segmentfault: https://segmentfault.com/u/dbtech
开源中国/oschina: https://my.oschina.net/dbtech
掘金: https://juejin.im/user/5e9d3ed251882538083fed1f/posts
博客园/cnblogs: https://www.cnblogs.com/dbtech
问题定位 | Peronca Xtrabackup 8.0近日踩坑总结 - xtrabackup 2.4和8.0区别的更多相关文章
- NET Core2.0 Memcached踩坑,基于EnyimMemcachedCore整理MemcachedHelper帮助类。
DotNetCore2.0下使用memcached缓存. Memcached目前微软暂未支持,暂只支持Redis,由于项目历史原因,先用博客园开源项目EnyimMemcachedCore,后续用到的时 ...
- 记一次Docker中部署Asp.Net Core 3.0的踩坑过程
最近公司打算重构目前直销报单系统到微信小程序中,目前的系统只能在PC上面使用,这两年也搞过App端,但是由于人员流动和公司架构调整最后都不了了之,只留下一堆写了一半的接口.以前的接口依然是使用Asp. ...
- 在IIS上部署 .Net Core 3.0 项目踩坑实录
在IIS上部署 .Net Core 3.0 项目的主要流程有: 安装并启用IIS 安装AspNetCoreModuleV2 添加.配置网站 设置应用程序池 通过VS发布 一.安装并启用IIS: 安装了 ...
- .net core 2.2.0 SOAP踩坑
首先确认下面几个程序集是最新版本: <PackageReference Include="System.ServiceModel.Http" Version="4. ...
- [置顶]
xamarin android toolbar(踩坑完全入门详解)
网上关于toolbar的教程有很多,很多新手,在使用toolbar的时候踩坑实在太多了,不好好总结一下,实在浪费.如果你想学习toolbar,你肯定会去去搜索androd toolbar,既然你能看到 ...
- Asp.Net Core 2.0 项目实战(5)Memcached踩坑,基于EnyimMemcachedCore整理MemcachedHelper帮助类。
Asp.Net Core 2.0 项目实战(1) NCMVC开源下载了 Asp.Net Core 2.0 项目实战(2)NCMVC一个基于Net Core2.0搭建的角色权限管理开发框架 Asp.Ne ...
- .NET Core 从1.1升级到2.0记录(Cookie中间件踩坑)
.NET Core 2.0 新时代 万众瞩目的.NET Core 2.0终于发布了,原定于9.19的dotnetconf大会的发布时间大大提前了1个月,.NET Core 2.0/.NET Stand ...
- manjaro xfce 18.0 踩坑记录
manjaro xfce 18.0 踩坑记录 1 简介1.1 Manjaro Linux1.2 开发桌面环境2 自动打开 NumLock3 系统快照3.1 安装timeshift3.2 使用times ...
- 用户数从 0 到亿,我的 K8s 踩坑血泪史
作者 | 平名 阿里服务端开发技术专家 导读:容器服务 Kubernetes 是目前炙手可热的云原生基础设施,作者过去一年上线了一个用户数极速增长的应用:该应用一个月内日活用户从零至四千万,用户数从零 ...
随机推荐
- PHP 循环 - While 循环
PHP 循环 - While 循环 循环执行代码块指定的次数,或者当指定的条件为真时循环执行代码块. PHP 循环 在您编写代码时,您经常需要让相同的代码块一次又一次地重复运行.我们可以在代码中使用循 ...
- 转载——完整的ASCII码表
完整的ASCII码表,转载自下面的博主: http://www.cnblogs.com/xmxu/archive/2012/07/10/2584032.html
- IntelliJ IDEA 修改内存大小,使得idea运行更流畅。(转发)
原文地址:https://blog.csdn.net/qq_27093465/article/details/81947933 idea有个配置文件,可以设置内存大小的,就跟咱的jvm的内存里面的堆大 ...
- sql developer连接mysql数据库
1 首先打开sql developer ,选择上方菜单,工具(tools)--->首选项,如下图 2 数据库(database)--->第三方 JDBC驱动程序 ; “添加条目”,选择m ...
- python1.3集合知识点:
#定义集合:{},集合是只有key没有value的字典,集合内元素不能重复!a={1,2,3,4,5,6}#列表转换成集合b=set([1,2,3,4,5])print(a,b) #集合对列表进行去重 ...
- 《笨办法学Python 3》python入门书籍推荐|附下载方式
<笨办法学Python 3>python入门书籍免费下载 内容简介 本书是一本Python入门书,适合对计算机了解不多,没有学过编程,但对编程感兴趣的读者学习使用.这本书以习题的方式引导读 ...
- python 正则表达式与JSON-正则表达式匹配数字、非数字、字符、非字符、贪婪模式、非贪婪模式、匹配次数指定等
1.正则表达式:目的是为了爬虫,是爬虫利器. 正则表达式是用来做字符串匹配的,比如检测是不是电话.是不是email.是不是ip地址之类的 2.JSON:外部数据交流的主流格式. 3.正则表达式的使用 ...
- 拓展欧几里得求 ax + by = c的通解(a >=0, b >= 0)
#include <iostream> #include <cstdio> #include <algorithm> #include <vector> ...
- 【模式识别与机器学习】——PCA与Kernel PCA介绍与对比
PCA与Kernel PCA介绍与对比 1. 理论介绍 PCA:是常用的提取数据的手段,其功能为提取主成分(主要信息),摒弃冗余信息(次要信息),从而得到压缩后的数据,实现维度的下降.其设想通过投影矩 ...
- java 增强for循环与泛型
一 增强for循环 增强for循环是JDK1.5以后出来的一个高级for循环,专门用来遍历数组和集合的.它的内部 原理其实是个Iterator迭代器,所以在遍历的过程中,不能对集合中的元素进行增删操作 ...