爬虫文件存储-1：mysql

1.连接并创建数据库

import pymysql

db = pymysql.connect(host='localhost', user='root', password='root', port=3306)

cursor = db.cursor()

cursor.execute('SELECT VERSION()')

data = cursor.fetchone()

print('Database version:', data)

cursor.execute("CREATE DATABASE spiders DEFAULT CHARACTER SET utf8")

db.close()

执行结果：

Database version: ('5.7.23',)

结果是创建一个名为spiders的数据库

2.创建数据表

注意：这次连接数据库时需要指定创建数据表所在的数据库，也就是db参数的值

import pymysql

db = pymysql.connect(host='localhost', user='root', password='root', port=3306, db='spiders')

cursor = db.cursor()

sql = 'CREATE TABLE IF NOT EXISTS students (id VARCHAR(255) NOT NULL, name VARCHAR(255) NOT NULL, age INT NOT NULL, PRIMARY KEY (id))'

cursor.execute(sql)

db.close()

3.插入一条数据

import pymysql

db = pymysql.connect(host='localhost', user='root', password='root', port=3306, db='spiders')

cursor = db.cursor()

id = ''

user = 'Bob'

age = 20

sql = 'INSERT INTO students(id, name, age) values(%s, %s, %s)'

try:

    cursor.execute(sql, (id, user, age))

    db.commit()

except:

    db.rollback()

db.close()

通用写法：

这样一来，若是写入更多值的话直接给data字典增加数据就行了，就不用其他sql语句了，推荐使用

import pymysql

db = pymysql.connect(host='localhost', user='root', password='root', port=3306, db='spiders')

cursor = db.cursor()

table = 'students'

data = {

    'id': '',

    'name': 'Bob11',

    'age': 200

}

keys = ', '.join(data.keys())

values = ', '.join(['%s'] * len(data))

sql = 'INSERT INTO {table} ({keys}) VALUES ({values})'.format(table=table, keys=keys, values=values)

try:

    if cursor.execute(sql, tuple(data.values())):

        print('Successful')

        db.commit()

except:

    print('Failed')

    db.rollback()

db.close()

4.更新数据

import pymysql

db = pymysql.connect(host='localhost', user='root', password='root', port=3306, db='spiders')

cursor = db.cursor()

sql = 'UPDATE students SET age = %s WHERE name = %s'

try:

   cursor.execute(sql, (25, 'Bob'))

   db.commit()

except:

   db.rollback()

db.close()

通用写法：

根据主键进行判断，若主键存在则更新，若不存在则插入，推荐使用

import pymysql

db = pymysql.connect(host='localhost', user='root', password='root', port=3306, db='spiders')

cursor = db.cursor()

table = 'students'

data = {

    'id': '',

    'name': 'Bob',

    'age': 21

}

keys = ', '.join(data.keys())

values = ', '.join(['%s'] * len(data))

sql = 'INSERT INTO {table}({keys}) VALUES ({values}) ON DUPLICATE KEY UPDATE'.format(table=table, keys=keys,

                                                                                     values=values)

update = ','.join([" {key} = %s".format(key=key) for key in data])

sql += update

try:

    if cursor.execute(sql, tuple(data.values()) * 2):

        print('Successful')

        db.commit()

except:

    print('Failed')

    db.rollback()

db.close()

5.删除数据

import pymysql

db = pymysql.connect(host='localhost', user='root', password='root', port=3306, db='spiders')

cursor = db.cursor()

table = 'students'

condition = 'age > 20'

sql = 'DELETE FROM  {table} WHERE {condition}'.format(table=table, condition=condition)

try:

    cursor.execute(sql)

    db.commit()

except:

    db.rollback()

db.close()

6.查询数据

import pymysql

db = pymysql.connect(host='localhost', user='root', password='root', port=3306, db='spiders')

cursor = db.cursor()

sql = 'SELECT * FROM students WHERE age >= 20'

try:

    cursor.execute(sql)

    print('Count:', cursor.rowcount)

    row = cursor.fetchone()

    while row:

        print('Row:', row)

        row = cursor.fetchone()

except:

    print('Error')

爬虫文件存储-1：mysql的更多相关文章

爬虫文件存储:txt文档，json文件，csv文件
5.1 文件存储文件存储形式可以是多种多样的,比如可以保存成 TXT 纯文本形式,也可以保存为 Json 格式.CSV 格式等,本节我们来了解下文本文件的存储方式. 5.1.1 TXT文本存储将数 ...
爬虫—文件存储—CSV存储
一,简介 CSV,全称Comma—Separated Values,可以称为逗号分隔或者字符分隔值,其文件以纯文本形式存储表格数据.该文件是一个字符序列,可以有任意的数目记录组成,记录间已某种换行符分 ...
Java读取文件存储到mysql
写了一批Lua脚本,要放到数据库里面,调用的时候进行计算,由于有太多lua脚本,就写了个程序来录入. 下面主要分三个部分: public static String readToString(Stri ...
爬虫文件存储-3：Redis
前提条件: 安装并运行redis服务端程序,安装RedisPy库说明:Redis 是 StrictRedis 的子类,它的主要功能是用于向后兼容旧版本库里的几个方法,官方推荐使用 StrictRed ...
爬虫文件存储-2：MongoDB
1.连接MongoDB 连接 MongoDB 我们需要使用 PyMongo 库里面的 MongoClient,一般来说传入 MongoDB 的 IP 及端口即可,第一个参数为地址 host,第二个参数 ...
【网络爬虫入门05】分布式文件存储数据库MongoDB的基本操作与爬虫应用
[网络爬虫入门05]分布式文件存储数据库MongoDB的基本操作与爬虫应用广东职业技术学院欧浩源 1.引言网络爬虫往往需要将大量的数据存储到数据库中,常用的有MySQL.MongoDB和Red ...
爬虫系列：使用 MySQL 存储数据
上一篇文章我们讲解了爬虫如何存储 CSV 文件,这篇文章,我们讲解如何将采集到的数据保存到 MySQL 数据库中. MySQL 是目前最受欢迎的开源关系型数据库管理系统.一个开源项目具有如此之竞争力实 ...
MySQL的数据文件存储
MySQL的数据文件存储 MyISAM引擎分为:静态.动态和压缩MyISAM三种: 静态MyISAM:如果数据表中的各数据列的长度都是预先固定好的,服务器将自动选择这种表类型.因为数据表中每一条记录所 ...
Python3编写网络爬虫10-数据存储方式三-CSV文件存储
3.CSV文件存储 CSV 全称 Comma-Separated Values 中文叫做逗号分隔值或者字符分隔值,文件以纯文本形式存储表格数据.文件是一个字符序列可以由任意数目的记录组成相当于一个结 ...

随机推荐

Android资源文件命名规范
在复杂Android应用的开发中,资源文件的规范命名非常重要,能帮助设计人员和开发人员减小沟通成本.资源的名字尽量力求准确,可以适当长一些,但换回的价值是值得的. 关于WCC的Android开发,资源 ...
Codeforces Round #273 (Div. 2) B . Random Teams 贪心
B. Random Teams n participants of the competition were split into m teams in some manner so that e ...
8.30 "我什么都不会"
/* 抢名额第一场 GG "我什么都不会阿" 这场磕死在E题了按说应该能想到费马小定理毕竟p is a prime 别的队都过了大家都比较熟悉的就只有这一个然后还有I题一开 ...
备忘录模式之C++实现
说明:本文仅供学习交流.转载请标明出处,欢迎转载. 备忘录模式是一种比較简单的设计模式.该模式非常好地体现了一种面向对象的封装思想. 该模式的思想是用一个专门的备份类将当前的状态信息保存起来.在整个 ...
[python基础] python生成wordcloud并保存
1.核心包 #jieba.pandas用来处理数据,数据源以xls格式存储的,这里用pandas进行处理import jieba from jieba import analyse import pa ...
JSP-Runoob：JSP 调试
ylbtech-JSP-Runoob:JSP 调试 1.返回顶部 1. JSP 调试要测试/调试一个JSP或servlet程序总是那么的难.JSP和Servlets程序趋向于牵涉到大量客户端/服务器 ...
fprintf与stderr、stdout的使用
#include <stdio.h> void main() { fprintf(stderr,"soyo8888!"); fprintf(stdout,"s ...
hadoop-Combiner作用用法
文章来源http://blog.csdn.net/ipolaris/article/details/8723782 reduce的输入每个key所对应的value将是一大串1,但处理的文本很多时,这一 ...
B. Mashmokh and ACM(dp)
http://codeforces.com/problemset/problem/414/B B. Mashmokh and ACM time limit per test 1 second memo ...
akka设计模式系列-Aggregate模式
所谓的Aggregate模式,其实就是聚合模式,跟masterWorker模式有点类似,但其出发点不同.masterWorker模式是指master向worker发送命令,worker完成某种业务逻辑 ...

爬虫文件存储-1：mysql

爬虫文件存储-1：mysql的更多相关文章

随机推荐

热门专题