scrapy 框架持久化存储的三个方法存入 mysql 文件 redis

这里就不做详细讲解了毕竟不是一句两句能说的清楚,所以我把代码和注释放到了这里谢谢!

import pymysql

from redis import Redis

# 写入mysql

class WangyiMysql(object):

    conn = None

    cursor = None

    def open_spider(self,spider):

        self.conn = pymysql.Connection(host='127.0.0.1',port=3306,user='root',password='',db='spider',charset='utf8')

        print(self.conn)

    def process_item(self, item, spider):

        sql = 'insert into news values ("%s","%s")'%(item['title'],item['content'])

        self.cursor = self.conn.cursor()

        try:

            self.cursor.execute(sql)

            self.conn.commit()

        except Exception as e:

            print(e)

            self.conn.rollback()

        return item

    def close_spider(self,spider):

        self.cursor.close()

        self.conn.close()

# 写入redis

class WangyiRedis(object):

    conn = None

    def open_spider(self,spider):

        self.conn = Redis(host='127.0.0.1',port=6379)

        print(self.conn)

    def process_item(self, item, spider):

        self.conn.lpush('news',item)

# 写入文件

class ChoutiproPipeline(object):

    #重写父类方法，该方法只会被执行一次

    fp = None

    def open_spider(self,spider):

        print('开始爬虫......')

        self.fp = open('chouti.txt','w',encoding='utf-8')

    #该方法调用后就可以接受爬虫类提交过来的item对象，且赋值给了item参数

    def process_item(self, item, spider):

        author = item['title']

        content = item['content']

        self.fp.write(author+':'+content+'\n')

        return item #将item传递给下一个即将被执行的管道类

    def close_spider(self,spider):

        # print('爬虫结束！')

        self.fp.close()

　　如果你要这三项同时执行的话,记得在setings 里面配置一下这个

    ITEM_PIPELINES = {

    'first_blod.pipelines.FirstBlodPipeline': ,

    'first_blod.pipelines.MysqlPileLine': ,
　　　# 记得写类名,哪个执行写哪个

}

scrapy 框架持久化存储的三个方法存入 mysql 文件 redis的更多相关文章

10 Scrapy框架持久化存储
一.基于终端指令的持久化存储保证parse方法中有可迭代类型对象(通常为列表or字典)的返回,该返回值可以通过终端指令的形式写入指定格式的文件中进行持久化操作. 执行输出指定格式进行存储:将爬取到的 ...
11.scrapy框架持久化存储
今日概要基于终端指令的持久化存储基于管道的持久化存储今日详情 1.基于终端指令的持久化存储保证爬虫文件的parse方法中有可迭代类型对象(通常为列表or字典)的返回,该返回值可以通过终端指令的 ...
scrapy框架持久化存储
基于终端指令的持久化存储基于管道的持久化存储 1.基于终端指令的持久化存储保证爬虫文件的parse方法中有可迭代类型对象(通常为列表or字典)的返回,该返回值可以通过终端指令的形式写入指定格式的文 ...
11，scrapy框架持久化存储
今日总结基于终端指令的持久化存储基于管道的持久化存储今日详情 1.基于终端指令的持久化存储保证爬虫文件的parse方法中有可迭代类型对象(通常为列表or字典)的返回,该返回值可以通过终端指令的 ...
scrapy 框架持久化存储
1.基于终端的持久化存储保证爬虫文件的parse方法中有可迭代类型对象(通常为列表或字典)的返回,该返回值可以通过终端指令的形式写入指定格式的文件中进行持久化操作. # 执行输出指定格式进行存储:将 ...
Scarpy框架持久化存储
一.介绍持久化存储操作分为两类:磁盘文件和数据库. 而磁盘文件存储方式又分为:基于终端指令和基于管道二.基于终端指令的持久化存储 Scrapy是通过 scrapy 命令行工具进行控制的. 这里我们 ...
scrapy之持久化存储
scrapy之持久化存储 scrapy持久化存储一般有三种,分别是基于终端指令保存到磁盘本地,存储到MySQL,以及存储到Redis. 基于终端指令的持久化存储 scrapy crawl xxoo - ...
scrapy各种持久化存储的奇淫技巧
理论磁盘文件: 基于终端指令 1)保证parse方法返回一个可迭代类型的对象(存储解析到的页面内容) 2)使用终端指令完成数据存储到指定磁盘文件中的操作,如:scrapy crawl 爬虫文件名称 ...
三种方法查看MySQL数据库的版本
1.使用-V参数首先我们想到的肯定就是查看版本号的参数命令,参数为-V(大写字母)或者--version 使用方法: D:\xampp\mysql\bin>mysql -V 或者 D:\xam ...

随机推荐

apipost 调试微信公众号小程序，秒生成文档工具
1.将已经鉴权的公众号,小程序接口的 header头信息复制进来 2.设置文档展示字段
JavaWeb_(SpringMVC框架)测试SpringMVC&Spring&MyBatis三大整合
搭建 SpringMVC&Spring&MyBatis三大整合传送门 1.准备测试搭建S pringMVC&Spring&MyBatis三大整合用例 a)准备 ...
overflow妙用--去除默认滚动条，内容仍可滚动
在开发中我们往往要去除默认滚动条,但是其在竖直方向的滚动效果仍然需要. <div id="parent"> <div id="child"&g ...
tp5 回滚事务记录，其中一条语句报错，全部回滚
#################################### 测试事务 // 启动事务 Db::startTrans(); try { //插入行为表 $data = [ 'userId' ...
js闭包小实验
js闭包小实验一.总结一句话总结: 闭包中引用闭包外的变量会使他们常驻内存 function foo() { var i=0; return function () { console.log(i ...
KVM——以桥接的方式搭建虚拟机网络配置
以桥接的方式搭建虚拟机网络,其优势是可以将网络中的虚拟机看作是与主机同等地位的服务器. 在原本的局域网中有两台主机,一台是win7(IP: 192.168.0.236),一台是CentOS7(IP: ...
OpenStack 虚拟机热迁移流程图
目录文章目录目录源计算节点与目的计算节点之间的交互流程 Nova 和 Neutron 之间的交互流程源计算节点与目的计算节点之间的交互流程热迁移主要包括三个阶段: pre_live_migr ...
一百二十九：CMS系统之七牛云存储介绍和配置
将图片的存储.尺寸等图片本身的一些擦做,交给七牛云处理,自己只关注网站开发本身七牛云官网:https://www.qiniu.com 操作登录后,点击管理控制台点击对象存储-->新建存储空 ...
Java 实现 telnet命令验证主机端口的连通性
Java 实现 telnet命令验证主机端口的连通性 1.Telnet 命令 Telnet协议是TCP/IP协议族中的一员,是Internet远程登录服务的标准协议和主要方式.它为用户提供了在本地计 ...
manjar 搭建aria2c下载器
从添加或删除软件管理程序里安装 aria2. 在一个地方创建一个文本文件,名为「aria2.conf」 : rpc-user=我是用户名 rpc-passwd=我是密码 enable-rpc=tru ...

scrapy 框架持久化存储的三个方法 存入 mysql 文件 redis

scrapy 框架持久化存储的三个方法 存入 mysql 文件 redis的更多相关文章

随机推荐

热门专题

scrapy 框架持久化存储的三个方法存入 mysql 文件 redis

scrapy 框架持久化存储的三个方法存入 mysql 文件 redis的更多相关文章