1. 需要安装这个
  1. pymysql
  1. 写法还是很简单的
  2.  
  3. # -*- coding: utf-8 -*-
  4.  
  5. # Define your item pipelines here
  6. #
  7. # Don't forget to add your pipeline to the ITEM_PIPELINES setting
  8. # See: https://doc.scrapy.org/en/latest/topics/item-pipeline.html
  9. import pymysql
  10. import douban.settings as settings
  11.  
  12. class DoubanPipeline(object):
  13. def __init__(self):
  14. # 连接数据库
  15. self.connect = pymysql.connect(
  16. host=settings.MYSQL_HOST,
  17. db=settings.MYSQL_DBNAME,
  18. user=settings.MYSQL_USER,
  19. passwd=settings.MYSQL_PASSWD,
  20. charset='utf8',
  21. use_unicode=True)
  22. # 通过cursor执行增删查改
  23. self.cursor = self.connect.cursor();
  24. def process_item(self, item, spider):
  25. #数据库的操作
  26. try:
  27. # 插入数据
  28. self.cursor.execute(
  29. """insert into course(name,teacher, content, comment )
  30. value (%s, %s, %s, %s)""",
  31. ( item['bookName'],
  32. item['author'],
  33. item['score'],
  34. item['comment']))
  35. # 提交sql语句
  36. self.connect.commit()
  37. except Exception as e:
  38. print("错误在这里>>>>>>>>>>>>>",e,"<<<<<<<<<<<<<错误在这里")
  39.  
  40. #写入文件txt
  41. with open('xuetang-0823.txt','a',encoding='utf-8') as fl:
  42. fl.write(str(item['xuhao'])+','+item['bookName']+','
  43. +item['author']+','
  44. +item['score'].replace("\n","").replace("\t","").replace(",",",").replace("\r","")+','+item['comment'].replace("\n","").replace("\t","").replace("\r","")+'\n')

python scrapy 插入数据库的操作的更多相关文章

  1. python对oracle数据库的操作

    1          Oracle数据库 1.1       Oracle环境配置&客户端连接 1.1.1          下载安装Oracle绿色版客户端instantclient: 到o ...

  2. python中mysql数据库的操作-sqlalchemy

    MySQLdb支持python2.*,不支持3.* ,python3里面使用PyMySQL模块代替 python3里面如果有报错  django.core.exceptions.ImproperlyC ...

  3. python访问Oracle数据库相关操作

    环境: Python版本:3.6.6 win系统:64位 Linux系统:64位 首先安装配置时,版本必须一致!包括:系统版本,python版本,oracle客户端的版本,cx_Oracle的版本! ...

  4. 文件夹文件遍历并插入数据库的操作,IO Directory File的递归操作

    在我们管理内容管理系统时,数据量大时,对机器的依赖性就比较强了,比如,我要将一个文件夹中的很多图片上传到网站,一个个上传会很花时间,就想到了通过遍历文件夹得到文件名,并将路径与文件保存到数据库中对应的 ...

  5. python scrapy爬虫数据库去重方法

    1. scrapy对request的URL去重 yield scrapy.Request(url, self.parse, dont_filter=False) 注意这个参数:dont_filter= ...

  6. Python创建插入数据库MySQL

    首先要在控制台创建好数据库 mysql -u root -p 创建数据库 查看数据库 -------------------更新分割线(上面为新增...太久没用都忘了SQL基本命令了)-------- ...

  7. python之(mysql数据库操作)

    前言:关心3步骤(此文章只针对python自动化根基展开描述) 什么是mysql数据库操作?  答:利用python对mysql数据库进行增, 删, 改, 查 操作 为什么要用python对mysql ...

  8. python scrapy 抓取脚本之家文章(scrapy 入门使用简介)

    老早之前就听说过python的scrapy.这是一个分布式爬虫的框架,可以让你轻松写出高性能的分布式异步爬虫.使用框架的最大好处当然就是不同重复造轮子了,因为有很多东西框架当中都有了,直接拿过来使用就 ...

  9. python中的MySQL数据库操作 连接 插入 查询 更新 操作

    MySQL数据库 就数据库而言,连接之后就要对其操作.但是,目前那个名字叫做qiwsirtest的数据仅仅是空架子,没有什么可操作的,要操作它,就必须在里面建立“表”,什么是数据库的表呢?下面摘抄自维 ...

随机推荐

  1. spring启动找不到spring.liveBeansView.mbeanDomain配置

    做项目时,启动tomcat报错 JNDI lookup for name [spring.liveBeansView.mbeanDomain] threw NamingException with m ...

  2. TCP/IP_网络基础知识

    今天看到k8s的网络,顿感网络知识不是特别扎实,立马回头补一下Tcp-ip知识,顺便记录下学习的过程: 计算机与网络发展的7个阶段: 批处理时代(计算机按照顺序处理,50年代)->分时系统时代( ...

  3. StanFord ML 笔记 第十部分

    第十部分: 1.PCA降维 2.LDA 注释:一直看理论感觉坚持不了,现在进行<机器学习实战>的边写代码边看理论

  4. General error: 24374 OCIStmtFetch: ORA-24374: define not done before fetch or execute and fetch

    问题 $sql='insert into "test"("id") values(4)'; $res=$this->conn->query($sql ...

  5. [Unity工具]批量修改字体

    效果图: using System.IO; using System.Text; using UnityEditor; using UnityEngine; using UnityEngine.UI; ...

  6. 测试HANA的真实案例

    configure memory limit for DEV.QAS 目前总内存为1367.19GB, DEV和QAS为同一数据库 我们将设置DEV为600GB QAS也为600GB ======== ...

  7. GitHub使用指南之快速入门

    出自http://blog.csdn.net/column/details/13170.html 1.Git安装 Git是一个版本控制系统,使用之前必须先下载安装,下面提供各平台的安装方式. Mac: ...

  8. python [] 数组 list 交集 并集 差集

    >>> a = [1,2,3] >>> b = [2,4,5] >>> list(set(a).intersection(set(b))) [2] ...

  9. jenkins部署配置

    https://www.cnblogs.com/rslai/p/8135460.html 修改jenkins的默认端口号: https://blog.csdn.net/qq_32440951/arti ...

  10. exe加载DLL的时候会有一系列的搜索路径

    假如安全DLL搜索模式启用,搜索顺序如下: 1. 应用程序所在的路径 2. Windows SYSTEM目录.通过调用GetSystemDirectory函数可以获取这个目录的路径. 3. 16位系统 ...