scrapy 采集数据存入excel

# -*- coding: utf-8 -*-

# Define your item pipelines here

#

# Don't forget to add your pipeline to the ITEM_PIPELINES setting

# See: https://doc.scrapy.org/en/latest/topics/item-pipeline.html

import csv

import xlwt

class GanjiPipeline(object):

    def __init__(self):

        self.line = 1

        self.file_name = "赶集.xls"

        self.book = xlwt.Workbook(encoding="utf8")

        self.sheet = self.book.add_sheet("租房数据")

        self.sheet.col(0).width = 256 * 70  # Set the column w

        self.sheet.col(1).width = 256 * 10

        self.sheet.col(2).width = 256 * 10

        self.sheet.col(3).width = 256 * 10

        self.sheet.col(4).width = 256 * 50

        self.tall_style = xlwt.easyxf('font:height 300')

        first_row = self.sheet.row(0)

        first_row.set_style(self.tall_style)

        head = ["标题","价格","面积","朝向","地址"]

        for h in head:

            self.sheet.write(0,head.index(h),h)

    def process_item(self, item, spider):

        self.sheet.write(self.line, 0, item['title'])

        self.sheet.write(int(self.line), 1, item['price'])

        self.sheet.write(int(self.line), 2, item['size'])

        self.sheet.write(int(self.line), 3, item['chaoxiang'])

        self.sheet.write(int(self.line), 4, item['address'])

        self.sheet.row(self.line).set_style(self.tall_style)

        self.line = self.line + 1

    def close_spider(self,spider):

        self.book.save(self.file_name)

    def optimizeContent(self,res):

        res = res.replace('b\'', '')

        res = res.replace('\\n', '')

        res = res.replace('\'', '')

        res = res.replace('style', 'nouse')

        res = res.replace('\.', '')

        return res

scrapy 采集数据存入excel的更多相关文章

将txt文件数据存入excel表格
前言最近使用Appium自动化在测试设备配网的情况,需要记录每次成功与否和耗时时间. 由于App不是很稳定,执行一段时间会奔溃,因此数据只能通过追加的形式写入到txt文件. 实现过程存储在txt文 ...
python 抓取数据存入 excel
import requestsimport datetimefrom random import choicefrom time import timefrom openpyxl import loa ...
Pandas提取数据存入excel
import pandas as pd import pymysql def connect_db(): MYSQL_HOSTS = '127.0.0.1' MYSQL_USER = 'root' M ...
解析Excel文件并把数据存入数据库
前段时间做一个小项目,为了同时存储多条数据,其中有一个功能是解析Excel并把其中的数据存入对应数据库中.花了两天时间,不过一天多是因为用了"upload"关键字作为URL从而导致 ...
C#+HtmlAgilityPack+XPath带你采集数据(以采集天气数据为例子)
第一次接触HtmlAgilityPack是在5年前,一些意外,让我从技术部门临时调到销售部门,负责建立一些流程和寻找潜在客户,最后在阿里巴巴找到了很多客户信息,非常全面,刚开始是手动复制到Excel, ...
【asp.net】将GridView数据导出Excel
概要: 中午睡了一会,醒来的时候看到老师叫我去办公室,需求是这样的,把excel表中的每个同学,判断图片目录中是否有对应的照片(图片的名字用的学号或身份证号码) 没有对应图片的学生记录,存入自己的数据 ...
C# DataSet数据导入Excel 修正版- .net FrameWork 4.0以上
引入 Microsoft.Office.Interop.Excel.dll 格式:标题加了下划线,单元格内容居中 1 using System; using System.Data; using S ...
用python抓取智联招聘信息并存入excel
用python抓取智联招聘信息并存入excel tags:python 智联招聘导出excel 引言:前一阵子是人们俗称的金三银四,跳槽的小朋友很多,我觉得每个人都应该给自己做一下规划,根据自己的进步 ...
爬取拉勾网招聘信息并使用xlwt存入Excel
xlwt 1.3.0 xlwt 文档 xlrd 1.1.0 python操作excel之xlrd 1.Python模块介绍 - xlwt ,什么是xlwt? Python语言中,写入Excel文件的扩 ...

随机推荐

oracle之dblink
当用户要跨本地Oracle数据库,访问另外一个数据库表中的数据时,本地数据库中必须创建了远程数据库的dblink,通过dblink本地数据库可以像访问本地数据库一样访问远程数据库表中的数据.下面讲介绍 ...
php第七天-文件处理系统
0x01 文件系统概述 1.1文件类型在程序运行时,程序本身和数据一般都存在内存中,当程序运行结束后,存放在内存中的数据被释放. 如果需要长期保存程序运行所需的原始数据,或程序运行产生的结果,就必须 ...
.net core中的那些常用的日志框架（Logging篇）
前言日志,在我们每个项目中是必不可少的,它不仅能在调试的时候测试数据,而且在项目上线,也是我们排查错误的得力助手,那我就能谈谈,用的多的几个日志框架吧!如果有不对的地方,欢迎来指教错误,谢谢! As ...
海量数据分库分表方案（二）技术选型与sharding-jdbc实现
上一章已经讲述分库分表算法选型,本章主要讲述分库分表技术选型文中关联上一章,若下文出现提及其时,可以点击分库分表算法方案与技术选型(一) 主要讲述框架比较 sharding-jdbc.zdal ...
MFC与QT区别
转载 https://www.cnblogs.com/forever5325/p/9597649.html QT使用的编译器是MinGW,即Linux下的GCC移植到windows的版本:MFC使用 ...
什么是64位和32位internet explorer
什么是64位和32位internet explorer 如果您使用 64 位版本的 Internet Explorer 时,您会遇到问题,请尝试使用 32 位版本的 Internet Explorer ...
Matlab中界面和注释---中英文切换问题
有参考网页后实践的心得: Matlab中界面和注释---中英文切换问题网上有大把的方法,并不是一一有效,这里介绍一种比较简单的方法我自己的电脑挺好用的,大家的电脑matlab需要你们自己实验了. 1 ...
可能是东半球第二好用的软件工具全部在这里（update in 2020.10.09）
1. 产品经理工具种草浏览器:Google Chrome 网络浏览器原型绘制软件:墨刀- 在线产品原型设计与协作平台(https://modao.cc/).摹客mockplus - 摹客,让设计和 ...
IDEA2020.2的破解
第一种方式:http://code.39sd.cn/ 直接获取二维码: 第二种:下载破解工具(本方法只是提供个人学习使用) 1.下载2020.2的idea 链接:https://pan.baidu.c ...
OpenCV计算机视觉学习（3）——图像灰度线性变换与非线性变换（对数变换，伽马变换）
如果需要处理的原图及代码,请移步小编的GitHub地址传送门:请点击我如果点击有误:https://github.com/LeBron-Jian/ComputerVisionPractice 下面 ...

scrapy 采集数据存入excel

scrapy 采集数据存入excel的更多相关文章

随机推荐

热门专题