几行代码教你快速创建scrapy项目，非常实用建议收藏！

import shutil,os

修改settings.py

def config(scrapy_path,project_name):
    judge=input("是否自动修改配置?是：yes|y   否：no|n\n请选择:")
    if judge=='yes'or judge=='y'or judge== '是':
        setting_path=f'{scrapy_path}/{project_name}/{project_name}/settings.py'
        #修改items配置
        with open(setting_path,"rt+",encoding="utf-8") as fp:
            lines=fp.readlines()
            for i in range(len(lines)):
                lines[i]=lines[i].replace('ROBOTSTXT_OBEY = True','ROBOTSTXT_OBEY = False')
                if "ITEM_PIPELINES" in lines[i] or "DOWNLOADER_MIDDLEWARES" in lines[i]:
                    lines[i]=lines[i].strip('# ')
                    lines[i+1] = lines[i+1].strip('# ')
                    lines[i+2] = lines[i+2].strip('# ')
        with open(setting_path,"wt+",encoding="utf-8") as fp:
            text="from fake_useragent import UserAgent\nua=UserAgent()\nUSER_AGENT = ua.ie\nLOG_LEVEL='ERROR'\n"
            fp.write(text)
            for line in lines:
                fp.write(line)
        print("配置成功")
    else:
        print("默认配置")

def INPUT():
    project_name=input("请输入scrapy项目名:").split()[0]
    spider_name = input("请输入爬虫名称:").split()[0]
    if project_name==spider_name:
        print('项目名和爬虫名不能相同，请重新输入!')
        os.system('cls')
        return INPUT()
    else:
        main_url = input("请输入网址:").split()[0]
        name = {
            'project_name': project_name,
            'spider_name': spider_name,
            'main_url':main_url,
        }
        return name

#创建主体项目文件
def start_project(scrapy_path,project_name,spider_name,main_url):
    # 创建scrapy工程
    man1 = f'scrapy startproject {project_name}'
    os.system(man1)
    # 创建爬虫文件
    man2 = f'scrapy genspider {spider_name} {main_url}'
    os.system(man2)
    # 移动爬虫文件
    shutil.move(f'{scrapy_path}/{spider_name}.py',
                f'{scrapy_path}/{project_name}/{project_name}/spiders/{spider_name}.py')
    # 创建主文件
    with open(f'{scrapy_path}/{project_name}/main.py', "w+", encoding="utf-8") as fp:
        text = f"from scrapy import cmdline\ncmdline.execute('scrapy crawl {spider_name}'.split())"
        fp.write(text)
    print("scrapy框架创建成功！".strip())

if __name__ == "__main__":
    scrapy_path = os.getcwd()
    name=INPUT()
    project_name =name['project_name']
    spider_name =name['spider_name']
    main_url=name['main_url']
    start_project(scrapy_path,project_name,spider_name,main_url)
    config(scrapy_path, project_name)

#文件介绍
#该框架默认创建在该py文件下
#mian.py可直接执行scrapy框架,不用输入繁琐的cmd命令
#直接对框架中的文件进行修改即可

几行代码教你快速创建scrapy项目，非常实用建议收藏！的更多相关文章

iOS开发——实用技术OC篇&8行代码教你搞定导航控制器全屏滑动返回效果
8行代码教你搞定导航控制器全屏滑动返回效果前言如果自定了导航控制器的自控制器的leftBarButtonItem,可能会引发边缘滑动pop效果的失灵,是由于 self.interactivePop ...
爬虫学习笔记（2）--创建scrapy项目&&css选择器
一.手动创建scrapy项目---------------- 安装scrapy: pip install -i https://pypi.douban.com/simple/ scrapy 1 ...
pycharm创建scrapy项目教程及遇到的坑
最近学习scrapy爬虫框架,在使用pycharm安装scrapy类库及创建scrapy项目时花费了好长的时间,遇到各种坑,根据网上的各种教程,花费了一晚上的时间,终于成功,其中也踩了一些坑,现在整理 ...
scrapy（一）--Pycharm创建scrapy项目
1.环境操作系统:windows10. python版本:python3.6,Anaconda(将Anaconda3\Scripts;路径添加到环境变量Path中) pycharm:pycharm2 ...
2springboot：快速创建springboot项目
使用IDEA快速创建springboot项目流程: 创建新的项目选择项目的命名以及包名需要什么包就导入什么包进行测试的单元 <dependency> <groupId>o ...
终端创建scrapy项目时报错（转）
在终端创建scrapy项目时报错 PS D:\scrapy_project> scrapy startproject fangFatal error in launcher: Unable to ...
Spring-boot(一)通过向导快速创建Spring-boot项目
通过向导快速创建Spring-boot项目创建步骤: 选择Spring Initializr 填写组织和模块名选择对应的模块注:这里左侧的模块比较多,玩家可以根据自己的实际需要自由选择,此处暂时 ...
【快学springboot】1.快速创建springboot项目
若图片查看异常,请前往掘金查看:https://juejin.im/post/5d00e793f265da1b614ff10b 使用spring initialize工具快速创建springboot项 ...
快速创建 Vue 项目
转载:https://www.jianshu.com/p/c7df292915e7 为了便于 Vue 项目的管理, Vue 团队官方开发了 vue-cli 工具. 本文将带您使用 vue-cli 快速 ...
在线快速创建SpringBoot项目
都2020年了,你还在手动创建SpringBoot项目吗?今天教你在线快速创建一个SpringBoot项目,瞬间高大上有木有! 进入正题,首先打开创建SpringBoot的官网:https://sta ...

随机推荐

ansible介绍与简单的使用
在roles下建立site.yml文件#site.yml - hosts: webservers remote_user: root roles: - websrvs - dbsrvs#将文件拷贝到f ...
GoAccess - 可视化 Web 日志分析工具
Centos安装: yum -y install goaccess 使用goaccess命令生成HTML文件 LANG="en_US.UTF-8" bash -c 'goacces ...
class3
#include<stdio.h> #include<stdlib.h> #include<time.h> #include<windows.h> #d ...
linux 修改文件内容命令
1.进入文件:vim 文件名 eg #vim /etc/httpd/httpd.conf 2.查找待修改内容位置 : (1)shift+":",使文件变成可查询状态 (2)输入 / ...
Jsp 总结
JSP中的include的两种用法 1.两种用法 <@inlcude file ="header.jsp"/> 此时引入的是静态的jsp文件,它将引入的jsp中的源代码 ...
element表格样式修改
HTML代码: <el-table :data="tableData" style="width: 100%" border :row-class-nam ...
json.dumps和json.loads，get和post
一.json.dumps()和json.loads()概念理解 1.json.dumps()和json.loads()是json格式处理函数(可以这么理解,json是字符串) json.dumps() ...
SimpleITK和nibable读取nii文件
import SimpleITK as sitk path = 'nii全路径' nii_obj = sitk.GetArrayFromImage(sitk.ReadImage(path)) #sha ...
对使用网站模板编写自己的jsp页面的收获
收获与问题先感叹一句模板的强大,模板只要按照我的上一篇博客的步骤进行修改,我们就能拥有一个自己写好看许多的界面了. 我目前套用模板还不是很熟练,套用的速度还需要加快,不过目前的我,已经掌握了基本要领 ...
存算分离实践：JuiceFS 在中国电信日均 PB 级数据场景的应用
01- 大数据运营的挑战 & 升级思考大数据运营面临的挑战中国电信大数据集群每日数据量庞大,单个业务单日量级可达到 PB 级别,且存在大量过期数据(冷数据).冗余数据,存储压力大:每个省公 ...

几行代码教你快速创建scrapy项目，非常实用建议收藏！

几行代码教你快速创建scrapy项目，非常实用建议收藏！的更多相关文章

随机推荐

热门专题