爬虫管理平台以及wordpress本地搭建

学习目标：

各爬虫管理平台了解
- scrapydweb
- gerapy
- crawlab
各爬虫管理平台的本地搭建
Windows下的wordpress搭建

爬虫管理平台了解:

scrapydweb：

用于Scrapyd实施管理的web应用程序，支持Scrapy日志分析和可视化

github地址：https://github.com/my8100/scrapydweb.git

gerapy：

基于Scrapy，Scrapyd，Scrapyd-Client，Scrapyd-API，Django和Vue.js的分布式爬虫管理框架

相关的配置在我之前博客地址：https://www.cnblogs.com/xbhog/p/13336651.html

该项目github地址：https://github.com/Gerapy/Gerapy.git

crawlab：

基于Golang的分布式爬虫管理平台，支持多种编程语言以及多种爬虫框架.

文档地址：https://docs.crawlab.cn/zh/

GitHub地址：https://github.com/crawlab-team/crawlab.git

注意：前两个框架的搭建基于Scrapyd，如果不知道怎么配置可以看我之前写的博客：https://www.cnblogs.com/xbhog/p/13336651.html

爬虫管理平台的本地搭建：

scrapydweb搭建：
- 安装：pip install scrapydweb -i https://pypi.doubanio.com/simple
- 先打开scrapyd（命令行输入）
- 再输入scrapydweb
- 界面效果：
- 部署安装网上教程很多，不多赘述
gerapy
- 相关的配置在我之前博客地址：https://www.cnblogs.com/xbhog/p/13336651.html
crawlab：（配置安装官方给的很详细，这里简单说下）
- 首先把代码从远程仓库clone下来：git clone 地址/复制地址到pycharm中
- ```
#官方推荐几种安装方式：

Docker（入门简单，推荐）

Kubernetes（多机器部署，推荐）

直接部署（理解原理）

开发模式（开发调试）

多节点部署

#个人选择docker,该项目配置环境过多，怕给本地造成冲突
```
- docker的安装：
  - 安装地址：https://www.docker.com/products/docker-desktop
  - 安装环境：本地虚拟化以及hyper-V需要打开，如图所示
- 默认安装即可
- 相关详细链接（菜鸟教程：https://www.runoob.com/docker/windows-docker-install.html）
- 安装docker-compose包：pip install docker-compose
- 在根目录下测试：
```
docker-compose ps

正常为空

Name   Command   State   Ports

------------------------------

--------------------------------
```
- 安装并启动：docker-compose up -d
- http://127.0.0.1:8080/#/login进入即可

Windows下的wordpress搭建：

环境准备：

wampserver软件
wordpress源码
百度网盘地址：链接：https://pan.baidu.com/s/1mAFu8XrNSfpyL_VgSvb8VA 提取码：1234

搭建步骤：

打开wampserver.exe，默认安装（注意在安装路径的时候不能有中文文件夹）
最后会有四个弹窗：
- 是否更改浏览器，该软件默认浏览器是explorer,我们点击是，选择谷歌浏览器；
- 选择nodpad++，选择否。
安装完成后，点击桌面图标运行，程序颜色表示状态
- 红色：配置没启动
- 橙色：配置启动一部分
- 绿色：配置完全启动
绿色后，单机程序图标，点击localhost进入网页
将预先准备的wordpress安装包放到wampserver/www文件夹下
进入网页地址输入：localhost/wordpress

点击开始进入配置页面：
上面配置先放置，我们先进行数据库设置

输入用户名root,密码空，点击执行。
进入账户下的root，修改权限，修改密码
我们需要对应之前的数据库名称（wordpress）,所以新建数据库
设置成功后返回之前的数据库登录页面，填写相关信息：
提交进入登陆界面配置：
填写完成进入登陆界面
登陆：前后台界面

爬虫管理平台以及wordpress本地搭建的更多相关文章

分布式爬虫管理平台Crawlab安装与使用
Why,为什么需要爬虫管理平台? 以下摘自官方文档: Crawlab主要解决的是大量爬虫管理困难的问题,例如需要监控上百个网站的参杂scrapy和selenium的项目不容易做到同时管理,而且命令行管 ...
Crawlab Lite 正式发布，更轻量的爬虫管理平台
Crawlab 是一款基于 Golang 的分布式爬虫管理平台,产品发布已经一年有余,经过开发团队的不断打磨,即将迭代到 v0.5 版本.在这期间我们为 Crawlab 加入了大量社区用户共同期望的功 ...
win7下wordPress本地搭建博客详解（深度亲测整理---傻瓜式详细教程）
搭建一个wordPress作为一个个人博客本来是特别简单的事情,但是网上的各种转载让初学者举步维艰,我就本身条件而言,会java EE,懂mysql都花费了我好长时间才搭建好本地博客. 注意:这个是本 ...
使用Docker部署爬虫管理平台Crawlab
当前目录创建 docker-compose.yml 文件 version: '3.3' services: master: image: tikazyq/crawlab:latest containe ...
30分钟快速搭建Web CRUD的管理平台--django神奇魔法
加上你的准备的时间,估计30分钟完全够用了,因为最近在做爬虫管理平台,想着快速开发,没想到python web平台下有这么非常方便的框架,简洁而优雅.将自己的一些坑总结出来,方便给大家的使用. 准备环 ...
CCNET+ProGet+Windows Batch搭建全自动的内部包打包和推送及管理平台
所要用的工具: 1.CCNET(用于检测SVN有改动提交时自动构建,并运行nuget的自动打包和推送批处理) 2.ProGet(目前见到最好用的nuget内部包管理平台) 3.Windows Batc ...
利用XAMPP本地搭建WordPress博客
现在越来越多的人利用WordPress搭建了自己的博客网站,我也是一样,但是还有一些人不知道怎么搭建WordPress网站的方法,因为怕弄不好,所以也就没有花钱去做,所以这里我就讲讲怎么样利用XAM ...
Hudson持续集成管理平台搭建
IP: 10.0.70.106 8G 内存 (Hudson 多个工程在同时构建的情况下比较耗内存) 环境: CentOS 6.5 . JDK7 注:Hudson 只是一个持续集成 ...
利用Wamp在本地搭建一个wordpress站点
原文链接:利用Wamp在本地搭建一个wordpress站点有时候我们会想搭建一个自己的站点,可是由于只是想自己访问,就不是很想为这个站点在买一个服务器和域名,那我们可能首先就想到把自己电脑当做服务器 ...

随机推荐

硬刚 lodash 源码之路，_.chunk
前置 chunk 函数内部借助其他函数实现,所以从其他函数开始,chunk 在最后. 你可能需要一些 JavaScript 基础知识才能看懂一些没有注释的细节. isObject 判断是否为 Obje ...
linux磁盘容量不足的处理方案
在虚机上安装memcached时,突然发现磁盘空间不足. df -h 发现,磁盘一共12G,原来是新申请的虚机,磁盘分区没有挂载上. fdisk -l 查看磁盘,发现有 /dev/vdb1 /dev/ ...
前端工程化的的理解，浅谈web工程化的开发流程
1. 什么是前端工程化自有前端工程师这个称谓以来,前端的发展可谓是日新月异.相比较已经非常成熟的其他领域,前端虽是后起之秀,但其野蛮生长是其他领域不能比的.虽然前端技术飞快发展,但是前端整体的工程生 ...
Java基础-线程与并发1
线程与并发 Thread 基本概念程序: 一组计算机能识别和执行的指令 ,是静态的代码. 进程: 程序的一次运行活动, 运行中的程序 . 线程: 进程的组成部分,它代表了一条顺序的执行流. 进程线程 ...
集训之各种dp
1.线性「BZOJ1609」麻烦的聚餐分别求一遍连续非下降/上升子序列长度,用总长减去,取最小值即可,主要\(O(n^2)\)优化 Code #include <cstdio> #in ...
微信网页授权access_token和普通access_token爬坑
两者的区别: 1.相同点:两者的有效期都是7200s 2.不同点: ①.网页授权access_token无需用户授权,无需用户关注,在网页授权回调域名下可获取到code,通过code换取网页授权acc ...
Github Actions简单部署一个vue/react项目
大体介绍本文对github actions部署前端项目做一个简单的总结,总体来说,我感觉用它想要部署一个前端项目,可以说非常简单,简单得令人震惊
Python 数字格式转换
# 数字格式转换v1 '''a = input() a1 = list(a) b = ["零", "一", "二", "三&quo ...
Python之爬虫（二十二） Scrapy分布式原理
关于Scrapy工作流程回顾 Scrapy单机架构上图的架构其实就是一种单机架构,只在本机维护一个爬取队列,Scheduler进行调度,而要实现多态服务器共同爬取数据关键就是共享爬取队列. 分布式架 ...
Hadoop进阶命令使用介绍
hadoop生产环境的使用是很复杂的,有些公司是CDH或者Ambari等管理工具运维的,有些是原生的集群俗称裸奔,前者优缺点是运维,查看监控等容易,对于底层理解不友好:裸奔集群反之,裸奔集群的很多东西 ...

爬虫管理平台以及wordpress本地搭建

爬虫管理平台以及wordpress本地搭建

学习目标：

爬虫管理平台了解:

爬虫管理平台的本地搭建：

Windows下的wordpress搭建：

环境准备：

搭建步骤：

爬虫管理平台以及wordpress本地搭建的更多相关文章

随机推荐

热门专题