一、Jupyter notebook环境安装

1、Anaconda 以及 安装步骤

  Anaconda指的是一个开源的Python发行版本,其包含了conda、Python等180多个科学包及其依赖项。因为包含了大量的科学包,Anaconda 的下载文件比较大(约 531 MB)。

  下载地址:https://www.anaconda.com/distribution/

  1)双击安装程序,如下图:

  2)同意协议,如下图:

  3)勾选"Just Me",即只为我这个用户安装。为所有用户(All Users)安装,要求有管理员权限,除非被要求以管理员权限安装,否则不要以管理员身份安装。

  4)选择安装路径,注意,安装路径中不能有空格和中文。

  5)添加环境变量

  7)点击install开始安装,时间有点长,耐心等待

  8)完成后点击next,如下图

  9)点击Install Microsoft VSCode,如下图

  10)完成后点击next

  11)全部完成后,点击Finish,两个选项不要勾选,如下图

  12)配置环境变量

    若上面安装过程中勾选了添加环境变量则可以跳过此步,若没有勾选则需要手动加,具体如下:

    将安装目录anaconda3文件加入安装path;

    将安装目录下的Scripts文件夹加入系统环境变量;

  13)验证是否安装成功,找到安装程序,右击"Anaconda Prompt",选择"更多 - > 以管理员身份运行"

    

  14)查看版本,输入conda list,可以查看已经安装的包名和版本号,如果结果可以正常显示,则说明安装成功,如下图

  15)查看版本,如下图

2、使用Jupyter Notebook

  Jupyter Notebook(此前被称为 IPython notebook)是一个交互式笔记本,支持运行 40 多种编程语言。

  Jupyter Notebook 的本质是一个 Web 应用程序,便于创建和共享文学化程序文档,支持实时代码,数学方程,可视化和 markdown。 用途包括:数据清理和转换,数值模拟,统计建模,机器学习等等。

  Jupyter Notebook 有两种键盘输入模式。

    - 编辑模式,允许你往单元中键入代码或文本;这时的单元框线是绿色的。

    - 命令模式,键盘输入运行程序命令;这时的单元框线是灰色。

  快捷键:

    Shift+Enter : 运行本单元,选中下个单元
    Ctrl+Enter : 运行本单元
    Alt+Enter : 运行本单元,在其下插入新单元
    Y:单元转入代码(code)状态
    M:单元转入markdown状态
    A :在上方插入新单元
    B:在下方插入新单元
    X:剪切选中的单元
    Shift+Tab : 显示帮助文档
    Shift +V : 在上方粘贴单元
  使用:以管理员身份打开终端,切换到一个目录下,输入以下命令,终端hung住,且自动打开浏览器窗口,浏览器中显示的文件根目录就是终端中执行命令所在的目录
 
  新建一个Python 3 文件,后缀名为.ipynb(即ipython notebook),如下图 
 

二、爬虫介绍

1、爬虫相关概念

  爬虫:通过编写程序,模拟浏览器上网,然后让其去互联网爬取数据的过程。

  爬虫的分类:

    - 通用爬虫;即将一整张页面进行数据爬取,搜索引擎抓取系统

    - 聚焦爬虫;即将网页中局部内容进行爬取,与通用爬虫有关系,要先进行通用爬虫

    - 增量式;只爬取最新更新的数据,或者说只爬取没有爬取过的数据

  反爬机制:对应的应用载体是门户网站。

  反反爬策略:对应的应用载体是爬虫程序。

  robots.txt协议:我们遇到的第一个反爬机制(https://www.taobao.com/robots.txt),遵从或者不遵从,一个防君子,不妨小人的协议。

  参考博客:https://www.cnblogs.com/bobo-zhang/p/9645024.html

2、回顾http/https

  参考博客:https://www.cnblogs.com/bobo-zhang/p/9645715.html

3、抓包工具fiddler安装和配置

  Fiddler是一个http协议调试代理工具,它能够记录并检查所有你的电脑和互联网之间的http通讯,设置断点,查看所有的进出Fiddler的数据。 Fiddler 要比其他的网络调试器要更加简单,因为它不仅仅暴露http通讯还提供了一个用户友好的格式。

  1)双击安装程序,选择安装路径,如下图

  2)安装完成后关闭窗口,找到程序

  3)打开程序,点击"是"

  4)是否更新提示弹框,选择"No",如下图

  5)点击菜单的"Tools -> Options",如下图

  6)安装证书,如下图

  7)重启fiddler,清楚记录,我们可以在fiddler中查看,我们主要使用以下几个部分

4、requests模块

  参考博客:https://www.cnblogs.com/bobo-zhang/p/9680561.html

  参考博客:https://www.cnblogs.com/bobo-zhang/p/9680673.html

5、bs4

  参考博客:https://www.cnblogs.com/bobo-zhang/p/9682516.html

  

jupyternotebook安装的更多相关文章

  1. Jupyter-notebook安装问题及解决

    两种方式: 1.pip install jupyter notebook 2.安装Anaconda 1.pip安装 通过命令行pip,要注意是在哪个虚拟环境,安装好后jupyter notebook所 ...

  2. 使用 jupyter-notebook + python + matplotlib 进行数据可视化

    上次用 python 脚本中定期查询数据库,监视订单变化,将时间与处理完成订单的数量进行输入写入日志,虽然省掉了人为定时查看数据库并记录的操作,但是数据不进行分析只是数据,要让数据活起来! 为了方便看 ...

  3. Web开发工具——Jupyter notebook

    jupyter-notebook 安装及远程访问 Introduction Jupyter Notebook(此前被称为 IPython notebook)是一个交互式笔记本,支持运行 40 多种编程 ...

  4. Python Anaconda2 (64-bit) 安装后启动jupyter-notebook默认目录更改

    看了网上很多关于更改 python notebook的,好麻烦,所以想了一招. python notebook 现在改名叫 jupyter-notebook ,被集成在Anaconda中. Anaco ...

  5. ubuntun 18.04 desktop安装jupyter-notebook

    在ubuntu18.04要安装jupyter-notebook,当然前提是先安装python,然后按如下步骤安装jupyter-notebook,现在记录如下: 1.sudo apt-get upda ...

  6. centos6.4安装 jupyter-notebook

    自上次发布了文章后有些网友就说不能实现效果,根据自己的实验发现确实有此事,那是因为版本的变化问题.这次基于yum仓库里的jupyter notebook 5.0.0版本实现: 系统:最小化安装[习惯性 ...

  7. Win10环境Tensorflow-GPU13.1/JupyterNotebook的安装

    参考 : Anaconda Tensorflow GPU 版本的安装问题 https://blog.csdn.net/u010977034/article/details/62038698 Windo ...

  8. [No000054] Windows 下Python3.5, NoteBook增强版安装

    接着上周继续,没看的童鞋.请移步: http://www.cnblogs.com/Chary/p/No00004B.html 这里,假设你已经能够看到这个画面了: 接下来,我们继续 给药 : 安装no ...

  9. window下安装jupyter

    1.Install [Anaconda](https://docs.continuum.io/anaconda/install#anaconda-install) 实际上安装了anaconda就已经安 ...

随机推荐

  1. Tarjan相关

    先码住: 板子:http://www.cnblogs.com/luckycode/p/5255656.html 求割点/割边:http://www.cnblogs.com/c1299401227/p/ ...

  2. 吴裕雄--天生自然python学习笔记:Python3 JSON 数据解析

    JSON (JavaScript Object Notation) 是一种轻量级的数据交换格式.它基于ECMAScript的一个子集. Python3 中可以使用 json 模块来对 JSON 数据进 ...

  3. Java反射的实例

    JAVA反射机制是在运行状态中,对于任意一个类,都能够得到这个类的所有属性和方法;对于任意一个对象,都能够调用它的任意一个方法;         这种动态获取的信息以及动态调用对象的方法的功能称为ja ...

  4. 吴裕雄--天生自然HTML学习笔记:HTML 属性

    属性是 HTML 元素提供的附加信息. HTML 属性 HTML 元素可以设置属性 属性可以在元素中添加附加信息 属性一般描述于开始标签 属性总是以名称/值对的形式出现,比如:name="v ...

  5. 使用JS-SDK自定义微信分享效果

    前言 刚进入一家新公司,接到的第一个任务就是需要需要自定义微信分享的效果(自定义缩略图,标题,摘要),一开始真是一脸懵逼,在网上搜索了半天之后大概有了方案.值得注意的是一开始搜索到的解决方案全是调用微 ...

  6. 849. Dijkstra求最短路 I

    给定一个n个点m条边的有向图,图中可能存在重边和自环,所有边权均为正值. 请你求出1号点到n号点的最短距离,如果无法从1号点走到n号点,则输出-1. 输入格式 第一行包含整数n和m. 接下来m行每行包 ...

  7. 玩转UITableView

    UITableView这个iOS开发中永远绕不开的UIView,那么就不可避免的要在多个页面多种场景下反复摩擦UITableView,就算是刚跳进火坑不久的iOS Developer也知道实现UITa ...

  8. 使用 KM 处理 HHKB 方向键

    对于上了 HHKB 这条贼船的人来说,刚开始使用起来最大的别扭可能就是没有方向键的问题了. 最早的我使用 Karabiner 来解决,里边有一些内置的组合可以替代方向键,我用 control + hj ...

  9. 美团新零售招聘-高级测试开发(20k-50k/月)

    内推邮箱:liuxinguang@meituan.com 地点:北京 职位级别:p2-2以上级别 15.5薪

  10. 爬虫入门(四):urllib2

    主要使用python自带的urllib2进行爬虫实验. 写在前面的蠢事:本来新建了一个urllib2.py便于好认识这是urllib2的实验,结果始终编译不通过,错误错误.不能用Python的关键字( ...