python做数据分析的优势:

  1. 拥有大量的库为数据分析和处理提供了完整的工具链
  2. 随着库还在不断的增加的同时, 算法的实现也更加的创新。Numpy, matplotlib, scipy,scikit-learn
  3. python还能和其他多语言对接,比如C语言等
  4. 相对于R和MATLAB,python可做的事情更多, 一系列的连贯性更加好, 如web开发,爬虫,脚本、运维、机器学习

环境:

将使用 Anaconda 作为数据分析的工具(在后续的KNN近邻算法, 线性回归等也同样会用Anaconda来完成)

Anaconda : 一个跨语言、跨系统的集包管理、环境管理于一身的工具

Anaconda的特点: - 开源 - 安装使用简便, 且已集成大量现有库 - 支持python和R语言

下载地址: https://www.anaconda.com/download

安装过程 :

windows 注意: - 选just for me 选项 - 添加到path 中 - 安装完后在开始菜单可以看到如下图显示:

Linux 注意: - 添加到.bashrc文件,并source这个文件

安装完成以后,如何检查是否已经安装成功: ``` conda --version ```

升级到最新版本 ``` conda update conda ```

这儿可以自行把源修改为国内的清华源地址 (不改也行), 但帅的人都会改, 下载包的速度确实很快 , 清华源地址:

https://mirrors.tuna.tsinghua.edu.cn/help/anaconda/

具体修改: 根据上图, 打开Anaconda Prompt , 输入下列代码即可

  1. # 添加清华源
  2. conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
  3. conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
  4. # 设置在下载的时候显示源的Url
  5. conda config --set show_channel_urls yes
  6. # 查看源是否已经添加成功
  7. conda config --show channels

使用conda配置环境, 创建环境

  1. # 创建一个名为py36的环境,指定python版本为3.6
  2. # (不管是指定哪个版本,conda会为我们自动寻找最新的版本,注意,这儿选的是python3.6,是会自动选择3.6版本里的最新小版本, 比如3.6.x,而不是整个python的大版本)
  3. conda create --name py36 python=3.6

激活环境

  1. # 在windows下直接输入 activate 激活
  2. activate py36
  3. # 在Linux或者Mac下,使用 source activate 激活
  4. source activate py36

激活以后,会发现控制台的命令行前面多了个(py36)的字样,这表示我们已经进入py35的环境里了

  1. # windows退出环境
  2. deactivate py36
  3. # Linux退出环境
  4. source deactivate py36
  5.  
  6. # 删除环境
  7. conda env remove -n py36

使用conda做包管理 查看已经安装的包

  1. # 查看当前环境中的包,已安装的包和对应的版本
  2. conda list
  3. # 查看指定环境内的包
  4. conda list -n py36

查找某个包

  1. # 查找指定的包是否可以通过conda来安装
  2. # 会返回这个包的信息,如果能看到相关信息,说明这个包可能用conda来安装
  3. conda search numpy
  4. # 如果卡着不动,有可能网络原因,可以使用--offline参数
  5. conda search numpy --offline

安装包

# 通过conda来安装Numpy # 如果numpy已经安装,会提示已安装 conda install numpy

更新包

# 通过conda更新包 conda update numpy

卸载包

conda remove numpy

以上就是conda对包的安装、更新、卸载。conda将conda、python、pip都视为包,因此,完全可以使用conda来管理conda和python的版本,比如:

  1. # 将conda更新到最新版本
  2. conda update conda
  3. # 同样的,也可以更anaconda到最新版本
  4. conda update anaconda
  5. # 更新python
  6. # 比如我们现在是python3.6.4,执行下面的命令,就会更新到python3.6.x的最新版本(例如3.6.5)
  7. conda update python

conda 和virtualenv / pip 的关系和区别

anaconda包含了navigator、prompt、conda、jupyter这些工具,同时也包含了python、pip、virtualenv等工具库

conda和pip的关系:

  • conda是包管理和环境管理工具,conda还支持多种环境的管理,包括python、R,注意:包括语言本身,不仅仅是语言的包 -
  • pip仅仅是python的包管理工具 -
  • conda不会影响系统自带的python

conda和virtualenv的关系:

  • conda是结合了pip和virtualenv的功能
  • conda可以创建多个Python版本的虚拟环境
  • virtualenv只能创建指定版本的环境

如何判断管理虚拟环境

  1. # 查看pip的绝对路径
  2. which pip
  3. # 查看当前环境中的pip使用的是什么python
  4. cat $(which pip)

我们可以编辑pip文件中的第一行,来改变我们的pip使用的python解释器

vim $(which pip)

  1. #! /Users/guye/anaconda/envs/py36/bin/python
  2.  
  3. # -*- coding: utf-8 -*-
  4. import re
  5. import sys
  6.  
  7. from pip._internal import main
  8.  
  9. if __name__ == '__main__':
  10. sys.argv[0] = re.sub(r'(-script\.pyw?|\.exe)?$', '', sys.argv[0])
  11. sys.exit(main())

或者也可以直接写pip的绝对路径来安装包

jupyter notebook的使用

启动juypter (会自动打开电脑默认设置的浏览器,我这儿的默认浏览器是谷歌)

  1. # 在默认地址和端口启动jupyter
  2. jupyter notebook
  3. # 在指定地址和端口启动
  4. jupyter notebook --ip=0.0.0.0 --port=8000

自定义jupyter界面

  1. # 创建一个目录 .jupyter/custom
  2. mkdir -p ~/.jupyter/custom
  3. # 添加编辑custom.js或者custom.css
  4. vim custom.js
  5. # 在js文件内写javascript代码

技术交流可以留言评论哦 ! 虚心学习, 不忘初心, 共同奋进 !

python数据分析的工具环境的更多相关文章

  1. python数据分析中常用的库

    Python是数据处理常用工具,可以处理数量级从几K至几T不等的数据,具有较高的开发效率和可维护性,还具有较强的通用性和跨平台性,这里就为大家分享几个不错的数据分析工具,需要的朋友可以参考下 Pyth ...

  2. python数据分析&挖掘,机器学习环境配置

    目录 一.什么是数据分析 1.这里引用网上的定义: 2.数据分析发展与组成 3.特点 二.python数据分析环境及各类常用分析包配置 1.处理的数据类型 2.为什么选择python 三.python ...

  3. Python数据分析工具:Pandas之Series

    Python数据分析工具:Pandas之Series Pandas概述Pandas是Python的一个数据分析包,该工具为解决数据分析任务而创建.Pandas纳入大量库和标准数据模型,提供高效的操作数 ...

  4. Python 数据分析中常用的可视化工具

    Python 数据分析中常用的可视化工具 1 Matplotlib 用于创建出版质量图表的绘图工具库,目的是为 Python 构建一个 Matlab 式的绘图接口. 1.1 安装 Anaconada ...

  5. Python的支持工具[0] -> 环境包管理工具[0] -> pip

    pip包管理工具 / pip Package Management Tools pip是一个Python包管理工具,主要是用于安装PyPI上的软件包,可以替代easy_install工具. 1 pip ...

  6. Python包管理工具和多版本环境管理

    1. Python包管理工具 在安装Python包的过程中,经常涉及到distutils.setuptools.distribute.setup.py.easy_install.easy_instal ...

  7. Python数据分析(二): Numpy技巧 (1/4)

    In [1]: import numpy numpy.__version__ Out[1]: '1.13.1' In [2]: import numpy as np  

  8. 【读书笔记与思考】《python数据分析与挖掘实战》-张良均

    [读书笔记与思考]<python数据分析与挖掘实战>-张良均 最近看一些机器学习相关书籍,主要是为了拓宽视野.在阅读这本书前最吸引我的地方是实战篇,我通读全书后给我印象最深的还是实战篇.基 ...

  9. (python数据分析)第03章 Python的数据结构、函数和文件

    本章讨论Python的内置功能,这些功能本书会用到很多.虽然扩展库,比如pandas和Numpy,使处理大数据集很方便,但它们是和Python的内置数据处理工具一同使用的. 我们会从Python最基础 ...

随机推荐

  1. zabbix的日常监控-分布式监控(十)

    参考博文:http://blog.51cto.com/jinlong/2051966 zabbix proxy 可以代替 zabbix server 检索客户端的数据,然后把数据汇报给 zabbix ...

  2. [EffectiveC++]item45:运用成员函数模板接受所有兼容类型

  3. 【转】爬虫的一般方法、异步、并发与框架scrapy的效率比较

    该文非原创文字,文字转载至  jclian91  链接:https://www.cnblogs.com/jclian91/p/9799697.html Python爬虫的N种姿势   问题的由来    ...

  4. 人工智能——搜索(1)回溯策略【N皇后问题】

    这学期学<人工智能>(马少平,朱小燕 编著)这本书,里面很多算法听老师讲都听不懂,就想试试写一下看看能不能写出来,就从最简单的回溯策略开始吧. 源码 题目描述 在一个n*n的国际象棋棋盘上 ...

  5. React 入门学习笔记2

    摘自阮一峰:React入门实例教程,转载请注明出处. 一.获取真实的DOM节点 组件并不是真实的 DOM 节点,而是存在于内存之中的一种数据结构,叫做虚拟 DOM (virtual DOM).只有当它 ...

  6. virtualbox+vagrant学习-2(command cli)-3-vagrant destroy命令

    Destroy 格式: vagrant destroy [options] [name|id] 此命令会停止vagrant管理的正在运行的机器,并销毁在机器创建过程中创建的所有资源.在运行这个命令之后 ...

  7. 多线程之线程间协作的两种方式:wait、notify、notifyAll和Condition

    Java并发编程:线程间协作的两种方式:wait.notify.notifyAll和Condition 在前面我们将了很多关于同步的问题,然而在现实中,需要线程之间的协作.比如说最经典的生产者-消费者 ...

  8. oracle什么时候须要commit

    今天在oracle的SQL plus 中运行了删除和查询操作,然后在PL/SQL中也运行查询操作,语句一样,结果却不一样,让我大感郁闷,后来才突然想到可能是两边数据不一致造成的,可是为什么不一致呢,就 ...

  9. 提取win10默认锁屏壁纸

    win10锁屏设置为windows聚焦时锁屏会有好看的图片出现.想让一张好看的图片一直使用,就去提取出来然后设置一下. 找到C盘:用户目录下 找到你的主机名文件夹: 在查看的选项栏中将隐藏文件夹显示: ...

  10. java 工作流项目源码 SSM 框架 Activiti-master springmvc 集成web在线流程设计器

    即时通讯:支持好友,群组,发图片.文件,消息声音提醒,离线消息,保留聊天记录 (即时聊天功能支持手机端,详情下面有截图) 工作流模块---------------------------------- ...