python数据分析的工具环境
python做数据分析的优势:
- 拥有大量的库为数据分析和处理提供了完整的工具链
- 随着库还在不断的增加的同时, 算法的实现也更加的创新。Numpy, matplotlib, scipy,scikit-learn
- python还能和其他多语言对接,比如C语言等
- 相对于R和MATLAB,python可做的事情更多, 一系列的连贯性更加好, 如web开发,爬虫,脚本、运维、机器学习
环境:
将使用 Anaconda 作为数据分析的工具(在后续的KNN近邻算法, 线性回归等也同样会用Anaconda来完成)
Anaconda : 一个跨语言、跨系统的集包管理、环境管理于一身的工具
Anaconda的特点: - 开源 - 安装使用简便, 且已集成大量现有库 - 支持python和R语言
下载地址: https://www.anaconda.com/download
安装过程 :
windows 注意: - 选just for me 选项 - 添加到path 中 - 安装完后在开始菜单可以看到如下图显示:
Linux 注意: - 添加到.bashrc文件,并source这个文件
安装完成以后,如何检查是否已经安装成功: ``` conda --version ```
升级到最新版本 ``` conda update conda ```
这儿可以自行把源修改为国内的清华源地址 (不改也行), 但帅的人都会改, 下载包的速度确实很快 , 清华源地址:
https://mirrors.tuna.tsinghua.edu.cn/help/anaconda/
具体修改: 根据上图, 打开Anaconda Prompt , 输入下列代码即可
# 添加清华源
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
# 设置在下载的时候显示源的Url
conda config --set show_channel_urls yes
# 查看源是否已经添加成功
conda config --show channels
使用conda配置环境, 创建环境
# 创建一个名为py36的环境,指定python版本为3.6
# (不管是指定哪个版本,conda会为我们自动寻找最新的版本,注意,这儿选的是python3.6,是会自动选择3.6版本里的最新小版本, 比如3.6.x,而不是整个python的大版本)
conda create --name py36 python=3.6
激活环境
# 在windows下直接输入 activate 激活
activate py36
# 在Linux或者Mac下,使用 source activate 激活
source activate py36
激活以后,会发现控制台的命令行前面多了个(py36)的字样,这表示我们已经进入py35的环境里了
# windows退出环境
deactivate py36
# Linux退出环境
source deactivate py36 # 删除环境
conda env remove -n py36
使用conda做包管理 查看已经安装的包
# 查看当前环境中的包,已安装的包和对应的版本
conda list
# 查看指定环境内的包
conda list -n py36
查找某个包
# 查找指定的包是否可以通过conda来安装
# 会返回这个包的信息,如果能看到相关信息,说明这个包可能用conda来安装
conda search numpy
# 如果卡着不动,有可能网络原因,可以使用--offline参数
conda search numpy --offline
安装包
# 通过conda来安装Numpy # 如果numpy已经安装,会提示已安装 conda install numpy
更新包
# 通过conda更新包 conda update numpy
卸载包
conda remove numpy
以上就是conda对包的安装、更新、卸载。conda将conda、python、pip都视为包,因此,完全可以使用conda来管理conda和python的版本,比如:
# 将conda更新到最新版本
conda update conda
# 同样的,也可以更anaconda到最新版本
conda update anaconda
# 更新python
# 比如我们现在是python3.6.4,执行下面的命令,就会更新到python3.6.x的最新版本(例如3.6.5)
conda update python
conda 和virtualenv / pip 的关系和区别
anaconda包含了navigator、prompt、conda、jupyter这些工具,同时也包含了python、pip、virtualenv等工具库
conda和pip的关系:
- conda是包管理和环境管理工具,conda还支持多种环境的管理,包括python、R,注意:包括语言本身,不仅仅是语言的包 -
- pip仅仅是python的包管理工具 -
- conda不会影响系统自带的python
conda和virtualenv的关系:
- conda是结合了pip和virtualenv的功能
- conda可以创建多个Python版本的虚拟环境
- virtualenv只能创建指定版本的环境
如何判断管理虚拟环境
# 查看pip的绝对路径
which pip
# 查看当前环境中的pip使用的是什么python
cat $(which pip)
我们可以编辑pip文件中的第一行,来改变我们的pip使用的python解释器
vim $(which pip)
#! /Users/guye/anaconda/envs/py36/bin/python # -*- coding: utf-8 -*-
import re
import sys from pip._internal import main if __name__ == '__main__':
sys.argv[0] = re.sub(r'(-script\.pyw?|\.exe)?$', '', sys.argv[0])
sys.exit(main())
或者也可以直接写pip的绝对路径来安装包
jupyter notebook的使用
启动juypter (会自动打开电脑默认设置的浏览器,我这儿的默认浏览器是谷歌)
# 在默认地址和端口启动jupyter
jupyter notebook
# 在指定地址和端口启动
jupyter notebook --ip=0.0.0.0 --port=8000
自定义jupyter界面
# 创建一个目录 .jupyter/custom
mkdir -p ~/.jupyter/custom
# 添加编辑custom.js或者custom.css
vim custom.js
# 在js文件内写javascript代码
技术交流可以留言评论哦 ! 虚心学习, 不忘初心, 共同奋进 !
python数据分析的工具环境的更多相关文章
- python数据分析中常用的库
Python是数据处理常用工具,可以处理数量级从几K至几T不等的数据,具有较高的开发效率和可维护性,还具有较强的通用性和跨平台性,这里就为大家分享几个不错的数据分析工具,需要的朋友可以参考下 Pyth ...
- python数据分析&挖掘,机器学习环境配置
目录 一.什么是数据分析 1.这里引用网上的定义: 2.数据分析发展与组成 3.特点 二.python数据分析环境及各类常用分析包配置 1.处理的数据类型 2.为什么选择python 三.python ...
- Python数据分析工具:Pandas之Series
Python数据分析工具:Pandas之Series Pandas概述Pandas是Python的一个数据分析包,该工具为解决数据分析任务而创建.Pandas纳入大量库和标准数据模型,提供高效的操作数 ...
- Python 数据分析中常用的可视化工具
Python 数据分析中常用的可视化工具 1 Matplotlib 用于创建出版质量图表的绘图工具库,目的是为 Python 构建一个 Matlab 式的绘图接口. 1.1 安装 Anaconada ...
- Python的支持工具[0] -> 环境包管理工具[0] -> pip
pip包管理工具 / pip Package Management Tools pip是一个Python包管理工具,主要是用于安装PyPI上的软件包,可以替代easy_install工具. 1 pip ...
- Python包管理工具和多版本环境管理
1. Python包管理工具 在安装Python包的过程中,经常涉及到distutils.setuptools.distribute.setup.py.easy_install.easy_instal ...
- Python数据分析(二): Numpy技巧 (1/4)
In [1]: import numpy numpy.__version__ Out[1]: '1.13.1' In [2]: import numpy as np
- 【读书笔记与思考】《python数据分析与挖掘实战》-张良均
[读书笔记与思考]<python数据分析与挖掘实战>-张良均 最近看一些机器学习相关书籍,主要是为了拓宽视野.在阅读这本书前最吸引我的地方是实战篇,我通读全书后给我印象最深的还是实战篇.基 ...
- (python数据分析)第03章 Python的数据结构、函数和文件
本章讨论Python的内置功能,这些功能本书会用到很多.虽然扩展库,比如pandas和Numpy,使处理大数据集很方便,但它们是和Python的内置数据处理工具一同使用的. 我们会从Python最基础 ...
随机推荐
- Spring 容器介绍
Spring 框架的实现依赖 IoC (反向控制) 原则,更为形象的称呼是 DI (依赖注入).相对于 Bean 直接构造依赖的对象,Spring 框架则根据 Bean之间的依赖关系创建对象,并注入到 ...
- MySQL开发规范和原则大全
一. 表设计 库名.表名.字段名必须使用小写字母,“_”分割. 库名.表名.字段名必须不超过12个字符. 库名.表名.字段名见名知意,建议使用名词而不是动词. 建议使用InnoDB存储引擎. 存储精确 ...
- Uva1001 Say Cheese Floyd
题意:一个无限大的奶酪里有n个球形的洞,在洞内可以瞬移,不然每一个单位要用10sec,现在给定起始点和结束点,问最短需要耗时多久? 思路:把球形的洞当做是节点,两点之间的距离是两者球心的距离减去两者的 ...
- 【[HNOI2016]序列】
莫队好题啊 莫队来做这个题的难点就是考虑如何在\(O(1)\)时间内由\([l,r]\)转移到\([l,r+1]\) 显然加入\(r+1\)这个数之后会和之前所有的位置都产生一个区间,就是要去快速求出 ...
- 【洛谷】【动态规划/二维背包】P1855 榨取kkksc03
[题目描述:] ... (宣传luogu2的内容被自动省略) 洛谷的运营组决定,如果...,那么他可以浪费掉kkksc03的一些时间的同时消耗掉kkksc03的一些金钱以满足自己的一个愿望. Kkks ...
- Apache去掉index.php
把 #LoadModule rewrite_module modules/mod_rewrite.so 前面的#去掉, 再把权限AllowOverride None都改为AllowOverride A ...
- 集合之hascode方法
在前面三篇博文中LZ讲解了(HashMap.HashSet.HashTable),在其中LZ不断地讲解他们的put和get方法,在这两个方法中计算key的hashCode应该是最重要也是最精华的部分, ...
- ios学习路线—Objective-C(Runtime消息机制)
RunTime简称运行时.就是系统在运行的时候的一些机制,其中最主要的是消息机制.对于C语言,函数的调用在编译的时候会决定调用哪个函数( C语言的函数调用请看这里 ).编译完成之后直接顺序执行,无任何 ...
- CentOS7.6离线安装MySql5.7
准备好mysql的离线安装文件: MySql官网下载mysql-5.7.25-1.el7.x86_64.rpm-bundle,并复制到/usr/mysql文件夹中. 删除CentOS自带的MariaD ...
- PHP切割字符用到的explode 以及计数count
在thinkphp中同样可以用 explode来进行字符的切割工作,比如 $jihe='1,2,3,4'; 在使用explode之后,可以获得一个数组: $array=explode(',',$jih ...