Python数据分析必备:

1.Anaconda操作

Anaconda是一个用于科学计算的Python发行版,支持 Linux, Mac, Windows系统,提供了包管理与环境管理的功能,可以很方便地解决多版本python并存、切换以及各种第三方包安装问题。Anaconda利用工具/命令conda来进行package和environment的管理,并且已经包含了Python和相关的配套工具。

conda可以理解为一个工具,也是一个可执行命令,其核心功能是包管理环境管理。包管理与pip的使用类似,环境管理则允许用户方便地安装不同版本的python并可以快速切换。Anaconda则是一个打包的集合,里面预装好了conda、某个版本的python、众多packages、科学计算工具等等,所以也称为Python的一种发行版。

首先应该设置本地存放数据目录为工作目录,这样可以加载本地数据集到内存中

import os
os.chdir("D:/BigData/Workspace/testdata/") #设置当前路径为工作路径
os.getcwd() #获取当前工作路径

2.安装Graphviz

摘录自官网:

What is Graphviz?

Graphviz is open source graph visualization software. Graph visualization is a way of representing structural information as diagrams of abstract graphs and networks. It has important applications in networking, bioinformatics, software engineering, database and web design, machine learning, and in visual interfaces for other technical domains.

什么是Graphviz?

Graphviz是开源图形可视化软件。 图形可视化是将结构信息表示为抽象图形和网络图。 它在网络,生物信息学,软件工程,数据库和网页设计,机器学习和其他技术领域的视觉界面中具有重要的应用。

网址:

http://www.graphviz.org/     或   http://www.graphviz.org/Download..php   #安装

命令:dot  -Tpdf  iris.dot -o output.pdf 可将dot文件转化为已转化为图形的pdf文件

3.Anaconda的快捷键

打开ipython notebook方式:

3.1在cmd中输入~

3.2 默认浏览器会打开http://localhost:8888/tree

3.3 运行当前行并换行shift+enter

运行当前行:ctrl+enter

3.4 conda版本查看

conda 安装所有的包

查看有几个python环境

4.创建多环境的Anaconda

4.1 使用conda create命令,后边跟上你希望用来称呼它的任何名字:

conda create --name snowflake biopython

这条命令将会给biopython包创建一个新的环境,位置在/envs/snowflakes
小技巧:很多跟在--后边常用的命令选项,可以被略写为一个短线加命令首字母。所以--name选项和-n的作用是一样的。通过conda -h或conda –-help来看大量的缩写。

4.2 激活这个新环境

Linux,OS X::  source activate snowflakes
Windows:: activate snowflake`

小技巧:新的开发环境会被默认安装在你conda目录下的envs文件目录下。

4.3 创建第二个环境

这次让我们来创建并命名一个新环境,然后安装另一个版本的python以及两个包 Astroid 和 Babel。

conda create -n bunnies python=3 Astroid Babel

这将创建第二个基于python3 ,包含Astroid 和 Babel 包,称为bunnies的新环境,在/envs/bunnies文件夹里。
小技巧:在此同时安装你想在这个环境中运行的包,
小提示:在你创建环境的同时安装好所有你想要的包,在后来依次安装可能会导致依赖性问题

4.4 列出所有环境

4.6 复制一个环境

通过克隆来复制一个环境。这儿将通过克隆snowfllakes来创建一个称为flowers的副本。

conda create -n flowers --clone snowflakes

通过conda info –-envs来检查环境
你现在应该可以看到一个环境列表:flowers, bunnies, and snowflakes.

4.7 删除一个环境

如果你不想要这个名为flowers的环境,就按照如下方法移除该环境:

conda remove -n flowers --all

为了确定这个名为flowers的环境已经被移除,输入以下命令:

conda info -e

flowers 已经不再在你的环境列表里了,所以我们知道它被删除了。

4.8 检查python版本

首先让我们检查那个版本的python可以被安装:

conda search --full --name python

你可以使用conda search python来看到所有名字中含有“python”的包或者加上--full --name命令选项来列出完全与“python”匹配的包。

4.9 确定环境添加成功

为了确保snakes环境已经被安装了,键入如下命令:

conda info -e

conda会显示环境列表,当前活动的环境会被括号括起来(snakes)

4.10 使用不同版本的python

为了使用不同版本的python,你可以切换环境,通过简单的激活它就可以,看看如何返回默认2.7

·Linux,OS X: source activate snowflakes
·Windows:activate snowflakes

4.11注销该环境

当你完成了在snowflakes环境中的工作室,注销掉该环境并转换你的路径到先前的状态:
 ·Linux,OS X:source deactivate
·Windows:deactivate

4.12 查找一个包

首先让我们来检查我们需要的这个包是否可以通过conda来安装:

conda search beautifulsoup4

它展示了这个包,所以我们知道它是可用的。

5.Anaconda中的安装包

5.1 从Anaconda.org安装一个包

  如果一个包不能使用conda安装,我们接下来将在Anaconda.org网站查找。Anaconda.org向公开和私有包仓库提供包管理服务。Anaconda.org是一个连续分析产品。

提示:你在Anaconda.org下载东西的时候不强制要求注册。
为了从Anaconda.org下载到当前的环境中,我们需要通过指定Anaconda.org为一个特定通道,通过输入这个包的完整路径来实现。
在浏览器中,去 http://anaconda.org 网站。我们查找一个叫“bottleneck”的包,所以在左上角的叫“Search Anaconda Cloud”搜索框中输入“bottleneck”并点击search按钮。
Anaconda.org上会有超过一打的bottleneck包的版本可用,但是我们想要那个被下载最频繁的版本。所以你可以通过下载量来排序,通过点击Download栏。
点击包的名字来选择最常被下载的包。它会链接到Anaconda.org详情页显示下载的具体命令:

conda install --channel https://conda .anaconda.ort/pandas bottleneck

5.2 通过pip命令来安装包

对于那些无法通过conda安装或者从Anaconda.org获得的包,我们通常可以用pip(“pip install packages”的简称)来安装包。
提示: pip只是一个包管理器,所以它不能为你管理环境。pip甚至不能升级python,因为它不像conda一样把python当做包来处理。但是它可以安装一些conda安装不了的包,和vice versa(此处不会翻译)。pip和conda都集成在Anaconda或miniconda里边。

我们激活我们想放置程序的环境,然后通过pip安装一个叫“See”的程序。

·Linux,OS X: source activate bunnies
·Windows:activate bunnies
所有平台:
pip install see

5.3检查pip安装

检查See是否被安装:

conda list


5.4安装商业包

安装商业包与你安装其他的包的过程异常。举个例子,让我们安装并删除一个更新的商业包的免费试用 IOPro,可以加速你的python处理速度:

conda install iopro


5.5 移除包、环境、或者conda

如果你愿意的话。让我们通过移除一个或多个试验包、环境以及conda来结束这次测试指导。

5.6移除包

假设你决定不再使用商业包IOPro。你可以在bunnies环境中移除它。

conda remove -n bunnies iopro


5.7确认包已经被移除

使用conda list命令来确认IOPro已经被移除了

conda list

5.8移除环境

我们不再需要snakes环境了,所以输入以下命令:
conda remove -n snakes --all

5.9确认环境被移除

为了确认snakes环境已经被移除了,输入以下命令:

 conda info --envis

snakes不再显示在环境列表里了,所以我们知道它已经被删除了

5.10删除conda

  • Linux,OS X:
    移除Anaconda 或 Miniconda 安装文件夹
rm -rf ~/miniconda OR  rm -rf ~/anaconda


<end>

Python数据分析必备Anaconda安装、快捷键、包安装的更多相关文章

  1. Python入门:Anaconda和Pycharm的安装和配置

    Python入门:Anaconda和Pycharm的安装和配置  转自:https://www.cnblogs.com/yuxuefeng/articles/9235431.html 子曰:“工欲善其 ...

  2. 【转】Python入门:Anaconda和Pycharm的安装和配置

    子曰:“工欲善其事,必先利其器.”学习Python就需要有编译Python程序的软件,一般情况下,我们选择在Python官网下载对应版本的Python然后用记事本编写,再在终端进行编译运行即可,但是对 ...

  3. Nginx的安装--------tar包安装

    Nginx的安装,在网上搜索是很多的结果,但是 真的安装起来却花费了不少 心思,总结起来就是依赖包安装了,但是没有指定对的路径,在安装的过程中遇到过两个问题: ①make[1]: *** [/usr/ ...

  4. Python基础--软件Anaconda的下载与安装

    1.Anaconda软件的优点: Anaconda指的是一个开源的Python发行版本开发平台,在进行Python开发上方便简洁,有利于初步学习和实践深度学习. 2.Anaconda软件的下载: An ...

  5. R的安装以及包安装

        今天看论文,需要用到R语言的库,于是又折腾了半天..     其实并没有什么太大的问题,只是在第三方包的下载方面还有python中使用R方面遇到了问题: 第三方包的导入      其实在网上有 ...

  6. apache安装zip包安装(非exe)

    安装步骤如下: (1) 下载apache安装程序 进入官网:选择一个版本的apache 选择红色区域的内容,在之后进入的页面中: 选择红色区域的内容,进入页面: 现则VC9的进行下载. (2) 安装 ...

  7. LLVM 安装教程(包安装)

    LLVM 安装教程 环境:ubuntu16.04  llvm-4.0 clang-4.0 步骤: 1.依赖库安装 $ sudo apt-get install build-essential curl ...

  8. 利用Python进行数据分析 第4章 IPython的安装与使用简述

    本篇开始,结合前面所学的Python基础,开始进行实战学习.学习书目为<利用Python进行数据分析>韦斯-麦金尼 著. 之前跳过本书的前述基础部分(因为跟之前所学的<Python基 ...

  9. 【python数据分析】利用Anaconda在window上搭建数据分析环境

    由于在进行数据分析过程中,需要安装一些第三方库,导致python总会报一些错误,现将通过利用Anaconda搭建数据分析环境,已测可用. 1.到官网上下载python:https://www.pyth ...

随机推荐

  1. 数据注解特性--NotMapped

    NotMapped特性可以应用到领域类的属性中,Code-First默认的约定,是为所有带有get,和set属性选择器的属性创建数据列.. NotManpped特性打破了这个约定,你可以使用NotMa ...

  2. JVM虚拟机内存模型以及GC机制

    JAVA堆的描述如下: 内存由 Perm 和 Heap 组成. 其中 Heap = {Old + NEW = { Eden , from, to } } JVM内存模型中分两大块,一块是 NEW Ge ...

  3. GoF--适配器设计模式

    1.概念:  适配器模式(Adapter Pattern)把一个类的接口变换成客户端所期待的另一种接口,从而使原本因接口不匹配而无法在一起工作的两个类能够在一起工作. 2.形式  a.类的适配器模式  ...

  4. junit的简单用法

    之前测试一个方法总要写一个main函数来调用,感觉既费事又有点low.今天来简单研究一下怎么使用junit来进行单元测试. 1. 依赖包 <dependency> <groupId& ...

  5. hbase2.0.0-安装部署

    依赖hadoop 环境,我这边的版本是hadoop-2.6.5 选择hbase2.0.0版本的时候,去官网查看支持的hadoop版本 1.伪分布式安装 下载:http://mirror.bit.edu ...

  6. IIS URL Rewrite Module的防盗链规则设置

    IIS版本:IIS 7.5 URL Rewrite组件:IIS URL Rewrite Module(http://www.iis.net/downloads/microsoft/url-rewrit ...

  7. Ubuntu 13.10 下安装搜狗输入法

    1.卸载ibus输入法: sudo apt-get remove ibus     sudo为取得root权限的意思,Ubuntu系统默认root账户关闭,很多操作需要取得root     权限才可以 ...

  8. osgExp只能将3dmax中的动画导出为路径动画osg::AnimationPath,而不能导出osgAnimation::Animation。osg播放骨骼动画应该使用FBX格式

    通过实际的模型测试,导出为.osg文本格式,搜索animation,只能搜索到AnimationPathCallback,而搜索不到osgAnimation相关类 在OSGExp1.5.0源代码中搜索 ...

  9. SQL - ROW_NUMBER,Rank 添加序号列

    百度的时候查到的博客: http://blog.csdn.net/xsfqh/article/details/6663895-------------------------------------- ...

  10. 【python3】 django2.0 在生成数据库表时报错: TypeError: __init__() missing 1 required positional argument: 'on_delete'

    python: 3.6.4 django: 2.0 models.py 代码如下 # coding: utf-8 from django.db import models from django.co ...