1.KNN原理: 存在一个样本数据集合,也称作训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一个数据与所属分类的对应关系.输入没有标签的新数据后,将新数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取样本集中最相似数据(最近邻)的分类标签.一般来说,只选择样本数据集中前 $k$ 个最相似的数据,这就是KNN算法 $k$ 的出处, 通常 $k$ 是不大于20的整数.最后,选择 $k$ 个最相似数据中出现次数最多的分类,作为新数据的分类. 2.实验准备: Python s…
Django学习笔记(一):环境安装与简单实例 通过本文章实现: Django在Windows中的环境安装 Django项目的建立并编写简单的网页,显示欢迎语与当前时间 一.环境安装 结合版本兼容性等原因,采用了Python3+Django1.11的组合.具体版本对应如下: Django version Python versions 1.11 2.7, 3.4, 3.5, 3.6 2.0 3.4, 3.5, 3.6, 3.7 2.1, 2.2 3.5, 3.6, 3.7 1.Python安装…
最近要做文字识别,不让直接用别人的接口,所以只能尝试去用开源的类库.tesseract-ocr是惠普公司开源的一个文字识别项目,通过它可以快速搭建图文识别系统,帮助我们开发出能识别图片的ocr系统.因为Windows环境开发,我也就必须在windows环境安装系统. 第一步:下载安装包 根据https://github.com/tesseract-ocr/tesseract/wiki,我找到非官方的安装包,好像我只看到64位的安装包http://digi.bib.uni-mannheim.de/…
一.环境安装 Win10(安装python3.x): 1.下载安装包     https://www.python.org/downloads/   2.安装完成后设置环境变量. 桌面-“计算机”-右键“属性”-“高级系统设置”-“高级”-“环境变量”-“系统变量”.找到Path,在后面加上python3.x安装路径下(记得用分号隔开)例             如;C:\Users\Administrator\AppData\Local\Programs\Python\Python35-32…
环境说明 系统版本:CentOS Linux release 7.3.1611 (Core) 内核版本:3.10.0-514.el7.x86_64 Httpd版本:Apache/2.4.6 (CentOS) MariaDB版本:5.5.52-MariaDB PHP版本:PHP 5.4.16 环境准备 [root@master ~]# setenforce 0 [root@master ~]# sed -i "s/SELINUX=enforcing/SELINUX=disabled/g"…
说明:这篇博客来自我的csdn博客,http://blog.csdn.net/lxxgreat/article/details/7753511 一.参考书:<hadoop权威指南--第二版(中文)> 二.hadoop环境安装 1.安装sun-jdk1.6版本 1)目前我只在一台服务器(CentOS5.5)上搭建hadoop环境,因此先卸载已安装的java1.4版本 卸载命令:yum -y remove java 2)下载sun-jdk1.6,地址:http://download.oracle.…
Standalone 环境安装 将 spark-3.0.0-bin-hadoop3.2.tgz 文件解压缩在指定位置(/opt/module) tar -zxvf spark-3.0.0-bin-hadoop3.2.tgz -C /opt/module 修改解压后文件名称为spark-standalone mv spark-3.0.0-bin-hadoop3.2 spark-standalone 进入解压缩后路径的 conf 目录,修改 slaves.template 文件名为 slaves m…
一.安装Python 1.下载安装python3.6 https://www.python.org/getit/ 2.配置环境变量(2个) 略...... 二.安装Python算法库 安装顺序:NumPy -> SciPy -> Matplotlib -> Scikit-Learn NumPy( Numberical Python )是一个开源的python科学计算库. 可用来存储和处理大型矩阵,比Python自身的嵌套列表(nested list structure)结构要高效的多(该…
1.测试安装版本 conda -V python -V 2.安装的命令 (1)库升级和安装 升级全部库:  conda upgrade --all [不知道为什么,我的conda install numpy总是失败,于是我暂时使用pip install numpy] 升级一个包  conda update packagename 安装包:conda install packagename 也可以安装多个包:   conda installl numpy pandas scipy 安装固定版本的包…
整个安装过程:     1. jdk 1.7.2   (http://www.oracle.com/technetwork/java/javase/downloads/index.html) 安装好之后环境变量配置:     新建系统变量JAVA_HOME 和CLASSPATH           变量名:JAVA_HOME           变量值:C:Program FilesJavajdk1.7.0          变量名:CLASSPATH           变量值:.;%JAVA…