C语言实现knn
以后写代码一定要谨慎,提高代码的正确率。
- /***************************************
- * 1.初始化距离为最大值
- * 2.计算未知样本和每个训练样本的距离为dist
- * 3.得到目前k个最邻近样本中的最大距离maxdist
- * 4.如果dist小于maxdist,则将改训练样本作为k-最近邻样本
- * 5.重复2、3、4,直至未知样本和训练样本的距离都算完
- * 6.统计k个最近邻样本中每个类别出现的次数
- * 7.选择出现频率最大的类别作为未知样本的类别
- * *****************************************/
- #include <stdio.h>
- #include <math.h>
- #include <stdlib.h>
- #include <string.h>
- #define MAX 0x7fffffff
- #define K 3
- double cal_dist(int n,double *x,double *y)
- {
- double sum = 0.0;
- int i =;
- for(i=;i<n;i++)
- {
- sum += pow((x[i]-y[i]),2.0);
- }
- return sqrt(sum);
- }
- void bubbleSort(double **array,int count,int flag)
- {
- int i = count,j;
- double temp;
- while(i>)
- {
- for(j=;j<i-;j++)
- {
- if(flag == )
- {
- if(array[][j] > array[][j+])
- {
- temp = array[][j];
- array[][j] = array[][j+];
- array[][j+] = temp;
- temp = array[][j];
- array[][j] = array[][j+];
- array[][j+] = temp;
- }
- }
- else if(flag == )
- {
- if(array[][j] > array[][j+])
- {
- temp = array[][j];
- array[][j] = array[][j+];
- array[][j+] = temp;
- temp = array[][j];
- array[][j] = array[][j+];
- array[][j+] = temp;
- }
- }
- }
- i--;
- }
- return;
- }
- int main()
- {
- int n,m;
- FILE *fp;
- fp = fopen("/data.txt","r");
- fscanf(fp,"N=%d,D=%d",&n,&m);
- printf("N=%d,D=%d\n",n,m);
- double **array;
- array = (double **)malloc(n*sizeof(double));
- array[] = (double *)malloc(n*m*sizeof(double));
- int h,j = ,i =;
- for(i=;i<n;i++)
- {
- array[i] = array[i-] + m;
- }
- for(i=;i<n;i++)
- {
- for(j=;j<m;j++)
- {
- fscanf(fp,"%lf",&array[i][j]);
- }
- }
- double **temp;
- temp = (double **)malloc(*sizeof(double));
- temp[] = (double *)malloc(*K*sizeof(double));
- for(i=;i<;i++)
- {
- temp[i] = temp[i-] + K;
- }
- for(i=;i<;i++)
- {
- for(j=;j<K;j++)
- {
- temp[i][j] = MAX*0.1;
- }
- }
- double *testdata;
- double max_dist = 0.0;
- double distance = 0.0;
- double tmp = 0.0;
- testdata=(double *)malloc((m-)*sizeof(double));
- printf("input test data containing %d numbers:\n",m-);
- for(i=;i<(m-);i++)
- {
- fscanf(fp,"%lf",&testdata[i]);
- }
- close(fp);
- while()
- {
- for(i=;i<K;i++)
- {
- if(K > n) break;
- temp[][i] = cal_dist(n,testdata,array[i]);
- temp[][i] = array[i][m-];
- }
- for(i=;i<K;i++)
- {
- printf("%4lf,%4lf\n",temp[][i],temp[][i]);
- }
- printf("\n");
- bubbleSort(temp,K,);
- max_dist = temp[][K-];
- for(i=K;i<n;i++)
- {
- distance = cal_dist(n,testdata,array[i]);
- if(max_dist > distance)
- {
- for(j=;j<K;j++)
- {
- if(distance < temp[][j])
- {
- for(h=K-;h>j;h--)
- {
- temp[][h] = temp[][h-];
- temp[][h] = temp[][h-];
- }
- }
- temp[][j] = distance;
- temp[][j] = array[i][m-];
- }
- }
- max_dist = temp[][K-];
- }
- bubbleSort(temp,K,);
- break;
- }
- int value_label = ;
- int count = ;
- int flag = ;
- for(i=;i<K-;i++)
- {
- if(temp[][i] != temp[][i+])
- {
- if(flag > count)
- {
- flag = count;
- value_label = temp[][i];
- count =;
- }
- }
- else
- {
- count ++;
- }
- }
- if(count > flag)
- {
- value_label = temp[][K-];
- flag = count;
- }
- printf("Predict message is %d\n",value_label);
- return ;
- }
C语言实现knn的更多相关文章
- 机器学习与R语言:kNN
#---------------------------------------- # 功能描述:演示kNN建模过程 # 数据集:威斯康星乳腺癌诊断 # #---------------------- ...
- 数据分析与挖掘 - R语言:KNN算法
一个简单的例子!环境:CentOS6.5Hadoop集群.Hive.R.RHive,具体安装及调试方法见博客内文档. KNN算法步骤:需对所有样本点(已知分类+未知分类)进行归一化处理.然后,对未知分 ...
- 大数据时代的精准数据挖掘——使用R语言
老师简介: Gino老师,即将步入不惑之年,早年获得名校数学与应用数学专业学士和统计学专业硕士,有海外学习和工作的经历,近二十年来一直进行着数据分析的理论和实践,数学.统计和计算机功底强悍. 曾在某一 ...
- 机器学习 第五篇:分类(kNN)
K最近邻(kNN,k-NearestNeighbor)算法是一种监督式的分类方法,但是,它并不存在单独的训练过程,在分类方法中属于惰性学习法,也就是说,当给定一个训练数据集时,惰性学习法简单地存储或稍 ...
- kd树和knn算法的c语言实现
基于kd树的knn的实现原理可以参考文末的链接,都是一些好文章. 这里参考了别人的代码.用c语言写的包括kd树的构建与查找k近邻的程序. code: #include<stdio.h> # ...
- 【机器学*与R语言】2-懒惰学*K*邻(kNN)
目录 1.理解使用KNN进行分类 KNN特点 KNN步骤 1)计算距离 2)选择合适的K 3)数据准备 2.用KNN诊断乳腺癌 1)收集数据 2)探索和准备数据 3)训练模型 4)评估模型的性能 5) ...
- k近邻算法(knn)的c语言实现
最近在看knn算法,顺便敲敲代码. knn属于数据挖掘的分类算法.基本思想是在距离空间里,如果一个样本的最接近的k个邻居里,绝大多数属于某个类别,则该样本也属于这个类别.俗话叫,"随大流&q ...
- 用R语言对一个信用卡数据实现logit,GBM,knn,xgboost
Prepare the data 数据来自UCIhttp://archive.ics.uci.edu/ml/machine-learning-databases/credit-screening,一个 ...
- knn算法的c语言实现
最近研究KNN,找到了一些优秀的源码,贴出来,做个笔记吧. #include<stdio.h> #include<stdlib.h> #include<math.h> ...
随机推荐
- 【MVVM Dev】多个具有依赖性质的ComboBox对数据的过滤
一.前言 在界面编程中,我们常常会遇到具有依赖性质的ComboBox框,比如最常见的: 省/直辖市 => 地级市/区 => 区/街道 今天就说一下在WPF的MVVM模式中如何实现该功能 二 ...
- 《剑指offer》— JavaScript(14)链表中倒数第k个结点
链表中倒数第k个结点 题目描述 输入一个链表,输出该链表中倒数第k个结点. 思路 两个指针,先让第一个指针和第二个指针都指向头结点,然后再让第一个指正走(k-1)步,到达第k个节点: 然后两个指针同时 ...
- python的StringIO模块
StringIO经常被用来作字符串的缓存,因为StringIO的一些接口和文件操作是一致的,也就是说同样的代码,可以同时当成文件操作或者StringIO操作. 一.StringIO中的常用方法 1.r ...
- MyEclipse解决Launching xx on MyEclipse Tomcat has encountered a problem
单击工具栏Run,选中Run Configurations... 将MyEclipse Server Application里面的工程右击选择Delete就好了.
- poi复杂excel的实现
一:前言 最近帮一个朋友做excel的导出功能,对于我来说还是挺头疼,我看了下表格样式,对于我来说还是挺头疼的,想当年耗子刚刚出社会的时候做的第一份工作,第一份任务就是把把word转换为html,在这 ...
- Linux_创建母版,快速克隆,如何移动虚拟机.ziw
2017年1月9日, 星期一 Linux_创建母版,快速克隆,如何移动虚拟机 1. 安裝虚拟机 2. 建立母版——第一次启动虚拟机 2.1 设置网卡为NAT模式 2. ...
- CSS 颜色属性
一.十六进制表示,如: a{ color: #F0E68C; } 当RGB一样时,可以简写,如#AABBCC 可以写成 #ABC 二.rgb(r,g,b)形式,其中rgb的值为1~255之间,如: a ...
- each()和eq()
今天工作的时候要遍历一个表格,于是我就想到了each(),也没看文档就开始写,大概是这么写的 $(".class").each(function(){ this.click(fun ...
- 【leetcode 简单】第五十题 位1的个数
编写一个函数,输入是一个无符号整数,返回其二进制表达式中数字位数为 ‘1’ 的个数(也被称为汉明重量). 示例 : 输入: 11 输出: 3 解释: 整数 11 的二进制表示为 00000000000 ...
- E.Text Editor (Gym 101466E + 二分 + kmp)
题目链接:http://codeforces.com/gym/101466/problem/E 题目: 题意: 给你s串和t串,一个数k,求t的最长前缀串在s串中出现次数不少于k. 思路: 一眼二分+ ...