c语言统计一个文件中的单词,字符和行数
body, table{font-family: 微软雅黑; font-size: 10pt} table{border-collapse: collapse; border: solid gray; border-width: 2px 0 2px 0;} th{border: 1px solid gray; padding: 4px; background-color: #DDD;} td{border: 1px solid gray; padding: 4px;} tr:nth-child(2n){background-color: #f8f8f8;}
|
#include<stdio.h>
#include<stdlib.h>
#include<string.h>
#define MAX 30
typedef struct node
{
char s[30];
struct node* next;
int count;
}node,*List;
int FindInDict(node **dict,char *s);
//int FindInDict(List dict,char *s);
void InsertToDict(node **dict,char *s);
//void InsertToDict(List dict,char *s);
void FindTop(node *dict,List top[],int n);
int main(int argc,char **argv)
{
FILE *fp=fopen(argv[1],"r");
char ch;
char word[30];
int len=0;
int c_ch=0,c_line=0,c_word=0;
node *dict =(node *)calloc(26,sizeof(node)); //定义动态数组,存放的是相应单词的头结点
node *top[10]={0}; //存放排名前十的单词的指针(内存地址)
int i=0;
fseek(fp,0,SEEK_SET);
if(fp!=NULL)
{
while((ch=fgetc(fp))!=EOF)
//注意这里必须(ch=fgetc(fp)),因为!=优先级高,先算!=结果为1,不加()结果ch=1
{
c_ch++;
len=0;
while(ch>='a'&&ch<='z')
{
word[len++]=ch;
ch=fgetc(fp);
c_ch++;
}
if(len!=0)
{
word[len]='\0';
c_word++;
if(FindInDict(&dict,word)==0)
//if(FindInDict(dict,word)==0)
InsertToDict(&dict,word);
// InsertToDict(dict,word);
}
if(ch=='\n')
c_line++;
}
printf("the number of character is:%d\n", c_ch);
printf("the number of line is:%d\n", c_line + 1);
printf("the number of word is:%d\n", c_word);
FindTop(dict,top,10);
for(i=0;i!=10;++i)
printf("the top %2d word is %-10s, %d\n", i + 1, top[i]->s, top[i]->count);
}
else
perror("fopen:The_Holy_Bible_Res.txt");
system("pause");
return 0;
}
int FindInDict(node **dict,char *s)
{
int index=(s[0]-'a');
node *p=((*dict)+index)->next;
while(p!=NULL)
{
if(strcmp((p->s),s)<0)
p=p->next;
else if(strcmp(p->s,s)>0)
return 0;
else
{
p->count++;
return 1;
}
}
return 0;
} |
void InsertToDict(List *dict,char *s)
{
int index=(s[0]-'a');
node *p=(*dict+index)->next;
node *word=(node *)malloc(sizeof(node));
word->count=1;
strcpy(word->s,s);
word->next=NULL;
if(NULL==p)
{
(*dict+index)->next=word;
}
else
{
if(strcmp(s,p->s)<0)
{
word->next=p;
(*dict+index)->next=word;
return;
}
while(p->next!=NULL)
{
if(strcmp(s,p->next->s)<0)
{
word->next=p->next;
p->next=word;
return;
}
else
p=p->next;
}
if(p->next!=word)
p->next=word;
}
}
int cmp(const void *a,const void *b) //List数组中任意两个元素的地址
{
List *i=(List*)a; //强制转换
List *j=(List*)b;
return ((*j)->count-(*i)->count);
}
void FindTop(List dict,List top[],int n)
{
node *p=dict;
node *q=p->next;
node *tmp[100000]={0};
int i,index=0;
while(p<dict+26)
{
while(q!=NULL)
{
tmp[index++]=q;
q=q->next;
}
p++;
q=p->next;
}
qsort(tmp,index,sizeof(List),cmp);
for(i=0;i<n;++i)
top[i]=tmp[i];
}
|
去除标点符号只要一个一个字符读,判断是标点符号就用空格代替;一个一个字符读是因为一行一行的读或者一个数组一个数组的读虽然能提高效率;但是有可能一个单词只读了一半在数组里数组就读满了,或者有些单词一行末尾没写完又转接写到下一行
c语言统计一个文件中的单词,字符和行数的更多相关文章
- MySQL数据库中统计一个库中的所有表的行数?
今天公司两个远端的数据库主从同步有点问题,查看下wordpress库下所有表的表的条目? mysql> use information_schema;Database changedmysql& ...
- 统计一个文件中出现字符'a'的次数
# -*- coding: utf-8 -*- #python 27 #xiaodeng #统计一个文件中出现字符'a'的次数 #http://www.cnblogs.com/hongten/p/ho ...
- HashMap 统计一个字符串中每个单词出现的次数
HashMap 统计一个字符串中每个单词出现的次数 import java.util.HashMap; import java.util.Map; public class Test { public ...
- js 统计一个字符串中出现的字符最多的字符
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/ ...
- C语言统计一个字符串中单词的个数
假定每一个单词用空格隔开. 样例: 输入:how are you! 输出:3 两种方法: 一: #include <stdio.h> #include <string.h> # ...
- Linux:从文件中搜索关键字并显示行数(cat,grep函数)
假如有test1.txt的格式如下图所示: 有test2.txt的内容如下: 现需将test2.txt含有的关键字的行搜索出来并显示行数 则可以用到命令: cat test1.txt | grep - ...
- 在Windows下通过命令行或者.bat文件统计一个目录中文件数量
在Windows下面怎样通过命令行统计一个目录中文件的数量,或者说,如果在一个.bat文件中,统计一个目录中的文件数量? 我原来以为是不可能的,要编一个vbs程序什么的,后来到网上找了下,发现还真是可 ...
- java算法面试题:编写一个程序,将a.txt文件中的单词与b.txt文件中的单词交替合并到c.txt文件中,a.txt文件中的单词用回车符分隔,b.txt文件中用回车或空格进行分隔。
package com.swift; import java.io.BufferedReader; import java.io.BufferedWriter; import java.io.File ...
- shell统计一个文件里某行出现的次数并排序
话说有个aaa.txt文件,文件内容如下: aaaabbbbccccddddeeeeffffmmmmooooaaaaccccaaaabbbbddddaaaammmmbbbbaaaaoooo 然后面试题 ...
随机推荐
- Elasticsearch强制重置未分配的分片(unassigned)
强制重置未分片的分片,这个问题源自于Elasticsearch维护中,Node意外退出的场景. 意外退出后Elasticsearch由于网络原因或者jvm性能压力,未能短时间内分配分片. 看一下分片的 ...
- timeline自适应时间轴
近期项目一直有类似QQ空间那样的时间轴,来展示公司新闻动态,或者流程之类的设计UI. 每每出现,不以为然,这次总结了下,精简下 ================= ================== ...
- Mongodb高级查询【二】
上一篇文章,写了mongodb常规操作,继续写入,本章主要讲高级查询,文本,聚集,大数据查询. Mongodb的查询语法是很多的,是NOSQL队伍中比较丰富的一个.当然有很多查询跟关系型查询无法相比. ...
- [Spark內核] 第41课:Checkpoint彻底解密:Checkpoint的运行原理和源码实现彻底详解
本课主题 Checkpoint 运行原理图 Checkpoint 源码解析 引言 Checkpoint 到底是什么和需要用 Checkpoint 解决什么问题: Spark 在生产环境下经常会面临 T ...
- http请求参数中包含特殊字符的严重后果,比如:#
URL请求中不能包含特殊符号,比如:# 今天在调接口,突然发现接口参数中传递的数据没有完全接收到controller层的model模型中,反反复复测了好几遍,真不信这个邪了,头晕脑胀的时候才关注到UR ...
- Linux下用ls和du命令查看文件以及文件夹大小
ls的用法 ls -l |grep "^-"|wc -l或find ./company -type f | wc -l 查看某文件夹下文件的个数,包括子文件夹里的. ls -lR ...
- TCP协议详解(一)
Tcp协议作为传输层的重要协议之一,想必每个稍有网络编程知识的人都不会感觉到陌生,三次握手/四次挥手这些基本概念也都是耳熟能详.但是当你们进行具体的网络编程的时候发现有很多事情并没有想象中的那么简单, ...
- 关于 for 循环与 循环嵌套
FOR循环精讲 > 1.初步结识 for是写出题的重要组成部分之一,每个题如果没有for循环根本是无法做出来的,可见for循环在c++语言中是有多么重要,那么for的格式是怎样的呢?? for( ...
- 【读书笔记】【深入理解ES6】#9-JavaScript中的类
大多数面向对象的编程语言都支持类和类继承的特性,而JavaScript却不支持这些特性,只能通过其他方法定义并关联多个相似的对象.这个状态一直从ECMAScript 1持续到ECMAScript 5. ...
- Django--进阶--中间件的使用
- 中间件是什么? 中间件是一个钩子框架,它们可以介入Django 的请求和响应处理过程.它是一个轻量级.底层的“插件”系统,用于在全局修改Django 的输入或输出. 每个中间件组件负责完成某个特定 ...