统计文件中单词的个数---Shell及python版

【统计文件中单词的个数---Shell及python版】的更多相关文章

统计文件中单词的个数---Shell及python版

最近在看shell中有个题目为统计单词的个数,使用了awk功能,代码如下 #!/bin/bash ];then echo "Usage:basename $0 filename" exit fi filename=$ egrep -o "[a-zA-Z]+" $filename | awk '{count[$0]++} END{printf "%-14s %s\n","Word","Count" for(i…

使用tuple统计文件中单词的个数

name = input("Enter file:") if len(name) < 1 : name = "input.txt" fhand = open(name) counts = dict() for line in fhand: words = line.split() for word in words: # find the value that key is word, if not, return 0 counts[word] = count…

学c语言做练习之统计文件中字符的个数

统计文件中字符的个数(采用命令行参数) #include<stdio.h> #include<stdlib.h> int main(int argc, char *argv[]) { char ch; FILE *fp; long count=0; if(argc !=2) { printf("文件名是:%s\n",argv[0]); exit(EXIT_FAILURE); } if ((fp=fopen(argv[1],"r…

JAVA实验--统计文章中单词的个数并排序

分析: 1)要统计单词的个数,就自己的对文章中单词出现的判断的理解来说是:当出现一个非字母的字符的时候,对前面的一部分字符串归结为单词 2)对于最后要判断字母出现的个数这个问题,我认为应该是要用到map比较合适吧,因为map中有键-值的关系,可以把字符串设置为键,把出现的个数设置为整型,这样就能够建立起一一对应的关系,不用再判断所在的位置根据上面自己的理解,今天我写了以下的一部分代码,对哈利波特第一集的这部分文章进行了单词的统计的测试,测试的结果相对良好,没有问题. package pip…

C语言算法--统计字符串中单词的个数

#include <stdio.h> #include <string.h> #include <stdlib.h> int main(void) { int len ; int i ; int flag = 0 ; int count = 0 ; char buffer[20] = {'\0'} ; gets(buffer); puts(buffer); for(i = 0 ; i < strlen(buffer) ; i++) { //判断输入字符串中间有没有…

Python 统计文本中单词的个数

1.读文件,通过正则匹配 def statisticWord(): line_number = 0 words_dict = {} with open (r'D:\test\test.txt',encoding='utf-8') as a_file: for line in a_file: words = re.findall(r'&#\d+;|&#\d+;|&\w+;',line) for word in words: words_dict[word] = words_dict.…

Linux统计文件中单词出现的次数

grep -E "\b[[:alpha:]]+\b" /etc/fstab -o | sort | uniq -c 或 awk '{for(i=1;i<NF;i++){count[$i]++}}END{for(i in count) {print i,count[i]}}' /etc/fstab -E 使用正则进行匹配 \b : backspace 退格 print 参数表示每行匹配完了回车 [[:alpha:]] : 代表所有字符 sort 去重 uniq -c 排序 -…

Scala快速统计文件中特定单词，字符的个数

val fileContent=Source.fromFile("/home/soyo/桌面/ss5.txt").getLines.mkString(",") //这里统计文件中每行最后字符是0的个数 println(fileContent.split(",0,").length) if(fileContent.endsWith(",0")) //判断最后一个字符是不是0,不是0:需要总数减1,是0:不需要改变 println…

sort +awk+uniq 统计文件中出现次数最多的前10个单词

实例cat logt.log|sort -s -t '-' -k1n |awk '{print $1;}'|uniq -c|sort -k1nr|head -100 统计文件中出现次数最多的前10个单词使用linux命令或者shell实现:文件words存放英文单词,格式为每行一个英文单词(单词可以重复),统计这个文件中出现次数最多的前10个单词. cat words.txt | sort | uniq -c | sort -k1,1nr | head -10 主要考察对sort.uniq命令…

java统计文本中单词出现的个数

package com.java_Test; import java.io.File; import java.util.HashMap; import java.util.Iterator; import java.util.Scanner; import java.util.Set; public class test { public static void main(String[] args) throws Exception { new test().wordCount(); }//…