mapreduce课上实验】的更多相关文章

今天我们课上做了一个关于数据清洗的实验,具体实验内容如下: 1.数据清洗:按照进行数据清洗,并将清洗后的数据导入hive数据库中: 2.数据处理: ·统计最受欢迎的视频/文章的Top10访问次数 (video/article) ·按照地市统计最受欢迎的Top10课程 (ip) ·按照流量统计最受欢迎的Top10课程 (traffic) 3.数据可视化:将统计结果倒入MySql数据库中,通过图形化展示的方式展现出来. 本次主要是因为自己尚未掌握Hive的操作,之后得以请教本宿舍的大佬将hive 配…
今天上课的时候进行了一个mapreduce的实验,但是由于课下对于mapreduce还有hive的理解不够透彻,因此导致了课上没能完成这次实验. 关于本次课堂上的实验的内容大致为: 1.对一个70k的文本进行简单地清洗,这个部分实验过程中,主要花费的实验的时间在于解决java和hive之间的连接问题,主要原因还是在于课下在linux上仅仅只安装了hive之后没有在windows上进行连接上的测试.不过经过了不断的尝试最终还是能连接上. 2.对这个70k的文件进行3部分简单的数据处理之后,把得到的…
(一)命令行下程序开发 (二)IDEA下程序开发调试 Mac OS系统下使用的IDEA为 Netbeans (三)测试题我的学号后两位为10 使用简单的PHP小程序得我的题目为2:实现简单四则运算(能支持分数,加减乘除,支持括号),并进行测试(正常情况,异常情况,边界情况) 由于Sublime不能支持输入,所以在终端运行在编译好的class文件. 总共运行3次,分别测试了正常情况,异常情况,边界情况.…
第二周-课上 码云 https://gitee.com/bestiisjava2017/XinXiAnQuanXiTongSheJiJiChu20155325thl/tree/master/0927 https://gitee.com/bestiisjava2017/XinXiAnQuanXiTongSheJiJiChu20155325thl/tree/master/1001 博客 http://www.cnblogs.com/GDDFZ/p/7617830.html 第四周-课上 码云 htt…
问题的表述就是说有那么一个人,他在一个论坛上发帖,然后每贴必回,自己也发帖.那么这个人在发帖的数目上就超过了整个论坛的帖子数目的一半以上. 我对这个问题一开始的思路是,用SQL语句获取整个列表中的数据,每次用sql读取id出现次数List储存这个人的id,接着读取下一个id,若在list中存在则跳过.若发帖数大于数据/2则这个人是“水王”. 我在课上完成的代码如下,其中list是我定义的获取全部数据的一个sql函数: ClassService service=new ClassService()…
课上内容2:stat命令的实现-mysate 学习使用stat(1),并用C语言实现 提交学习stat(1)的截图 man -k ,grep -r的使用 伪代码 产品代码 mystate.c,提交码云链接 测试代码,mystat 与stat(1)对比,提交截图 首先,利用 man命令学习stat(1),man 1 stat,结果如下图: 通过学习理解到,stat命令主要用于显示文件或文件系统的详细信息, -L:显示符号链接所指向文件的信息 -f:显示文件所在文件系统的信息 -t:以简洁方式输出信…
实验要求: 编写一个程序 "week0603学号.c",运行下面代码: short int v = -学号后四位 unsigned short uv = (unsigned short) v printf("v = %d, uv = %u\n ", v, uv); 在第三行设置断点用gdb调试,用p /x v; p /x uv 查看变量的值,提交调试结果截图,要全屏,要包含自己的学号信息 分析p /x v; p /x uv 与程序运行结果的不同和联系 其中,强制转换…
课上测试 测试-3-ch02 任务详情 编写一个程序 "week0203学号.c",运行下面代码: 1 short int v = -学号后四位 2 unsigned short uv = (unsigned short) v 3 printf("v = %d, uv = %u\n ", v, uv); 在第三行设置断点用gdb调试,用p /x v; p /x uv 查看变量的值,提交调试结果截图,要全屏,要包含自己的学号信息 分析p /x v: p /x uv 与…
第一次在java课上的编程(使用参数输入求和): 代码: public class He {    public static void main(String[] args)    {        System.out.println("参数个数:"+args.length);        int b=0;        System.out.print("输入数:");        for(String arg:args)        {        …
目录 [第九周学习总结] 教材内容总结 [第八周课上测试] (一)求命令行传入整数参数的和 (二)练习Y86-64模拟器汇编 (三)基于socket实现daytime(13)服务器和客户端 参考资料 第九周学习总结 课堂内容总结 (一)学习目标 理解虚拟存储器的概念和作用 理解地址翻译的概念 理解存储器映射 掌握动态存储器分配的方法 理解垃圾收集的概念 了解C语言中与存储器有关的错误 (二)学习内容 (1)虚拟存储器 概念:虚拟存储器,又称虚拟内存(VM),是对主存的抽象概念 能力:①高效使用主…
课上补做:用C语言编程实现ls命令 一.有关ls ls :用来打印当前目录或者制定目录的清单,显示出文件的一些信息等. ls -l:列出长数据串,包括文件的属性和权限等数据 ls -R:连同子目录一同显示出来,也就所说该目录下所有文件都会显示出来 ls -a:可以将目录下的全部文件(包括隐藏文件)显示出来 ls -r:将排序结果反向输出 二.参考伪代码实现ls的功能,提交代码的编译,运行结果截图. 打开目录文件 针对目录文件 读取目录条目 显示文件名 关闭文件目录文件 #include <uni…
20175316 2018-2019-2 <Java程序设计>第2周课上测试总结 上周考试题目总结 题目1 题目要求: 在Ubuntu中用自己的有位学号建一个文件,教材p29 Example2_5 修改代码a[]中添加自己的学号,输入的数据中要有自己的学号 提交运行结果截图,要有找到和找不到的情况,要对边界值进行测试 过程 1.添加学号20175316 2.编译运行 题目2 题目要求: 在Ubuntu中用自己的有位学号建一个文件,教材p45 Example3_7 修改代码中的100为自己学号的…
2017-2018-1 20155326信息安全系统设计基础>嵌入式C语言课上考试补交 PPT上的例子 已知位运算规则为: &0 --> 清零 &1 --> 不变 |1 --> 置1 |0 --> 不变 getMinutes部分 由于Seconds是0-5位,因此先右移5位将Minutes的最低位与位0对齐,再与上0000 0000 0011 1111,即0x3F,可将6-15位全部清0,获得minuts部分. SetMinutes部分 代码如下: #defi…
1. 下载附件中的world.sql.zip, 参考http://www.cnblogs.com/rocedu/p/6371315.html#SECDB,导入world.sql,提交导入成功截图 2. 编写程序,查询世界上超过"你学号前边七位并把最后一位家到最高位,最高位为0时置1"(比如学号20165201,超过3016520:学号20165208,超过1016520)的所有城市列表,提交运行结果截图 3. 编写程序,查询世界上的所有中东国家的总人口 4. 编写程序,查询世界上的平均…
第一次测试 第二次测试 第三次测试 上传代码 第四次测试 总结 之前我一直在git bash进行程序设计,但是对于我来说操作起来有点困难,所以我改用了虚拟机,之后之前一直困扰我的问题在虚拟机下就没有了,而且一些·不要能进行的操作例如"tree","jdb调试"等都可以顺利进行.在上一周的课上试验中因为在用git bash运行代码时总是出现不识别的地方,并且也一直没有很好的解决,在以后的学习中我会多留意一些,看是否能找到解决方法.…
放暑假之前,建民老师就给我们布置了每一天学习两小时的代码,但是自己的不重视,根本就没有达到这个要求,简单学了一点点基本的东西,然后在开学的第一堂课上,连续三个小时的敲代码,让我意识到了自己的问题,一个系统,很多功能都没有实现,真正的感受到了付出与不付出最后的感觉,所以新学期的开始,自己就一定要有自己的规划 . 第一,   在上半年,就听到过建民老师说过一万小时定律,只有真正做一件事情达到一万个小时才能说自己对着一件事情非常的熟悉,而仔细算一算,自己想要在在即大学毕业之前达到一万个小时的目标,每一…
20155205 <Java程序设计>0510课上实践博客 一.教材代码检查-p98 未提交成功原因: 一开始在iterm中运行,但是结果出错,没有时间提交了.这个提交其实很简单,没有提交成功也是我自己当初没有好好调试的过. 二.Arrays和String单元测试 在IDEA中以TDD的方式对String类和Arrays类进行学习 测试相关方法的正常,错误和边界情况 String类 charAt split Arrays类 sort binarySearch 码云链接 分析: 参考API中bi…
第六周课上测试-1-ch02 1. 要求: 1.参考附图代码,编写一个程序 "week0601学号.c",判断一下你的电脑是大端还是小端. 2. 提交运行结果"学号XXXX的笔记本电脑是X端"的运行截图,要全屏,包含自己的学号信息 3.*************课下把代码推送到代码托管平台*************** 2. 测试代码: #include <stdio.h> #include <stdbool.h> union { int n…
课上实践补交 题目二要求: 学习使用stat(1),并用C语言实现 提交学习stat(1)的截图 man -k ,grep -r的使用 伪代码 产品代码 mystate.c,提交码云链接 测试代码,mystat 与stat(1)对比,提交截图 问题探索与解决 首先学习stat(1)指令:使用指令man 1 stat 使用指令man -k stat 使用指令man -k stat | grep 2 伪代码:就是获取stat结构然后打印. 产品代码: #include <sys/types.h>…
2017-2018-1 20155232 <信息安全系统设计基础>第四周学习总结以及课上myod练习补充博客 课上myod练习 1 参考教材第十章内容 2 用Linux IO相关系统调用编写myod.c 用myod XXX实现Linux下od -tx -tc XXX的功能,注意XXX是文件名,通过命令行传入,不要让用户输入文件名 不要把代码都写入main函数中 要分模块,不要把代码都写入一个.c中 5 提交测试代码和运行结果截图, 提交调试过程截图,要全屏,包含自己的学号信息 在第一次尝试在我…
说明 本次测试老师将所有课下测试的易错题全部重新考察了一遍,虽然是第二次做,还提前复习过,还是错了很多,回到寝室发现老师还没有结束测试,43分的我又忍不住再做了一遍. 做第二遍发现了有几个题目是蓝墨云上答案错误,老师在课上纠正过的,我还是和蓝墨云上的一样的答案,在做第二遍的时候特意改了一下. 题目 (多选题|1分)假设用ADD指令完成C表达式t=a+b的功能,有关条件码寄存器的说法正确的是() A.若t==0,则ZF=1 B.若t<0, 则CF=1 C.若t<0, 则SF=1 D.若(a<…
课上练习. 第一题: 参考 http://www.cnblogs.com/rocedu/p/6766748.html#SECCLA 在Linux下完成"求命令行传入整数参数的和" 测试代码传入自己的8位学号 上方提交代码 附件提交运行测试截图 课上做本题的时候很快就感觉自己写好了,但是运行的时候显示段错误.回去找原因的时候没有找到,后面发现是argv写成了argc造成的. 第二题 把第一个练习中的代码在X86-64(Ubuntu)中反汇编,给出汇编代码和机器码的截图 把X86-64汇编…
Bag类的接口的实现与测试(课上测试补做) 截图 由于截图有一定的的限制就没有吧所有的代码截进去,后面有代码. 代码 package ClassTest; import java.util.Objects; /** * Created by 春旺 on 2017/9/22. */ /* 实现接口BagInterface, 声明一个有限长度的T类型的数组用来储存各个类 */ public class Bag<T> implements BagInterface<T>{ public…
Java 课上的语录 在用系统类库的类的时候啊,你是不是充分的理解这个系统类库的类.比如这个 ArrayList 你是不是知道它里面有这样那样这样那样的函数,能够帮你做各种各样的事情.很重要,你不知道它有这个 toArray 你自己写个循环,自己写个循环又费时又可能出错,你知道它有 toArray 用就好了.它做的,一定比你效率更高,一定比你性能更好.…
一道Matlab编程题 & 暴力解法 Matlab课上老师出了这样一道题: 一个篮子有K个鸡蛋: 2个2个拿剩1个: 3个3个全部拿完: 4个4个拿剩1: 5个5个拿剩4个: 6个6个拿剩3个: 7个7个拿全部拿完: 8个8个拿剩1个: 9个9个拿全部拿完: 求篮子里鸡蛋的个数K 虽然这是一道matlab拿来玩的题目,可是我觉得完全可以拿来做笔试题或者面试题.仔细想还是有点考算法能力的. 这道题直观地想是非常简单的,简单一想就可以发现鸡蛋个数一定是7,9,3的最小公倍数63的N倍,然后我们就可以…
今天是第二周的java课. 自从转入了软件工程专业后,在我没有学习c++的基础上,直接开始了学习java的过程.不得不说过程很艰辛.今天下午老师让编写一个随机产生作业的软件.而我的基础差到都不知道如何创建数组. 在尴尬的坐了一下午后,我终于尴尬的回到了宿舍.激动的我又开始气冲冲的写代码,但写了一俩小时也没有什么进展.在借鉴了同学的作业后,明明是一模一样,我的却死活无法运行,显示by zero. 悲伤欲绝的我疯狂的修改代码,却仍然无法解决这个错误.最后才发现我误把一个变量名写成了另一个变量名.真是…
对于随机数的实验,根据课程上的教程,有如下的公式: 对应的变量参数的说明: 其中对应的Mouduls变量对应的就是公式中a的值,在公式中的含义就是相当于要循环多少个数才重复的一个值. Multiplier对应的就是公式中m的值,表示的是范围值,例如图上的16807表示的就是取种子返回的随机数的范围为0-16806. 公式中的c表示的是公式每次返回的随机数要增长的一个值,如果是常数的话,每次增长的值将会是一个固定的值,就变成了容易重复的状态,所以,为了不使其是一个重复的状态,我打算在每次取完随机数…
4. Index_Iterator实现 这里就是需要实现迭代器的一些操作,比如begin.end.isend等等 下面是对于IndexIterator的构造函数 template <typename KeyType, typename ValueType, typename KeyComparator> IndexIterator<KeyType, ValueType, KeyComparator>:: IndexIterator(BPlusTreeLeafPage<KeyT…
(在家里的电脑上Linux Deepin截的图,屏幕大一点的话,deepin用着还挺不错的说) 这个应该是大二的算法课程上机实验时做的一个小程序,也是我的第一个GUI小程序,实现什么的都记不清了,只记得当年费了不少心思,找了不少的资料,至今连好多排序算法还不会…咕~~(╯﹏╰)b 在排序算法的文件中还保存有直接从网上找的代码的地址链接…这些我都不会乱说的 在Linux下,键入make即可生成main程序,运行,点击上面的按钮就会调用各个排序函数计算,嗯…现在回想起来,貌似是做过内存拷贝保证各个排…
编写MyOD.java 用java MyOD XXX实现Linux下od -tx -tc XXX的功能 Linux下od -tx -tc XXX的功能 1.功能 od命令用于将指定文件内容以八进制.十进制.十六进制.浮点格式或ASCII编码字符方式显示,通常用于显示或查看文件中不能直接显示在终端的字符.od命令系统默认的显示方式是八进制,名称源于Octal Dump. 常见的文件为文本文件和二进制文件.od命令主要用来查看保存在二进制文件中的值,按照指定格式解释文件中的数据并输出,不管是IEEE…