1.测试文件

A:B,C,D,F,E,O

B:A,C,E,K

C:F,A,D,I

D:A,E,F,L

E:B,C,D,M,L

F:A,B,C,D,E,O,M

G:A,C,D,E,F

H:A,C,D,E,O

I:A,O

J:B,O

K:A,C,D

L:D,E,F

M:E,F,G

O:A,H,I,J

2.方法

2-1.方法一:

  1. 1.将域用户和好友分别作为值和键输出
  2. {B,C,D,F,E,O}:A
  3. {A,C,E,K}:B
  4. 2.可以看出:B,C,D,F,E,O都有共同好友A
  5. 3.A的好友两两组合作为键,A作为值,冒泡输出
  6. 4.经过shuffle处理后,会把BC作为键,共同好友作为值放入集合中
  7. 5.迭代集合中的好友,一次输出即可

2-2.方法二:

  1. 1.将用户和好友作为键和值输出
  2. A:B,C,D,F,E,O --A:B,C,D,F,E,O
  3. B:A,C,E,K --B:A,C,E,K
  4. C:F,A,D,I --C:A,D,F,I
  5. D:A,E,F,L --D:A,E,F,L
  6. E:B,C,D,M,L --E:B,C,D,L,M
  7. 2.将所有键值对添加到map集合中
  8. 3.map的键(所有用户)为数组
  9. 4.迭代数组,通过用户名"A"map中取得他的好友
  10. 5.迭代除用户"A"以外的其他用户,获取这些用户的好友;
  11. 如果有用户同时存在于"A""B"的好友列表中
  12. 那么这些好友就是"AB"的共同好友
  13. --A:{B,C,D,F,E,O}
  14. --B:{A,C,E,K}
  15. "A"中存在"C,E"用户,"B"中也存在"C,E"用户,那么"C,E"就是AB的共同好友
  16. 6."AB"作为键,共同好友作为值输出即可

3.代码

  1. public class Friends {
  2. // map
  3. public static class MRMapper extends Mapper<LongWritable, Text, Text, Text> {
  4. protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {
  5. String str = value.toString();
  6. String friends = str.substring(2);
  7. System.out.println(friends);
  8. context.write(new Text(str.charAt(0) + ""), new Text(friends));
  9. }
  10. }
  11. // reduce
  12. public static class MRReducer extends Reducer<Text, Text, Text, Text> {
  13. private static HashMap<String, String> map1 = new HashMap<String, String>();
  14. public void run(Context context) throws IOException, InterruptedException {
  15. try {
  16. while (context.nextKeyValue()) {
  17. reduce(context.getCurrentKey(), context.getValues(), context);
  18. }
  19. } finally {
  20. cleanup(context);
  21. }
  22. }
  23. public void reduce(Text key, Iterable<Text> iterable, Context context)
  24. throws IOException, InterruptedException {
  25. for (Text t : iterable) {
  26. map1.put(key.toString(), t.toString());
  27. }
  28. }
  29. public void cleanup(Reducer<Text, Text, Text, Text>.Context context)
  30. throws IOException, InterruptedException {
  31. List<String> list = new ArrayList<String>();
  32. Collection<String> keys = map1.keySet();// 所有用户
  33. String keys1 = keys.toString();
  34. String keys2 = keys1.substring(1, keys1.length() - 1);
  35. String[] split = keys2.split(",");
  36. for (int i = 1; i < split.length; i++) {//迭代用户
  37. String a = split[i].trim();
  38. for (int j = (i+1); j < split.length; j++) {//迭代除外层循环以外的用户
  39. String b = split[j].trim();
  40. String a_and_b = "";
  41. // a的好友
  42. String af = map1.get(a);
  43. String[] friends = af.split(",");
  44. for (String s : friends) {//比较两个用户的好友列表,取共同好友
  45. if (map1.get(b).contains(s)) {
  46. a_and_b += "," + s;
  47. }
  48. }
  49. System.out.println(a + "," + b + " 共同好友 " + a_and_b);
  50. if (a_and_b.length() > 1) {
  51. list.add(a + "," + b + " 共同好友 :" + a_and_b.substring(1));
  52. }
  53. }
  54. }
  55. for(String s:list){
  56. context.write(new Text(""), new Text(s));
  57. }
  58. }
  59. }
  60. public static void main(String[] args) throws IOException, ClassNotFoundException, InterruptedException {
  61. Configuration conf = new Configuration();
  62. Job job = Job.getInstance(conf);
  63. job.setJarByClass(Friends.class);
  64. job.setMapperClass(MRMapper.class);
  65. job.setReducerClass(MRReducer.class);
  66. job.setCombinerClass(MRReducer.class);
  67. job.setMapOutputKeyClass(Text.class);
  68. job.setMapOutputValueClass(Text.class);
  69. job.setOutputKeyClass(Text.class);
  70. job.setOutputValueClass(Text.class);
  71. FileInputFormat.setInputPaths(job, new Path("hdfs://hadoop5:9000/input/friends.txt"));
  72. FileOutputFormat.setOutputPath(job, new Path("hdfs://hadoop5:9000/output/friends"));
  73. System.out.println(job.waitForCompletion(true) ? 1 : 0);
  74. }
  75. }

如果有更简洁的方法,欢迎留言给博主。

MapReduce寻找共同好友的更多相关文章

  1. python版mapreduce题目实现寻找共同好友

    看到一篇不知道是好好玩还是好玩玩童鞋的博客,发现一道好玩的mapreduce题目,地址http://www.cnblogs.com/songhaowan/p/7239578.html 如图 由于自己太 ...

  2. 用Mapreduce求共同好友

    import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs ...

  3. mapreduce 查找共同好友

    A:B,C,D,F,E,O B:A,C,E,K C:F,A,D,I D:A,E,F,L E:B,C,D,M,L F:A,B,C,D,E,O,M G:A,C,D,E,F H:A,C,D,E,O I:A, ...

  4. mapreduce求共同好友

    逻辑分析 以下是qq的好友列表数据,冒号前是一个用户,冒号后是该用户的所有好友(数据中的好友关系是单向的) A:B,C,D,F,E,O B:A,C,E,K C:F,A,D,I D:A,E,F,L E: ...

  5. MapReduce案例-好友推荐

    用过各种社交平台(如QQ.微博.朋友网等等)的小伙伴应该都知道有一个叫 "可能认识" 或者 "好友推荐" 的功能(如下图).它的算法主要是根据你们之间的共同好友 ...

  6. 大数据入门第九天——MapReduce详解(五)mapJoin、GroupingComparator与更多MR实例

    一.数据倾斜分析——mapJoin 1.背景 接上一个day的Join算法,我们的解决join的方式是:在reduce端通过pid进行串接,这样的话: --order ,,P0001, ,,P0001 ...

  7. 中国移动飞信WAP登陆分析及脚本

    中国移动飞信WAP网页版 http://f.10086.cn/im5/ 用WAP飞信登录并向好友发送信息,同时用wireshark抓包. 1.过滤POST表单提交数据包(wireshark规则: ht ...

  8. MapReduce实现二度好友关系

    一.问题定义 我在网上找了些,关于二度人脉算法的实现,大部分无非是通过广度搜索算法来查找,犹豫深度已经明确了2以内:这个算法其实很简单,第一步找到你关注的人:第二步找到这些人关注的人,最后找出第二步结 ...

  9. 基于mapreduce的大规模连通图寻找算法

    基于mapreduce的大规模连通图寻找算法 当我们想要知道哪些账号是一个人的时候往往可以通过业务得到两个账号之间有联系,但是这种联系如何传播呢? 问题 已知每个账号之间的联系 如: A B B C ...

随机推荐

  1. js对象,set和get方法 的三种实现形式

    var obj1 = { name: 'shaanxi', get nameGet() { return this.name + 'a'; }, set nameSet(name) { this.na ...

  2. Python中function(函数)和methon(方法)的区别

    在Python中,对这两个东西有明确的规定: 函数function —— A series of statements which returns some value to a caller. It ...

  3. mysqlfront提示过期解决方式

    帮助菜单(help)->登记(registration) 粘贴就好了 gNBpPFgyOw9Rwt/ozsnjgM7tJNo2 bhaaAThangemMkaz2tQhq3/f7dZ7Vj29W ...

  4. Java与算法之(1) - 冒泡排序

    冒泡排序法的原理是,每次比较相邻的两个元素,如果它们的顺序错误就把它们交换过来. 例如对4 3 6 2 7 1 5这7个数字进行从小到大的排序,从最左侧开始,首先比较4和3 因为是从小到大排序,4和3 ...

  5. Axios使用说明

    vue更新到2.0之后,作者就宣告不再对vue-resource更新,而是推荐的axios,前一段时间用了一下,现在说一下它的基本用法. 首先就是引入axios,如果你使用es6,只需要安装axios ...

  6. CTF---Web入门第一题 what a fuck!这是什么鬼东西?

    what a fuck!这是什么鬼东西?分值:10 来源: DUTCTF 难度:易 参与人数:7942人 Get Flag:3358人 答题人数:3475人 解题通过率:97% what a fuck ...

  7. ECJTUACM16 Winter vacation training #1 题解&源码

    //寒假训练赛,第一次拿第一,感觉很爽哦,AC3题! A------------------------------------------------------------------------ ...

  8. 【WC2013】糖果公园

    Candyland 有一座糖果公园,公园里不仅有美丽的风景.好玩的游乐项目,还有许多免费糖果的发放点,这引来了许多贪吃的小朋友来糖果公园玩. 糖果公园的结构十分奇特,它由 nn 个游览点构成,每个游览 ...

  9. 洛谷 P1177 【模板】快速排序【13种排序模版】

    P1177 [模板]快速排序 题目描述 利用快速排序算法将读入的N个数从小到大排序后输出. 快速排序是信息学竞赛的必备算法之一.对于快速排序不是很了解的同学可以自行上网查询相关资料,掌握后独立完成.( ...

  10. Centos7安装和卸载Mongodb数据库

    MongoDB是一个基于分布式文件存储的数据库.由C++语言编写.旨在为WEB应用提供可扩展的高性能数据存储解决方案. MongoDB MongoDB是一个介于关系数据库和非关系数据库之间的产品,是非 ...