四两拨千斤:借助Spark GraphX将QQ千亿关系链计算提速20倍 时间 2016-07-22 16:57:00 炼数成金 相似文章 (5) 原文  http://www.dataguru.cn/article-9648-1.html 主题 Graphx Spark 腾讯QQ有着国内最大的关系链,而共同好友数,属于社交网络分析的基本指标之一,是其它复杂指标的基础.借助Spark GraphX,我们用寥寥100行核心代码,在高配置的TDW-Spark集群上,只花了2个半小时,便完成了原来需要2…
3.9  指向内存位置的指针 一天,两个变量在街上遇到了: “老兄,你家住哪儿啊?改天找你玩儿去.” “哦,我家在静态存储区的0x0049A024号,你家呢?” “我家在动态存储区的0x0022FF0C号.有空来玩儿啊.” 在前面的章节中,我们学会了用int等数值数据类型表达各种数字数据,用char等字符数据类型表达文字数据,我们甚至还可以用结构体将多个基本数据类型组合形成新的数据类型,用以表达更加复杂的事物.除了这些现实世界中常见的数据之外,在程序设计当中,我们还有另外一种数据经常需要处理,那…
本文由  网易云发布. 近日,媒体曝光Memcache服务器一个漏洞,犯罪分子可利用Memcache服务器通过非常少的计算资源发动超大规模的DDoS攻击.该漏洞是Memcache开发人员对UDP协议支持的方式不安全导致的,黑客能通过它实现“反射型DDoS攻击”. 什么是反射型DDoS攻击,犯罪分子是如何利用UDP协议进行攻击的?我们应该采取什么方式去减少它所带来的危害?网易云首席安全架构师沈明星对此进行了解读. “四两拨千斤”的攻击方式 沈明星称,反射型DDoS攻击是一种新的变种.攻击者并不直接…
在智能手机.平板大行其道的今天,ARM这个名字我们几乎每天都要见到或者听到几次,作为编辑的我更是如此,每天涉及到的新闻总是或多或少跟ARM扯上关系,它还与Intel.AMD.NVIDA等公司有说不清道不明的仇怨情仇. 虽然名字如雷贯耳,但是很多人对ARM公司却缺少基本的认知,它到底有多强大以致于Intel在进军移动处理器市场上都要面临ARM公司的激烈竞争?实际上ARM公司小的很,从之前公布的Q1季度财报来看,其营收不过2.6亿美元,利润还不到9000万美元,这跟Intel Q1季度营收126亿美…
转载请注明出处:葡萄城官网,葡萄城为开发者提供专业的开发工具.解决方案和服务,赋能开发者. 原文参考:https://blog.bitsrc 如果你体验过JAVA这种强类型语言带来的便利,包括其丰富的类型变量.抽象与接口,转而使用JavaScript一定会觉得不够满意.尤其是JavaScript声明的变量Number可以轻而易举的分配给String,IDE如何执行任何类型的IntelliSense都让人十分困扰. 面对这个技术障碍,我们就无法忽视TypeScript带来的便利.相比较于JavaS…
压测之四两拨千斤核心观念: 1.传统的http请求肯定不能用于压测,原因是请求一次,响应一次,而响应数据同时占用了客户端的带宽,故此,客户端请求后,不需要接受响应,让服务器单相思去. 2.寻找可以令服务器产生内存或带宽(包括网络带宽/IO带宽等)负载的接口进行压测 何为压测,何为DDOS攻击.CC攻击,我想,百度会告诉你一切. 在做这件事情之前,我先贴上一份代码,如果你是测试工程师,或许这份代码对你有用. package com.ezone.test.socket;import java.net…
今天看了<白帽子讲web安全>一书,顺便记录一下,HttpOnly的设置 httponly的设置值为 TRUE 时,使得Javascript无法获取到该值,有效地防御了XSS打管理员的 cookie 这里以本博客作为测试对象,实现了一下. 找到网站 /include/lib/loginauth.php 文件,如下修改: 这里解释一下:在PHP>5.2版本中支持HttpOnly设置,可以直接在php.ini文件中设置,个人不推荐这种方式,推荐如上图所述在设置cookie时设置. setco…
快刀初试:Spark GraphX在淘宝的实践 作者:明风 (本文由团队中梧苇和我一起撰写,并由团队中的林岳,岩岫,世仪等多人Review,发表于程序员的8月刊,由于篇幅原因,略作删减,本文为完整版) 对于网络科学而言,世间万物都可以抽象成点,而事物之间的关系都可以抽象成边,并根据不同的应用场景,生成不同的网络,因此整个世界都可以用一个巨大的复杂网络来代表.有关复杂网络和图算法的研究,在最近的十几年取得了巨大的进展,并在多个领域有重要的应用. 作为最大的电商平台,淘宝上数亿买家和卖家,每天产生数…
简介 spark graphx官网:http://spark.apache.org/docs/latest/graphx-programming-guide.html#overview spark graphx是基于spark core之上的一个图计算组件,graphx扩展了spark RDD,是spark对于图计算的一种抽象. 这里的图,不是“图画”的意思,是一种数据结构.这种数据结构由“点”和“线”组成,拿用户关系图来说,“点”描述的就是用户,“线”描述的就是这些用户之间的关系,所以由“点”…
1.GraphX介绍 1.1 GraphX应用背景 Spark GraphX是一个分布式图处理框架,它是基于Spark平台提供对图计算和图挖掘简洁易用的而丰富的接口,极大的方便了对分布式图处理的需求. 众所周知·,社交网络中人与人之间有很多关系链,例如Twitter.Facebook.微博和微信等,这些都是大数据产生的地方都需要图计算,现在的图处理基本都是分布式的图处理,而并非单机处理.Spark GraphX由于底层是基于Spark来处理的,所以天然就是一个分布式的图处理系统. 图的分布式或者…