本文作者:Jay Kreps,linkedin公司首席工程师:文章来自于他在linkedin上的分享:原文标题:The Log: What every software engineer should know about real-time data’s unifying abstraction. 文章内容非常干货,非常值得学习.文章将以四部分进行阐述,建议大家耐心看完. 第一部分:Log是什么? 第二部分:数据集成 第三部分:日志和实时流处理 第四部分:系统建设 我在六年前的一个令人兴奋的时…
转载自https://www.oschina.net/news/73939/hadoop-spark-%20difference 谈到大数据,相信大家对Hadoop和Apache Spark这两个名字并不陌生.但我们往往对它们的理解只是提留在字面上,并没有对它们进行深入的思考,下面不妨跟我一块看下它们究竟有什么异同. 解决问题的层面不一样 首先,Hadoop和Apache Spark两者都是大数据框架,但是各自存在的目的不尽相同.Hadoop实质上更多是一个分布式数据基础设施: 它将巨大的数据集…
1.对查询进行优化,应尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引. 2.应尽量避免在 where 子句中对字段进行 null 值判断,否则将导致引擎放弃使用索引而进行全表扫描,如:select id from t where num is null可以在num上设置默认值0,确保表中num列没有null值,然后这样查询:select id from t where num=0 3.应尽量避免在 where 子句中使用!=或<>操作符,否则引擎将放弃使用…
这里说的大数据是指你的网站数据库大小至少超过了500M,当然只有50M的网站也同样可以用这样的方法来轻松安全的实现网站搬家,前提是你使用的是linux环境下的VPS或者独立服务器. 我们假设你的网站域名为www.jqueryba.com,目前放置在A服务器上,我们的目标是把网站整体迁移到B服务器上. 对于A服务器的操作,我们主要有备份网站文件和数据库两个环节,在进行备份之前请先关闭你的网站,以免在数据备份过程中造成数据丢失. 一.备份网站文件 假设我们的网站文件存放路径为 /home/wwwro…
大数据全栈工程师一词,最早出现于Facebook工程师Calos Bueno的一篇文章 - Full Stack (需fanqiang).他把全栈工程师定义为对性能影响有着深入理解的技术通才.自那以后全栈这个词便流行起来,我看到过的就有大数据全栈工程师,大数据全栈设计师,大数据全栈运维,大数据全栈市场营销人员等等.我自己是名大数据程序员, 阿里巴巴年薪800k大数据全栈工程师成长记 需要的技能 全栈工程师的价值 随着时间的推移,全栈工程师的作用和价值在越来越多的产品或项目中得到了印证.那么,我们…
撰写我对java后端开发工程师选择方向的想法,写给在java后端选择转方向的人 背景 看到一些java开发工程师,对java后端薪酬太悲观了.认为换去大数据领域就会高工资.觉得java后端没有前途.我从事java后端开发,对大数据领域工作有些了解,但不深入.本文描述一下我对java后端和是否转大数据开发的个人见解. 目的 分析大数据领域分类 分析大数据工作工资高的原因 分析造成觉得java后端开发不够前景的原因 java后端转大数据工作做什么 转去大数据领域的各类方向与java后端比较衡量 一.…
前段时间,跟候选人聊天的时候,一个有多年工作经验的资深 iOS 工程师告诉我,他最近正在学习 Machine Learning 相关的知识.他觉得,对于程序员来说,技术进步大大超过世人的想象,如果你不跟随时代进步,就会落后于时代. 我其实已经听过很多人跟我说过类似的话.只不过不同人嘴里提到的词汇各有不同——大数据.数据挖掘.机器学习.人工智能…… 这些当前火热的概念各有不同,又有交叉,总之都是推动我们掌控好海量数据,并从中提取到有价值信息的技术. 程序员对这些技术跃跃欲试,知乎上「深度学习如何入…
大数据之行,始于足下:谈谈语料库知多少 作者:白宁超 2016年7月20日13:47:51 摘要:大数据发展的基石就是数据量的指数增加,无论是数据挖掘.文本处理.自然语言处理还是机器模型的构建,大多都是基于一定量的数据,数据规模达到一定程度,采用基于规则方法或者概率统计学的方法进行模型构建,感兴趣知识的获取才更有意义.那么,是不是数据足够大就是大数据了?是不是数据足够多就构成语料库了?往往一个模型好坏跟训练数据或者检验数据的语料库息息相关.本文笔者带你走进语料库的世界,在随后模型构建过程避免一些…
许久不见的朋友请我吃饭,期间给我介绍他一个弟弟,说明年要毕业了,还不知道找啥工作,说有培训机构让他学VR.大数据什么的,不知道前景咋样,想咨询一下我.相信很多朋友面临毕业,都不知道该从事哪个行业,自己又有能力做哪些工作,很迷茫!他说你早九晚六,周末双休,工作轻松工资又不低,多好啊,能不能让弟弟也干你这行? 确实如他所说,笔者2008年毕业以后,从事软件行业至今9个年头了,算是对行业比较了解的. 你是否适合做程序猿?     程序猿的爱好 我们先来说一下程序猿的日常生活吧.一般软件公司的上班时间是…
许久不见的朋友请我吃饭,期间给我介绍他一个弟弟,说明年要毕业了,还不知道找啥工作,说有培训机构让他学VR.大数据什么的,不知道前景咋样,想咨询一下我.相信很多朋友面临毕业,都不知道该从事哪个行业,自己又有能力做哪些工作,很迷茫!他说你早九晚六,周末双休,工作轻松工资又不低,多好啊,能不能让弟弟也干你这行? 确实如他所说,笔者2008年毕业以后,从事软件行业至今9个年头了,算是对行业比较了解的. 你是否适合做程序猿?     程序猿的爱好 我们先来说一下程序猿的日常生活吧.一般软件公司的上班时间是…