大数据,why python
《机器学习编程语言之争,Python夺魁》,又是一只黑天鹅
初步规划》blog中,我们极大地强化了大数据功能,并作为首个All-in-one大数据分析平台。参见:http://blog.sina.com.cn/s/blog_7100d4220102vlpa.html
3.0目标:目前最强的集成式Python开发平台,大数据分析平台,没有之一:
- 比pythonXY更加强大,内置全中文用户手册;
- 苹果“开箱即用”模式,绿色软件,解压即可,零配置。
- 首个All-in-one大数据分析平台:内置pandas、Scala、R语言、Q语言、Quant、matlab、hadoop、spark模块库和API接口支持。(仅限V3.0版本)
- 超强功能:图像处理、AI人工智能、机器学习、openCV人像识别、gpu、openCL并行超算开发、pygame游戏设计......
补充,本文发布后,发现也有学者开始强调“小数据”了
《大数据,小数据,哪道才是你的菜?》
http://blog.sina.com.cn/s/blog_7100d4220102vkdb.html
看来,zw的大方向,还是正确的 :)
这个都通不过其他都是扯蛋
百度都有相关的项目胜率<50%
one”级别的:
、Theano、Pylearn等
Pylearn2(python)”
初步规划》blog,有感而作,没有详细核对资料,可能有不少bug,请大家谅解)
可以称为大数据全栈式开发语言。因为 Python
在云基础设施,DevOps,大数据处理等领域都是炙手可热的语言。
就可以写出完整的 Web 应用,只要会 Python,就可以实现一个完整的大数据处理平台。
LeCun(燕乐存)的访问记录
LeCun(燕乐存),Facebook人工智能实验室主任,NYU数据科学中心创始人,计算机科学、神经科学、电子电气科学教授。
《大数据·实战个案“宏”分析》作为附件发这里
大数据·实战个案“宏”分析
MBA教育体系最成功之处,就在于导入了科学的个案分析。
Ps,二战最伟大的技术成功,不是原子弹、导弹、喷气机,而是流水线。流水线提供的生产力,比二战所有科技提高的总和还要高。
至于“宏”,学过c语言的,都知道宏定义、宏替换。
本文不玩文字游戏,也不玩数字游戏,只是简简单单,对几个大数据实战个案,进行宏观的定性分析。
目前,大数据,和大数据分析的核心,人工智能,都处于v0.1的黑暗期,这个阶段,“宏”分析,可能比大量的数字堆砌,更加重要。
还记得量子物理学爆发前的原子轨道模型吗?
当时,有几个人能够想象、理解原子轨道的跳变模型?
还记得天圆地方、地球中心学吗?
要不是哥伦布,“宏”分析一把,认为地球是个“球”,敢去环球探险?
废话少说,言归正传。
本文“宏”分析,包括以下几个大数据案例:
l 经典“啤酒+尿布”案例
l 2015中国股市“七·七”股灾
l 国内首个大数据网络推广个案
个案1:经典“啤酒+尿布”案例
“啤酒+尿布”案例,是最经典、最古老的大数据个案,其历史甚至比大数据这个名词更悠久。
早在上个世纪,dbase时代,数据仓库,数据分析,都用其做过案例。
久而久之,“啤酒+尿布”案例,似乎成了“神”一样的存在。
好像三大几何原理,成为大数据的基本“公理”。
不过,这个“神”,是“伪神”。
参见:《字王看:大数据观点补充》
http://blog.sina.com.cn/s/blog_7100d4220102vkdb.html
【黑天鹅才是新常态】
"啤酒和尿布有什么关系",这个十年前经典案例, 目前我是作为反面课件来说的
这个是冰岛的一个数据分析结果,至少 在中国 不存在
参见:《大数据与黑天鹅等》
http://blog.sina.com.cn/s/blog_7100d4220102vkxa.html
大数据,再多的专家,再nb的模型,再炫的demo,
也不如自己亲自去沃尔玛、家乐福、华润等超市亲眼看看,再回头问问这些大师们,"啤酒和尿布"模型,怎么玩砸了?
个案2:2015中国股市“七·七”股灾
blog《股灾、马云、大数据》
http://blog.sina.com.cn/s/blog_7100d4220102vpzv.html
blog,虽然发布与7月20日,但成文要早得多。
“这篇blog,股市关头“七·七”之日,就差不多构思,因为事件敏感,一直压住没有发布。”
笔者的这篇blog,可能是全网第一个,从大数据分析、技术层面,对“七·七”股灾,进行“宏”分析,断定事件:
“七·七”股灾,根本就不关华尔街、美帝什么事?
幸运的是,笔者blog当中,对于“七·七”股灾的“宏”分析,及其推断,目前,已经证明是科学的、正确的。
“七·七”股灾前后,整个社会好像“三战”核弹爆发,经济、金融的“灭国”之战,国家经济有倒退十年的危险。。。。。
连外访总理都匆忙回国,好像美国华尔街、联合欧洲、日本等全球资本,恶意做空中国,
更加关键的是,这种错误的推断,引发了政府部门实质性的的救市行为,上万亿的资金被导入股市,
好似当年三个代表,有关政府部门,近期言必“大数据”,这次股灾应对,必然会极大的参考大数据方面的资料。
可惜,政府主导的大数据,和其他政府项目一样,往往换来的是是十倍、百倍的失败。
面对“七·七”股灾,政府种种应对措施,全面失败,而且,闹出了个世界金融史上的超级“大乌龙”事件,居然找错了“靶标”。
“七·七”股灾的最终调查结果,目前虽然没有发布,但有消息称,虽然不一定正确:
前期,不过是江浙的一些土老板,为防止风险,做的空头对冲保险,因为配资杠杆,引发的技术性股市大幅度下调。
后期,则是因为程序化交易系统,对阀值K值的设定,引发的一系列自动抛盘,
就像前几年光大乌龙事件,专业人员一听,就知道是因为交易系统,相关参数,未进行初始化设置,直接上线引发的自动抛盘
也许,“七·七”股灾,根本就不关华尔街、美帝什么事?
完全是躺枪。
ps,8月10日新增片段:笔者很少引用中华网的资料,因为基本是TG的文宣。不过这次,过了一个月,这些blog也羞羞答答、间接认可了上面的推断。
《大老虎想在中国玩双头政治?白日做梦》
http://jnwct.blog.china.com/201508/13458004.html
欧洲最近有点看中国的笑话。大老虎作乱。欧美都看笑话。
(ps,应该就是这个“七·七”股灾的超级“大乌龙”事件)
个案3:国内首个大数据网络推广个案
2004年,我们利用AI人工智能和大数据分析技术,研发成功国内首个海量级社区营销软件:百万社区营销系统(软件著作权登记号:2005sr5133)。社区数据库超过一百万个,比同期类似产品,高两个数量级。
2008年,依托百万社区营销系统,在北京联合创办国内首家4A级的专业网络公关公司:wowa传媒,首年业绩突破一千万。
同年,“特仑苏” 危机公关案爆发,wowa受中国国际公关协会委托,在北京,首度对国内大型公关公司,统一进行专业的网络公关培训,被协会誉为:中国网络公关事业的开拓者和启蒙者。
Wowa服务过150+国际500强客户;是微软公司首家官方认证的网络公关服务商;新华美通首选网络传媒合作伙伴;国内TOP10网络公关公司,50%采购过wowa的服务。
2007年,操盘惠普笔记本“数码混搭”推广个案,成为年度十大公关行业经典案例(注意,非仅指网络公关);被业界誉为:史上最强之网络推广案例,没有之一;不可逾越的概念营销“标杆之作”。
我们在惠普笔记本“数码混搭”推广个案当中,首度提出的百度、谷歌搜索引擎:覆盖率指标,NLP反向链接数,等参数,目前已经成为网络公关行业的基础指数。
这个也是大数据技术,首度在网络推广方面的应用个案,我们当时的经验参数:1:1000。(百度NLP反向链接数-抽样采集率)。
按照客户要求,利用自行开发的AI语义分析系统,针对“笔记本电脑”,“数码混搭”两个主关键词,结合百度、搜狗的行业分类关键词,将发布主题帖,细分为数十组不同风格的软文,并在每篇软文前后,插入系统细分的关键词组。
硬件方面,我们采用了近百台PC,组成了一个简单的发布集群系统,通过1-2周时间,围绕关键词:hp笔记本、数码混搭,发布了过百万条网络推广软文。
最终,hp笔记本“数码混搭”的网络推广方案,获得了“空前绝后满天飞”的成功,软文的存活率非常高。
“数码混搭”个案当中高至70-80%的覆盖率,至今,国内外尚没有一家团队、公司能够超越,包括百度、谷歌自身。
python" title="大数据,why python">
python" title="大数据,why python">
技术博客:http://blog.sina.com.cn/zbrow
--------------
zwPython 3.0 初步规划
zwPython 3.0目标:目前最强的集成式Python开发平台,大数据分析平台,没有之一:
- ::
比pythonXY更加强大,内置全中文用户手册; - ::
苹果“开箱即用”模式,绿色软件,解压即可,零配置。 - ::
首个All-in-one大数据分析平台:内置pandas、Scala、R语言、Q语言、Quant、matlab、hadoop、spark模块库和API接口支持。(仅限V3.0版本) - ::
超强功能:图像处理、AI人工智能、机器学习、openCV人像识别、gpu、openCL并行超算开发、pygame游戏设计......
因为“All-in-one”大数据分析平台,增加了N多第三方软件,许多都是目前IT领域最前沿的大型系统,
测试相关脚本代码很耗时间,相关软件,包括python本身,也都在不断更新当中(而且非常活跃),
目前无法确定最终发布时间,初步预计需要6-10个月。
幸运的是,zwPython 3.0,基本平台框架,和80%的新增模块,都已经到位
至于为什么选择python,作为大数据分析平台,请参见blog《大数据,why python》
http://blog.sina.com.cn/
---
更多参见blog《大喜,python版opencv3发布 》
http://blog.sina.com.cn/s/blog_7100d4220102vo2m.html
zwPython3的升级也可以启动了,一直在等这个,zwPython会直接升级到版本3:zwPython3
大喜python版opencv3发布,demo脚本抢鲜版发布
zwPython3采用64位python3,支持opencv3
zwPython3的重点会由原来偏重于字库、图像处理,延展到大数据领域,会重点强化以下模块:
pandas数据分析
theano、Scikit
Learn机器学习
cuda、gpu并行超算
采用python3,是因为v3的内码是unicode,而且是趋势,目前模块库也n多了,超过一万个
原来用2.7版,最主要的是因为opencv2对python3
的支持很差
遗憾的是,opencv3的demo脚本还都是python2的,连GitHub的官方包都是
为方便大家学习opencv3,用2to3.py把demo脚本升级到python3,并修改了数据包目录
测试了一下,70%可以直接运行
作为抢鲜版,大家先凑合用用
下载还是在zw项目的百度网盘:
文件名:cv3python3demo.zip
大数据,why python的更多相关文章
- 《零起点,python大数据与量化交易》
<零起点,python大数据与量化交易>,这应该是国内第一部,关于python量化交易的书籍. 有出版社约稿,写本量化交易与大数据的书籍,因为好几年没写书了,再加上近期"前海智库 ...
- 【Python开发】Python 适合大数据量的处理吗?
Python 适合大数据量的处理吗? python 能处理数据库中百万行级的数据吗? 处理大规模数据时有那些常用的python库,他们有什么优缺点?适用范围如何? 需要澄清两点之后才可以比较全面的看这 ...
- zw·10倍速大数据与全内存计算
zw·10倍速大数据与全内存计算 zw全内存10倍速计算blog,早就在博客园机器视觉栏目发过,大数据版的一直挂着,今天抽空补上. 在<零起点,python大数据与量化交易>目录中 htt ...
- [转]大数据时代,python竟是最好的语言?
随着大数据疯狂的浪潮,新生代的工具Python得到了前所未有的爆发.简洁.开源是这款工具吸引了众多粉丝的原因.目前Python最热的领域,非数据分析和挖掘莫属了.从以Pandas为代表的数据分析领 ...
- python大数据工作流程
本文作者:hhh5460 大数据分析,内存不够用怎么办? 当然,你可以升级你的电脑为超级电脑. 另外,你也可以采用硬盘操作. 本文示范了硬盘操作的一种可能的方式. 本文基于:win10(64) + p ...
- Python/Numpy大数据编程经验
Python/Numpy大数据编程经验 1.边处理边保存数据,不要处理完了一次性保存.不然程序跑了几小时甚至几天后挂了,就啥也没有了.即使部分结果不能实用,也可以分析程序流程的问题或者数据的特点. ...
- 大数据全栈式开发语言 – Python
前段时间,ThoughtWorks在深圳举办一次社区活动上,有一个演讲主题叫做“Fullstack JavaScript”,是关于用JavaScript进行前端.服务器端,甚至数据库(MongoDB) ...
- 为大数据软件准备JAVA、Python环境
环境:SUSE 11 64位 安装JAVA JDK 1.确定版本.一般都是安装最新的JDK(Java SE Development Kit).个别软件和系统需要特定版本的JDK,根据实际需要下载. 2 ...
- 大数据Python学习大纲
最近公司在写一个课程<大数据运维实训课>,分为4个部分,linux实训课.Python开发.hadoop基础知识和项目实战.这门课程主要针对刚从学校毕业的学生去应聘时不会像一个小白菜一样被 ...
- 为什么说Python 是大数据全栈式开发语言
欢迎大家访问我的个人网站<刘江的博客和教程>:www.liujiangblog.com 主要分享Python 及Django教程以及相关的博客 交流QQ群:453131687 原文链接 h ...
随机推荐
- Android NDK开发-3-环境搭建
1.创建Android工程 2.打开android-ndk32-r10-windows-x86_64\android-ndk-r10\samples例子 3.打开hello-jni,拷贝java代码和 ...
- Linux mysqladmin 命令
mysqladmin命令可以用来设置或修改 MySQL 密码,常见用法如下: [root@localhost ~]$ mysqladmin -uroot password 'newPass' # 在无 ...
- EventBus 简单原理(一)
EventBus 1.根据文章最前面所讲的EventBus使用步骤,首先我们需要定义一个消息事件类: public class MessageEvent { private String messag ...
- linux上如何快速删除一个目录
在linux中删除一个目录很简单,很多人还是习惯用rmdir,不过一旦目录非空,就陷入深深的苦恼之中,现在使用rm -rf命令即可解决.直接rm就可以了,不过要加两个参数-rf 即:rm -rf ...
- PHP webservice 接口实例
原文地址,就不摘抄了 http://www.sky00.com/archives/91.html
- ubuntu安装TexturePicker
TexturePacker网页:https://www.codeandweb.com/texturepackerTexturePacker下载页面:https://www.codeandweb.com ...
- HTML5文件拖拽上传记录
JS文件: var FileName = ""; var FileStr = ""; (function () { function $id(id) { ret ...
- linux下有趣的几个命令
1.时常我们将频繁使用的‘ls’命令打成‘sl’,那就使用一下sl这个命令吧.在我们敲错的时候,肯定会会心一笑. 安装: yum install sl -y 或 apt-get install sl ...
- Minix2.0操作系统kernel文件分析
详细分析 MINIX消息机制的核心: mpx386.s start.c proc.c 保护模式分析: src/kernel/exception.c src/kernel/protect.c src/ ...
- 通过JS模拟select表单,达到美化效果[demo]
.m-form{background:#fff;padding:50px;font-family:12px/1.5 arial,\5b8b\4f53,sans-serif;} .m-form ul,. ...