创建图.启动图 Shift+Tab Tab 变量介绍: F etch Feed 简单的模型构造 :线性回归 MNIST数据集 Softmax函数 非线性回归神经网络   MINIST数据集分类器简单版本 二次代价函数 sigmoid函数 交叉熵代价函数 对数释然代价函数 拟合 防止过拟合 Dropout 优化器 优化器的使用 如何提升准确率? 1.改每批训练多少个 2.改神经网络中间层(神经元层数,每层的个数,每层用的激活函数,权重的初值用随机正态.要不要防止过拟合) 3.改计算loss的函数:…
dataguru访问地址:http://f.dataguru.cn/?fromuid=99611 课程优惠码:C4B6  这段时间一直在dataguru(炼数成金)上学习<hadoop数据分析平台(第十四期)>,说说我对炼数成金的印象. 最开始听说dataguru是通过它的广告邮件中的链接,发送的对象是itpub会员,如果你也是itpub会员,应该也会收到这么一封邮件. 后来才知道dataguru的前身是是ITPUB培训,ITPUB的创始人正是dataguru的主讲师-黄志洪(同时也是分布式系…
2016我定的目标就是要走出舒适区,进入学习区!为了少走弯路,节约学习的成本和时间,我选择了dataguru.看到心仪的课程毫不犹豫的就报了名. 分享了炼数成金邀请码,使用邀请码报名课程可以减免50%固定学费哦!http://www.dataguru.cn/invite.php?invitecode=AA62 课程优惠码:AA62 推荐理由有三: 1. 最近我在Dataguru学了<***>网络课程,挺不错的,你可以来看看!要是想报名,可以用我的优惠码 AA62 ,立减你50%的固定学费! 2…
炼数成金数据分析课程---14.Logistic回归 一.总结 一句话总结: 大纲+实例快速学习法 主要讲Logistic回归的原理及编程实现 1.事件的优势比(odds)是什么? 记y取1的概率是p=P(y=1|X),取0的概率 是1-p,取1和取0的概率之比为p/(1-p),称为事件的优势比(odds) 假设在p个独立自变量…
炼数成金数据分析课程---10.python中如何画图 一.总结 一句话总结: 主要matplotlib库,pandas中也可以画一些基础图 大纲+实例快速学习法 1.matplotlib的最简单画图操作是什么? 1.import matplotlib.pyplot as plt 2.plt.plot([1,2,3,2,3,2,2,6]) #这是y数据,自动生成x轴数据 3.plt.show() import matplotlib.pyplot as plt #####matplotlib创建图…
MapReduce工作原理图文详解 1.Map-Reduce 工作机制剖析图: 1.首先,第一步,我们先编写好我们的map-reduce程序,然后在一个client 节点里面进行提交.(一般来说可以在Hadoop集群里里面的任意一个节点进行,只要该节点装了Hadoop并且连入了Hadoop集群) 2.job client 在收到这个请求以后呢,会找到JobTracker并且请求一个作业ID(Job ID).(根据我们的核心配置文件,可以很轻易的找到JobTracker) 3.通过HDFS 系统把…
点击了解更多Python课程>>> Python数据分析[炼数成金15周完整课程] 课程简介: Python是一种面向对象.直译式计算机程序设计语言.也是一种功能强大而完善的通用型语言,已经具有十多年的发展历史,成熟且稳定.Python 具有脚本语言中最丰富和强大的类库,足以支持绝大多数日常应用. Python语法简捷而清晰,具有丰富和强大的类库.它常被昵称为胶水语言,它能够很轻松的把用其他语言制作的各种模块(尤其是C/C++)轻松地联结在一起. 课程大纲: 第一部分. Python基础…
chapter1 #变量 import tensorflow as tf x = tf.Variable([1,2]) a = tf.constant([3,3]) #增加一个减法op sub = tf.subtract(x,a) #增加一个假发op add = tf.add(x,sub) #初始化所有变量 init = tf.global_variables_initializer() with tf.Session() as sess: #变量初始化操作 sess.run(init) pri…
支持向量机SVM 原创性(非组合)的具有明显直观几何意义的分类算法,具有较高的准确率源于Vapnik和Chervonenkis关于统计学习的早期工作(1971年),第一篇有关论文由Boser.Guyon.Vapnik发表在1992年(参考文档见韩家炜书9.10节)思想直观,但细节异常复杂,内容涉及凸分析算法,核函数,神经网络等高深的领域,几乎可以写成单独的大部头与著.大部分非与业人士会觉得难以理解.某名人评论:SVM是让应用数学家真正得到应用的一种算法 思路 简单情况,线性可分,把问题转化为一个…
决策树decision tree 什么是决策树输入:学习集输出:分类觃则(决策树) 决策树算法概述 70年代后期至80年代初期,Quinlan开发了ID3算法(迭代的二分器)Quinlan改迚了ID3算法,称为C4.5算法1984年,多位统计学家在著名的<Classification and regression tree>书里提出了CART算法ID3和CART几乎同期出现,引起了研究决策树算法的旋风,至今已经有多种算法被提出…
视频地址:http://pan.baidu.com/s/1dDEgKwD 着重介绍了HDFS 运行了示例程序wordcount,自己也试了一遍(用的伪分布式) 1.建立数据(和讲师的操作有些不一样,不过我相信自己) 2.运行wordcount程序 3.查看结果 (可以看出来,只要没空格,它都看作是一个单词) 接下来介绍了50030和50070查看任务和HDFS状态 ...... 其中如果想看日志的话除了命令行也可以直接输入 http://localhost:50070/logs/ http://…
一.Tensorflow基本概念 1.使用图(graphs)来表示计算任务,用于搭建神经网络的计算过程,但其只搭建网络,不计算 2.在被称之为会话(Session)的上下文(context)中执行图 3.使用张量(tensor)表示数据,用“阶”表示张量的维度.关于这一点需要展开一下 0阶张量称为标量,表示单独的一个数 1阶张量称为向量, 表示一个一维数组 2阶张量称为矩阵,表示一个二维数组 …… 张量是几阶的可以通过张量右边的方括号数来判断.例如 t = [ [ [    ] ] ],显然这个…
1.海量日志数据,提取出某日访问百度次数最多的那个IP. 首先是这一天,并且是访问百度的日志中的IP取出来,逐个写入到一个大文件中.注意到IP是32位的,最多有个2^32个IP.同样可以采用映射的方法,比如模1000,把整个大文件映射为1000个小文件,再找出每个小文中出现频率最大的IP(可以采用hash_map进行频率统计,然后再找出频率最大的几个)及相应的频率.然后再在这1000个最大的IP中,找出那个频率最大的IP,即为所求. 或者如下阐述(雪域之鹰): 算法思想:分而治之+Hash 1.…
视频地址:http://pan.baidu.com/s/1dDEgKwD 最开始还是讲hadoop的起源,但是和其他垃圾视频不同,不是照本宣科,听了还是受益.作者给人一种感觉就是他是确实把他的经验和体会告诉别人,而不是像其他讲师把网上别人的思想讲一遍 视频给了课程目标,不知道我听完了视频能达到多少 Google是两个大学生创业建立起来的,值得我去反思,我的年轻在哪里? Google是hadoop的细想之源: 通讯运营商要向Google付费(Google已经垄断到这种地步了) Google的数据是…
1.大数据金字塔结构 Data Source-->Data Warehouses/Data Marts-->data exploration-->Data Mining-->Data Presentations-->Making Decisions 2.从业职位   业务人员.ETL工程师.数据仓库工程师(及时需求).数据分析师.数据展现设计师.   IT支持人员:运维.程序员.生产线数据管理员 3.数据分析:统计方法,有目的 地对收集到的数据进行处理.   数据挖掘:查找隐…
原文:http://www.oschina.net/news/43389/the-plight-of-programmer 在大型公司中不能腐蚀自己的学习能力和时间能力. 最近我为一个内核程序员的职位面试了十几个候选人.这些候选人都来自一些不错的大公司,这些公司在芯片或嵌入式操作系统领域十分有名.这些候选人大多声称自己在内核方面有着十年的在职工作经验.他们的简历看起来非常耀眼--各种相关的项目.术语和奖项--但他们几乎无人能够回答一个非常基础的问题:当我们调用标准的malloc函数时,内核中会发…
视频地址:http://pan.baidu.com/s/1dDEgKwD 第六课统讲了hadoop几个子项目和HBase,第七课还是讲的HBase 第八课讲了PIG 第九课讲了Hive和Zookeeper 第十课讲了sqoop 这一课还是比较受用,之前就一直疑问HDFS怎么和关系型数据库联系起来 原来有这样的组件 这几节讲的很笼统,也不实践,都是快进看的. Linux whereis命令 http://www.jb51.net/os/RedHat/1103.html MR的输出目录必须是不存在的…
视频地址:http://pan.baidu.com/s/1dDEgKwD 这一节是讲师助教带着动手操作写简单的开发环境的部署和两个实例 开发环境的部署:http://www.cnblogs.com/admln/p/test-deployDevelopment.html 第一个实例就是wordcount 第二个实例 package testHadoop; import java.io.IOException; import org.apache.hadoop.conf.Configuration;…
视频地址:http://pan.baidu.com/s/1dDEgKwD 这一节讲的全是理论 任务执行优化 : 1.推测式执行: 2.重用JVM: 3.忽略模式. 除了手动修改Log4J.properties也可以在web界面修改logLevle…
视频地址:http://pan.baidu.com/s/1dDEgKwD 这个视频理论性太强,不过倒是给了自己唯一的选项就是自己实践,不用像以前那样视频中敲一个字符,我也敲一个字符 讲到的内容: 介绍了三本书 讲师说第一本适合入门者,重实验,但是里面错误不少:第二本重理论,讲的深:第三本是高级人员才能看的,属于源码级别的书,深入解析了HDFS源码,并教你怎么修改以让你的HDFS最大限度的优化到完美对接自己的项目. 无疑,这才是我想搞定的. 接下来讲了怎么安装hadoop 伪分布式 完全分布式 以…
重点归纳 回归分析就是利用样本(已知数据),产生拟合方程,从而(对未知数据)迚行预测用途:预测,判别合理性例子:利用身高预测体重:利用广告费用预测商品销售额:等等.线性回归分析:一元线性:多元线性:广义线性非线性回归分析困难:选定变量(多元),避免多重共线性,观察拟合方程,避免过度拟合,检验模型是否合理 相关系数…
原文转载自「刘悦的技术博客」https://v3u.cn/a_id_189 笔者投入M1的怀抱已经有一段时间了,俗话说得好,但闻新人笑,不见旧人哭,Intel mac早已被束之高阁,而M1 mac已经不能用真香来形容了,简直就是"香透满堂金玉彩,扇遮半面桃花开!",轻抚M1 mac那滑若柔荑的秒控键盘,别说996了,就是007,我们也能安之若素,也可以笑慰平生.好了,日常吹M1的环节结束,正所谓剑虽利,不厉不断,材虽美,不学不高.本次我们尝试在M1 Mac os 中搭建Python3的…
TensorFlow是一个采用数据流图(data flow graphs),用于数值计算的开源软件库,说白了,就是一个库. 小编自己在Ubuntu搭建了深度学习框架TensorFlow,感觉挺简单,现在总结如下. 1.安装Anaconda 在ubuntu系统版本的Anaconda3已经集成了3.6版本的Python,安装步骤如下: a.下载Anoconda3 b.安装:以下操作在系统终端执行 输入yes: 默认安装位置 将Anconda的安装路径添加到环境变量中去,点yes,然后静静等待安装.…
什么是TensorFlow TensorFlow是谷歌在去年11月份开源出来的深度学习框架.开篇我们提到过AlphaGo,它的开发团队DeepMind已经宣布之后的所有系统都将基于TensorFlow来实现.TensorFlow一款非常强大的开源深度学习开源工具.它可以支持手机端.CPU.GPU以及分布式集群.TensorFlow在学术界和工业界的应用都非常广泛.在工业界,基于TensorFlow开发的谷歌翻译.谷歌RankBrain等系统都已经上线.在学术界很多我在CMU.北大的同学都表示Te…
[TensorFlow] ——( https://morvanzhou.github.io/tutorials/machine-learning/tensorflow/) 1.TensorFlow是啥? ——TensorFlow是Google开发的一款神经网络的Python外部的结构包,也是一个采用数据流图来进行数值计算的开源软件库.TensorFlow 让我们可以先绘制计算结构图, 也可以称是一系列可人机交互的计算操作, 然后把编辑好的Python文件 转换成 更高效的C++,并在后端进行计算…
笔记整理者:王小草 笔记整理时间2017年2月24日 原文地址 http://blog.csdn.net/sinat_33761963/article/details/56837466?fps=1&locationNum=5 Tensorflow官方英文文档地址:https://www.tensorflow.org/get_started/mnist/beginners 本文整理时官方文档最近更新时间:2017年2月15日 1.案例背景 本文是跟着Tensorflow官方文档的第二篇教程–识别手…
首先在这里给大家分享Google工程师亲授 Tensorflow2.0-入门到进阶教程 有需要的小伙伴可点击进入扣群下载,群内不定期的会分享资料教程,点击直达链接:https://jq.qq.com/?_wv=1027&k=55fzJrT #!/usr/bin/env python3.6# -*- coding: utf-8 -*-#fetchimport tensorflow as tfimport numpy as npimport matplotlib.pyplot as plt #实用n…
欢迎大家关注我们的网站和系列教程:http://www.tensorflownews.com/,学习更多的机器学习.深度学习的知识! 作者:AI小昕 在之前的Tensorflow系列文章中,我们教大家学习了Tensorflow的安装.Tensorflow的语法.基本操作.CNN的一些原理和项目实战等.本篇文章将为大家总结Tensorflow纯干货学习资源,非常适合新手学习,建议大家收藏.想要学习更多的Tensorflow知识,欢迎点击上方蓝字,关注我们的微信公众号. 一 .Tensorflow教…
来源 | 悦动智能(公众号ID:aibbtcom) 本篇文章将为大家总结TensorFlow纯干货学习资源,非常适合新手学习,建议大家收藏. ▌一 .TensorFlow教程资源 1)适合初学者的TensorFlow教程和代码示例: https://github.com/aymericdamien/TensorFlow-Examples 该教程不光提供了一些经典的数据集,更是从实现最简单的"Hello World"开始,到机器学习的经典算法,再到神经网络的常用模型,一步步带你从入门到精…
引言:AlphaGo在2017年年初化身Master,在弈城和野狐等平台上横扫中日韩围棋高手,取得60连胜,未尝败绩.AlphaGo背后神秘的推动力就是TensorFlow--Google于2015年11月开源的机器学习及深度学习框架.  TensorFlow在2015年年底一出现就受到了极大的关注,在一个月内获得了GitHub上超过一万颗星的关注,目前在所有的机器学习.深度学习项目中排名第一,甚至在所有的Python项目中也排名第一.本文将带我们简单了解下TensorFlow,并与其他主流深度…