Volume Analysis 1. “卷”可以理解为从逻辑上对物理存储设备的重新编制,便于操作系统管理. (A volume is a collection of addressable sectors that an Operating System (OS) or application can use for data storage.) 每个卷的第一个扇区通常是它的引导记录(VBR)(可以把整个磁盘看成一个更大的卷),引导记录内应包含对它所管辖范围内的分区表. 分区表记录了下属卷的起始…
CH4 带有约束条件的最小二乘法 重点提炼 提出带有约束条件的最小二乘学习法的缘故:   左图中可见:一般的最小二乘学习法有个缺点----对于包含噪声的学习过程经常会过拟合 右图:有了空间约束之后,学习到的曲线能避免过拟合,得到想要的学习结果(x-y关系). 带有约束条件的最小二乘学习法具体方法 1.部分空间约束的最小二乘学习法 ① 公式 在上面普通最小二乘学习法公式基础上添加一个约束条件:  ② 对线性模型进行带有约束条件的最小二乘学习,得到参数theta   ③ 优点:只用了参数空间的一部分…
Hard Disk Technology 1. 机械硬盘内部构造 几个重要概念:Sector(扇区),Head(读写头),Track(磁道),Cylinder(柱面). 如果一个文件比较大,磁盘的写入顺序如下,因此有了后面的CHS地址表示: 写满一个扇区->磁盘旋转,写同磁道的下一个扇区->写满一个磁道 ->电路切换,写下一盘面(下一个读写头)->写满一个柱面 ->动臂径向移动,写下一个柱面->写完整个文件 这是根据旋转等待(latency)时间<<寻道(s…
Data Organization 1. 进制转换. 按照正常的书写顺序写一个数字(无论多少进制),其中最左边的列称为“最高有效符号”,最右边的列称为“最低有效符号”. (The right-most column is called the least significant symbol, and the left-most column is called the most significant symbol.) 二进制.十进制与十六进制转换表,学过数电一定对这个很熟悉~   2. Da…
<代码整洁之道>ch1~ch4读书笔记  <clean code>正如其书名所言,是一本关于整洁代码规范的“教科书”.作者在书中通过实例阐述了整洁代码带来的种种利处以及混乱代码.冗余注释等带来的毁灭性后果,并且结合多段代码块.非常详尽地将“书写整洁代码的技巧与守则”教给读者.以下,是我本周细读其前四章的心得体会. 1.      Ch1:整洁代码三问:是什么,为什么,怎么做 为什么要写整洁代码?书中首先列举了几条案例,比如某公司的热门软件由于混乱代码导致无法维护.开发团队因为混乱代…
HDFS Federation (读书笔记) HDFS的架构 HDFS包含两个层次:命名空间管理(Namespace) 和 块/存储管理(Block Storage). 命名空间管理(Namespace) HDFS的命名空间包含目录.文件和块.命名空间管理是指命名空间支持对HDFS中的目录.文件和块做类似文件系统的创建.修改.删除.列表文件和目录等基本操作. 块/存储管理(Block Storage) 在块存储服务中包含两部分工作:块管理和物理存储.这是一个更通用的存储服务.其他的应用可以直接建…
前言 最近在看Peter Harrington写的"机器学习实战",这是我的学习心得,这次是第13章 - 利用PCA来简化数据. 这里介绍,机器学习中的降维技术,可简化样品数据. 降维技术的用途 使得数据集更易使用: 降低很多算法的计算开销: 去除噪声: 使得结果易懂. 基本概念 降维(dimensionality reduction). 如果样本数据的特征维度很大,会使得难以分析和理解.我们可以通过降维技术减少维度. 降维技术并不是将影响少的特征去掉,而是将样本数据集转换成一个低维度…
前言 最近在看Peter Harrington写的"机器学习实战",这是我的学习心得,这次是第11章 - 使用Apriori算法进行关联分析. 基本概念 关联分析(association analysis)或者关联规则学习(association rule learning) 这是非监督学习的一个特定的目标:发现数据的关联(association)关系.简单的说,就是那些数据(或者数据特征)会一起出现. 关联分析的目标包括两项:发现频繁项集和发现关联规则.首先需要找到频繁项集,然后才能…
php中的数据类型: 一.8种主要数据类型 标量类型 1.整型(int|integer):八进制.十进制.十六进制.超过整型存储范围,会产生溢出. 整型数的字长和平台有关,尽管通常最大值是大约二十亿(32 位有符号).64 位平台下的最大值通常是大约 9E18.PHP 不支持无符号整数. 2.浮点类型(float|double|real):浮点型(也叫浮点数 float,双精度数 double 或实数 real). 浮点数的字长和平台相关,尽管通常最大值是 1.8e308 并具有 14 位十进制…
记得知乎以前有个问题说:如果用一天的时间学习一门技能,选什么好?里面有个说学会Git是个很不错选择,今天就抽时间感受下Git的魅力吧.   Pro Git (Scott Chacon) 读书笔记:   第一章:Git起步   版本控制出现的原因及分类    类别 基本原理 优点 缺点 本地版本控制系统 自己把复制整个项目,改名或加上备份时间来区别 采用某种简单的数据库来记录文件的历次更新差异 简单 有时会混淆所在的工作目录, 丢了文件毛了数据就没有后退的路 集中化的版本控制系统 解决在不同系统上…