Massive Data Mining学习记录】的更多相关文章

第一周: 学习PageRank, 知识点:每个节点的权值由其他节点的投票决定,所有节点的权值和为1 当节点很多时候必须转换成矩阵运算来计算节点的最终值,由马尔可夫链可以证明,这个值可以迭代得到 问题:可能出现无出度节点,导致总体失衡 解决办法:每个节点的入读权值矩阵M' = 0.8*M + 0.2*1/n,以0.2的概率跳出当前节点 第二周: minhashing h(i) 随机排列后,一列数据的第一个不为1的下标 用普通hash替代每个minhashing(hash出每行每列,在移动行中,确定…
开新坑 开新坑了(笑)....公司项目使用的是Spring Data JPA做持久化框架....学习了一段时间以后发现了一点值得注意的小问题.....与大家分享 主要是针对1:N单向关联产生的一系列问题. @PrePersistent @PrePersist和@PreUpdate2个注解是我在公司项目里遇到的...公司是在save对象或者update对象的时候去影子表里同时做一个备份时用到的(公司项目很多地方我现在还是不懂...这里我是觉得他们是这么用的...)...然后公司的实体间的关系大部分…
原文: Wu X, Zhu X, Wu G Q, et al. Data mining with big data[J]. IEEE transactions on knowledge and data engineering, 2013, 26(1): 97-107. 大数据中的数据挖掘 Xindong Wu, Fellow, IEEE, Xingquan Zhu, Senior Member, IEEE, Gong-Qing Wu, and Wei Ding, Senior Member,…
Data Mining的十种分析方法: 记忆基础推理法(Memory-Based Reasoning:MBR)        记忆基础推理法最主要的概念是用已知的案例(case)来预测未来案例的一些属性(attribute),通常找寻最相似的案例来做比较.        记 忆基础推理法中有两个主要的要素,分别为距离函数(distance function)与结合函数(combination function).距离函数的用意在找出最相似的案例:结合函数则将相似案例的属性结合起来,以供预测之用.…
前言:工欲善其事,必先利其器.倘若不懂得构建一套大数据挖掘环境,何来谈Data Mining!何来领悟“Data Mining Engineer”中的工程二字!也仅仅是在做数据分析相关的事罢了!此文来自于笔者在实践项目开发中的记录,真心希望日后成为所有进入大数据领域挖掘工程师们的良心参考资料.下面是它的一些说明: 它是部署在Windows环境,在项目的实践开发过程中,你将通过它去完成与集群的交互,测试和发布: 你可以部署成使用MapReduce框架,而本文主要优先采用Spark版本: 于你而言,…
模型学习记录篇,仅仅自己学习时做的记录!!! 实现模型变更的三个步骤: 修改你的模型(在models.py文件中). 运行python manage.py makemigrations ,为这些修改创建迁移文件 运行python manage.py migrate ,将这些改变更新到数据库中. 模型字段类型: AutoField自增字段   一个IntegerField 根据实际ID自动增长. BigIntegerField   一个64位整数, 这个字段默认的表单组件是一个TextInput.…
最近在看 Faster RCNN的Matlab code,发现很多matlab技巧,在此记录: 1. conf_proposal  =  proposal_config('image_means', model.mean_image, 'feat_stride', model.feat_stride); function conf = proposal_config(varargin) % conf = proposal_config(varargin) % ------------------…
更新于2015/6/16日,因图片地址失效,请在此地址查看:http://note.youdao.com/share/?id=1c249ae6dc6150cbf692adec67b23a33&type=note 谢谢! 这几天在学习linux的一些知识,在这里记录学习记录.       以下是一些综合实践题: 课程综合实践题 实践描述:随着慕课网的不断发展,用户量不断上涨,MySQL数据量越来越庞大,占用磁盘空间越来越多,假设现有的服务器硬盘空间告急了.慕课网的服务器运维攻城狮坐不住了,向领导汇…
官方网站: Weka 3: Data Mining Software in Java 相关使用方法博客 WEKA使用教程(经典教程转载) (实例数据:bank-data.csv) Weka初步一.二.三.四 使用Weka进行数据挖掘 一个小时速度入门数据挖掘WEKA(一个完整的小例子) 百度文库 WEKA中文详细教程(全) WEKA 3-5-3 Experimenter 指南 数据挖掘工具(weka教程)   基本概念 classify分类     cluster聚类     Associate…
原文网址:http://m.blog.csdn.net/blog/chiooo/43985401 BLE 学习记录 ANROID BLE 开发,基于 bluetoothlegatt 分析 mBluetoothAdapter = mBluetoothManager.getAdapter(); 得到 手机上蓝牙主机的适配器 mBluetoothAdapter public boolean initialize() { // For API level 18 and above, get a refe…