前段时间,由于项目中用到了序列挖掘的算法,师兄推荐我用用SPMF.在此做个记录. 首先简单介绍一下SPMF: SPMF是一个采用Java开发的开源数据挖掘平台. 它提供了51种数据挖掘算法实现,用于: 序列模式挖掘, 关联规则挖掘, frequent itemset 挖掘, 顺序规则挖掘, 聚类 HOME PAGE:http://www.philippe-fournier-viger.com/spmf/ 首先还是学习一下序列挖掘的有关概念: 所谓序列模式,我的定义是:在一组有序的数据列组成的数据…
开源安全平台Ossim 4.5系统使用入门 时长:15分钟 观看地址: http://www.tudou.com/programs/view/Yb0m4vPYlIQ/ 视频截图: 650) this.width=650;" style="float:none;" title="tmp-42.jpg" alt="wKioL1NDS1Ojck8dAAJ64VpEYps740.jpg" src="http://s3.51cto.co…
一. 前言 经过了一个多月的努力,软件系统又添加了不少新功能.这些功能包括非常实用的数据导入导出,对触摸进行优化的画布和画笔工具,以及对一些智能分析的报告生成模块等.进一步加强了平台系统级的功能. 马上要进入研三了,这套系统和我本人一样,前途未卜.一方面,实验室要求重新以JAVA开发一套数据挖掘框架而放弃当前的.NET版本,我的思路是两边一起发展,优势互补,可惜后继无人.另一方面,马上毕业的我,未来做不做数据挖掘工作都是两说,在多方面的压力下,开发软件目前近似于奢侈的选择.但是,就算是为了自己心…
Kaggle大数据竞赛平台入门 大数据竞赛平台,国内主要是天池大数据竞赛和DataCastle,国外主要就是Kaggle.Kaggle是一个数据挖掘的竞赛平台,网站为:https://www.kaggle.com/.很多的机构,企业将问题,描述,期望发布在Kaggle上,以竞赛的方式向广大的数据科学家征集解决方案,体现了集体智慧这一思想.每个人在网站上注册后,都可以下载感兴趣项目的数据集,分析数据,构造模型,解决问题提交结果.按照结果的好坏会有一个排名,成绩优异者还可能获得奖金/面试机会等. 图…
一. 前言 好久没有更新博客了,最近一直在忙着找工作,目前差不多尘埃落定.特别期待而且准备的都很少能成功,反而是没怎么在意的最终反而能拿到,真是神一样的人生. 言归正传,一直以来,数据挖掘系统的数据类型是我很头疼的问题,不可能为了每一种场景都定义一种新的数据类型,但通用类型又没法满足所有需求,而且性能上有影响.思来想去,最终决定结合两种特点制定一种方案:以通用类型为主,一些特定场合和要求再制定自定义类型,比如微博.   通用数据类型的名字叫FreeDocument,它的内部核心是Dictiona…
很早之前准备写Quartz系列文章,现在终于能够实现了.从本篇开始将带你实现一款自己的任务管理平台.在工作中你曾经需要应用执行一个任务吗?这个任务每天或每周星期二晚上11:30,或许仅仅每个月的最后一天执行.一个自动执行而无须干预的任务在执行过程中如果发生一个严重错误,应用能够知到其执行失败并尝试重新执行吗?你和你的团队是用.NET编程吗?如果这些问题中任何一个你回答是,那么你应该使用Quartz.NET调度器. 阅读目录 Quart.Net介绍 Cron表达式 开源TaskManager实现原…
odoo:开源 ERP/CRM 入门与实践 看了这张图,或许你对odoo有了一些兴趣. 这次Chat就是和大家一起交流开源ERP/CRM系统:odoo 对以下读者有帮助:研发.产品.项目.市场.服务.运营.管理等. 一.背景趋势 社交网络.电商O2O: 每家企业都将是电子商务企业.精益企业: 每家企业都需要有套软件管理人.财.物,管理信息量,物流和资金流. 二.odoo是什么 odoo不仅仅是开源ERP/CRM: 还是一套伴随企业成长可扩展的商业运营支撑系统: 一个巨大的应用生态系统,有近125…
    Hadoop平台K-Means聚类算法分布式实现+MapReduce通俗讲解 在Hadoop分布式环境下实现K-Means聚类算法的伪代码如下: 输入:参数0--存储样本数据的文本文件inputfile: 参数1--存储样本数据的SequenceFile文件inputPath: 参数2--存储质心数据的SequenceFile文件centerPath: 参数3--存储聚类结果文件(SequenceFile文件)所处的路径clusterPath: 参数4--类的数量k: 输出:k个类 Be…
上一篇开源任务管理平台TaskManager介绍发布后,有网友联系我看看能不能做个后台管理界面,方便管理系统中所有的任务.由于时间和技术问题1.0版本的时候,新增了一个3分钟读取配置文件动态修改任务的功能,不过总体来说还是不直观,操作不便捷.刚好最近接触到了Owin,可以实现自己的宿主程序运行Web站点,无需IIS中即可运行后台Web,这里演示的是点击控制台程序运行的结果.最近利用闲暇时间使用该技术实现了后台管理程序,也就是本文要说的TaskManagerV2.0版本.对TaskManagerV…
E-Form++是一套值得推荐的高品质开源C++矢量图形库,C++编程之所以异常困难,主要就是没有很专业的C++基础架构库有关.E-Form++的出现一定程度上填补了这个空白.是开发工控.监控.建模与仿真应用的必备之选. 下文是E-Form++开发工业组态平台HMIBuilder评估时如何添加自定义接口的方法说明: 如何为HMIBuilder开发的项目接上硬件数据 1. 在VC++中打开HMIDataDll.dsw项目. 2. 覆盖如下函数: void HMIGenData(const CStr…
在上一篇Legolas工业自动化平台入门(二)数据响应动作 一文中,我们介绍了"动作"相关内容,了解到"动作"分为多种,各种动作的添加方式相同,但是应用方式各自不同.这篇里,我们会介绍交互事件响应动作的使用. 首先来看一段视频: 在视频中能看到两种阀门(扳手式和旋转式)的不同动作,这里就以它们的实现为例,来介绍交互事件响应动作的使用. 交互事件响应动作指人机交互时的事件响应动作,例如鼠标.键盘,w3c中对各种交互事件有规范的命名,Legolas中交互事件响应动作也遵…
在上一篇文章Legolas工业自动化平台入门(一)搭建应用里,我们简单地提到了"动作"的概念.不清楚的童鞋不要着急,这篇我们就来介绍如何在Legolas平台上添加动作,并应用动作. 概念介绍 "动作"从使用场景角度可以分为数据响应动作和事件响应动作,其中事件响应动作又可以细分为交互响应动作和逻辑事件响应动作. "动作"是一个JavaScript的function,参数是包含属性值的绑定关系(relation): {bid:'', property…
Quartz.net 的开源任务管理平台 前面总结了很多,关于Quartz.net 的文章,介绍了如何使用Quartz.net.不清楚的朋友,可以看我之前的系列文章,http://www.cnblogs.com/zhangweizhong/category/771057.html . 最近,又重新整理,开发出了一套基于Quartz.net 的任务管理平台.将Quartz.net 的任务调度,管理等功能统一整合,形成了一套比较完整的任务调度平台.主要是:任务调度服务,后台任务管理 等功能. git…
在统计计算中,最大期望(EM,Expectation–Maximization)算法是在概率(probabilistic)模型中寻找参数最大似然估计的算法,其中概率模型依赖于无法观测的隐藏变量(Latent Variabl).最大期望经常用在机器学习和计算机视觉的数据集聚(Data Clustering)领域.最大期望算法经过两个步骤交替进行计算,第一步是计算期望(E),也就是将隐藏变量象能够观测到的一样包含在内从而计算最大似然的期望值:另外一步是最大化(M),也就是最大化在 E 步上找到的最大…
在网络日益发达的现在,也伴随着有益信息与造成不稳定因素的信息也随之日益泛滥,为了网民的思想健康,也为了社会的和谐,在许多对外公共场合下,有些内容是要经过审查才能显示的.在网络审查初期,都是通过人工审核,这种审核方式虽然准确且智能,但与网络文字产生的速度相比,其效率就显示微不足道了!因此,自动化的系统处理方式的需求越来越强烈-- 而NLPIR大数据挖掘平台是一套专门针对原始文本集进行处理和加工的软件,提供了中间件处理效果的可视化展示,也可以作为小规模数据的处理加工工具.用户可以使用该软件对自己的数…
Kaltura是一个很优秀的开源视频平台.提供了视频的管理系统,视频的在线编辑系统等等一整套完整的系统,功能甚是强大. Kaltura不同于其他诸如Brightcove,Ooyala这样的网络视频平台,主要区别表现在:一方面,它的代码是开源的,可以免费部 署到企业:另一方面,它拥有一个模块化结构,可以让用户根据自己的需要购买平台的部分服务,而不是像其他公司那样采取一刀切的购买模式:最后它允许客户连 接到Kaltura自己的托管平台,在后台部署自己的防火墙,为用户提供最大的安全保障.由于上述的产品…
Linux开源监控平台归总 Cacti 偏向于基础监控.成图非常漂亮,需要php环境支持,并且需要mysql作为数据存储 Cacti是一个性能广泛的图表和趋势分析工具,可以用来跟踪并几乎可以绘制出任何可监测指标,描绘出图表.从硬盘的利用率到风扇的转速,在一个电脑管理系统中,只要是可以被监测的指标,Cacti都可以监测,并快速的转换成可视化的图表. Nagio 不用存储历史数据,注重服务或者监控项的状态 Nagios是一款开源的免费网络监视工具,能有效监控Windows.Linux和Unix的主机…
物联网(IoT)是帮助人工智能(AI)以更好的方式控制和理解事物的未来技术. 我们收集了一些最有名的物联网平台,帮助您以受控方式开发物联网项目. 物联网平台是帮助设置和管理互联网连接设备的组件套件. 一个人可以从一个系统远程收集数据,监控和管理所有连接互联网的设备. 物联网平台上有很多可用的在线平台,但为公司构建物联网解决方案都依赖于物联网平台主机和支持质量. 在这里,我们编译了一些最好的和着名的开源物联网(IoT)平台. 大多数这些平台都提供API来支持Linux开发板,如Raspberry…
https://blog.csdn.net/shnbiot/article/details/80432017 物联网(IoT)是帮助人工智能(AI)以更好的方式控制和理解事物的未来技术. 我们收集了一些最有名的物联网平台,帮助您以受控方式开发物联网项目. 物联网平台是帮助设置和管理互联网连接设备的组件套件. 一个人可以从一个系统远程收集数据,监控和管理所有连接互联网的设备. 物联网平台上有很多可用的在线平台,但为公司构建物联网解决方案都依赖于物联网平台主机和支持质量. 在这里,我们编译了一些最好…
<.NET 开源Protobuf-net从入门到精通>课程包含以下两个部分: 一..NET 开源Protobuf-net组件[数据存储篇] 本次分享课程包含以下干货知识点: 1.什么是Protobuffer? 2.Protobuffer应用场景介绍 3.为什么Protocol Buffer性能这么好? 4.什么是Protobuf-net? 5.ProtoGen工具介绍和使用 6.什么是.proto文件? 7..proto文件生成cs代码 8.从cs文件反推.proto文件 9.Protobuf…
flynn 是一个不错的开源paas 平台,基于git 以及容器技术,开发模型与 heroku 基本一样,同时构建方式就是基于heroku 的buildpacks 安装 官方文档提示说明是ubuntu 操作系统16 以及14 ,所以安装就试用ubuntu了 shell sudo bash < <(curl -fsSL https://dl.flynn.io/install-flynn) 效果 比较漫长,等待 安装的组件 Install Flynn’s runtime dependencies…
Orange的数据挖掘工具入门使用 声明: 1)本报告由博客园bitpeach撰写,版权所有,免费转载,请注明出处,并请勿作商业用途. 2)若本文档内有侵权文字或图片等内容,请联系作者bitpeach删除相应部分. 3)本文档内容涉及配合Python编程语言,介绍Orange数据挖掘工具的简单实用主题. 4)仅仅作为参考用途,抛砖引玉,不作为证据证明用途,请自行取舍,核实引用. 0目录 目录 0目录    1 [1]为什么要写该博文    1 1.1原因    2 [2]数据格式    2 2.…
2019年1月29日,Linux基金会宣布,开源映射平台Mapzen现在是Linux基金会项目的一部分. Mapzen专注于地图显示的核心组件,如搜索和导航.它为开发人员提供了易于访问的开放软件和数据集.它是在2013年由地图行业资深人士与城市规划师,建筑师,电影制作人和视频游戏开发商合作推出的. Mapzen前首席执行官兼StreetCred实验室现任首席执行官Randy Meech表示,“Mapzen很高兴加入Linux基金会并继续采用开放式协作方式绘制软件和数据.共享技术可以非常强大,但也…
1. 问题描述 Java平台要调用Pyhon平台已有的算法,为了减少耦合度,采用Pyhon平台提供Restful 接口,Java平台负责来调用,采用Http+Json格式交互. 2. 解决方案 2.1 JAVA平台侧 2.1.1 项目代码 public static String invokeAlgorithm(String url, HashMap params) throws Exception { HttpHeaders headers = new HttpHeaders(); heade…
实验七.数据挖掘之K-means聚类算法 一.实验目的 1. 理解K-means聚类算法的基本原理 2. 学会用python实现K-means算法 二.实验工具 1. Anaconda 2. sklearn 3. matplotlib 三.实验简介 1 K-means算法简介 k-means算法是一种聚类算法,所谓聚类,即根据相似性原则,将具有较高相似度的数据对象划分至同一类簇,将具有较高相异度的数据对象划分至不同类簇.聚类与分类最大的区别在于,聚类过程为无监督过程,即待处理数据对象没有任何先验…
原贴:https://ask.dcloud.net.cn/article/35985 Android平台云端打包证书使用说明 分类:HBuilderX 证书 Android 签名证书是一个应用的所有者信息描述和身份标记.Android应用打包,必须配一个签名证书才能打包. HBuilder|HBuilderX中开发完成发布为原生App提交云端打包时,Android平台需要选择签名证书: Android的应用安全管理模型,包括包名.证书.应用市场的账户. 包名是公开的,任何人都可以做一个apk包,…
详解Twitter开源分布式自增ID算法snowflake,附演算验证过程 2017年01月22日 14:44:40 url: http://blog.csdn.net/li396864285/article/details/54668031 1.snowflake简介 互联网快速发展的今天,分布式应用系统已经见怪不怪,在分布式系统中,我们需要各种各样的ID,既然是ID那么必然是要保证全局唯一,除此之外,不同当业务还需要不同的特性,比如像并发巨大的业务要求ID生成效率高,吞吐大:比如某些银行类业…
TurtleBot 3 & 2i ROS开源实验平台,全球更受欢迎的ROS平台. TurtleBot是ROS标准平台机器人,在全球开发人员和学生中深受欢迎.其有3个版本: TurtleBot1--在iRobot的Roomba研究机器人Create之上开发,用于ROS部署,于2010年开发并发售: TurtleBot2--2012年Yujin Robot在研究机器人iClebo Kobuki的基础上开发: TurtleBot3--2017年旨在补充其前代产品的不足功能和用户需求,采用ROBOTIS…
1.概述 大数据时代,数据的存储与挖掘至关重要.企业在追求高可用性.高扩展性及高容错性的大数据处理平台的同时还希望能够降低成本,而Hadoop为实现这些需求提供了解决方案.面对Hadoop的普及和学习热潮,笔者愿意分享自己多年的开发经验,带领读者比较轻松地掌握Hadoop数据挖掘的相关知识.这边是笔者编写本书的原因.本书使用通俗易懂的语言进行讲解,从基础部署到集群管理,再到底层设计等内容均由涉及.通过阅读本书,读者可以较为轻松地掌握Hadoop大数据挖掘与分析的相关技术. 本书目前已在网上商城上…
本数据挖掘框架在这几个月的时间内,有了进一步的功能增强 一. 超大网络的画布显示虚拟化     如前几节所述,框架采用了三级层次实现,分别是数据,抽象Node和绘图的DataPoint,结构如下:      在界面显示部分,之前并没有做过虚拟化优化,为了实现更多的功能,通过大量的事件挂接和其他操作将显示的控件与底层数据紧密耦合,因此内存回收机制几乎不起什么作用(原因见我另外一篇博客-事件的迷惑).另外,绘图控件包含很多可视化元素.这样的恶果便是当点的数量增大时,内存占用量也急剧增大,1万点时,就…