R_Studio(关联)对dvdtrans.csv数据进行关联规则分析

　　dvdtrans.csv数据：该原始数据仅仅包含了两个字段(ID, Item) 用户ID，商品名称(共30条)

#导入arules包

#install.packages("arules")

library (arules)

setwd('D:\\data')

Gary=read.csv(file="dvdtrans.csv",header=T)

# 将数据转换为arules关联规则方法apriori 可以处理的数据形式.交易数据

# transactions "事务"

Gary<- as(split(Gary$Item, Gary$ID),"transactions")

# 查看一下数据

#attributes(Gary)

summary(Gary)

# 使用apriori函数生成关联规则

rules <- apriori(Gary, parameter=list(support=0.3,confidence=0.5))

# 查看一下数据

inspect(rules)

Gary.R

实现过程

　　导入arules包

　　对数据进行预处理

#导入arules包

#install.packages("arules")

library (arules)

setwd('D:\\data')

Gary=read.csv(file="dvdtrans.csv",header=T)

# 将数据转换为arules关联规则方法apriori 可以处理的数据形式.交易数据

# transactions "事务"

Gary<- as(split(Gary$Item, Gary$ID),"transactions")

> # 查看一下数据

> #attributes(Gary)

> summary(Gary)

transactions as itemMatrix in sparse format with

 10 rows (elements/itemsets/transactions) and　　　　　　　　　　　　10行（元素/项集/事务）

 10 columns (items) and a density of 0.3 　　　　　　　　　　　　　　 10列（项）和0.3的密度

most frequent items:　　　　　　　　　　　　　　　　　　　　　　　　　　　最常见的项目(频率)：

    Gladiator       Patriot   Sixth Sense    Green Mile Harry Potter1       (Other)

            7             6             6             2             2             7 

element (itemset/transaction) length distribution:　　　　　　　　　　元素（项集/事务）长度分布：

sizes

2 3 4 5

3 5 1 1 

   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.

   2.00    2.25    3.00    3.00    3.00    5.00 

includes extended item information - examples:

      labels

1 Braveheart

2  Gladiator

3 Green Mile

includes extended transaction information - examples:

  transactionID

1             1

2             2

3             3

　　生成关联规则

> # 使用apriori函数生成关联规则

> rules <- apriori(Gary, parameter=list(support=0.3,confidence=0.5))

Apriori

Parameter specification:

 confidence minval smax arem  aval originalSupport maxtime support minlen maxlen target   ext

        0.5    0.1    1 none FALSE            TRUE       5     0.3      1     10  rules FALSE

Algorithmic control:

 filter tree heap memopt load sort verbose

    0.1 TRUE TRUE  FALSE TRUE    2    TRUE

Absolute minimum support count: 3 

set item appearances ...[0 item(s)] done [0.00s].

set transactions ...[10 item(s), 10 transaction(s)] done [0.00s].

sorting and recoding items ... [3 item(s)] done [0.00s].

creating transaction tree ... done [0.00s].

checking subsets of size 1 2 3 done [0.00s].

writing ... [12 rule(s)] done [0.00s].

creating S4 object  ... done [0.00s].

>

> # 查看一下数据

> inspect(rules)

     lhs                        rhs           support confidence lift     count

[1]  {}                      => {Patriot}     0.6     0.6000000  1.000000 6

[2]  {}                      => {Sixth Sense} 0.6     0.6000000  1.000000 6

[3]  {}                      => {Gladiator}   0.7     0.7000000  1.000000 7

[4]  {Patriot}               => {Sixth Sense} 0.4     0.6666667  1.111111 4

[5]  {Sixth Sense}           => {Patriot}     0.4     0.6666667  1.111111 4

[6]  {Patriot}               => {Gladiator}   0.6     1.0000000  1.428571 6

[7]  {Gladiator}             => {Patriot}     0.6     0.8571429  1.428571 6

[8]  {Sixth Sense}           => {Gladiator}   0.5     0.8333333  1.190476 5

[9]  {Gladiator}             => {Sixth Sense} 0.5     0.7142857  1.190476 5

[10] {Patriot,Sixth Sense}   => {Gladiator}   0.4     1.0000000  1.428571 4

[11] {Gladiator,Patriot}     => {Sixth Sense} 0.4     0.6666667  1.111111 4

[12] {Gladiator,Sixth Sense} => {Patriot}     0.4     0.8000000  1.333333 4

R_Studio(关联)对dvdtrans.csv数据进行关联规则分析的更多相关文章

python 读取csv 数据并画图分析
数据源 : https://pan.baidu.com/s/1eR593Uy 密码: yqjh python环境 python3 #encoding: utf-8 import csv impo ...
jmeter参数化之【CSV Data Set Config/CSV数据配置文件】
这里以登录功能为例: 1.新建.txt文件,将参数值写入到txt文件中(多个参数值如:用户名,密码之间以逗号隔开),将文件放置在想要放置的目录下 2.添加csv数据文件设置右键线程组->添加 ...
[moka同学摘录]Yii2 csv数据导出扩展
yii2-thecsv(Yii2框架csv数据导出扩展) github: https://github.com/13552277443/yii2-thecsv 1.安装运行 php composer ...
mysql导出csv/excel文件的几种方法,mysql的load导入csv数据
方法一 php教程用mysql的命令和shell select * into outfile './bestlovesky.xls' from bestlovesky where 1 order by ...
python_如何读写csv数据
案例: 通过股票网站,我们获取了中国股市数据集,它以csv数据格式存储 Data,Open,High,Low,Close,Volume,Adj Close 2016-06-28,8.63,8.47,8 ...
Logstash 6.4.3 导入 csv 数据到 ElasticSearch 6.4.3
本文实践最新版的Logstash从csv文件导入数据到ElasticSearch. 本文目录: 1.初始化ES.Kibana.Logstash 2.安装logstash文件导入.过滤器等插件 3.配置 ...
csv 数据
csv数据:逗号分隔值,其文件以纯文本的形式存储表格数据(数据和文本).csv模块是python的内置模块,需要引用后再使用 csv.reader(csv_file) #使用with结构 with o ...
Loadrunner脚本优化-参数化之关联MySQL数据库获取数据
脚本优化-参数化之关联MySQL数据库获取数据 by:授客 QQ:1033553122 测试环境: Loadrunner 11 Win7 64位实操: 1. 安装MySQL ODBC驱动程序 O ...
mysql SQLyog导入csv数据失败怎么办？
分享下mysql使用SQLyog导入csv数据失败的解决方法给mysql导入数据,选中某个表选择导入--导入使用本地csv数据即可,单有的时候不知道什么问题导入不成功!!! 给mysql导入数据,使 ...

随机推荐

codeforces 620C
题目链接:https://codeforces.com/problemset/problem/620/C 题目分析题意:给你一串珍珠,每个珍珠都有一个对应值,需要分割这n个珍珠(必须连续),使得每一 ...
# ACM奇淫技巧
目录 ACM奇淫技巧差分操作坐标旋转 ACM 卡常优化 vsc代码块(头文件模板) 读入输出优化逗号表达式内联函数inline 寄存器变量register 条件判断加减代替取模自增运算符优化 ...
myBatis+Spring+SpringMVC框架面试题整理
myBatis+Spring+SpringMVC框架面试题整理(一) 2018年09月06日 13:36:01 新新许愿树阅读数 14034更多分类专栏: SSM 版权声明:本文为博主原创文章 ...
SpringBoot上传文件，经过spingCloud-Zuul，中文文件名乱码解决办法
最近用springCloud整合springboot做分布式服务发现经过zuul之后上传的中文文件名乱码全都变成?????,从而引发异常,单独用springboot却是好的,在网上找到相关资料总结如下 ...
debezium关于cdc的使用(下)
博文原址:debezium关于cdc的使用(下) 简介 debezium在debezium关于cdc的使用(上)中有做介绍.具体可以跳到上文查看.本篇主要讲述使用kafka connector方式来同 ...
09 Python两种创建类的方式
第一种比较普遍的方式: class Work(): def __init__(self,name): self.name = name w = Work('well woker') 这样就简单创建了一 ...
多线程的些许理解（平台x86，具体考虑linux,windows）
多线程的些许理解一.体系架构 1.原子操作 1) 定义不可中断的一个或者一系列操作,也就是不会被线程调度机制打断的操作,在运行期间不会有任何的上下文切换(context switch). 2) 我 ...
在mysql 上如何在不影响生产的情况下删除一个大表
mysql 中常用的删除的方法基本上有下面三种方式: 1.delete 一般用于删除少量表中的数据优化建议,一定要加上where 条件,并且where条件的列上一定要有主键或者索引.否则会出现全表 ...
Inception网络模型
最近在研究inception模型,将v1到v4版本的论文都研读了一下,这里做一下总结. 这里推荐一下这个GitHub,博主将常见的论文都做了翻译,大家可以参考中文来加深理解. 1.Inception ...
zencart模板列表下载地址
下载index.html文件后用浏览器打开,里面有一百多个zencart模板示例下载地址:zencart模板示例下载地址或者复制下面网址,用浏览器打开即可下载: http://bcs.duapp. ...

R_Studio(关联)对dvdtrans.csv数据进行关联规则分析

R_Studio(关联)对dvdtrans.csv数据进行关联规则分析的更多相关文章

随机推荐

热门专题