词频分析 评论标签 nltp APP-分析买家评论的评分-高频词:二维关系
0-定评论结果:好评、差评,1星、4星,二元化为“积极、消极”,取一元的数据为样本
1-得到词频结果:如手机类的“积极样本”得到前10的高频词:运行(run running ran)、内存(memory)、速度(speed)
2-建立key-value、keys-values的多对多 、n:n键值对,样本继承2
内存--->大/小
运行--->快
速度--->快
2-1-n:n键值对可“同义词合并”或“卖品实质用户体验一致”聚类为一对一 、1:1,但此处非一一映射
3-根据2中结果进行产销策略调整
未引入 主成份 聚类 检验 等
女装 T恤
与描述相符
4.8
2017夏装新款纯棉t恤女短袖圆领修身简约上衣百搭纯白色打底衫女-tmall.com天猫 2017夏装新款纯棉t恤女短袖圆领修身简约上衣百搭纯白色打底衫女-tmall.com天猫 https://detail.tmall.com/item.htm?id=544012028905&skuId=3276167404508
与描述相符
4.8
夏装新款大码女装POLO衫翻领休闲运动上衣纯棉宽松半袖短袖T恤女-tmall.com天猫 https://detail.tmall.com/item.htm?id=544298509053&ali_trackid=1_5e534393b365310f0108e04d4086a70b
电脑
【AppleMacBook Air】Apple MacBook Air 13.3英寸笔记本电脑 银色(Core i5 处理器/8GB内存/128GB SSD闪存 MMGF2CH/A)【行情 报价 价格 评测】-京东 https://item.jd.com/2342601.html
w
# -*- coding: utf-8 -*-
from nltk import * # TO FIX : No such file or directory
os.chdir(r'E:\zpy') f = open('reviews_text_lt_3.txt', 'r')
f_r = f.read()
strList = f_r.split(' ')
fdist1 = FreqDist(strList)
#总的词数
print fdist1
#表达式 keys()为我们提供了文本中所有不同类型的链表
vocabulary1 = fdist1.keys()
#通过切片看看这个链表的前 50 项
res0_50 =vocabulary1[:50]
print res0_50
C:\>python E:\zpy\wltp.py
<FreqDist with 16789 samples and 180043 outcomes>
['', 'raining', 'disappointing.It', 'uncomfortable...', "lot's", 'uv.\nSo,', 'yellow', 'Seller', 'four', 'vaporizers.I', 'Does', 'completely!!', 'hanging', 'Monday,', 'asap!!This', 'Until', 'instead.The', 'malfunctioned.', 'Lately', 'looking', 'LAST', 'eligible', 'electricity', 'DISAPPOINTED', 'oneWorks', 'powdery', 'unanswered', 'also.', 'refun
'sooooo', 'foul', 'on\nafter', 'fingers.', 'advice:', 'fingers,', 'advice?', 'each),', 'month.I'] C:\>
SELECT
amz_review_text
FROM
amz_reviews_grab_us
WHERE
amz_review_rating < 3
LIMIT 3000;
对于通过亚马逊us美国站的买家而言,在数据库前3000条的时间周期y-m-d内,在不考虑品类、价格、评分相对值等因素的情况下,
暂得出以下推测:
0-卖品属性为yellow,其他条件相同情况下,可能不受欢迎,评分相对低;
1-周一可能会给买家糟糕的购买体验,周一的促销活动须结合其他因素,如人文风俗、新闻事件慎重;
注:dev的当前视角
词频分析 评论标签 nltp APP-分析买家评论的评分-高频词:二维关系的更多相关文章
- 某音乐类App评论相关API的分析及SQL注入尝试
关键字:APIfen.工具使用.sql注入 涉及工具/包:Fiddler.Burpsuite.Js2Py.Closure Compiler.selenium.phantomjs.sqlmap 摘要: ...
- 网易云音乐APP分析
网易云音乐-感受音乐的力量 你选择的产品是? 网易云音乐 为什么选择该产品作为分析? 之前用的一直是QQ音乐,但是有一天一个朋友分享了一首网易云上的音乐(顺便分享一下歌名:Drop By Drop) ...
- [python] 常用正则表达式爬取网页信息及分析HTML标签总结【转】
[python] 常用正则表达式爬取网页信息及分析HTML标签总结 转http://blog.csdn.net/Eastmount/article/details/51082253 标签: pytho ...
- 如何科学地蹭热点:用python爬虫获取热门微博评论并进行情感分析
前言:本文主要涉及知识点包括新浪微博爬虫.python对数据库的简单读写.简单的列表数据去重.简单的自然语言处理(snowNLP模块.机器学习).适合有一定编程基础,并对python有所了解的盆友阅读 ...
- Hadoop基础--统计商家id的标签数案例分析
Hadoop基础--统计商家id的标签数案例分析 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.项目需求 将“temptags.txt”中的数据进行分析,统计出商家id的评论标 ...
- CSDN app分析
项目 内容 这个作业属于哪个课程 2020春季计算机学院软件工程(罗杰 任健) (北京航空航天大学 - 计算机学院) 这个作业的要求在哪里 个人博客作业-软件案例分析 我的教学班级 005 说说csd ...
- Android系统自带APP分析——短信app
Android操作系统本身就是一个巨大的开源软件仓库,熟悉它既可以了解到Android系统的设计框架,也可以获得高效的应用程序编写方式.本文所分析的源码来自于Google官方的AOSP源码4.0.1_ ...
- 【HELLO WAKA】WAKA iOS客户端 之一 APP分析篇
由于后续篇幅比较大,所以调整了内容结构. 全系列 [HELLO WAKA]WAKA iOS客户端 之一 APP分析篇 [HELLO WAKA]WAKA iOS客户端 之二 架构设计与实现篇 [HELL ...
- NetCloud——一个网易云音乐评论抓取和分析的Python库
在17的四月份,我曾经写了一篇关于网易云音乐爬虫的文章,还写了一篇关于评论数据可视化的文章.在这大半年的时间里,有时会有一些朋友给我发私信询问一些关于代码方面的问题.所以我最近抽空干脆将原来的代码整理 ...
随机推荐
- 【JZOJ 3909】Idiot 的乘幂
题面: 正文: 把题目中的方程组组合在一起就变成了: \(X^{a+c}\equiv b \cdot d (\mod p)\) 那这时,我们假定两个数\(x\)和\(y\),使得: \(ax + cy ...
- WNMP环境搭建步骤 nginx1.4.3+php-5.3.27+mysql-5.5+RunHiddenConsole
安装目录:D:/webServer/所需软件: mysql-installer-community-5.5.34.0.msi 下载:http://cdn.mysql.com/D ...
- PCIe事务层包TLP Header详解
1.事务层包的一般格式: 包的header为3DW(double word)或者4DW(一个DW代表4字节),数据负载为1~1024DW(即4~4096byte,最大4M),TLP Digest可选, ...
- (ES6)数据处理常用工具方法收集(更新状态: on)
1. 扁平数组转成tree结构(来源: StackOverflow的印度老哥写的) // Data Set // One top level comment var comments = [{ id: ...
- SpringMVC拦截器(资源和权限管理)
转自:https://www.cnblogs.com/downey/p/4928951.html 1.DispatcherServlet SpringMVC具有统一的入口DispatcherServl ...
- 40. Combination Sum II (JAVA)
Given a collection of candidate numbers (candidates) and a target number (target), find all unique c ...
- Keepalived高可用服务器案例
部署Keepalived高可用软件,实现如下: - 使用Keepalived实现web服务器的高可用 - Web服务器IP地址分别为192.168.4.100和192.168.4.200 - Web服 ...
- Android相关资源
各类黑客大会资料 https://infocon.org/cons/ 各类课程.视频 https://github.com/Developer-Y/cs-video-courses#security ...
- Python核心技术与实战——十一|程序的模块化
我们现在已经总结了Python的基本招式和套路,现在可以写一些不那么简单的系统性工程或代码量较大的应用程序.这时候,一个简单的.py文件就会显得过于臃肿,无法承担一个重量级软件开发的重任.这就需要这一 ...
- python3-访问限制
在Class内部,可以有属性和方法,而外部代码可以通过直接调用实例变量的方法来操作数据,这样,就隐藏了内部的复杂逻辑. 但是,从前面Student类的定义来看,外部代码还是可以自由地修改一个实例的na ...