词频分析 评论标签 nltp APP-分析买家评论的评分-高频词:二维关系
0-定评论结果:好评、差评,1星、4星,二元化为“积极、消极”,取一元的数据为样本
1-得到词频结果:如手机类的“积极样本”得到前10的高频词:运行(run running ran)、内存(memory)、速度(speed)
2-建立key-value、keys-values的多对多 、n:n键值对,样本继承2
内存--->大/小
运行--->快
速度--->快
2-1-n:n键值对可“同义词合并”或“卖品实质用户体验一致”聚类为一对一 、1:1,但此处非一一映射
3-根据2中结果进行产销策略调整
未引入 主成份 聚类 检验 等
女装 T恤
与描述相符
4.8
2017夏装新款纯棉t恤女短袖圆领修身简约上衣百搭纯白色打底衫女-tmall.com天猫 2017夏装新款纯棉t恤女短袖圆领修身简约上衣百搭纯白色打底衫女-tmall.com天猫 https://detail.tmall.com/item.htm?id=544012028905&skuId=3276167404508
与描述相符
4.8
夏装新款大码女装POLO衫翻领休闲运动上衣纯棉宽松半袖短袖T恤女-tmall.com天猫 https://detail.tmall.com/item.htm?id=544298509053&ali_trackid=1_5e534393b365310f0108e04d4086a70b
电脑
【AppleMacBook Air】Apple MacBook Air 13.3英寸笔记本电脑 银色(Core i5 处理器/8GB内存/128GB SSD闪存 MMGF2CH/A)【行情 报价 价格 评测】-京东 https://item.jd.com/2342601.html
w
- # -*- coding: utf-8 -*-
- from nltk import *
- # TO FIX : No such file or directory
- os.chdir(r'E:\zpy')
- f = open('reviews_text_lt_3.txt', 'r')
- f_r = f.read()
- strList = f_r.split(' ')
- fdist1 = FreqDist(strList)
- #总的词数
- print fdist1
- #表达式 keys()为我们提供了文本中所有不同类型的链表
- vocabulary1 = fdist1.keys()
- #通过切片看看这个链表的前 50 项
- res0_50 =vocabulary1[:50]
- print res0_50
- C:\>python E:\zpy\wltp.py
- <FreqDist with 16789 samples and 180043 outcomes>
- ['', 'raining', 'disappointing.It', 'uncomfortable...', "lot's", 'uv.\nSo,', 'yellow', 'Seller', 'four', 'vaporizers.I', 'Does', 'completely!!', 'hanging', 'Monday,', 'asap!!This', 'Until', 'instead.The', 'malfunctioned.', 'Lately', 'looking', 'LAST', 'eligible', 'electricity', 'DISAPPOINTED', 'oneWorks', 'powdery', 'unanswered', 'also.', 'refun
- 'sooooo', 'foul', 'on\nafter', 'fingers.', 'advice:', 'fingers,', 'advice?', 'each),', 'month.I']
- C:\>
- SELECT
- amz_review_text
- FROM
- amz_reviews_grab_us
- WHERE
- amz_review_rating < 3
- LIMIT 3000;
对于通过亚马逊us美国站的买家而言,在数据库前3000条的时间周期y-m-d内,在不考虑品类、价格、评分相对值等因素的情况下,
暂得出以下推测:
0-卖品属性为yellow,其他条件相同情况下,可能不受欢迎,评分相对低;
1-周一可能会给买家糟糕的购买体验,周一的促销活动须结合其他因素,如人文风俗、新闻事件慎重;
注:dev的当前视角
词频分析 评论标签 nltp APP-分析买家评论的评分-高频词:二维关系的更多相关文章
- 某音乐类App评论相关API的分析及SQL注入尝试
关键字:APIfen.工具使用.sql注入 涉及工具/包:Fiddler.Burpsuite.Js2Py.Closure Compiler.selenium.phantomjs.sqlmap 摘要: ...
- 网易云音乐APP分析
网易云音乐-感受音乐的力量 你选择的产品是? 网易云音乐 为什么选择该产品作为分析? 之前用的一直是QQ音乐,但是有一天一个朋友分享了一首网易云上的音乐(顺便分享一下歌名:Drop By Drop) ...
- [python] 常用正则表达式爬取网页信息及分析HTML标签总结【转】
[python] 常用正则表达式爬取网页信息及分析HTML标签总结 转http://blog.csdn.net/Eastmount/article/details/51082253 标签: pytho ...
- 如何科学地蹭热点:用python爬虫获取热门微博评论并进行情感分析
前言:本文主要涉及知识点包括新浪微博爬虫.python对数据库的简单读写.简单的列表数据去重.简单的自然语言处理(snowNLP模块.机器学习).适合有一定编程基础,并对python有所了解的盆友阅读 ...
- Hadoop基础--统计商家id的标签数案例分析
Hadoop基础--统计商家id的标签数案例分析 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.项目需求 将“temptags.txt”中的数据进行分析,统计出商家id的评论标 ...
- CSDN app分析
项目 内容 这个作业属于哪个课程 2020春季计算机学院软件工程(罗杰 任健) (北京航空航天大学 - 计算机学院) 这个作业的要求在哪里 个人博客作业-软件案例分析 我的教学班级 005 说说csd ...
- Android系统自带APP分析——短信app
Android操作系统本身就是一个巨大的开源软件仓库,熟悉它既可以了解到Android系统的设计框架,也可以获得高效的应用程序编写方式.本文所分析的源码来自于Google官方的AOSP源码4.0.1_ ...
- 【HELLO WAKA】WAKA iOS客户端 之一 APP分析篇
由于后续篇幅比较大,所以调整了内容结构. 全系列 [HELLO WAKA]WAKA iOS客户端 之一 APP分析篇 [HELLO WAKA]WAKA iOS客户端 之二 架构设计与实现篇 [HELL ...
- NetCloud——一个网易云音乐评论抓取和分析的Python库
在17的四月份,我曾经写了一篇关于网易云音乐爬虫的文章,还写了一篇关于评论数据可视化的文章.在这大半年的时间里,有时会有一些朋友给我发私信询问一些关于代码方面的问题.所以我最近抽空干脆将原来的代码整理 ...
随机推荐
- 码云与Git的使用
码云注册和使用 网址:https://gitee.com 注册之后新建一个仓库 接下来安装Git 协同开发Git安装与使用 下载地址:https://gitforwindows.org 安装完成之后选 ...
- Asp.net MVC 发布到IIS6
1.发布网站 2.打开IIS,添加网站 3.修改程序池,改为.net 4.0 4.添加虚拟目录(及添加aspnet_isapi.dll文件,该文件目录在“C:\Windows\Microsoft.NE ...
- 网络爬虫之HTTPClient
HTTPClient官网:http://hc.apache.org/httpcomponents-client-4.5.x/quickstart.html 问题一:明明浏览器请求有数据,可使用HTTP ...
- 深度学习之group convolution,计算量及参数量
目录: 1.什么是group convolution? 和普通的卷积有什么区别? 2.分析计算量.flops 3.分析参数量 4.相比于传统普通卷积有什么优势以及缺点,有什么改进方法? 5.refer ...
- SpringBoot 单元测试忽略@component注解
springboot框架在单元测试时可能需要忽略某些带有@component的实例 例如以下代码: @Component public class MyCommandLineRunner implem ...
- How Does Caching Work in AFNetworking? : AFImageCache & NSUrlCache Explained
http://blog.originate.com/blog/2014/02/20/afimagecache-vs-nsurlcache/
- Spring基础09——Bean的自动装配
1.XML配置的Bean自动装配 SpringIOC容器可以自动装配Bean,需要做的仅仅是在<bean>的autowire属性里指定自动装配的模式,而不需要手工去指定要装配的Bean,a ...
- Windows 实用软件
Useful tool Listary Ditto Winsnap Quick Look Myper Splash GifCam ScreenToGif Free Download Manage Si ...
- HTML5初识
HTML:超文本标记语言 HTML文档树结构 标签:有一对<>组成的,标签不区分大小写,大多数都是成对出现,有开始标签和结束标签,但也有单个出现的自闭和标签 标签属性:以键值对放在标签中, ...
- pandas 的axis参数的理解
# pandas的axis参数怎样理解? # axis=0 或者 "index": # 如果是单行操作,就指的是某一行 # 如果是聚合操作,指的是跨行cross rows # ax ...