人物关系图: https://www.cnblogs.com/images/cnblogs_com/elesos/1120632/o_2033091006.jpg 红楼梦 (古典名著普及文库) (曹雪芹) - 您在位置 #125-125的标注 | 添加于 2018年8月2日星期四 下午2:01:25 觉其行止见识,皆出于我之上. ========== 红楼梦 (古典名著普及文库) (曹雪芹) - 您在位置 #166-166的标注 | 添加于 2018年8月2日星期四 下午2:16:32 消…
先来看一看结果,发现: 1.贾宝玉和袭人的关系最近. 2.薛宝钗和自己的妈妈关系最近. 3.贾宝玉和林黛玉逼格比较统一,薛宝钗属于独树一帜的逼格调性. 4.大观园中可以看到邢岫烟经常出没... 还有更多秘密等你自己上手去训练模型并发现... 开始写代码! 1from tqdm import tqdm2#tqdm用来观察进度条,非必须3import jieba4import sys5import os 声明一下,这里自定义了两个词典分别命名为"renming.txt"和"dim…
文本可视化[二]--<今生今世>人物关系可视化python实现 在文本可视化[一]--<今生今世>词云生成与小说分析一文中,我使用了jieba分词和wordcloud实现了,文本关键词的提取并生成词云,同时也尝试直接提取人名关键词来绘制.这次我们换一种方式--通过分析人物之间的关系,而不是人物在文本集中的频率来绘制一张复杂网络图,如下所示.数据经过可视化后还是非常有趣的.下面就讲讲人物关系网图的实过程. 用到的工具 jieba jieba分词,最好用的开源中文分词工具.他最主要的两…
Google BERT应用之<红楼梦>对话人物提取 https://www.jiqizhixin.com/articles/2019-01-24-19…
一.程序说明 本程序流程是读取红楼梦txt文件----使用jieba进行分词----借助Counter读取各人名出现次数并排序----使用matplotlib将结果可视化 这里的统计除了将“熙凤”出现的次数合并到“凤姐”中外并没有其他处理,但应该也大体能反映人物提及次数情况 二.执行结果展示 条形图: 饼状图: 三.程序源代码 import jieba from collections import Counter import matplotlib.pyplot as plt import n…
高级持续性威胁(APT)正日益成为针对政府和企业重要资产的不可忽视的网络空间重大威胁.由于APT攻击往往具有明确的攻击意图,并且其攻击手段具备极高的隐蔽性和潜伏性,传统的网络检测手段通常无法有效对其进行检测.近年来,APT攻击的检测和防御技术逐渐引起各国政府和网络安全研究者的关注.本文首先对发达国家APT相关研究进行了梳理,从战略.法规和具体的技术模型层面阐述了美国在网络空间战略和APT攻击检测及追踪方面的一些变化和取得的标志性成果:其次基于自身的研究,提出了一套结合知识图谱进行APT组织追踪的…
一.写在前面的话~ 刚吃饭的时候同学问我,你为什么要用R做文本分析,你不是应该用R建模么,在我和她解释了一会儿后,她嘱咐我好好写这篇博文,嗯为了娟儿同学,细细说一会儿文本分析. 文本数据挖掘(Text Mining)是指从文本数据中抽取有价值的信息和知识的计算机处理技术.顾名思义,文本数据挖掘是从文本中进行数据挖掘(Data Mining).从这个意义上讲,文本数据挖掘是数据挖掘的一个分支. 文本分析是指对文本的表示及其特征项的选取:文本分析是文本挖掘.信息检索的一个基本问题,它把从文本中抽取出…
1. 红楼梦大观园2d图 2. 红楼梦3d图 潇湘馆 注册机:根据电脑名和时间生成一个id,然后根据注册机生成注册码.…
终于效果图: Girl.h // // Girl.h // 12_tableView的增删改 // // Created by beyond on 14-7-27. // Copyright (c) 2014年 com.beyond. All rights reserved. // #import <Foundation/Foundation.h> @interface Girl : NSObject // UI控件用weak,字符串用copy,其它对象用strong // 头像图片名 @pr…
朴素贝叶斯算法简单.高效.接下来我们来介绍其如何应用在<红楼梦>作者的鉴别上. 第一步,当然是先得有文本数据,我在网上随便下载了一个txt(当时急着交初稿...).分类肯定是要一个回合一个回合的分,所以我们拿到文本数据后,先进行回合划分.然后就是去标点符号.分词,做词频统计. # -*- coding: utf- -*- import re import jieba import string import collections as coll jieba.load_userdict('E:…