NLPIR(ICTCLAS)分析包的使用记录】的更多相关文章

前段时间使用了HanLP一个纯JAVA分词工具包,后来老大说分词效果不是很好,需要换一个分词工具.于是推荐了一个分词工具——NLPIR,它是中科院XXX研发的一个分词工具.这个分词工具只用C/C++写的,但是它提供了JAVA,C#等调用接口.于是我希望是的通过java来调用.使用java调用C/C++的代码需要用到JNA,所以工程需要添加JNA的依赖包. 这里面官网上介绍的不是特别清楚,里面有些坑,第一次使用的人还真需要一段时间解决,下面将我踩的坑记录一下: 1.首先进官网:http://ict…
使用 Angular CLI 和 Webpack 分析包尺寸 对于 Web app 来说,高性能总是最高优先级,对于 Angular 也不例外.但是随着应用复杂度的不断增长,我们如何才能知道哪些内容打包到了应用中呢?如何跟踪包的尺寸?我们不希望一次发送太多的 JavaScript ,以至于拖慢应用的速度. 过大尺寸的 JavaScript 包是丧失用户欢心的良药.不仅是拖慢了下载效率,而且要花费更多的时间在浏览器中分析然后执行.为了保持应用的速度,我们需要确保包尺寸足够小(250k 或更小),并…
数据库管理员一般是用percona的toolkit工具来分析MySQL慢查询记录,但是不够直观. 下面介绍一款比较直观的工具来统计分析MySQL慢查询记录anemometer. 在使用之前需要安装percona的toolkit工具,anemometer提供web界面. anemometer介绍参见:https://github.com/box/Anemometer/wiki 1. 安装 # cd /data/www/my.ttlsa.com # git clone https://github.…
1.前言 主要介绍在android手机上如何利用tcpdump抓包,用wireshark分析包. android tcpdump官网: http://www.androidtcpdump.com/ tcpdump  官网: http://www.tcpdump.org/ 2.准备 To use this application, you need to have: A Rooted Android Device (root权限) A Terminal Access Program  (终端程序)…
之前在用python自带的logging包进行日志输出的时候发现有些logging语句没有输出,感到比较奇怪就去查了一下logging文档.然后发现其在设置和引用时的logging level会影响最后的输出.logging包默认对输出分成了6个等级: 这里的分值就代表了相应关键字出现的等级高低,NOTSET最低,CRITICAL最高.高等级的语句会覆盖低等级的语句. 一般我们用logging的时候会先在主程序配置一个logging类的格式,然后在子程序中直接引用即可(举个例子).如果我们在设置…
      最近写完mysql flashback,突然发现还有有这种使用场景:有些情况下,可能会统计在某个时间段内,MySQL修改了多少数据量?发生了多少事务?主要是哪些表格发生变动?变动的数量是怎么样的? 但是却不需要行记录的修改内容,只需要了解 行数据的 变动情况.故也整理了下.     昨晚写的脚本,因为个人python能力有限,本来想这不发这文,后来想想,没准会有哪位园友给出优化建议.       如果转载,请注明博文来源: www.cnblogs.com/xinysu/   ,版权归…
最近项目要使用到可视化分析工具Cytoscape,所以会花费很多的时间跟精力来整理Cytoscape软件使用和开发的相关资料,希望写下的文章能减少有兴趣的同行学习跟开发所走的弯路时间.同时也是因为百度跟CodeProject的资料太少,所以只能靠官网文档来慢慢摸索,不当之处望指出,大家一起进步. 官网: http://www.cytoscape.org/ 源码网址https://github.com/cytoscape/cytoscape-impl 下载源码并解压缩到D:\cytoscape-i…
https://www.cnblogs.com/xinysu/archive/2017/05/26/6908722.html import pymysqlfrom pymysql.cursors import DictCursorimport reimport osimport sysimport datetimeimport timeimport loggingimport importlibimportlib.reload(logging)logging.basicConfig(level=…
使用 Wireshark 选取你要抓包的网络接口,并设置你的过滤器之后,当有数据通信后即可抓到对应的数据包,这里将分析其每一帧数据包的结构. 每一帧数据都有类似的结构组成,我这里使用抓到一个对应的ping 包进行分析. 这一帧包包含以下四种信息. Frame: 物理层的数据帧情况. Ethernet II , Src: 数据链路层以太网帧头部信息. Internet Protocol Version 4, Src: 互联网层IP包头信息. Internet Control Message Pro…
学习HashMap时,需要带着这几个问题去,会有很大的收获: 一.什么是哈希表 二.HashMap实现原理 三.为何HashMap的数组长度一定是2的次幂? 四.重写equals方法需同时重写hashCode方法 一.什么是哈希表 在了解哈希表之前,先了解下其他数据结构的操作执行性能,数据结构的物理存储结构只有两种方式:顺序存储结构和链式存储结构(栈,队列,数,图等) 数组:采用一段连续的存储单元来存储数据,对于指定下标的查找,时间复杂度为O(1);根据确定的值来查找,需要遍历数组,逐一进行比较…
前言 Fiddler是一款强大的Web调试代理工具,又称抓包软件,本文记录如何使用Flidder进行抓包 Fiddler官网:https://www.telerik.com/fiddler 下载安装 下载后双击,选择自己的目录安装即可,so easy 配置https 我这里选择了"from remote clients only",主要是为了更方便的测试手机抓包 配置手机远程连接 Fiddler工具开启服务,(http://电脑ip:8888) 手机连接WiFi,确保与Fiddler端…
我大php的composer 国内镜像包http://pkg.phpcomposer.com/  还是全局的爽些: omposer config -g repo.packagist composer https://packagist.phpcomposer.com 首先下载nodejs https://nodejs.org/en/ 没有被墙可直接下载,或者去 http://nodejs.cn/ 下载 安装即可   nodejs的包管理器为npm,安装nodejs时也就一起安装了 起因是:需要使…
kantouspringmvc 看透SpringMVC中文版电子书,使用Markdown语法记录学习<看透SpringMVC>的内容,方便自己整理知识,并在原作者写作的基础上添加自己的理解. 原著链接:http://item.jd.com/11807414.html 现有章节: - 第14章 ViewResolver - 第15章 RequestToViewNameTranslator - 第16章 HandlerExceptionResolver - 第17章 MultipartResolv…
1. 这边功能测试 一个linux服务器 4c 16g的内存 发现总是出现异常. dotnet run 起来的一个 程序 总是会被killed 现象为: 2. 一开始怀疑是 打开的文件描述符过多 引起的 然后 找了一个函数 watch - |lsof -p |wc -l 3 结果开发同事认为跟这个没关系 查看系统日志发现是 oom了 cat /var/log/messages |grep memory 4. 然后安装epel-release 以及htop 进行跟踪 发现内存暴涨 5. 总结一下…
最近在研究中文分词及自然语言相关的内容,关注到JAVA环境下的HanLP,HanLP是一个致力于向生产环境普及NLP技术的开源Java工具包,支持中文分词(N-最短路分词.CRF分词.索引分词.用户自定义词典.词性标注),命名实体识别(中国人名.音译人名.日本人名.地名.实体机构名识别),关键词提取,自动摘要,短语提取,拼音转换,简繁转换,文本推荐,依存句法分析(MaxEnt依存句法分析.神经网络依存句法分析). 由于自己才疏学浅,对JAVA方面了解不多,所以打算在Python环%2, line…
使用 C/C++ 进行 SNMP 开发,网上比较流行的主要是用 net-snmp 和 snmp++ .在 sourceforge 上以 Qt 和 snmp 为关键词进行搜索,搜到的项目 net-snmp 相关的占了多数,推测,net-snmp 的使用人数可能更多一点.遂决定采用 net-snmp. 仍然是从 sourceforge 开始,随便找了一个规模不大的项目,开始对 net-snmp 进行熟悉. 1. 尝试代码编译 从项目把代码拉过来: git clone https://git.code…
如果我们再一个表单中放了一个text的input 还放了一个file的input进行文件上传,此时用wireshark抓到的包应该是什么样子的呢 html代码 <form action="/upload/json" method="post" enctype="multipart/form-data"> <input type="file" name="file1"/> <in…
转自: http://hi.baidu.com/hepeng597/item/5ba27e0b98bc8de3ff240de0 三次握手Three-way Handshake 一个虚拟连接的建立是通过三次握手来实现的 1. (B) --> [SYN] --> (A) 假如服务器A和客户机B通讯. 当A要和B通信时,B首先向A发一个SYN (Synchronize) 标记的包,告诉A请求建立连接. 注意: 一个 SYN包就是仅SYN标记设为1的TCP包(参见TCP包头Resources). 认识…
2020.12.29 发现一片博客:https://blog.csdn.net/harrycomeon/article/details/94650103 需要一个硬件:CAN分析仪,网上200元左右. 是因为can总线是通过两条线上的电压对比,??? 所以,需要阻抗匹配,也就是发射出来的电压信号,??? 通过线路传输后,达到终端,然后从终端测量的电压应该不失真才是好的.??? 上面是自己的想法,下面是从网上搜到的:https://rf.eefocus.com/article/id-332676?…
背景:JAVA APP,主要功能是处理日志并存入db 现象:运行一段时间就出现OOM问题,查看GC log发现运行没多久就一直Full GC,并且抛出OOM的异常. [Full GC (Ergonomics) [PSYoungGen: 529920K->525999K(614912K)] [ParOldGen: 1398052K->1397869K(1398272K)] 1927972K->1923868K(2013184K), [Metaspace: 33827K->33827K…
1.创建项目方法和步骤,网上一搜一大把 2.主要出现了一个配置上的错误,java_home的配置 发现idea和eclipse有一个地方配置不同,就是java_home,在eclipse中 mvn的配置文件pom.xml 中配置${JAVA_HOME}可以自动读取,然而 同样的写法在idea中则无法识别,idea有其特定的书写格式,必须写${java.home}…
准备工作: 1.必须确保安装fiddler的电脑和手机在同一个wifi环境下 备注:如果电脑是笔记本当然最好;如果电脑用的是台式机,可以安装一个随身wifi,来确保台式机和手机在同一wifi环境下     配置步骤: 1.下载一个fiddler,网上随便下一个就可以了(https://www.telerik.com/fiddler) 2.配置fiddler Tools->Fiddler Options->Connections   Tools->Fiddler Options->H…
不用造轮子是真的好用啊 python中单引号双引号的区别 和cpp不一样,cpp单引号表示字符,双引号表示字符串,'c'就直接是ascii值了 Python中单引号和双引号都可以用来表示一个字符串 单双引号是用于区分在引号中还要用引号的情况 参考:Python中单引号,双引号,3个单引号及3个双引号的区别 https://blog.csdn.net/woainishifu/article/details/76105667 运算符* 和 ** 参考:https://blog.csdn.net/yi…
关于tcpdump如何抓包,本文不再总结,可以查看 tcpdump的官方地址查看http://www.tcpdump.org 本文重点记录两个部分:           第一部分:tcpdump所抓包与TCP/IP协议的对应分析           第二部分:tcpdump所抓包的分析 先看第一部分 一.tcpdump所抓包与TCP/IP协议的对应分析 在使用tcpdump抓包时, 使用-X参数,可以显示IP包的包头信息;  使用-xx参数,可以显示链路层的包头信息,这里我们只看IP包,IP包包…
一.为什么写这个 昨天遇到个ftp相关的问题,关于ftp匿名访问的.花费了大量的脑细胞后,终于搞定了服务端的配置,现在客户端可以像下图一样,直接在浏览器输入url,即可直接访问. 期间不会弹出输入用户名密码来登录的窗口. 今天我主要是有点好奇,在此过程中,究竟是否是用匿名账户“anonymous”该账户登录了,还是根本不需要登录呢? 于是用wireshark抓包了一下. 二.抓包过程 我这边直接用了捕获过滤器抓本机和ftp之间的包.抓包后直接ctrl+F进行文本查找. 果然发现是发送了USER…
额,这篇忘了是来自哪位作者的了. whistle:1.14.6 这里以抓取浏览器数据包为例,分析抓取的数据. Method:Connect,对应Host:Tunnel to意思是因为网络环境受限,客户端无法直接访问某些网络,所以只能通过代理服务器访问网络(客户端使用http connect请求代理服务器,代理服务器使用connect方法与目标服务器建立http tunnel),然后将内容转发给客户端,从宏观上看,客户端与服务器端就像建立了一条隧道一样. GET:网址带参数. POST:回车操作,…
随便说两句 前两天写了一个python脚本,试图以分析网页源码的方式得到优酷视频的下载地址,结果只得到视频的纯播放地址,下载纯播放地址得到的文件也无法正常播放视频. 这里共享一下播放地址得到的方法(想看的可以展开折叠): # 实验视频地址:http://v.youku.com/v_show/id_XMTY3OTYyODM2NA==.html?f=27873045&from=y1.2-3.2 # 解析到播放地址:http://static.youku.com/v1.0.0646/v/swf/loa…
本文可任意转载,但请保留作者及出处作者:rainfish出处:http://blog.csdn.net/bat603/经过几天的突击,终于明白了怎样在局域网内抓包,这可是我多年来的梦想.首先说说我的学习过程,一开始从网上搜索了关于sniffer大量资料,大致学会了,可是仔细分析结果发现,都是本机上的数据包,而不是整个局域网的.于是又查资料,在 linuxsir上有高人指点,说,现在局域网内都是交换机联接,而不是以前的Hub所以,如果要抓整个局域网的数据包,必须用libpcap,于是又查了许多关于…
在安装包后面加两个参数 --nodeps --force 如下: [root@sh158-xen data]#rpm -ivh MySQL-server-5.5.24-1.linux2.6.x86_64.rpm --nodeps --forcePreparing...                ########################################### [100%]   1:MySQL-server           ######################…
视频信息 Packet Capture, Analysis, and Injection with Goby John Leonat GopherCon 2016 https://www.youtube.com/watch?v=APDnbmTKjgM 代码:https://github.com/gophercon/2016-talks/tree/master/JohnLeon-PacketCapturingWithGo博文:http://www.devdungeon.com/content/pa…