paip.提升分词---准确度--常用量词表 作者Attilax  艾龙,  EMAIL:1466519819@qq.com  来源:attilax的专栏 地址:http://blog.csdn.net/attilax  脚,大,拨,造,等,边,立方公尺,天,盎司,公分,头,筐,筒,回事,平方英里,缕,缗,拳,路,筥,拍,处,拉,颗,担,点钟,拃,缸,册,通,班,脬,招,领,夜,缶,筹,遭,湾,出,抬,腔,觉,女,笔,角,趟,曲,抱,替,罗,罐,网,遍,把,石,蔸,千克,抛,折,环,套,抔,道,…
paip.提升中文分词准确度---新词识别 近来,中文每年大概出现800---1仟个新的词.. 60%的分词错误是由新词导致的 作者Attilax  艾龙,  EMAIL:1466519819@qq.com  来源:attilax的专栏 地址:http://blog.csdn.net/attilax  新词的概念   目前,在中文分词领域出现了新词(New Words)和未登录词(Unknown Words)两种概念.很多研究者并没有对未登录词和新词加以区别,认为它们是一样的[12][13].通…
paip.提升性能--多核cpu中的java/.net/php/c++编程 作者Attilax  艾龙,  EMAIL:1466519819@qq.com  来源:attilax的专栏 地址:http://blog.csdn.net/attilax ////////////////目前情况 需要一个处理50w行的文件,按行进行分词..需要50s才能完成.. 经过调试,瓶颈在这个代码上... TokenStream ts = Analyzer.tokenStream("", reader…
paip.语义分析--分词--常见的单音节字词 2_deDuli  单字词 774个 作者Attilax  艾龙,  EMAIL:1466519819@qq.com  来源:attilax的专栏 地址:http://blog.csdn.net/attilax 啊挨癌岸凹傲扒拔把掰百拜稗瓣邦绑蚌胞堡爆碑奔绷嘣蹦彼笔闭裨扁便遍镖憋别濒冰兵柄播帛泊不埠擦猜财舱藏操糙嘈槽草册测恻层曾蹭叉茶查拆搀禅蝉尝怅潮扯撤趁呈乘池尺冲仇处揣踹喘疮窗床创吹捶锤瓷雌此刺葱从凑粗促窜催脆存寸搓达逮蛋裆岛到得蹬等瞪堤敌嫡电刁…
paip. 提升性能---hibernate的缓存使用 总结 作者Attilax  艾龙,  EMAIL:1466519819@qq.com  来源:attilax的专栏 地址:http://blog.csdn.net/attilax 除了延迟加载.迫切外连接.查询过滤等,可以使用在的内存缓存比如memcache Hibernate缓存分为二级,第一级存放于session中称为一级缓存,默认带有且不能卸载.   第二级是由sessionFactory控制的进程级缓存.是全局共享的缓存,凡是会调用…
paip.提升性能---mysql 优化cpu多核以及lan性能的关系. 作者Attilax  艾龙,  EMAIL:1466519819@qq.com 来源:attilax的专栏 地址:http://blog.csdn.net/attilax //////环境 双核2.9g , 内存2g  ,XPSP2 mysql5.6 ,myisam 50W数据insert,需要50s...平均1w/s的速度了.呵. /////cpu多核大幅提升mysql性能 传输myisam,10w数据.20连接.. 在…
paip.提升性能---mysql 性能 测试以及 参数调整.txt 作者Attilax  艾龙,  EMAIL:1466519819@qq.com 来源:attilax的专栏 地址:http://blog.csdn.net/attilax /////////环境 xpsp3   cpu2.1g  单核.  mem :2g ----------1000>1   1.8s "D:\MySQL56\bin\mysqlslap.exe"     --concurrency=1 --au…
paip.提升性能---jvm java 工具使用. 作者Attilax  艾龙,  EMAIL:1466519819@qq.com 来源:attilax的专栏 地址:http://blog.csdn.net/attilax linux: top,sar,vmstat,iostat,pidstat windows: pslist jps -m -l -v 可查看,主函数全路径,MAIN参数,jvm参数. jstat:  jvm内存查看. jinfo :jvm 信息. jmap: 导出core d…
paip.提升性能----jvm参数调整.txt 作者Attilax  艾龙,  EMAIL:1466519819@qq.com 来源:attilax的专栏 地址:http://blog.csdn.net/attilax jvm内存 1.stack    2.heap    3.class method 区.. 1.stack xss设置..每个线程的使用内存尺寸. 要是xss太大,线程量会变小...因为总体stack区不便... 总stack区尺寸也能以及heap有关..反向关系.. 2.he…
paip.提升性能---协程的使用. 近乎无限并发的"微线程" 作者Attilax  艾龙,  EMAIL:1466519819@qq.com 来源:attilax的专栏 地址:http://blog.csdn.net/attilax 协程,又称微线程和纤程等,Fiber,即纤程..协程有时也被叫做用户态线程..据说源于 Simula 和 Modula-2 语言( 现代编程语言基本上都有支持,比如 Lua.ruby 协程是用户空间线程,操作系统对其存在一无所知,所以需要用户自己去做调度…