paip.输入法编程---词库多意义条目分割 python实现. ==========子标题 python mysql 数据库操作 多字符分隔,字符串分割 字符列表循环  作者 老哇的爪子 Attilax 艾龙,  EMAIL:1466519819@qq.com 来源: http://blog.csdn.net/attilax ===================主要的流程 词库原来格式 carp      n.鲤鱼:v.吹毛求疵    813 需要意义分割.. 主要的流程如下: for  …
paip.输入法英文词库的处理 python 代码 o4 目标是eng>>>中文>>atian 当输入非atian词的时候儿,能打印出 atian pinyin >>>english提示..  ,在根据英文输入.. =====下载源词库 要下载一个格式好的词库文件还是很困难的..几乎没..只好自己写兰... 下载一个-GRE 8k词库..excel,删除不要的datasheet,导入mysql 格式如下: abandon    v./n.放弃:放纵    …
paip.输入法编程----删除双字词简拼 作者Attilax ,  EMAIL:1466519819@qq.com  来源:attilax的专栏 地址:http://blog.csdn.net/attilax 双字词简拼重码太多了,意义不大,决定要从词库删除... 1.查询双字词记录 ------------------- 主要步骤是a.查询汉字表,找到拼音码长度>1的汉字. b.取出词库词,截取第一个字... c.词库词跟汉字表的对比... SELECT * FROM gaopinzi WH…
paip.输入法编程--英文ati化By音标原理与中文atiEn处理流程 python 代码为例 #---目标 1. en vs enPHati 2.en vs enPhAtiSmp 3.cn vs enPHati 4. cn vs enPhAtiSmp #两个方法,一个获得enPhAtied代码,一个获得哪的smp版本.. def convert2atiEnPnNoSpltr(old):        a=old.replace("@", "").replace(…
paip.输入法编程---输入法ATIaN历史记录 c823 作者Attilax ,  EMAIL:1466519819@qq.com 来源:attilax的专栏 地址:http://blog.csdn.net/attilax 7.24 ------------ 3500 单字,3000词组(全拼形式+单声母形式) ------2013.7.27 wen缩写on,yen缩写in , 词组改为(ssha形式) ------2013.7.29 字频调整: 500高频字,第一级汉字1000字,第二级汉…
paip.输入法编程---智能动态上屏码儿长调整--.txt 作者Attilax ,  EMAIL:1466519819@qq.com 来源:attilax的专栏 地址:http://blog.csdn.net/attilax 智能动态上屏码儿长 的含义: 比如 设置是4, 打个 "sheobn" ,犹豫没有这个词..最后出来的"上班" ,还有个n留在输入法上.. 不是我们的本意.. 应该设置成个99.. 重剑,出来的的走是个"sheobn"…
paip.数据挖掘--导出词库 清理太长的iptcode 原来eng2atian的时候儿,有些cnchar无对眼的atian,走临时使用nonex代替... 而个,要不个那清理给挂了.. #keyword python 文件读写rwrite  unicode #清理规则:长度大的9,  而且含有nonex 作者 老哇的爪子 Attilax 艾龙,  EMAIL:1466519819@qq.com 来源: http://blog.csdn.net/attilax #主要的算法如下 x=r"c:\导…
paip.输入法编程---词频顺序order by py 作者Attilax ,  EMAIL:1466519819@qq.com  来源:attilax的专栏 地址:http://blog.csdn.net/attilax 本来输入venti要出来个"问题"了,但是,"闻听"却在前面... 原来,问题的cpcp_ritCye2形式的编码是 ventisy  ,"闻听"的编码是ventinkj 导出的时候按atian 排序,这样"闻听&…
paip.输入法编程---带ord gudin去重复- 作者Attilax ,  EMAIL:1466519819@qq.com 来源:attilax的专栏 地址:http://blog.csdn.net/attilax --------查询重复(不同ORD) SELECT  hezi,  atian,  gudin,    count(id) AS num FROM  gaopinzi WHERE  LENGTH(atian) > 0 and   ( del is null    or del…
paip.输入法编程---增加码表类型 作者Attilax ,  EMAIL:1466519819@qq.com 来源:attilax的专栏 地址:http://blog.csdn.net/attilax 查询是否已经有这个码表. --------------  select * from gaopinzi  where jpcpcye='jpcye' 记录最后码表ID --------------------- select * from gaopinzi    order by id  de…