paip输入法编程之生活用高频字 作者Attilax ,  EMAIL:1466519819@qq.com  来源:attilax的专栏 地址:http://blog.csdn.net/attilax 在进行输入法编程时,需要对高频字进行前排序..主要是日常生活中常用的名词,动词,形容词等.. 一般来说,生活中常用的高频字也就是个500左右.. 高频字固定后,把其他的3000常用汉字分为三级,第一级字加上顺序10,第二级字加上顺序20,其他99 这样,就把3500常用汉字分级OK兰.. 编号  …
paip.输入法编程---输入法ATIaN历史记录 c823 作者Attilax ,  EMAIL:1466519819@qq.com 来源:attilax的专栏 地址:http://blog.csdn.net/attilax 7.24 ------------ 3500 单字,3000词组(全拼形式+单声母形式) ------2013.7.27 wen缩写on,yen缩写in , 词组改为(ssha形式) ------2013.7.29 字频调整: 500高频字,第一级汉字1000字,第二级汉…
paip.输入法编程----一级汉字1000个.txt 作者Attilax ,  EMAIL:1466519819@qq.com  来源:attilax的专栏 地址:http://blog.csdn.net/attilax 的一是在了不和有大这主中人上为们地个用工时要动国产以我到他会作来分生对于学下级义就年阶发成部民可出能方进同行面说种过命度革而多子后自社加小机也经力线本电高量长党得实家定深法表着水理化争现所二起政三好十 战无农使性前等反体合斗路图把结第里正新开论之物从当两些还天资事对批如应形想…
paip.输入法编程--英文ati化By音标原理与中文atiEn处理流程 python 代码为例 #---目标 1. en vs enPHati 2.en vs enPhAtiSmp 3.cn vs enPHati 4. cn vs enPhAtiSmp #两个方法,一个获得enPhAtied代码,一个获得哪的smp版本.. def convert2atiEnPnNoSpltr(old):        a=old.replace("@", "").replace(…
paip.输入法编程---词库多意义条目分割 python实现. ==========子标题 python mysql 数据库操作 多字符分隔,字符串分割 字符列表循环  作者 老哇的爪子 Attilax 艾龙,  EMAIL:1466519819@qq.com 来源: http://blog.csdn.net/attilax ===================主要的流程 词库原来格式 carp      n.鲤鱼:v.吹毛求疵    813 需要意义分割.. 主要的流程如下: for  …
paip.输入法编程---词频顺序order by py 作者Attilax ,  EMAIL:1466519819@qq.com  来源:attilax的专栏 地址:http://blog.csdn.net/attilax 本来输入venti要出来个"问题"了,但是,"闻听"却在前面... 原来,问题的cpcp_ritCye2形式的编码是 ventisy  ,"闻听"的编码是ventinkj 导出的时候按atian 排序,这样"闻听&…
paip.输入法编程----删除双字词简拼 作者Attilax ,  EMAIL:1466519819@qq.com  来源:attilax的专栏 地址:http://blog.csdn.net/attilax 双字词简拼重码太多了,意义不大,决定要从词库删除... 1.查询双字词记录 ------------------- 主要步骤是a.查询汉字表,找到拼音码长度>1的汉字. b.取出词库词,截取第一个字... c.词库词跟汉字表的对比... SELECT * FROM gaopinzi WH…
paip.输入法编程---带ord gudin去重复- 作者Attilax ,  EMAIL:1466519819@qq.com 来源:attilax的专栏 地址:http://blog.csdn.net/attilax --------查询重复(不同ORD) SELECT  hezi,  atian,  gudin,    count(id) AS num FROM  gaopinzi WHERE  LENGTH(atian) > 0 and   ( del is null    or del…
paip.输入法编程---增加码表类型 作者Attilax ,  EMAIL:1466519819@qq.com 来源:attilax的专栏 地址:http://blog.csdn.net/attilax 查询是否已经有这个码表. --------------  select * from gaopinzi  where jpcpcye='jpcye' 记录最后码表ID --------------------- select * from gaopinzi    order by id  de…
paip.输入法编程---智能动态上屏码儿长调整--.txt 作者Attilax ,  EMAIL:1466519819@qq.com 来源:attilax的专栏 地址:http://blog.csdn.net/attilax 智能动态上屏码儿长 的含义: 比如 设置是4, 打个 "sheobn" ,犹豫没有这个词..最后出来的"上班" ,还有个n留在输入法上.. 不是我们的本意.. 应该设置成个99.. 重剑,出来的的走是个"sheobn"…