paip.输入法编程--英文ati化By音标原理与中文atiEn处理流程 python 代码为例



#---目标

1. en vs enPHati

2.en vs enPhAtiSmp

3.cn vs enPHati

4. cn vs enPhAtiSmp





#两个方法,一个获得enPhAtied代码,一个获得哪的smp版本..



def convert2atiEnPnNoSpltr(old):

       a=old.replace("@", "").replace("-", "")

       return a

def Smp(old):

        """odl=@n-@y-u@t-@rw-@t-

        """

        old=trim(old,"@")

        

        r=""

        a=old.split("@")

        

        for val in a:

            a2=val.split("-")

            csnt=a2[0]

            r=r+csnt

        #endfor

        old=trim(old,"-")

        if(isStartWithVowel(old)):

            startx=old[0]

            r=startx+r

        if(len(trim(old))<=3) :

            

            return old

        return r





        作者 老哇的爪子 Attilax 艾龙,  EMAIL:1466519819@qq.com

转载请注明来源: http://blog.csdn.net/attilax





#---导出为输入法词库格式.

en  vs  atiEnPh  and atiENPHsmp



SELECT encn.en,atiNoSpltr  FROM `grejx_def`  encn  

left JOIN  `enphonetic` enph

on enph.en=encn.en

where atiNoSpltr is not null   and encn.en is not null





SELECT encn.en,atismp  FROM `grejx_def`  encn  

left JOIN  `enphonetic` enph

on enph.en=encn.en

where atismp is not null   and encn.en is not null





#--  cn vs atiEnPh and smp









SELECT clrbrkt, atiNoSpltr  FROM `grejx_def`  encn  

left JOIN  `enphonetic` enph

on enph.en=encn.en

where atiNoSpltr is not null   and clrbrkt is not null







SELECT encn.en, clrbrkt,atiNoSpltr,atismp,enph.id  FROM `grejx_def`  encn  

left JOIN  `enphonetic` enph

on enph.en=encn.en

where atismp is not null and LENGTH(atiNoSpltr)<=4

paip.输入法编程--英文ati化By音标原理与中文atiEn处理流程 python 代码为例的更多相关文章

  1. paip.输入法编程---词库多意义条目分割 python实现.

    paip.输入法编程---词库多意义条目分割 python实现. ==========子标题 python mysql 数据库操作 多字符分隔,字符串分割 字符列表循环  作者 老哇的爪子 Attil ...

  2. paip.输入法编程---词频顺序order by py

    paip.输入法编程---词频顺序order by py 作者Attilax ,  EMAIL:1466519819@qq.com  来源:attilax的专栏 地址:http://blog.csdn ...

  3. paip.输入法编程----删除双字词简拼

    paip.输入法编程----删除双字词简拼 作者Attilax ,  EMAIL:1466519819@qq.com  来源:attilax的专栏 地址:http://blog.csdn.net/at ...

  4. paip.输入法编程---带ord gudin去重复-

    paip.输入法编程---带ord gudin去重复- 作者Attilax ,  EMAIL:1466519819@qq.com 来源:attilax的专栏 地址:http://blog.csdn.n ...

  5. paip.输入法编程---增加码表类型

    paip.输入法编程---增加码表类型 作者Attilax ,  EMAIL:1466519819@qq.com 来源:attilax的专栏 地址:http://blog.csdn.net/attil ...

  6. paip输入法编程之生活用高频字,以及汉字分级

    paip输入法编程之生活用高频字 作者Attilax ,  EMAIL:1466519819@qq.com  来源:attilax的专栏 地址:http://blog.csdn.net/attilax ...

  7. paip.输入法编程----一级汉字1000个

    paip.输入法编程----一级汉字1000个.txt 作者Attilax ,  EMAIL:1466519819@qq.com  来源:attilax的专栏 地址:http://blog.csdn. ...

  8. paip.输入法编程---智能动态上屏码儿长调整--.txt

    paip.输入法编程---智能动态上屏码儿长调整--.txt 作者Attilax ,  EMAIL:1466519819@qq.com 来源:attilax的专栏 地址:http://blog.csd ...

  9. paip.输入法编程---输入法ATIaN历史记录 c823

    paip.输入法编程---输入法ATIaN历史记录 c823 作者Attilax ,  EMAIL:1466519819@qq.com 来源:attilax的专栏 地址:http://blog.csd ...

随机推荐

  1. NSMutableAttributedString(改变文字颜色)

    //类型 //创建一个label    UILabel *label1=[[UILabel alloc]initWithFrame:CGRectMake(130, 60,250, 150)];     ...

  2. pause 和 title

    -------siwuxie095 pause 暂停批处理程序,并显示:请按任意键继续- 暂停高级技巧: pause>nul 只暂停,不显示任何信息,且光标移到下一行 如果不想用默认提示语:请按 ...

  3. plink:将bed文件转化为ped,map文件

    用--recode命令,--out表示转化的文件的名字,本例已经命名为“filter” /plink-1.07-x86_64/plink --bfile filter --recode --out f ...

  4. python 小知识

    PYTHONPATH是Python搜索路径,默认我们import的模块都会从PYTHONPATH里面寻找. 使用下面的代码可以打印PYTHONPATH: print(os.sys.path) impr ...

  5. AsyncTask源码分析

    在Android中,主线程是UI线程,当需要根据其他数据进行更新UI时,如果获取数据的操作比较耗时的话,会触发ANR,所以我们应该讲耗时的操作进行异步操作,尤其是请求网络数据的操作应该放在后台线程进行 ...

  6. NSArray其中的方法--遍历,

    1. ForLoop, For - in, enumerateObjects这个三个方法的区别: 遍历一个数组用For-in最快. 通过Value查询index的时候, 面对大量的数组推荐使用 enu ...

  7. 【Map】获取字符串中,每一个字母出现的次数

    package cn.itcast.p1.map.test; import java.util.Iterator; import java.util.Map; import java.util.Tre ...

  8. 在centos上编译安装mariadb数据库

    一.安装前提(准备数据文件.安装其他依赖的软件) 1.准备数据存放的目录 [root@localhost ~]# fdisk /dev/sdb  (fdisk /dev/sdb 创建一个逻辑分区/de ...

  9. java开发中的一些工具软件

    1. XJad, 反编译工具,类似于.Net中的Refractor.可以反编译单个jar文件或一个文件夹下的class文件,效果还不错. 2. dirtyJOE, class文件直接修改工具.有时想修 ...

  10. 2011 wireshark 实用过滤表达式(针对ip、协议、端口、长度和内容) 实例介绍

    首先说几个最常用的关键字,“eq” 和 “==”等同,可以使用 “and” 表示并且,“or”表示或者.“!" 和 "not” 都表示取反. 一.针对wireshark最常用的自然 ...