之前看龙书的时候,龙书提到可以在编译器里用动态的生成的NFA自动机来动态匹配自己的输入串,NFA的简单实现其实写起来非常简单,但是我是实际凭感觉写完之后,却觉得并不是非常的好用,在处理自己已经输入过的串,如果还要处理空串和一个符号对应多种路径就势必涉及回溯,所以我就动态生成了一个DFA,应该不是最简的,但是也能满足需求。

DFA状态

package sample;

import java.util.ArrayList;
import java.util.HashMap;
import java.util.Map; /**
* Dfa 状态
*
* @author liufengkai
* Created by liufengkai on 16/7/10.
*/
public class DfaState implements Comparable<DfaState> { private static int DFA_ID_COUNT = 0;
/**
* state id
*/
private int stateId;
/**
* transition set
* char / set of dfaState
*/
private Map<Integer, DfaState> transitionSet; private DfaState parentState; private Integer parentInput; /**
* 构造方法
*
* @param input 输入串
* @param parentState 父节点
*/
public DfaState(Integer input, DfaState parentState) {
this.parentInput = input;
this.parentState = parentState;
this.stateId = DFA_ID_COUNT++;
this.transitionSet = new HashMap<>();
} /**
* 添加一条转移语句
*
* @param input 输入字符
* @param state 下一个状态
* @return 返回添加状态
*/
public DfaState addTransition(int input, DfaState state) { if (!transitionSet.containsKey(input)) {
transitionSet.put(input, state);
} return state;
} public DfaState getTransitionInput(int input) {
return getTransitionSet().get(input);
} public int getStateId() {
return stateId;
} public static int getTotalNumber() {
return DFA_ID_COUNT;
} public Map<Integer, DfaState> getTransitionSet() {
return transitionSet;
} public DfaState getParentState() {
return parentState;
} @Override
public int compareTo(DfaState o) {
return 0;
} public int getParentInput() {
return parentInput;
} /**
* 打印状态
*/
public void printState() {
System.out.println("state : " + getStateId());
for (Integer integer : transitionSet.keySet()) {
System.out.println("symbol: " +
(char) integer.intValue() + " to :" +
transitionSet.get(integer).getStateId());
transitionSet.get(integer).printState();
}
} /**
* 返回结束状态
*
* @param list 传入结束状态
*/
public void returnEndList(ArrayList<DfaState> list) {
for (Integer key : transitionSet.keySet()) {
DfaState cur = transitionSet.get(key);
if (cur.getTransitionSet().isEmpty()) {
list.add(cur);
} else {
cur.returnEndList(list);
}
}
}
}

DFAState定义了很多基础的方法,比如每个状态都有唯一的ID值与之对应,虽然是一个DFA但是插入的过程是发现下一个节点不同才分叉,由此看来每个状态都应该有唯一的父节点与之对应,使用了一个Map来记录我们有哪些路径,还有一个方法来递归查找终结节点,使用这个方法来倒序查找预测分析出的字符串,这并不是一个效率很高的方法,之后也会被替换。

DFABuilder创建DFA

package sample;

import java.util.ArrayList;
import java.util.HashMap; /**
* Created by liufengkai on 16/7/10.
*/
public class DfaBuilder {
/**
* NFA 状态机的起始状态
*/
public DfaState startState = null;
/**
* 状态机的当前状态
*/
public DfaState currentState = null;
/**
* 接受状态
*/
public HashMap<Integer, DfaState> acceptState; private static final int RETURN_ID = 13; private static final int CHANGE_LINE_ID = 10; private static final int TAB_ID = 9; private static final int SPACE_ID = 32; private ArrayList<Integer> endIdList; private DfaCallBack dfaCallBack = null; public DfaBuilder() {
// parent is null
this(new DfaState(null, null));
} public DfaBuilder(DfaState startState) {
this.startState = startState;
this.currentState = startState;
initial();
} /**
* 添加接受状态
*/
public void addAcceptState(int input, DfaState accept) {
if (!acceptState.containsKey(input)) {
acceptState.put(input, accept);
}
} private void initial() {
this.acceptState = new HashMap<>();
this.endIdList = new ArrayList<>();
initialEndIdList();
} private void initialEndIdList() {
endIdList.add(RETURN_ID);
endIdList.add(CHANGE_LINE_ID);
endIdList.add(TAB_ID);
endIdList.add(SPACE_ID);
} public DfaState input(int input) {
// parser 了所有特殊情况 对于单词的提示
// 一个单词内是不会出现空格制表符和换行的
// System.out.println(input + "sss");
if (endIdList.contains(input)) {
this.currentState = startState;
return null;
} // 处理了当输入串还在起始状态的情况
if (currentState.getStateId() == startState.getStateId()) {
return startInput(input);
} // 说明状态不在起始状态
DfaState tempCurrent = currentState.getTransitionInput(input);
if (tempCurrent == null) {
tempCurrent = new DfaState(input, currentState);
currentState.addTransition(input, tempCurrent);
} else {
if (dfaCallBack != null) dfaCallBack.onMultipleSetBack(tempCurrent, tempCurrent.getTransitionSet());
}
currentState = tempCurrent;
return currentState;
} /**
* 处理还在输入串起始状态的情况
*
* @param input 输入
* @return current状态
*/
public DfaState startInput(int input) {
DfaState current;
// 转入第一个起始状态
if (!acceptState.containsKey(input)) {
current = new DfaState(input, currentState);
this.addAcceptState(input, current);
} else {
current = acceptState.get(input);
if (dfaCallBack != null) dfaCallBack.onMultipleSetBack(current, current.getTransitionSet());
}
this.currentState = current;
return current;
} public void setDfaCallBack(DfaCallBack dfaCallBack) {
this.dfaCallBack = dfaCallBack;
} public void printDfa() {
for (Integer integer : acceptState.keySet()) {
System.out.println("接受状态 " + acceptState.get(integer).getStateId());
acceptState.get(integer).printState();
}
} /**
* 重设startState
*/
public void resetStartState() {
this.currentState = startState;
}
}

DFABuilder定义了DFA的开始状态和现在的匹配的状态还定义了一些如何继续处理节点的方法。

重点应该看如下的这个方法:

    public DfaState input(int input) {
// parser 了所有特殊情况 对于单词的提示
// 一个单词内是不会出现空格制表符和换行的
// System.out.println(input + "sss");
if (endIdList.contains(input)) {
this.currentState = startState;
return null;
} // 处理了当输入串还在起始状态的情况
if (currentState.getStateId() == startState.getStateId()) {
return startInput(input);
} // 说明状态不在起始状态
DfaState tempCurrent = currentState.getTransitionInput(input);
if (tempCurrent == null) {
tempCurrent = new DfaState(input, currentState);
currentState.addTransition(input, tempCurrent);
} else {
if (dfaCallBack != null) dfaCallBack.onMultipleSetBack(tempCurrent, tempCurrent.getTransitionSet());
}
currentState = tempCurrent;
return currentState;
}

endIdList里面包含一些提示匹配方法结束的标志,比如空格,换行,回车,制表符,每次匹配到这个的时候就把状态切换回初始状态。如果输入串还在初始状态即第一次输入,就添加一个接受状态,其余的就找到对应的DFAState步进或是插入就可以了。另外还定义了一个接口用于返回数据进行处理。

package sample;

import java.util.Map;

/**
* Created by liufengkai on 16/7/10.
*/
public interface DfaCallBack {
void onMultipleSetBack(DfaState current, Map<Integer, DfaState> states);
}

返回当前节点和接续的状态集。

        DfaBuilder builder = new DfaBuilder();

        builder.setDfaCallBack((current, states) -> {

            System.out.println("current list " + getCurrentString(current));
ArrayList<DfaState> list = new ArrayList<>();
for (Integer key : states.keySet()) {
states.get(key).returnEndList(list);
} for (DfaState state : list) {
System.out.println("prediction list " + getCurrentString(state));
}
}); public static String getCurrentString(DfaState currentState) {
String tempString = "";
DfaState tempState = currentState;
while (tempState.getParentState() != null) {
tempString = (char) tempState.getParentInput() + tempString;
tempState = tempState.getParentState();
}
return tempString;
}

使用的时候使用类似这样的方式就能实现简单的预测提示了。

效果图

我打算看看javaFx,写一个带gui的,不过现在有点懒,还没写完。

使用DFA做文本编辑器的自动提示的更多相关文章

  1. 用VC++MFC做文本编辑器(单文档模式)

    用VC++MFC做文本编辑器(单文档模式) 原来做过一个用对话框实现的文本编辑器,其实用MFC模板里面的单文档模板也可以做,甚至更加方便,适合入门级的爱好者试试,现介绍方法如下: < xmlna ...

  2. ueditor取消文本编辑器的自动拉伸高度、宽度。

    1.首先引入富文本编辑器 <script type="text/javascript" src="<%=basePath%>js/ueditor/ued ...

  3. 百度UEditor富文本编辑器去除自动追加p标签

    本篇文章还原了我在遇到这个问题时的解决过程: 找到ueditor.all.js文件,搜索 me.addInputRule(function(root){ 或者直接搜索 //进入编辑器的li要套p标签 ...

  4. jquery 仿文本编辑器(智能提示输入文字)

    1.前台代码 <%@ Page Language="C#" AutoEventWireup="true" CodeBehind="InputAu ...

  5. [No0000139]轻量级文本编辑器,Notepad最佳替代品:Notepad++

    在详细介绍Notepad++之前,先来解释一下,为何要选择Notepad++,即把常见的一些文本编辑器和Notepad++比较,看看其有哪点好: 常见的文本编辑器有很多,此处,只提及Notepad,N ...

  6. 关于layui富文本编辑器和form表单提交的问题

    今天下午因为要做一个富文本编辑器上传文件给后台,所以看了一下layui的富文本编辑器,折腾了半天,终于把这玩意搞定了. 首先需要先创建layui的富文本编辑器 <textarea id=&quo ...

  7. Jquery 搜索框自动提示

    为文本框增加自动提示下拉功能,比如输入 1,则从后台数据库查询出包含1 的字段,在文本框增加下拉列表供用户选择 ajax 返回数据为搜索查询字段的json集合 <script src=" ...

  8. ASP.NET输入文本框自动提示功能

    在ASP.NET Web开发中会经常用到自动提示功能,比如百度搜索.我们只要输入相应的关键字,就可以自动得到相似搜索关键字的提示,方便我们快速的输入关键字进行查询. 那么在ASP.NET中,如果我们需 ...

  9. 放弃WebView,使用Crosswalk做富文本编辑器

    版权声明: 欢迎转载,但请保留文章原始出处 作者:GavinCT 出处:http://www.cnblogs.com/ct2011/p/4100132.html 为什么放弃WebView Androi ...

随机推荐

  1. 【Win 10 应用开发】TCP通信过程

    基于TCP协议的通信,估计大伙儿都不陌生的,以前玩.net或玩C++的时候应该玩得很多吧.现在老周简单介绍一下在RT中如何用. TCP是基于连接的,所以,肯定有一方是监听者,通常称服务端或服务器,它负 ...

  2. jQuery之常用且重要方法梳理(siblings,nextAll,end,wrap,apply,call,each)-(二)

    1.siblings() siblings() 获得匹配集合中每个元素的同胞,通过选择器进行筛选是可选的. <body> <div><span>Hello</ ...

  3. 【转】c#、wpf 字符串,color,brush之间的转换

    转自:http://www.cnblogs.com/wj-love/archive/2012/09/14/2685281.html 1,将#3C3C3C 赋给background this.selec ...

  4. 欢迎使用 MWeb

    首先介绍一下 MWeb 是什么,MWeb 是专业的 Markdown 写作.记笔记.静态博客生成软件.MWeb 使用的是 Github Flavored Markdown 语法,在使用 MWeb 前, ...

  5. 如何通过官方渠道为Windows 10 添加具有中国特色的字体

    Windows 10的变化细节上个人认为要比Windows 8多很多,而且很多功能找到之后还是小惊喜,就是挺多好用的地方居然都不正经宣传一下,微软真是搞得悄悄地干活? 今天为大家介绍一下通过官方途径添 ...

  6. JavaScript 函数节流和函数去抖应用场景辨析

    概述 也是好久没更新 源码解读,看着房价蹭蹭暴涨,心里也是五味杂陈,对未来充满恐惧和迷茫 ...(敢问一句你们上岸了吗) 言归正传,今天要介绍的是 underscore 中两个重要的方法,函数节流和函 ...

  7. Oracle数据库验证IMP导入元数据是否会覆盖历史表数据

    场景:imp导入数据时,最终触发器报错退出,并未导入存储过程.触发器.函数. 现在exp单独导出元数据,然后imp导入元数据,验证是否会影响已导入的表数据. 测试环境:CentOS 6.7 + Ora ...

  8. 现代3D图形编程学习-基础简介(1) (译)

    本书系列 现代3D图形编程学习 基础简介 并不像本书的其他章节,这章内容没有相关的源代码或是项目.本章,我们将讨论向量,图形渲染理论,以及OpenGL. 向量 在阅读这本书的时候,你需要熟悉代数和几何 ...

  9. 手把手教从零开始在GitHub上使用Hexo搭建博客教程(二)-Hexo参数设置

    前言 前文手把手教从零开始在GitHub上使用Hexo搭建博客教程(一)-附GitHub注册及配置介绍了github注册.git相关设置以及hexo基本操作. 本文主要介绍一下hexo的常用参数设置. ...

  10. EntityFramework 事务处理

    默认情况下,当EF调用SaveChanges()时,会把生成的所有SQL命令“包”到一个“事务(transaction)”中,只要有一个数据更新操作失败,整个事务将回滚. 在多数情况下,如果你总在数据 ...