串(string)(或字符串)是由零个或多个字符组成的有限序列。串中字符的数目称为串的长度。零个字符的串称为空串(null string),它的长度为零。

串中任意个连续的字符组成的子序列称为该串的子串。包含子串的串相应地称为主串。通常称字符在序列中的序号为该字符在串中的位置。子串在主串中的位置则以子串的第一个字符在主串中的位置来表示。

只有当两个串的长度相等,并且各个对应位置的字符都相等时才相等。

串有3种机内表示方法:
* 1.定长顺序存储表示
* 2.堆分配存储表示
* 3.串的块链存储表示

定长顺序存储表示:

类似于线性表的顺序存储结构,用一组地址连续的存储单元存储串值得字符序列。在串的定长顺序存储结构中,按照预定义的大小,为每个定义的串变量分配一个固定长度的存储区,则可用定长数组来描述。

以下标为0的数组分量存放串的实际长度:

结构图:

实现:

 function SString() {
this.MAXSTRLEN = 10;
} exports.SString = SString;
SString.prototype = {
constructor: SString,
// 返回由s1和s2连接而成的新串
concat: function (s2) {
var t = new SString();
// 未截断
if (this[0] + s2[0] <= this.MAXSTRLEN) {
copyStr2T(this);
copyStr2T(s2, this[0]);
t[0] = this[0] + s2[0]; // 截断
} else if (this[0] < this.MAXSTRLEN) {
copyStr2T(this);
copyStr2T(s2, this[0], this.MAXSTRLEN - this[0]);
t[0] = this.MAXSTRLEN; // 截断(仅取s1)
} else {
copyStr2T(this, 0, this.MAXSTRLEN);
t[0] = this[0] = this.MAXSTRLEN;
} return t; function copyStr2T(str, start, end) {
start = start || 0;
for (var i = 1, len = end || str[0]; i <= len; i++) {
t[start + i] = str[i];
}
}
},
substring: function (position, len) {
position = ~~position || 0;
len = ~~len || this[0];
if (position < 0 || position > this[0] - 1 || len < 0 || len > this[0] - position)
throw new Error('unexpected parameter'); var sub = new SString();
for (var i = 1; i <= len; i++) {
sub[i] = this[position + i - 1];
}
sub[0] = len; return sub;
},
toString: function () {
var str = '';
for (var i = 1; this[i]; i++) {
str += this[i];
}
return str;
},
// 返回子串sstring在主串中的第position个字符之后的位置
index: function (sstring, position) {
var i = position || 0;
var j = 1; while (i <= this[0] && j <= sstring[0]) {
if (this[i] === sstring[j]) {
i++;
j++;
} else {
i = i - j + 2;
j = 1;
}
} return j > sstring[0] ? i - sstring[0] : -1;
},
kmpIndex: function (sstring, position) {
var i = position || 0;
var j = 1;
var next = getNext(sstring); while (i <= this[0] && j <= sstring[0]) {
if (j === 0 || this[i] === sstring[j]) {
++i;
++j;
} else {
j = next[j];
}
} return j > sstring[0] ? i - sstring[0] : -1;
}
}; function getNext(sstring) {
var i = 1;
var next = {1: 0};
var j = 0; while (i < sstring[0]) {
if (j === 0 || sstring[i] === sstring[j]) {
if(sstring[++i] !== sstring[++j]){
next[i] = j;
} else {
next[i] = next[j];
}
// next[++i] = ++j;
} else {
j = next[j];
}
} return next;
} var a = new SString();
var b = new SString();
for (var i = 0; i < 4; i++) {
a[i + 1] = i + '';
b[i + 1] = i + '';
}
a[0] = b[0] = 4;
var t = a.concat(b);
console.log(t + ''); // var d = new SString();
var str = 'acabaabaabcacaabc';
for(i = 0; i < str.length; i++){
d[i + 1] = str[i];
}
d[0] = str.length; var c = new SString();
str = 'abaabc';
for(i = 0; i < str.length; i++){
c[i + 1] = str[i];
}
c[0] = str.length; console.log(d.index(c));
console.log(d.kmpIndex(c));

单元测试代码:

 describe('SString tests', function(){
var a = new SString();
var b = new SString(); it('should concat without break strings', function(){
for(var i = 0; i < 4; i++){
a[i + 1] = i + '';
b[i + 1] = i + '';
}
a[0] = b[0] = 4; var t = a.concat(b);
console.log(a);
console.log(b);
expect(t[0]).toBe(8);
expect(t + '').toBe('01230123');
}); it('should break strings of b', function(){
for(var i = 0; i < 7; i++){
b[i + 1] = i + '';
}
b[0] = 7; var t = a.concat(b);
console.log(a);
console.log(b);
expect(t[0]).toBe(10);
expect(t + '').toBe('0123012345');
}); it('should break strings of a', function(){
for(var i = 4; i < 10; i++){
a[i + 1] = i + '';
}
a[0] = 10; var t = a.concat(b);
console.log(a);
console.log(b);
expect(t[0]).toBe(10);
expect(t + '').toBe('0123456789');
}); it('should get substring', function(){
console.log(a);
var t = a.substring(1, 10);
expect(t + '').toBe('0123456789'); t = a.substring(3, 5);
expect(t + '').toBe('23456');
});
});

在顺序存储结构中,实现串操作的原操作为“字符串序列的复制”,操作时间复杂度基于复制的字符串序列的长度。
另一操作特点是,如果在操作中出现串值序列的长度超过MAXSTRLEN时,约定用截尾法处理,这种情况不仅在求连接串时可能发生,在串的其他操作中,如插入,置换等也可能发生,克服这个弊病唯有不限定串长的最大长度,即动态分配串值的存储空间。

javascript实现数据结构:串--定长顺序存储表示以及kmp算法实现的更多相关文章

  1. 串的模式匹配 BF算法和KMP算法

    设有主串s和子串t,子串t的定位就是要在主串中找到一个与子串t相等的子串.通常把主串s称为目标串,把子串t称为模式串,因此定位也称为模式匹配. 模式匹配成功是指在目标串s中找到一个模式串t: 不成功则 ...

  2. javascript实现数据结构: 串的块链存储表示

    和线性表的链式存储结构相类似,也可采用链式方式存储串值.由于串结构的特殊性--结构中的每个数据元素是一个字符,则用链表存储串值时,存在一个“结点大小”的问题,即每个结点可以存放一个字符,也可以存放多个 ...

  3. 大话数据结构(十二)java程序——KMP算法及改进的KMP算法实现

    1.朴素的模式匹配算法 朴素的模式匹配算法:就是对主串的每个字符作为子串开头,与要连接的字符串进行匹配.对主串做大循环,每个字符开头做T的长度的小循环,直到成功匹配或全部遍历完成为止. 又称BF算法 ...

  4. 串String(1):串的实现(定长顺序存储结构)

    前言 PS:本文相关头文件.预编译以及typedef如下,阅读一遍以便于下面的理解: #include <stdio.h> #include <stdlib.h> #inclu ...

  5. javascript实现数据结构与算法系列

    1.线性表(Linear list) 线性表--简单示例及线性表的顺序表示和实现 线性表--线性链表(链式存储结构) 线性表的静态单链表存储结构 循环链表与双向链表 功能完整的线性链表 线性链表的例子 ...

  6. 《数据结构》之串的模式匹配算法——KMP算法

    //串的模式匹配算法 //KMP算法,时间复杂度为O(n+m) #include <iostream> #include <string> #include <cstri ...

  7. 数据结构——串(KMP)

    空串:长度为0的串 空格串:由一个或多个空格组成的串 串常用的3种机内表示方法: 定长顺序存储表示: 用一组地址连续的存储单元存储串的字符序列,每一个串变量都有一个固定长度的存储区,可用定长数组来描述 ...

  8. sql 数据类型 论可变长度字符串与定长性能差异(my sql版)

    首先从字节上来说CHAR是定长,意思就是只要输入在我这个定长以下,不管是几个字符,它的实际占用空间都是CHAR定长的长度.而VARCHAR则相对来说会节省一点空间,比如:你VARCHAR的长度设为10 ...

  9. 串、串的模式匹配算法(子串查找)BF算法、KMP算法

    串的定长顺序存储#define MAXSTRLEN 255,//超出这个长度则超出部分被舍去,称为截断 串的模式匹配: 串的定义:0个或多个字符组成的有限序列S = 'a1a2a3…….an ' n ...

随机推荐

  1. MIS2000 Lab,我的IT人生与职场--从零开始的前十五年 与 我的微创业

    http://www.dotblogs.com.tw/mis2000lab/archive/2014/09/16/ithome_2014_ironman.aspx [IT邦幫忙]鐵人賽 -- MIS2 ...

  2. EditText 监听回车事件 避免2次触发

    // 侦听回车事件 EidtText txtSN = (EditText) findViewById(R.id.txtSN); txtSN.setOnEditorActionListener(new ...

  3. Toast提示信息

    用Toast来作为操作成功以及用户误操作等等的提示,非常的简单.直接上代码: 创建方式一: ps: 此处没有设置toast的其他属性,均使用默认的风格(个人觉得默认的风格除了字体比较小之外 还是挺好看 ...

  4. jQuery学习笔记(1)

    设置和获取HTML,文本和值 val()方法: 1.单选框 <html xmlns="http://www.w3.org/1999/xhtml"> <head r ...

  5. WPF DragDrop事件元素跟随

    前一段时间项目里面要实现一个鼠标拖动一个元素到另外一个元素上面并且赋值的功能,由于要在surface上运行,拖动的时候手指会挡住系统默认的拖动图标,导致用户意识不到自己是不是在拖动着东西,所以要解决这 ...

  6. OpenStack:初识

    OpenStack提纲:-------------------------------------------初识OpenStack, 千头万绪, 不知所措. 逐渐剥茧抽丝, 厘清思路...一. Op ...

  7. WebStorm mac 下载地址及注册码

    webStorm : UserName:William ===== LICENSE BEGIN ===== 45550-12042010 00001SzFN0n1bPII7FnAxnt0DDOPJA  ...

  8. ExtJS4.x 开发环境搭建

    需要的资源 ExtJS4.2 eclipse 开发环境搭建 在项目中国需要引用的文件: eclipse中有报错.需要处理的是ext-lang-zh_CN.js,中文编码不能识别.右键->属性-& ...

  9. 设置搜狗输入法在任何时候按左右两侧的shift激活

    如上图,搜狗输入法for linux最近与广大用户见面了,现在的版本是1.0.0.0014,本人系统是ubuntu 14.04非麒麟版本 使用过程中有个习惯就是在任何窗口内只要按任意一侧的shift就 ...

  10. PBOC规范下的java卡介绍

    JAVA卡与智能卡 什么是 JAVA 卡呢?JAVA 卡是一种可以运行 JAVA 程序的接触式微处理器智能卡.1996 年 11 月,JAVA 卡 1.0 版本的规范正式发布了.如今 JAVA 卡最新 ...