基础算法-查找：线性索引查找（II）

索引查找是在索引表和主表(即线性表的索引存储结构)上进行的查找。

索引查找的过程是：

1)首先根据给定的索引值K1，在索引表上查找出索引值等于K1的索引项，以确定对应子表在主表中的开始位置和长度。

2)然后再根据给定的关键字K2，在对应的子表中查找出关键字等于K2的元素(结点)。

对索引表或子表进行查找时，若表是顺序存储的有序表，则既可进行顺序查找，也可进行二分查找，否则只能进行顺序查找。

一提到“索引”，估计大家第一反应就是“数据库索引”，对的，其实主键建立“索引”，就是方便我们在海量数据中查找。

实现索引查找时常使用的三个术语：

1)主表：这个很简单，要查找的对象，主表在逻辑上被划分为一个一个的子表。

2)索引项：一般我们会用函数将一个主表划分成几个子表，每个子表建立一个索引，这个索引叫做索引项。

3)索引表：索引项的集合也就是索引表。

一般“索引项”包含三种内容：index，start，length

第一：index，也就是索引指向主表的关键字。

第二：start，也就是index在主表中的位置。

第三：length, 也就是子表的区间长度。

下面做一个有关分块索引的实现：

在主表中有10000个数据，现在分成100个子表，每个子表有100条记录，整个索引表有100个索引项对应100个子表。

对于某个子表，把它的所有记录中的最大项作为它对应的索引项的index。

在存储数据的时候，每个子表都有各自的数值的范围，插入一个新的数据时，先找到其要存储的位置（在那张子表中存储），然后查看这张子表是否有剩余的空间，如果有剩余的空间，插入该值然后更新对应的索引项。

程序代码实现

const int MaxSize = 10000;

const int IndexItemNum = 100;

//定义主表

struct student_info

{

	int score;

	//some other attributes

};

typedef struct student_info mainTable[MaxSize];

//定义索引表

struct indexItem

{

	int index;

	int start;

	int length;

};

typedef struct indexItem indexTable[IndexItemNum];

class IndexSearch

{

public:

	IndexSearch();

	//在主表中添加一个元素，添加后返回它的下标，失败后返回-1

	int addElements(int key);

	//返回搜索值在主表中的下标，如果检索失败返回-1

	int searchElements(int key);

private:

	indexTable index_table;

	mainTable main_table;

	//索引表中索引项的个数

	const int indexItem_num;

	//每个子表存储的数据的个数

	const int numPerBlock;

};

　　上述代码定义了主表和索引表，同时确定了主表分成多少个子表和每个子表中存储数据的个数。

#include "IndexSearch.h"

int IndexSearch::searchElements(int element)

{

	int i,j;

	//检索索引表

	int low = 0;

	int high = indexItem_num - 1;

	while(low <= high)

	{

		int mid = (low +high) / 2;

		if(element > index_table[mid].index)

		{

			low = mid + 1;

		}

		else if(element < index_table[mid-1].index)

		{

			high = mid - 1;

		}

		else

		{

			i = mid;//用i暂存结果

			break;

		}

	}//while

	if(low > high)

	{

		return -1;	//检索失败

	}

	//检索主表

	low  = index_table[i].start;

	high = index_table[i].start + index_table[i].length;

	for(j = low; j < high; j++)

	{

		if(main_table[j].score == element)

		{

			break;

		}

	}//for

	if(j < high)

	{

		return j;

	}

	else

	{

		return -1;

	}

}

int IndexSearch::addElements(int element)

{

	int tag = element / numPerBlock;

	if(tag > numPerBlock - 1)

	{

		tag = numPerBlock - 1;

	}

	if(index_table[tag].length < numPerBlock)

	{

		int start  = index_table[tag].start;

		int length = index_table[tag].length;

		main_table[start + length].score = element;

		index_table[tag].length++;

		if(element > index_table[tag].index)

		{

			index_table[tag].index = element;

		}

		return start + length;

	}

	else

	{

		return -1;

	}

}

IndexSearch::IndexSearch(): indexItem_num(IndexItemNum), numPerBlock(100)

{

	int index = 0;

	int start = 0;

	for(int i = 0; i < 100; i++)

	{

		index_table[i].length = 0;

		index_table[i].index  = index;

		index_table[i].start  = start; 

		index += 100;

		start += 100;

	}//for

}

　　初始化子表的个数和每个子表中存储数据的个数，同时实现插入和查找这两个函数。

测试代码：

#include <iostream>

#include <ctime>

#include "IndexSearch.h"

using namespace std;

void main()

{

	srand(time(0));

	IndexSearch searchTool;

	int index;

	int key;

	for(int i = 0; i < 1000; i++)

	{

		key = rand()%10000;

		index = searchTool.addElements(key);

		cout << "the number: " << key << " is insert in " << index << endl;

	}

	index = searchTool.addElements(2015);

	cout << "the number 2015: "<< " is insert in " << index << endl;

	//查找刚才插入的这个值

	cout << "the number 2015 is stored is the position of "<< searchTool.searchElements(2015) << endl;

	index = searchTool.addElements(467);

	cout << "the number 467: "<< " is insert in " << index << endl;

	//查找刚才插入的这个值

	cout << "the number 467 is stored is the position of "<< searchTool.searchElements(467) << endl;

}

基础算法-查找：线性索引查找（II）的更多相关文章

基础算法-查找：线性索引查找（I）
前面介绍的几种查找的算法都是基于数据有序的基础上进行的.但是在实际的应用中,很多数据集可能有惊人的数据量,面对这些海量的数据,要保证记录全部按照当中的某个关键字有序,其时间代价是非常昂贵的,所以这种数 ...
hrbustoj 1551:基础数据结构——字符串2 病毒II（字符串匹配，BM算法练习）
基础数据结构——字符串2 病毒IITime Limit: 1000 MS Memory Limit: 10240 KTotal Submit: 284(138 users) Total Accepte ...
Python 基础算法
递归时间&空间复杂度常见列表查找算法排序数据结构递归在调用一个函数的过程中,直接或间接地调用了函数本身这就叫做递归. 注:python在递归中没用像别的语言对递归进行优化,所以每一 ...
Java基础算法
i++;++i; i--;--i; int a=5;int b=a++;++放在后面,表示先使用a的值,a再加1b=5,a=a+1,a=6 int c=5;int d=++c;++放在前面,表示先将c ...
Python <算法思想集结>之初窥基础算法
1. 前言数据结构和算法是程序的 2 大基础结构,如果说数据是程序的汽油,算法则就是程序的发动机. 什么是数据结构? 指数据在计算机中的存储方式,数据的存储方式会影响到获取数据的便利性. 现实生活中 ...
PHP基础算法
1.首先来画个菱形玩玩,很多人学C时在书上都画过,咱们用PHP画下,画了一半. 思路:多少行for一次,然后在里面空格和星号for一次. <?php for($i=0;$i<=3;$i++ ...
c/c++面试总结---c语言基础算法总结2
c/c++面试总结---c语言基础算法总结2 算法是程序设计的灵魂,好的程序一定是根据合适的算法编程完成的.所有面试过程中重点在考察应聘者基础算法的掌握程度. 上一篇讲解了5中基础的算法,需要在面试之 ...
c/c++面试指导---c语言基础算法总结1
c语言基础算法总结 1 初学者学习任何一门编程语言都必须要明确,重点是学习编程方法和编程思路,不是学习语法规则,语法规则是为编程实现提供服务和支持.所以只要认真的掌握了c语言编程方法,在学习其它的语 ...
ACM基础算法入门及题目列表
对于刚进入大学的计算机类同学来说,算法与程序设计竞赛算是不错的选择,因为我们每天都在解决问题,锻炼着解决问题的能力. 这里以TZOJ题目为例,如果为其他平台题目我会标注出来,同时我的主页也欢迎大家去访 ...

随机推荐

宣布发布全新的 Windows Azure 缓存预览版
全新 Windows Azure 缓存的预览版现已发布.此托管服务可以提供闪电般的数据访问速度,以帮助您构建更具可伸缩性.响应更快的应用程序. 详情如下: · 托管式缓存:这一全新的托管服务为需 ...
php获取apk信息
使用方法如下: <?php require('apk_parser.php'); $p = new ApkParser(); /* if($argc<2) { echo "usa ...
第七届河南省赛A.物资调度（dfs）
10401: A.物资调度 Time Limit: 2 Sec Memory Limit: 128 MB Submit: 95 Solved: 54 [Submit][Status][Web Bo ...
[置顶] .NET下枚举类型的Save和Load分析
今天在写代码的时候,心血来潮对原来的字符串保存状态位的方式很不满意,对于代码里出现了 state == "1" 这样的状态判断很是不爽.那么理想中的判断是怎样的呢?很简单如你所想枚 ...
linux之多进程fork:进程通信
++++++++++++++++++信号机制+++++++++++++++++++ 接收信号 int signal(int sig,__sighandler_t handler); int func( ...
BootStrap 智能表单系列四表单布局介绍
表单的布局分为自动布局和自定义布局两种: 自动布局就是根据配置项中第二级配置项中数组的长度来自动使用不同的bootstrap栅格,通过设置autoLayout为true可以实现自动布局自动以布局就是 ...
BZOJ 4305: 数列的GCD( 数论 )
对于d, 记{ai}中是d的倍数的数的个数为c, 那么有: 直接计算即可,复杂度O(NlogN+MlogM) --------------------------------------------- ...
Python 第三篇(上)：python文件基础操作、json模块、lambda、map、filter、reduce和函数位置参数
python一切皆对象,linux一切皆文件,python操作文件是很常见的O/I操作,其内置来open()函数可以完成文件的基本操作: 一:使用内置open()函数操作文件,基本语法如下: with ...
[LeetCode]题解：005-Longest Palindromic Substring优化
题目来源和题意分析: 详情请看我的博客:http://www.cnblogs.com/chruny/p/4791078.html 题目思路: 我上一篇博客解决这个问题的时间复杂度是最坏情况是(O(n^ ...
设置MAVEN_OPTS的推荐方法
运行mvn eclipse:eclipse时,经常会出现因为maven项目过大,导致内存不足java栈溢出的error,需要更改MAVEN启动内存 http://stackoverflow.com/q ...

基础算法-查找：线性索引查找（II）

基础算法-查找：线性索引查找（II）的更多相关文章

随机推荐

热门专题