最近没事做了一个数据库project,要求实现一个简单的数据库,能满足几个特定的查询,这里主要介绍一下我们的实现过程,代码放在过ithub,可参看这里.都说python的运行速度很慢,但因为时间比较急,工作量大,我们还是选择了高效实现的python. 一.基本要求 1.设计存储方式 测试的数据量大小为1.5GB,最大的表有6,001,215条记录.最大限度减少I/O次数,减少磁盘占有空间. 2.实现和优化group by,order by 对大表进行group by 聚集.排序,提高查询效率 3