list dict 性能测试

from random import randint

def load_list_data(total_nums, target_nums):

    """

    从文件中读取数据，以list的方式返回

    :param total_nums: 读取的数量

    :param target_nums: 需要查询的数据的数量

    """

    all_data = []

    target_data = []

    file_name = "fbobject_idnew.txt"

    with open(file_name, encoding="utf8", mode="r") as f_open:

        for count, line in enumerate(f_open):

            if count < total_nums:

                all_data.append(line)

            else:

                break

    for x in range(target_nums):

        random_index = randint(0, total_nums)

        if all_data[random_index] not in target_data:

            target_data.append(all_data[random_index])

            if len(target_data) == target_nums:

                break

    return all_data, target_data

def load_dict_data(total_nums, target_nums):

    """

    从文件中读取数据，以dict的方式返回

    :param total_nums: 读取的数量

    :param target_nums: 需要查询的数据的数量

    """

    all_data = {}

    target_data = []

    file_name = "fbobject_idnew.txt"

    with open(file_name, encoding="utf8", mode="r") as f_open:

        for count, line in enumerate(f_open):

            if count < total_nums:

                all_data[line] = 0

            else:

                break

    all_data_list = list(all_data)

    for x in range(target_nums):

        random_index = randint(0, total_nums-1)

        if all_data_list[random_index] not in target_data:

            target_data.append(all_data_list[random_index])

            if len(target_data) == target_nums:

                break

    return all_data, target_data

def find_test(all_data, target_data):

    #测试运行时间

    test_times = 100

    total_times = 0

    import time

    for i in range(test_times):

        find = 0

        start_time = time.time()

        for data in target_data:

            if data in all_data:

                find += 1

        last_time = time.time() - start_time

        total_times += last_time

    return total_times/test_times

if __name__ == "__main__":

    # all_data, target_data = load_list_data(10000, 1000)

    # all_data, target_data = load_list_data(100000, 1000)

    # all_data, target_data = load_list_data(1000000, 1000)

    # all_data, target_data = load_dict_data(10000, 1000)

    # all_data, target_data = load_dict_data(100000, 1000)

    # all_data, target_data = load_dict_data(1000000, 1000)

    all_data, target_data = load_dict_data(2000000, 1000)

    last_time = find_test(all_data, target_data)

    #dict查找的性能远远大于list

    #在list中随着list数据的增大 查找时间会增大

    #在dict中查找元素不会随着dict的增大而增大

    print(last_time)

不可变对象 都是可hash的， str， fronzenset， tuple，自己实现的类 __hash__

dict的内存花销大，但是查询速度快， 自定义的对象 或者python内部的对象都是用dict包装的

查找效率：set>dict>list

单次查询中：看来list 就是O(n)的；而set做了去重，本质应该一颗红黑树（猜测，STL就是红黑树），复杂度O(logn)；dict类似对key进行了hash,然后再对hash生成一个红黑树进行查找，其查找复杂其实是O(logn),并不是所谓的O(1)。O(1)只是理想的实现，实际上很多hash的实现是进行了离散化的。dict比set多了一步hash的过程，so 它比set慢，不过差别不大。

list dict 性能测试的更多相关文章

Locust性能测试学习总结
Locust学习总结分享简介: Locust是一个用于可扩展的,分布式的,性能测试的,开源的,用Python编写框架/工具,它非常容易使用,也非常好学.它的主要思想就是模拟一群用户将访问你的网站.每 ...
数据库之redis篇（2）—— redis配置文件，常用命令，性能测试工具
redis配置如果你是找网上的其他教程来完成以上操作的话,相信你见过有的启动命令是这样的: 启动命令带了这个参数:redis.windows.conf,由于我测试环境是windows平台,所以是这个 ...
性能测试URL自动转码
最近做性能测试,写了个python程序自动将URL里面的‘%2B’,‘20%’,‘3B'等转换成正常字符,方便查看. import os,sys; path = sys.path[0] os.chdi ...
Locust 性能测试工具安装使用说明
1. 介绍它是一个开源性能测试工具.使用 Python 代码来定义用户行为.用它可以模拟百万计的并发用户访问你的系统. 性能工具对比 LoadRunner 是非常有名的商业性能测试工具,功能 ...
【Python】模块学习之locust性能测试
背景 locust是一个python的第三方库,用于做性能测试,可使用多台机器同时对一台服务器进行压测,使用其中一台机器作为主节点,进行分布式管理博主测试接口的时候一直是使用python脚本,后来有 ...
[性能测试] locust学习-基础篇
在本文中,我将介绍一个名为Locust的性能测试工具.我将从Locust的功能特性出发,结合实例对Locust的使用方法进行介绍. 概述 Locust主要有以下的功能特性: 在Locust测试框架中, ...
Ignite性能测试以及对redis的对比
测试方法为了对Ignite做一个基本了解,做了一个性能测试,测试方法也比较简单主要是针对client模式,因为这种方法和使用redis的方式特别像.测试方法很简单主要是下面几点: 不作参数优化,默认 ...
性能测试工具 wrk 安装与使用
介绍今天给大家介绍一款开源的性能测试工具 wrk,简单易用,没有Load Runner那么复杂,他和 apache benchmark(ab)同属于性能测试工具,但是比 ab 功能更加强大,并且可以 ...
.NET Core性能测试组件BenchmarkDotNet 支持.NET Framework Mono
.NET Core 超强性能测试组件BenchmarkDotNet 支持Full .NET Framework, .NET Core (RTM), Mono. BenchmarkDotNet支持 C# ...

随机推荐

PostgreSql的使用
title: PostgreSql的使用 tags: PostgreSql --- PostgreSql官网: https://www.postgresql.org/ 1 PostgreSql的安装 ...
AngularJs学习笔记-服务
服务 (1)在模块中声明的服务对所有组件可见 (2)在组件中声明的服务对自己本身和其子组件 (3)在组件中声明的服务会覆盖在模块中声明的服务 (4)通过@Injectable()装饰器可以在服务中注入 ...
common-fileupload组件实现java文件上传和下载
简介:文件上传和下载是java web中常见的操作,文件上传主要是将文件通过IO流传放到服务器的某一个特定的文件夹下,而文件下载则是与文件上传相反,将文件从服务器的特定的文件夹下的文件通过IO流下载到 ...
mysql添加、移除服务
sc delete 服务名路径/bin/mysqld --install 服务名
【思维题最大权闭合子图】loj#6045. 「雅礼集训 2017 Day8」价
又是经典模型的好题目题目描述人类智慧之神 zhangzj 最近有点胖,所以要减肥,他买了 NN 种减肥药,发现每种减肥药使用了若干种药材,总共正好有 NN 种不同的药材. 经过他的人脑实验,他发现 ...
linux下mysql的权限设计总结
1,进入mysql,终端中输入 mysql -u 用户名 -p .enter键后,提示输入密码. 2,执行grant all privileges on xxxdb.* to usertest@& ...
基于django的个人博客网站建立（三）
基于django的个人博客网站建立(三) 前言网站效果可点击这里访问今天主要完成的是文章在页面的显示以及评论,留言具体内容首先我希望主页面是显示我的所有文章,于是在主页面的视图函数中返回了所有 ...
python3 练习题100例（十五）
这个比较难,主要难在考虑的问题太多,有好几个还没写出来.有空再来改进.请高手指教! #!/usr/bin/env python3 # -*- coding: utf-8 -*- __author__ ...
Scrapy用pipelines把字典保存为csv格式
import csv class MyProjectPipeline(object): # 保存为csv格式 def __init__(self): # 打开文件,指定方式为写,利用第3个参数把csv ...
721. Accounts Merge
https://leetcode.com/problems/accounts-merge/description/ class UnionFound { public: unordered_map&l ...

list dict 性能测试

list dict 性能测试的更多相关文章

随机推荐

热门专题