在科学技术和机器学习等其他算法相关任务中,我们经常需要用到随机数,为了把握随机数的生成特性,从随机数的随机无序中获得确定和秩序。我们可以利用随机数种子(random seed)来实现这一目标,随机数种子,可以使得引入了随机数的整个程序,在多次运行中得到确定的,一致的结果。

很多博文谈到随机数种子,只是简单论及,利用随机数种子,可以每次生成相同的随机数。想真正用好掌握它,对此很容易产生疑惑,生成相同的随机数数怎么个相同法?随机数种子又作何用处?

1. 随机数种子

下面我们从实例中揭开随机数种子的神秘面纱:

import random

# print(help(random))

def test_random_seed_in_std_lib(seed=0, cnt=3):
random.seed(seed)
print("test seed: ", seed)
for _ in range(cnt):
print(random.random())
print(random.randint(0,100))
print(random.uniform(1, 10))
print('\n')
test_random_seed_in_std_lib()
test seed:  0
0.8444218515250481
97
9.01219528753418 0.04048437818077755
65
5.373349269065314 0.9182343317851318
38
9.710199954281542
test_random_seed_in_std_lib()
test seed:  0
0.8444218515250481
97
9.01219528753418 0.04048437818077755
65
5.373349269065314 0.9182343317851318
38
9.710199954281542
test_random_seed_in_std_lib(99)
test seed:  99
0.40397807494366633
25
6.39495190686897 0.23026272839629136
17
7.8388969285727015 0.2511510083752201
49
5.777313434770537

通过两次运行以上程序,我们得到相同的结果,这说明了以下几点:

  1. 在确定了一次随机数种子后,随机数函数,无论任何分布任何类型,在多次重复调用中(for循环)生成的随机数不同;
  2. 当再次声明相同的随机数种子时(第二次调用test_random_seed_in_std_lib函数,random.seed(seed)这一行),随机数将从“头”开始, 按相同的顺序生成随机数。这里的“头”,即是random.seed(seed)声明后,随机数函数的首次调用;
  3. 若指定不同的随机数种子(seed=99),无论任何随机数函数,生成的随机数将不同于,之前的(随机数种子为0)的运行结果。

上面的几点解释了随机数种子可以使得每次生成相同随机数的具体含义。这里的相同,其实还有一种更普遍的内涵,即环境独立和跨平台。上面的实验,在任何电脑或主机,运行以上代码,可以复现完全一致的结果。

以上几点囊括了随机数种子的基本特性,下面我们来对numpy中的随机数种子作进一步的拓展研究。

2. numpy中的随机数种子

import numpy as np
def test_numpy_random_seed(seed=0, cnt=3):
np.random.seed(seed)
print("test numpy seed: ", seed)
for _ in range(cnt):
print(np.random.random())
print(np.random.randn(1, 5))
print(np.random.uniform(1, 10, 5))
print('\n')

多次运行以上的test_numpy_random_seed函数,你可以观察到与使用random模块时相似的情形,进一步验证了我们总结的关于随机数种子的特性。

此外,我们可以对多维随机数组做一些有益的探索:

def test_mult_shape(seed=0):
np.random.seed(seed)
print(np.random.randn(1, 3))
print(np.random.randn(1, 2)) np.random.seed(seed)
print(np.random.randn(2, 5))
test_mult_shape()
[[1.76405235 0.40015721 0.97873798]]
[[2.2408932 1.86755799]]
[[ 1.76405235 0.40015721 0.97873798 2.2408932 1.86755799]
[-0.97727788 0.95008842 -0.15135721 -0.10321885 0.4105985 ]]

运行test_mult_shape函数,我们发现,设定相同的随机数组,两次运行两个一行的多维正态分布的结果,与一次运行两行的多维正态分布的结果的第一行完全相同。

这个结果,说明了对相同类型的随机数分布,形状特征不会影响分布的生成秩序,程序中,np.random.randn(1, 2),这一行不像是第二次运行多维正态分布的随机数组,它"几乎"是后缀于它的前一行一次性生成的。

3. 随机数“顺序”的奥秘

至此,我们对随机数生成顺序有了初步印象,但是这里的顺序,其实比我们的朴素观察更复杂,我们来进一步考察这一点。

def test_numpy_random_seed_order(seed=0):
np.random.seed(seed)
print(np.random.random())
# print(np.random.randint(1, 10))
print(np.random.randn(1, 5)) np.random.seed(seed)
print(np.random.randn(2, 5))
test_numpy_random_seed_order()
0.5488135039273248
[[ 0.74159174 1.55291372 -2.2683282 1.33354538 -0.84272405]]
[[ 1.76405235 0.40015721 0.97873798 2.2408932 1.86755799]
[-0.97727788 0.95008842 -0.15135721 -0.10321885 0.4105985 ]]

运行以上程序,我们看到,设定了相同的随机数种子,np.random.randn(1, 5)看起来是第一次运行多维正态分布数组,实际上并不是,np.random.randn(2, 5)才是真正的第一次运行多维正态分布随机数组。

这说明,前面的np.random.random()对np.random.randn产生了干扰,使得这次正态分布的随机数组中的任何一个数,都不在np.random.randn(2, 5)中,这样它显示了一种不可把握的随机性。

我们可以把这一点考察得更加深入一点:

def test_numpy_random_seed_order_further(seed=0, randint_high=10):
np.random.seed(seed)
print(np.random.randint(1, randint_high))
print(np.random.randn(1, 5)) np.random.seed(seed)
print(np.random.randn(2, 5))
test_numpy_random_seed_order_further()
6
[[ 0.11849646 0.11396779 0.37025538 1.04053075 -1.51698273]]
[[ 1.76405235 0.40015721 0.97873798 2.2408932 1.86755799]
[-0.97727788 0.95008842 -0.15135721 -0.10321885 0.4105985 ]]
test_numpy_random_seed_order_further(randint_high=5)
1
[[ 1.12279492 0.30280522 0.07085926 0.07304142 -1.42232584]]
[[ 1.76405235 0.40015721 0.97873798 2.2408932 1.86755799]
[-0.97727788 0.95008842 -0.15135721 -0.10321885 0.4105985 ]]

紧接上面对随机数干扰项对考察,我们看到,这次我们改变了干扰项随机数生成器,np.random.randn(1, 5)的生成结果不同于test_numpy_random_seed_order中同一行的运行结果。

另外,两次设置不同的randint的右边界,np.random.randn(1, 5)生成的结果也全然不同,这说明了np.random.randint设置不同的参数,即是全然不同的随机数发生器。这一点,也不难在其他类型的随机数分布中得到验证。

随机数种子(random seed)的更多相关文章

  1. 随机数种子random.seed()理解

    总结: 若采用random.random(),每次都按照一定的序列(默认的某一个参数)生成不同的随机数. 若采用随机数种子random.seed(100),它将在所设置的种子100范围内调用rando ...

  2. 怎么理解np.random.seed()?

    在使用numpy时,难免会用到随机数生成器.我一直对np.random.seed(),随机数种子搞不懂.很多博客也就粗略的说,利用随机数种子,每次生成的随机数相同. 我有两个疑惑:1, 利用随机数种子 ...

  3. datetime函数和random.seed()函数的应用

    一,datetime 在python中datetime是一个库是一个模块也是一个函数,作用很多,这里面只对其做简单的最常用的讲解. 首先返回系统时间 import datetime nowTime=d ...

  4. 改变random.seed()种子值,获取不同的随机值

    random.seed() random.seed()是随机数种子,也就是为随机数提供算法,完全相同的种子产生的随机数列是相同的, 所以如果想产生不同的随机数就需要用当前时间作为种子 一般情况下see ...

  5. numpy中np.random.seed()的详细用法

    在进行机器学习和深度学习中,我们会经常用到np.random.seed(),利用随机数种子,使得每次生成的随机数相同. numpy.randn.randn(d0,d1,...,dn) randn函数根 ...

  6. nu.random.seed()如何理解

    结论: np.random.seed(a) # 按照规定的顺序生成随机数 # 参数a指定了随机数生成的起始位置: # 如果两处都采用了np.random.seed(a),且两处的参数a相同,则生成的随 ...

  7. random seed()函数

    用seed()生成随机数字,生成的法则与seed内部的数字相关,如果数字相同,则生成的随机数是相同的. 刷题宝上面的题目: >>> import random >>> ...

  8. numpy.random.seed()方法

    先贴参考链接: https://stackoverflow.com/questions/21494489/what-does-numpy-random-seed0-do numpy.random.se ...

  9. np.random.seed()

    124.np.random.seed()的作用 陈容喜 关注 2018.01.11 21:36 字数 3 阅读 4460评论 0喜欢 6 今天看到一段代码时遇到了np.random.seed(),搞不 ...

随机推荐

  1. runtime系统的Cello

    runtime系统的Cello 通过充当一个现代的.功能强大的runtime系统,Cello使许多以前在C中不切实际或笨拙的事情变得简单,例如: 通用数据结构 多态函数 接口/类型类 构造函数/析构函 ...

  2. 【Android编程】Java利用apktool编写Metasploit恶意后门注入工具

    /声明:本文作者Kali_MG1937 csdn博客id:ALDYS4 QQ:3496925334 未经许可禁止转载!/ 注意,本文为作者从CSDN搬迁至此的文章 注意!此文章虽然 未被 作者标记到 ...

  3. 12:media配置以及后端指定资源暴露

    django需要用到的静态文件默认都是放在static目录下 而针对后期用户上传的静态文件也应该统一存储 # media配置:规定用户上传的静态文件存储位置 MEDIA_ROOT = os.path. ...

  4. js 统计图插件chart.js

    chart是一个纯js插件,它功能强大小巧使用也很简单. 第一步引入 chart.js . <script type="text/javascript" src=" ...

  5. noip2008 总结

    noip 2008题解 笨小猴 原题 笨小猴的词汇量很小,所以每次做英语选择题的时候都很头疼.但是他找到了一种方法,经试验证明,用这种方法去选择选项的时候选对的几率非常大!这种方法的具体描述如下:假设 ...

  6. 【源码分析】- 在SpringBoot中你会使用REST风格处理请求吗?

    ​ 目录 前言 1.什么是 REST 风格 1.1  资源(Resources) 1.2  表现层(Representation) 1.3  状态转化(State Transfer) 1.4  综述 ...

  7. python基本函数增删改排序,用range()求和

    a=["blue","red","brack"] print(len(a))#列表长度 a.append("yellow" ...

  8. 什么是WAF?

    1.什么是Web Application Firewall(WAF)? WAF或Web Application Firewall通过过滤和监控Web应用程序与Internet之间的HTTP流量来帮助保 ...

  9. 基于 Electron 实现 uTools 的超级面板

    前言 为了进一步提高开发工作效率,最近我们基于 electron 开发了一款媲美 uTools 的开源工具箱 rubick.该工具箱不仅仅开源,最重要的是可以使用 uTools 生态内所有开源插件!这 ...

  10. 14.6、mysql半同步插件的使用

    1.半同步介绍: (1)从MySQL5.5开始,MySQL以插件的形式支持半同步复制.如何理解半同步呢?首先我们来看看异步,全同步的概念: 1)异步复制(Asynchronous replicatio ...