作者:代码律动
链接:https://zhuanlan.zhihu.com/p/36303821
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

挑战 1:引入 numpy 并查看 numpy 的版本。

要求:这是第一步,以后我们使用 numpy 时都将用别名 np。

  1. # 答案
  2. import numpy as np
  3. print(np.__version__)
  4. #> 1.13.3

挑战 2:创建数组

要求:创建一维数组,内容为从 0 到 9。

  1. # 输入数组
  2. arr = np.arange(10)

挑战 3:创建布尔数组

要求:数组大小为 3*3,全部为 True。

  1. # 答案一:
  2. np.full((3, 3), True, dtype=bool)
  3. # 答案二:
  4. np.ones((3,3), dtype=bool)

挑战 4:按要求抽取数组中的元素

要求:原数组为一维数组,内容为从 0 到 9,抽取出所有奇数。

  1. # 输入数组
  2. arr = np.array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
  3. # 答案
  4. arr[arr % 2 == 1]
  5. #> array([1, 3, 5, 7, 9])

挑战 5:按要求修改数组中的元素(原地修改)

要求:原数组为一维数组,内容为从 0 到 9,将所有奇数原地修改为 -1。

  1. # 输入数组
  2. arr = np.array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
  3. # 答案
  4. arr[arr % 2 == 1] = -1
  5. #> array([ 0, -1, 2, -1, 4, -1, 6, -1, 8, -1])

挑战 6:按要求修改数组中的元素(返回新数组)

要求:原数组为一维数组,内容为从 0 到 9,返回一个该数组的拷贝,其中奇数修改为 -1。

  1. # 输入数组
  2. arr = np.arange(10)
  3. # 答案
  4. out = np.where(arr % 2 == 1, -1, arr)
  5. #> array([ 0, -1, 2, -1, 4, -1, 6, -1, 8, -1])

挑战 7:修改数组的形状

要求:将给定的一维数组 reshape 为二维数组,其中新数组的行数为2。

  1. # 输入数组
  2. arr = np.arange(10)
  3. # 答案
  4. arr.reshape(2, -1) # -1 表示自动计算该维度的大小
  5. #> array([[0, 1, 2, 3, 4], [5, 6, 7, 8, 9]])

挑战 8:合并数组(列方向)

要求:将给定数组在列方向上合并。

  1. # 输入数组
  2. a = np.arange(10).reshape(2,-1) b = np.repeat(1, 10).reshape(2,-1)
  3. # 答案 1:
  4. np.concatenate([a, b], axis=0)
  5. # 答案 2:
  6. np.vstack([a, b])
  7. # 答案 3:
  8. np.r_[a, b]
  9. #> array([[0, 1, 2, 3, 4],
  10. #> [5, 6, 7, 8, 9],
  11. #> [1, 1, 1, 1, 1],
  12. #> [1, 1, 1, 1, 1]])

挑战 9:合并数组(水平方向)

要求:将给定数组在水平方向上合并。

  1. # 输入数组
  2. a = np.arange(10).reshape(2,-1)
  3. b = np.repeat(1, 10).reshape(2,-1)
  4. # 答案 1:
  5. np.concatenate([a, b], axis=1)
  6. # 答案 2:
  7. np.hstack([a, b])
  8. # 答案 3:
  9. np.c_[a, b]
  10. #> array([[0, 1, 2, 3, 4, 1, 1, 1, 1, 1],
  11. #> [5, 6, 7, 8, 9, 1, 1, 1, 1, 1]])

挑战 10:创建数组(进阶)

要求:不用硬编码,使用内置方法,从给定数组 a 生成数组 b。

  1. # 输入数组
  2. a = np.array([1,2,3])
  3. b = np.array([1, 1, 1, 2, 2, 2, 3, 3, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3])
  4. # 答案
  5. np.r_[np.repeat(a, 3), np.tile(a, 3)]

挑战 11:返回公共元素

要求:给定两个数组,要求返回这两个数组元素的交集。

  1. # 输入数组
  2. a = np.array([1,2,3,2,3,4,3,4,5,6])
  3. b = np.array([7,2,10,2,7,4,9,4,9,8])
  4. # 答案:
  5. np.intersect1d(a,b)
  6. #> array([2, 4])

挑战 12:删除元素

要求:给定两个数组 a、b,从数组 a 中删除 b 中出现的元素。

  1. # 输入数组
  2. a = np.array([1,2,3,4,5])
  3. b = np.array([5,6,7,8,9])
  4. # 答案
  5. np.setdiff1d(a,b)
  6. #> array([1, 2, 3, 4])

挑战 13:找出相同元素

要求:给定两个数组 a、b,返回两数组中相同元素的下标。

  1. # 输入数
  2. a = np.array([1,2,3,2,3,4,3,4,5,6])
  3. b = np.array([7,2,10,2,7,4,9,4,9,8])
  4. # 答案:
  5. np.where(a == b)
  6. #> (array([1, 3, 5, 7]),)

挑战 14:按要求取出元素

要求:从数组中取出大于等于 5 且小于等于 10 的元素。

  1. # 输入数组
  2. a = np.arange(15)
  3. # 答案 1:
  4. index = np.where((a >= 5) & (a <= 10))
  5. a[index]
  6. # 答案 2:
  7. index = np.where(np.logical_and(a>=5, a<=10))
  8. a[index]
  9. # 答案 3:
  10. a[(a >= 5) & (a <= 10)]
  11. #> (array([6, 9, 10]),)

挑战 15:实现 max 的 numpy 版

要求:给定长度相同的数组 a、b,返回一个新数组,数组上的每一个元素为 max(a_i, b_i)。

若 pair_max 为满足要求的函数,则对于 a 和 b,期望输出如下:

  1. # 输入数组
  2. a = np.array([5, 7, 9, 8, 6, 4, 5])
  3. b = np.array([6, 3, 4, 8, 9, 7, 1])
  4. pair_max(a, b)
  5. #> 期望输出:array([ 6., 7., 9., 8., 9., 7., 5.])
  6. # 答案:
  7. def maxx(x, y):
  8. """Get the maximum of two items"""
  9. if x >= y:
  10. return x
  11. else:
  12. return y
  13. pair_max = np.vectorize(maxx, otypes=[float])
  14. a = np.array([5, 7, 9, 8, 6, 4, 5])
  15. b = np.array([6, 3, 4, 8, 9, 7, 1])
  16. pair_max(a, b)

挑战 16:交换二维数组的列

要求:交换数组的第一第二列。

  1. # 输入数组
  2. arr = np.arange(9).reshape(3,3)
  3. # 答案:
  4. arr[:, [1,0,2]]
  5. #> array([[1, 0, 2],
  6. #> [4, 3, 5],
  7. #> [7, 6, 8]])

挑战 17:交换二维数组的行

要求:交换二维数组的第一第二行。

  1. # 输入数组
  2. arr = np.arange(9).reshape(3,3)
  3. # 答案
  4. arr[[1,0,2], :]
  5. #> array([[3, 4, 5],
  6. #> [0, 1, 2],
  7. #> [6, 7, 8]])

挑战 18:将一个数组按行反序

要求:数组 arr 为二维数组,将其行反序。

  1. # 输入数组
  2. arr = np.arange(9).reshape(3,3)
  3. # 答案:
  4. arr[::-1]

挑战 19:将一个数组按列反序

要求:数组 arr 为二维数组,将其列反序。

  1. # 输入数组
  2. arr = np.arange(9).reshape(3,3)
  3. # 答案:
  4. arr[:, ::-1]

挑战 20:创建随机数组

要求:创建一个 5*3 的数组,数组元素为 5 到 10 的随机浮点数。

  1. # 答案 1:
  2. rand_arr = np.random.randint(low=5, high=10, size=(5,3)) + np.random.random((5,3))
  3. # print(rand_arr)
  4. # 答案 2:
  5. rand_arr = np.random.uniform(5,10, size=(5,3))
  6. print(rand_arr)
  7. #> [[ 8.50061025 9.10531502 6.85867783]
  8. #> [ 9.76262069 9.87717411 7.13466701]
  9. #> [ 7.48966403 8.33409158 6.16808631]
  10. #> [ 7.75010551 9.94535696 5.27373226]
  11. #> [ 8.0850361 5.56165518 7.31244004]]

挑战 21:按要求打印数组(一)

要求:数组元素输出时保留 3 位小数。

  1. # 输入数组
  2. rand_arr = np.random.random([5,3])
  3. # 答案:
  4. # 设置保留 3 位小数
  5. np.set_printoptions(precision=3)
  6. rand_arr[:4]
  7. #> array([[ 0.443, 0.109, 0.97 ],
  8. #> [ 0.388, 0.447, 0.191],
  9. #> [ 0.891, 0.474, 0.212],
  10. #> [ 0.609, 0.518, 0.403]])

挑战 22:按要求打印数组(二)

要求:数组为小数,使用小数点的形式来打印,而不是科学记数法(如1e-4)。

  1. # 输入数组
  2. np.random.seed(100)
  3. rand_arr = np.random.random([3,3])/1e3
  4. rand_arr
  5. #> array([[ 5.434049e-04, 2.783694e-04, 4.245176e-04],
  6. #> [ 8.447761e-04, 4.718856e-06, 1.215691e-04],
  7. #> [ 6.707491e-04, 8.258528e-04, 1.367066e-04]])
  8. # 答案:
  9. np.set_printoptions(suppress=True, precision=6) # precision 是可选项
  10. rand_arr
  11. #> array([[ 0.000543, 0.000278, 0.000425],
  12. #> [ 0.000845, 0.000005, 0.000122],
  13. #> [ 0.000671, 0.000826, 0.000137]])

挑战 23:按要求打印数组(三)

要求:打印时省略中间元素,限制显示数组元素的个数为 6。

  1. # 输入数组
  2. a = np.arange(15)
  3. #> 原输出 :[ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14]
  4. #> 目标输出:[ 0 1 2 ..., 12 13 14] array([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14])
  5. # 答案:
  6. np.set_printoptions(threshold=6)
  7. a
  8. #> array([ 0, 1, 2, ..., 12, 13, 14])

挑战 24:加载特殊矩阵

要求:著名的 iris 数据集是包含兰花属性和种类的数据集,其中每行属性有数字和文字,用 numpy 来加载他们。

  1. # 答案
  2. url = 'https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data'
  3. iris = np.genfromtxt(url, delimiter=',', dtype='object')
  4. names = ('sepallength', 'sepalwidth', 'petallength', 'petalwidth', 'species')
  5. # 输出前三行
  6. iris[:3]
  7. #> array([[b'5.1', b'3.5', b'1.4', b'0.2', b'Iris-setosa'],
  8. #> [b'4.9', b'3.0', b'1.4', b'0.2', b'Iris-setosa'],
  9. #> [b'4.7', b'3.2', b'1.3', b'0.2', b'Iris-setosa']], dtype=object)

挑战 25:重定义数组的元素范围

要求:将 iris 数组集的第一个列的数据范围缩放为 0 到 1。

  1. # Input url = 'https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data'
  2. sepallength = np.genfromtxt(url, delimiter=',', dtype='float', usecols=[0])
  3. # 答案
  4. Smax, Smin = sepallength.max(), sepallength.min()
  5. S = (sepallength - Smin)/(Smax - Smin)
  6. # or
  7. S = (sepallength - Smin)/sepallength.ptp()
  8. print(S)
  9. #> [ 0.222 0.167 0.111 0.083 0.194 0.306 0.083 0.194 0.028 0.167
  10. #> 0.306 0.139 0.139 0. 0.417 0.389 0.306 0.222 0.389 0.222
  11. #> 0.306 0.222 0.083 0.222 0.139 0.194 0.194 0.25 0.25 0.111
  12. #> 0.139 0.306 0.25 0.333 0.167 0.194 0.333 0.167 0.028 0.222
  13. #> 0.194 0.056 0.028 0.194 0.222 0.139 0.222 0.083 0.278 0.194
  14. #> 0.75 0.583 0.722 0.333 0.611 0.389 0.556 0.167 0.639 0.25
  15. #> 0.194 0.444 0.472 0.5 0.361 0.667 0.361 0.417 0.528 0.361
  16. #> 0.444 0.5 0.556 0.5 0.583 0.639 0.694 0.667 0.472 0.389
  17. #> 0.333 0.333 0.417 0.472 0.306 0.472 0.667 0.556 0.361 0.333
  18. #> 0.333 0.5 0.417 0.194 0.361 0.389 0.389 0.528 0.222 0.389
  19. #> 0.556 0.417 0.778 0.556 0.611 0.917 0.167 0.833 0.667 0.806
  20. #> 0.611 0.583 0.694 0.389 0.417 0.583 0.611 0.944 0.944 0.472
  21. #> 0.722 0.361 0.944 0.556 0.667 0.806 0.528 0.5 0.583 0.806
  22. #> 0.861 1. 0.583 0.556 0.5 0.944 0.556 0.583 0.472 0.722
  23. #> 0.667 0.722 0.417 0.694 0.667 0.667 0.556 0.611 0.528 0.444]

挑战 26:根据百分比大小返回元素

要求:返回数组中按从小到大排序,位置为 5% 和 95% 的数。

  1. # 输入数组
  2. url = 'https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data'
  3. sepallength = np.genfromtxt(url, delimiter=',', dtype='float', usecols=[0])
  4. # 答案:
  5. np.percentile(sepallength, q=[5, 95])
  6. #> array([ 4.6 , 7.255])

挑战 27:找出数组的缺失值

要求:数组中有多处缺失值(答案nan),找出他们的位置。

  1. # 输入数组
  2. url = 'https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data'
  3. iris_2d = np.genfromtxt(url, delimiter=',', dtype='float', usecols=[0,1,2,3]) iris_2d[np.random.randint(150, size=20), np.random.randint(4, size=20)] = np.nan
  4. # 答案:
  5. print("Number of missing values: \n", np.isnan(iris_2d[:, 0]).sum())
  6. print("Position of missing values: \n", np.where(np.isnan(iris_2d[:, 0])))
  7. #> Number of missing values:
  8. #> 5
  9. #> Position of missing values:
  10. #> (array([ 39, 88, 99, 130, 147]),)

挑战 28:数组缺失值判断

要求:返回数组是否具有缺失值。

  1. # 输入数组
  2. url = 'https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data'
  3. iris_2d = np.genfromtxt(url, delimiter=',', dtype='float', usecols=[0,1,2,3])
  4. iris_2d[np.random.randint(150, size=20), np.random.randint(4, size=20)] = np.nan
  5. # 答案:
  6. np.isnan(iris_2d).any()
  7. #> False

挑战 29:数组缺失值处理

要求:替换数组中的缺失值为0。

  1. # 输入数组
  2. url = 'https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data'
  3. iris_2d = np.genfromtxt(url, delimiter=',', dtype='float', usecols=[0,1,2,3])
  4. iris_2d[np.random.randint(150, size=20), np.random.randint(4, size=20)] = np.nan
  5. # 答案
  6. iris_2d[np.isnan(iris_2d)] = 0
  7. iris_2d[:4]
  8. #> array([[ 5.1, 3.5, 1.4, 0. ],
  9. #> [ 4.9, 3. , 1.4, 0.2],
  10. #> [ 4.7, 3.2, 1.3, 0.2],
  11. #> [ 4.6, 3.1, 1.5, 0.2]])

挑战 30:数组的 unique 元素

要求:返回数组中出现的所有元素集合

  1. # 输入数组
  2. url = 'https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data'
  3. iris = np.genfromtxt(url, delimiter=',', dtype='object')
  4. # 答案:
  5. species = np.array([row.tolist()[4] for row in iris])
  6. np.unique(species, return_counts=True)
  7. #> (array([b'Iris-setosa', b'Iris-versicolor', b'Iris-virginica'],
  8. #> dtype='|S15'), array([50, 50, 50]))

挑战 31:二维数组排序

要求:根据第一列排序二维数组

  1. # 输入数组
  2. url = 'https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data'
  3. iris = np.genfromtxt(url, delimiter=',', dtype='object')
  4. # 答案:
  5. print(iris[iris[:,0].argsort()][:5])
  6. #> [[b'4.3' b'3.0' b'1.1' b'0.1' b'Iris-setosa']
  7. #> [b'4.4' b'3.2' b'1.3' b'0.2' b'Iris-setosa']
  8. #> [b'4.4' b'3.0' b'1.3' b'0.2' b'Iris-setosa']
  9. #> [b'4.4' b'2.9' b'1.4' b'0.2' b'Iris-setosa']
  10. #> [b'4.5' b'2.3' b'1.3' b'0.3' b'Iris-setosa']

挑战 32:出现最频繁的元素

要求:返回数组中出现最多的元素。

  1. # 输入数组:
  2. url = 'https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data'
  3. iris = np.genfromtxt(url, delimiter=',', dtype='object')
  4. # 答案:
  5. vals, counts = np.unique(iris[:, 2], return_counts=True)
  6. print(vals[np.argmax(counts)])
  7. #> b'1.5'

挑战 33:找出数组中某元素满足第一次大于某数的下标

要求:在 iris 数据集中,返回第一个元素的下标,满足第4列属性大于1.0。

  1. # 输入数组:
  2. url = 'https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data'
  3. iris = np.genfromtxt(url, delimiter=',', dtype='object')
  4. # 答案:
  5. np.argwhere(iris[:, 3].astype(float) > 1.0)[0]
  6. #> 50

挑战 34:设定数组元素的上下限

要求:给定数组 a,将数组中大于 30 的数截断为 30,小于 10 的数截断为 10。

  1. # 输入数组
  2. np.set_printoptions(precision=2)
  3. np.random.seed(100)
  4. a = np.random.uniform(1,50, 20)
  5. # 答案 1:
  6. np.clip(a, a_min=10, a_max=30)
  7. # 答案 2:
  8. print(np.where(a < 10, 10, np.where(a > 30, 30, a)))
  9. #> [ 27.63 14.64 21.8 30. 10. 10. 30. 30. 10. 29.18 30.
  10. #> 11.25 10.08 10. 11.77 30. 30. 10. 30. 14.43]

挑战 35:去掉所有缺失值

要求:给定一维数组 a 包含缺失值,去掉他们。

  1. # 输入数组
  2. a = np.array([1,2,3,np.nan,5,6,7,np.nan])
  3. # 答案:
  4. a[~np.isnan(a)]
  5. #> array([ 1., 2., 3., 5., 6., 7.])

numpy 中不常用的一些方法的更多相关文章

  1. JavaScript中Number常用属性和方法

    title: JavaScript中Number常用属性和方法 toc: false date: 2018-10-13 12:31:42 Number.MAX_VALUE--1.79769313486 ...

  2. (数据科学学习手札131)pandas中的常用字符串处理方法总结

    本文示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介 在日常开展数据分析的过程中,我们经常需要对 ...

  3. Python中最常用的字符串方法!

    字符串是字符序列.Python中内置的string类代表基于Unicode国际字符集的字符串.除了Python中常见的操作外,字符串还有一些专属于它们的附加方法.下图显示了所有这些可用的方法: Pyt ...

  4. numpy 中 shape_base提供的tile方法

    tile函数 来自于numpy.lib.shape_base 功能:重复某个数组. 比如说tile(A, n), 功能是将数组A重复n次,构成一个新的数组(行数只有1个) 比如说tile(A, n, ...

  5. oracle中的常用函数1-------decode方法

    DECODE函数是ORACLE PL/SQL是功能强大的函数之一,目前还只有ORACLE公司的SQL提供了此函数,其他数据库厂商的SQL实现还没有此功能.DECODE有什么用途呢? 先构造一个例子,假 ...

  6. iOS中UITextField常用设置和方法

    //初始化textField并设置位置及大小 UITextField *text = [[UITextField alloc]initWithFrame:CGRectMake(, , , )]; // ...

  7. numpy中一些常用函数的用法总结

    先简单记录一下,后续补充详细的例子   1. strip()函数 s.strip(rm):s为字符串,rm为要删除的字符序列 只能删除开头或是结尾的字符或者字符串.不能删除中间的字符或是字符串 当rm ...

  8. JS面向对象组件(三)--面向对象中的常用属性和方法

    图片的由来看下面: 1.hasOwnProperty:看是不是对象自身下面的属性 var arr = []; arr.num = ; Array.prototype.num2 = ; //所有的数组对 ...

  9. numpy函数库中一些常用函数的记录

    ##numpy函数库中一些常用函数的记录 最近才开始接触Python,python中为我们提供了大量的库,不太熟悉,因此在<机器学习实战>的学习中,对遇到的一些函数的用法进行记录. (1) ...

随机推荐

  1. IntelliJ IDEA全局内容搜索和替换

      在做项目时,有时会在整个项目里或指定文件夹下进行全局搜索和替换,这是一个很方便功能.使用方法如下: 一.全局搜索 1.使用快捷键Ctrl+Shift+F打开搜索窗口,或者通过点击Edit–> ...

  2. Eclipse 4.5.0 离线安装 Veloeclipse 插件

    下载 Veloeclipse 在 Eclipse eclipse-jee-mars-R-win32-x86_64 版本 4.5.0,Build id 为 20150621-1200,离线安装 Velo ...

  3. 最经典的常用拍照姿势大全,顶级POSE

    伸出手遮阳光.   捂住一只眼睛.   手放在最旁.这是一个极具诱惑的姿势 站立,背对镜头,扭过来,仰角拍, 俩手按在头两边,歪头,或者直头,表情一般都困惑,迷茫,咬下嘴唇效果更佳.         ...

  4. swift3 单例写法

    import UIKit class SingleOnce { // 单例 static let shared = SingleOnce.init() private init(){} // 其他方法 ...

  5. 【C#】详解C#异常

    目录结构: contents structure [+] 异常处理机制 try块 catch块 finally块 自定义异常 CLS异常和非CLS异常 在这篇文章中,笔者会阐述C#中的异常.C#是一门 ...

  6. ES 插入十万条数据耗时1573秒

  7. SNF快速开发平台MVC-审核流,审核完成后会给下一个审核人发邮件,下一个审核人可以不登录系统,在邮件里进行审核处理

    审核流设计和使用参考以下资料: 审核流设计 http://www.cnblogs.com/spring_wang/p/4874531.html 审核流实例 http://www.cnblogs.com ...

  8. python工具 - alert弹框输出姓名年龄、求和

    使用python自带的tkinter库进行GUI编程,完成两个功能: (1)要求用户输入姓名和年龄然后打印出来 (2)要求用户输入一个数字,然后计算1到该数字之间的和 代码部分: # 导入tkinte ...

  9. ORGANISING THE TEST CASES

    ORGANISING THE TEST CASES -Test note of “Essential Software Test Design” 2015-09-24 目录 22.1 Test Cas ...

  10. ios开发:一个音乐播放器的设计与实现

    github地址:https://github.com/wzpziyi1/MusicPlauer 这个Demo,关于歌曲播放的主要功能都实现了的.下一曲.上一曲,暂停,根据歌曲的播放进度动态滚动歌词, ...