基本运算
数组的算术运算是按元素逐个运算。数组运算后将创建包含运算结果的新数组。
1
2
3
4
5
6
7
8
9
10
11
12
13
|
>>> a = np.array([ 20 , 30 , 40 , 50 ]) >>> b = np.arange( 4 ) >>> b array([ 0 , 1 , 2 , 3 ]) >>> c = a - b >>> c array([ 20 , 29 , 38 , 47 ]) >>> b * * 2 array([ 0 , 1 , 4 , 9 ]) >>> 10 * np.sin(a) array([ 9.12945251 , - 9.88031624 , 7.4511316 , - 2.62374854 ]) >>> a< 35 array([ True , True , False , False ], dtype = bool ) |
与其他矩阵语言不同,NumPy中的乘法运算符*按元素逐个计算,矩阵乘法可以使用dot函数或创建矩阵对象实现(后续章节会介绍)
1
2
3
4
5
6
7
8
9
10
|
>>> A = np.array([[ 1 , 1 ], ...[ 0 , 1 ]]) >>> B = np.array([[ 2 , 0 ], ...[ 3 , 4 ]]) >>> A * B # 逐个元素相乘 array([[ 2 , 0 ], [ 0 , 4 ]]) >>> np.dot(A,B) # 矩阵相乘 array([[ 5 , 4 ], [ 3 , 4 ]]) |
有些操作符如+=和*=用来更改已存在数组而不创建一个新的数组。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
|
>>> a = np.ones(( 2 , 3 ), dtype = int ) >>> b = np.random.random(( 2 , 3 )) >>> a * = 3 >>> a array([[ 3 , 3 , 3 ], [ 3 , 3 , 3 ]]) >>> b + = a >>> b array([[ 3.69092703 , 3.8324276 , 3.0114541 ], [ 3.18679111 , 3.3039349 , 3.37600289 ]]) >>> a + = b # b转换为整数类型 >>> a array([[ 6 , 6 , 6 ], [ 6 , 6 , 6 ]]) |
当数组中存储的是不同类型的元素时,数组将使用占用更多位(bit)的数据类型作为其本身的数据类型,也就是偏向更精确的数据类型(这种行为叫做upcast)。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
|
>>> a = np.ones( 3 , dtype = np.int32) >>> b = np.linspace( 0 ,np.pi, 3 ) >>> b.dtype.name 'float64' >>> c = a + b >>> c array([ 1. , 2.57079633 , 4.14159265 ]) >>> c.dtype.name 'float64' >>> d = exp(c * 1j ) >>> d array([ 0.54030231 + 0.84147098j , - 0.84147098 + 0.54030231j , - 0.54030231 - 0.84147098j ]) >>> d.dtype.name 'complex128' |
许多非数组运算,如计算数组所有元素之和,都作为ndarray类的方法来实现,使用时需要用ndarray类的实例来调用这些方法。
1
2
3
4
5
6
7
8
9
10
|
>>> a = np.random.random(( 2 , 3 )) >>> a array([[ 0.65806048 , 0.58216761 , 0.59986935 ], [ 0.6004008 , 0.41965453 , 0.71487337 ]]) >>> a. sum () 3.5750261436902333 >>> a. min () 0.41965453489104032 >>> a. max () 0.71487337095581649 |
这些运算将数组看作是一维线性列表。但可通过指定axis参数(即数组的行)对指定的轴做相应的运算:
1
2
3
4
5
6
7
8
9
10
11
12
13
|
>>> b = np.arange( 12 ).reshape( 3 , 4 ) >>> b array([[ 0 , 1 , 2 , 3 ], [ 4 , 5 , 6 , 7 ], [ 8 , 9 , 10 , 11 ]]) >>> b. sum (axis = 0 ) # 计算每一列的和,注意理解轴的含义,参考数组的第一篇文章 array([ 12 , 15 , 18 , 21 ]) >>> b. min (axis = 1 ) # 获取每一行的最小值 array([ 0 , 4 , 8 ]) >>> b.cumsum(axis = 1 ) # 计算每一行的累积和 array([[ 0 , 1 , 3 , 6 ], [ 4 , 9 , 15 , 22 ], [ 8 , 17 , 27 , 38 ]]) |
索引,切片和迭代
和列表和其它Python序列一样,一维数组可以进行索引、切片和迭代操作。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
|
>>> a = np.arange( 10 ) * * 3 #记住,操作符是对数组中逐元素处理的! >>> a array([ 0 , 1 , 8 , 27 , 64 , 125 , 216 , 343 , 512 , 729 ]) >>> a[ 2 ] 8 >>> a[ 2 : 5 ] array([ 8 , 27 , 64 ]) >>> a[: 6 : 2 ] = - 1000 # 等同于a[0:6:2]= -1000,从开始到第6个位置,每隔一个元素将其赋值为-1000 >>> a array([ - 1000 , 1 , - 1000 , 27 , - 1000 , 125 , 216 , 343 , 512 , 729 ]) >>> a[: : - 1 ] # 反转a array([ 729 , 512 , 343 , 216 , 125 , - 1000 , 27 , - 1000 , 1 , - 1000 ]) >>> for i in a: ... print i * * ( 1 / 3. ), ... nan 1.0 nan 3.0 nan 5.0 6.0 7.0 8.0 9.0 |
多维数组可以每个轴有一个索引。这些索引由一个逗号分割的元组给出。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
|
>>> def f(x,y): ... return 10 * x + y ... >>> b = np.fromfunction(f,( 5 , 4 ),dtype = int ) #fromfunction是一个函数,下篇文章介绍。 >>> b array([[ 0 , 1 , 2 , 3 ], [ 10 , 11 , 12 , 13 ], [ 20 , 21 , 22 , 23 ], [ 30 , 31 , 32 , 33 ], [ 40 , 41 , 42 , 43 ]]) >>> b[ 2 , 3 ] 23 >>> b[ 0 : 5 , 1 ] # 每行的第二个元素 array([ 1 , 11 , 21 , 31 , 41 ]) >>> b[: , 1 ] # 与前面的效果相同 array([ 1 , 11 , 21 , 31 , 41 ]) >>> b[ 1 : 3 ,: ] # 每列的第二和第三个元素 array([[ 10 , 11 , 12 , 13 ], [ 20 , 21 , 22 , 23 ]]) |
当少于提供的索引数目少于轴数时,已给出的数值按秩的顺序复制,确失的索引则默认为是整个切片:
1
2
|
>>> b[ - 1 ] # 最后一行,等同于b[-1,:],-1是第一个轴,而缺失的认为是:,相当于整个切片。 array([ 40 , 41 , 42 , 43 ]) |
b[i]中括号中的表达式被当作i和一系列:,来代表剩下的轴。NumPy也允许你使用“点”像b[i,...]。
点(…)代表许多产生一个完整的索引元组必要的分号。如果x是秩为5的数组(即它有5个轴),那么:
- x[1,2,…] 等同于 x[1,2,:,:,:],
- x[…,3] 等同于 x[:,:,:,:,3]
- x[4,…,5,:] 等同 x[4,:,:,5,:]
1
2
3
4
5
6
7
8
9
10
11
12
13
|
>>> c = array( [ [[ 0 , 1 , 2 ], #三维数组(两个2维数组叠加而成) ...[ 10 , 12 , 13 ]], ... ...[[ 100 , 101 , 102 ], ...[ 110 , 112 , 113 ]]] ) >>> c.shape ( 2 , 2 , 3 ) >>> c[ 1 ,...] #等同于c[1,:,:]或c[1] array([[ 100 , 101 , 102 ], [ 110 , 112 , 113 ]]) >>> c[..., 2 ] #等同于c[:,:,2] array([[ 2 , 13 ], [ 102 , 113 ]]) |
多维数组的遍历是以是第一个轴为基础的:
1
2
3
4
5
6
7
8
|
>>> for row in b: ... print row ... [ 0 1 2 3 ] [ 10 11 12 13 ] [ 20 21 22 23 ] [ 30 31 32 33 ] [ 40 41 42 43 ] |
如果想对数组中每个元素都进行处理,可以使用flat属性,该属性是一个数组元素迭代器:
1
2
3
4
|
>>> for element in b.flat: ... print element, ... 0 1 2 3 10 11 12 13 20 21 22 23 30 31 32 33 40 41 42 43 |
更多关于[]、…、newaxis、ndenumerate、indices、index exp的内容请参考NumPy示例
形状(shape)操作
更改数组的形状
数组的形状取决于其每个轴上的元素个数:
1
2
3
4
5
6
7
|
>>> a = np.floor( 10 * np.random.random(( 3 , 4 ))) >>> a array([[ 7. , 5. , 9. , 3. ], [ 7. , 2. , 7. , 8. ], [ 6. , 8. , 3. , 2. ]]) >>> a.shape ( 3 , 4 ) |
可以用多种方式修改数组的形状:
1
2
3
4
5
6
|
>>> a.ravel() # 平坦化数组 array([ 7. , 5. , 9. , 3. , 7. , 2. , 7. , 8. , 6. , 8. , 3. , 2. ]) >>> a.shape = ( 6 , 2 ) >>> a.transpose() array([[ 7. , 9. , 7. , 7. , 6. , 3. ], [ 5. , 3. , 2. , 8. , 8. , 2. ]]) |
由ravel()展平的数组元素的顺序通常是“C风格”的,就是以行为基准,最右边的索引变化得最快,所以元素a[0,0]之后是a[0,1]。如果数组改变成其它形状(reshape),数组仍然是“C风格”的。NumPy通常创建一个以这个顺序保存数据的数组,所以ravel()通常不需要创建起调用数组的副本。但如果数组是通过切片其它数组或有不同寻常的选项时,就可能需要创建其副本。还可以同过一些可选参数函数让reshape()和ravel()构建FORTRAN风格的数组,即最左边的索引变化最快。
reshape函数改变调用数组的形状并返回该数组,而resize函数改变调用数组自身。
1
2
3
4
5
6
7
8
9
10
11
|
>>> a array([[ 7. , 5. ], [ 9. , 3. ], [ 7. , 2. ], [ 7. , 8. ], [ 6. , 8. ], [ 3. , 2. ]]) >>> a.resize(( 2 , 6 )) >>> a array([[ 7. , 5. , 9. , 3. , 7. , 2. ], [ 7. , 8. , 6. , 8. , 3. , 2. ]]) |
如果在reshape操作中指定一个维度为-1,那么其准确维度将根据实际情况计算得到
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持服务器之家。
原文链接:http://blog.csdn.net/sunny2038/article/details/9023797