数组存储成CSV之类的区隔型文件:
下面代码给随机数生成器指定种子,并生成一个3*4的NumPy数组
将一个数组元素的值设为NaN:
1
2
3
4
5
6
7
8
|
In [ 26 ]: import numpy as np In [ 27 ]: np.random.seed( 42 ) In [ 28 ]: a = np.random.randn( 3 , 4 ) In [ 29 ]: a[ 2 ][ 2 ] = np.nan In [ 30 ]: print (a) [[ 0.49671415 - 0.1382643 0.64768854 1.52302986 ] [ - 0.23415337 - 0.23413696 1.57921282 0.76743473 ] [ - 0.46947439 0.54256004 nan - 0.46572975 ]] |
NumPy的savetxt()函数是与loadtxt()相对应的一个函数,它能以诸如CSV之类的区隔型文件格式保存数组:
1
|
In [ 31 ]: np.savetxt( 'np.csv' ,a,fmt = '%.2f' ,delimiter = ',' ,header = "#1,#2,#3,#4" ) |
上面的函数调用中,我们规定了用以保存数组的文件的名称、数组、可选格式、间隔符和一个可选的标题
通过cat np.csv,可以查看刚才所建的np.csv文件的具体内容
利用随机数组来创建pandas DataFrame:
1
2
3
4
5
6
7
|
In [ 38 ]: df = pd.DataFrame(a) In [ 39 ]: df Out[ 39 ]: 0 1 2 3 0 0.496714 - 0.138264 0.647689 1.523030 1 - 0.234153 - 0.234137 1.579213 0.767435 2 - 0.469474 0.542560 NaN - 0.465730 |
pandas会自动替我们给数据取好列名
利用pandas的to_csv()方法可以为CSV文件生成一个DataFrame:
1
|
In [ 40 ]: df.to_csv( 'pd.csv' ,float_format = '%.2f' ,na_rep = "NAN!" ) |
对于这个方法,我们需要提供文件名、类似于NumPy的savetxt()函数的格式化参数的可选格式串和一个表示NaN的可选字符串
以上这篇使用NumPy和pandas对CSV文件进行写操作的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持服务器之家。
原文链接:https://blog.csdn.net/qq_24683561/article/details/54565862