利用NumPy和pandas对CSV文件进行写操作

创建时间：2017-01-16 投稿人：浏览次数：7830

数组存储成CSV之类的区隔型文件：
下面代码给随机数生成器指定种子，并生成一个3*4的NumPy数组
将一个数组元素的值设为NaN:
	In [26]: import numpy as np
	In [27]: np.random.seed(42)
	In [28]: a = np.random.randn(3,4)
	In [29]: a[2][2] = np.nan
	In [30]: print(a)
	[[ 0.49671415 -0.1382643   0.64768854  1.52302986]
	 [-0.23415337 -0.23413696  1.57921282  0.76743473]
	 [-0.46947439  0.54256004         nan -0.46572975]]

NumPy的savetxt()函数是与loadtxt()相对应的一个函数，它能以诸如CSV之类的区隔型文件格式保存数组：
	In [31]: np.savetxt("np.csv",a,fmt="%.2f",delimiter=",",header="#1,#2,#3,#4")
上面的函数调用中，我们规定了用以保存数组的文件的名称、数组、可选格式、间隔符和一个可选的标题
通过cat np.csv，可以查看刚才所建的np.csv文件的具体内容

利用随机数组来创建pandas DataFrame：
	In [38]: df = pd.DataFrame(a)
	In [39]: df
	Out[39]: 
		  0         1         2         3
	0  0.496714 -0.138264  0.647689  1.523030
	1 -0.234153 -0.234137  1.579213  0.767435
	2 -0.469474  0.542560       NaN -0.465730
pandas会自动替我们给数据取好列名
利用pandas的to_csv()方法可以为CSV文件生成一个DataFrame：
	In [40]: df.to_csv("pd.csv",float_format="%.2f",na_rep="NAN!")
对于这个方法，我们需要提供文件名、类似于NumPy的savetxt()函数的格式化参数的可选格式串和一个表示NaN的可选字符串

声明：该文观点仅代表作者本人，牛骨文系教育信息发布平台，牛骨文仅提供信息存储空间服务。

上一篇： Java中JNI的使用详解第三篇:JNIEnv类型中方法的使用
下一篇： python使用webdriver爬取微信公众号信息

热门文章: CTF writeup 2_南邮网络攻防训...; SSM框架——详细整合教程（...; Linux Shell脚本编程－－curl命...; HttpClient使用详解; Java面试题全集（上）; JAVA设计模式之单例模式; java.lang.OutOfMemoryError: PermGen ...; TCP协议中的三次握手和四次...; form表单的两种提交方式，su...; String,StringBuffer与StringBuilder...

最新文章: Java之品优购课程讲义_day20（7）; 剑指 Offer - 8：跳台阶; Netty权威指南_札记02_NIO编程; mysql时间属性之时间戳和datetime之...; 虚拟现实或许可以拯救古埃及的“...; spring cloud服务注册中心eureka---集群...; Java SE 第六章; HTTP请求+数据库; HIDL学习笔记之HIDL C++（第二天）; ubuntu系统下指定tomcat运行时为JDK1.8...