脚本之家,脚本语言编程技术及教程分享平台!
分类导航

Python|VBS|Ruby|Lua|perl|VBA|Golang|PowerShell|Erlang|autoit|Dos|bat|

服务器之家 - 脚本之家 - Python - Python数据分析之pandas读取数据

Python数据分析之pandas读取数据

2021-11-21 11:57小菜鸡也会有春天 Python

Pandas读取的文件主要有CSV,TXT和JSON,今天就整理了这3种文件格式的读取和导出代码,文中有非常详细的代码示例及介绍,需要的朋友可以参考下

一、三种数据文件的读取

Python数据分析之pandas读取数据

二、csv、tsv、txt 文件读取

1)csv文件读取:

语法格式:pandas.read_csv(文件路径)
csv文件内容如下:

Python数据分析之pandas读取数据

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
import pandas as pd
file_path = "e:\\pandas_study\\test.csv"
content = pd.read_csv(file_path)
 
content.head()  # 默认返回前5行数据
content.head(3# 返回前3行数据
content.shape  # 返回一个元组(总行数,总列数),总行数不包括标题行
 
content.index    #    返回索引,是一个可迭代的对象<class 'pandas.core.indexes.range.rangeindex'>
 
content.column    #  返回所有的列名 index(['姓名', '年龄', '籍贯'], dtype='object')
 
content.dtypes  #  返回的是每列的数据类型
姓名    object
年龄     int64
籍贯    object
dtype: object

2)csv文件读取:

语法格式:pandas.read_csv(文件路径)
csv文件内容如下:

Python数据分析之pandas读取数据

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
import pandas as pd
file_path = "e:\\pandas_study\\test2.txt"
 
content = pd.read_csv(file_path,sep='\t',header = none ,names= ['name','age','adress'])
#参数说明:
# header = none 表示没有标题行
# sep='\t'  表示去除分割符中的空格
# names= ['name','age','adress'] ,列名依次自定义为'name','age','adress'
 
content.head()  # 默认返回前5行数据
content.head(3# 返回前3行数据
content.shape  # 返回一个元组(总行数,总列数),总行数不包括标题行
 
content.index    #    返回索引,是一个可迭代的对象<class 'pandas.core.indexes.range.rangeindex'>
 
content.column    #  返回所有的列名 index(['姓名', '年龄', '籍贯'], dtype='object')
 
content.dtypes  #  返回的是每列的数据类型

三、excel文件读取

Python数据分析之pandas读取数据

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
import pandas as pd
file_path = "e:\\pandas_study\\test3.xlsx"
content = pd.read_excel(file_path)
 
content.head()  # 默认返回前5行数据
content.head(3# 返回前3行数据
content.shape  # 返回一个元组(总行数,总列数),总行数不包括标题行
 
content.index    #    返回索引,是一个可迭代的对象<class 'pandas.core.indexes.range.rangeindex'>
 
content.column    #  返回所有的列名 index(['姓名', '年龄', '籍贯'], dtype='object')
 
content.dtypes  #  返回的是每列的数据类型
姓名    object
年龄     int64
籍贯    object
dtype: object

四、数据库表格读取

语法: pandas.read_sql(sql语句,数据库连接对象)
数据对象的创建,可以根据pymysql,cx_oracle等模块连接mysql或者oracle。

到此这篇关于python数据分析之pandas读取数据的文章就介绍到这了,更多相关pandas读取数据内容请搜索服务器之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持服务器之家!

原文链接:https://blog.csdn.net/weixin_50640351/article/details/117336508

延伸 · 阅读

精彩推荐