属性和⽅法
DataFrame有许多的的属性和⽅法使得pabdas⽤起来⾮常的快捷简便。导⼊数据:
1 import pandas as pd2 import numpy as np
3 from pandas import Series,DataFrame
4 test=pd.read_excel(\"/Users/yaozhilin/Downloads/数据.xls\",sep=\"t\")5 test.head(5)#显⽰前五⾏
•属性
test.columns 获取DataFrame的列名test.index 获取DataFrame的索引名
test.dtypes 获取DataFrame的没列数据的属性test.shape 获取DataFrame的⾏和列数test.size 获取DataFrame的总元素
1 test.columns
Index(['公司名称', '联系⼈姓名', '联系⼈头衔', '地址', '电话', '传真', '电⼦邮件', '⽇期', '附件'], dtype='object')1 test.index
RangeIndex(start=0, stop=91, step=1)1 test.dtypes
公司名称 object联系⼈姓名 object联系⼈头衔 object地址 object电话 object传真 object电⼦邮件 object⽇期 datetime[ns]附件 floatdtype: object1 test.shape(91, 9)1 test.size819
•⽅法
⽅法使⽤
1、head() 显⽰数据前⼏⾏(默认5⾏)2、tail() 显⽰数据后⼏⾏(默认5⾏)3、rename(index/columns={a:a1}) 数据索引或列重命名4、replace(columns:{a:a1}) 替换数据 5、unique 显⽰唯⼀值6、sort_index 索引排序7、sort_values 值排序
8、value_counts 统计每个值的数量9、describe 统计所有值的数据10、max/min/sum/mean
11、reindex 创建新索引
下⾯举⼏个列⼦rename/head
1 test.rename(columns={\"联系⼈姓名\":\"姓名\",\"联系⼈头衔\":\"职位\"},inplace=True)2 test.head(5)
replace/tail
1 test.replace({\"职位\":{\"物主\":\"房东\"}}).tail(5)
unique
1 test[\"职位\"].unique()
array(['销售代表', '物主', '采购员', '市场经理', '结算经理', '销售代理', '销售员', '销售经理', '市场助理', '助理销售代理', '助理销售代表', '物主/市场助理'], dtype=object)1 len(test[\"职位\"].unique())12
sort_index
1 test.sort_index(ascending=False).head(5)#ascending默认为true
sort_values
1 test.sort_values(by=[\"姓名\",\"职位\"]).head(4)
duplicated()/value_counts
1 test.duplicated().value_counts()#判断该数据中是否有重复值False 91dtype: int
1 test[\"职位\"].value_counts()销售代表 17物主 17市场经理 12销售经理 11结算经理 10销售员 7市场助理 6销售代理 5采购员 2
助理销售代理 2助理销售代表 1物主/市场助理 1
Name: 职位, dtype: int
describe
1 test[\"附件\"]=range(91)2 test.describe()
reindex
1 test.reindex(np.arange(2,93)).head(4)
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- igat.cn 版权所有 赣ICP备2024042791号-1
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务