pandas快速入门

1173-杨同学

发表文章数:29

首页 » 数据科学库 » 正文

pandas

创建数据集对象

一维数组

pandas快速入门

二维数组

pandas快速入门
df.values:
array([[ 1.18898298, -1.15011854, -0.70058776, 0.43906549],
[-2.04154443, 1.08450747, -0.33544069, 1.96975377],
[ 1.2041512 , -1.27771421, -0.23067059, 0.62906316],
[-0.35235094, -1.70158492, -0.03429361, -0.33013878],
[ 0.62760104, -0.29293918, 0.45797463, 2.26240237],
[-1.12186945, -0.53322343, 0.6274522 , 0.41266481]])
另外一种创建方式:

# 使用字典来创建:key 为 DataFrame 的列;value 为对应列下的值
df = pd.DataFrame({
                  'A': 1,
                  'B': pd.Timestamp('20160301'),
                  'C': range(4),
                  'D': np.arange(5, 9),
                  'E': 'text',
                  'F': ['AA', 'BB', 'CC', 'DD']})
df

pandas快速入门

查看数据

data.head() 默认返回前五行
data.tail() 默认返回后五行
pandas快速入门
data.T 转置
pandas快速入门
pandas快速入门

数据选择

pandas快速入门
效率较低,可以通过标签进行选择。

通过标签选择

pandas快速入门
pandas快速入门

通过位置选择

pandas快速入门
注:iat访问速度较快。

布尔索引

pandas快速入门
pandas快速入门

修改数据

pandas快速入门

处理丢失数据

pandas快速入门
pandas快速入门

数据运算

统计

注:numpy.NaN 不参与计算
pandas快速入门
pandas快速入门
pandas快速入门

数据合并

pandas快速入门
注:可以通过(df==df1).all().all() 判断是否相等
pandas快速入门
pandas快速入门

分组统计

数据分组
每个组应用一个函数,输出一个结果
合并每个组的结果构成最终输出
pandas快速入门pandas快速入门

数据整形

pandas快速入门
pandas快速入门
pandas快速入门

数据透视表

pandas快速入门
pandas快速入门
pandas快速入门

时间序列

pandas 提供了强大的时间序列功能,比如把秒级的股票数据转换为5分钟周期数据等
pandas快速入门
时区表达与转换
pandas快速入门
在不同的时间表达方式间转换
pandas快速入门

类别数据

Categorical 是 pandas 0.15 版本才加入的新功能。用来表达类别数据。
pandas快速入门

画图(数据可视化)

pandas快速入门

数据读写

df = pd.DataFrame(np.random.randn(100, 4), columns=list('ABCD'))
df.to_csv('data.csv')
# pd.read_csv('data.csv')
pd.read_csv('data.csv', index_col=0)

未经允许不得转载:作者:1173-杨同学, 转载或复制请以 超链接形式 并注明出处 拜师资源博客
原文地址:《pandas快速入门》 发布于2020-07-14

分享到:
赞(0) 打赏

评论 抢沙发

评论前必须登录!

  注册



长按图片转发给朋友

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

Vieu3.3主题
专业打造轻量级个人企业风格博客主题!专注于前端开发,全站响应式布局自适应模板。

登录

忘记密码 ?

您也可以使用第三方帐号快捷登录

Q Q 登 录
微 博 登 录