机器学习-数据科学库(第4节)

1416-李同学

发表文章数:28

热门标签

首页 » 数据科学库 » 正文

一、pandas是什么?

示例:pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。
常用数据类型:
Series 一维,带标签数组
DataFrame 二维,Series容器

二、Series创建

机器学习-数据科学库(第4节)
机器学习-数据科学库(第4节)

三、pandas之Series切片和索引

机器学习-数据科学库(第4节)
机器学习-数据科学库(第4节)

四、pandas之读取外部数据

数据存在csv中,直接使用pd. read_csv即可
对于数据库比如mysql或者mongodb中数据:pd.read_sql(sql_sentence,connection)

五、pandas之DataFrame

DataFrame对象既有行索引,又有列索引
行索引,表明不同行,横向索引,叫index,0轴,axis=0
列索引,表名不同列,纵向索引,叫columns,1轴,axis=1
机器学习-数据科学库(第4节)
机器学习-数据科学库(第4节)

六、pandas之取行或者列

机器学习-数据科学库(第4节)
机器学习-数据科学库(第4节)
机器学习-数据科学库(第4节)

七、pandas之布尔索引

机器学习-数据科学库(第4节)

八、pandas之字符串方法

机器学习-数据科学库(第4节)

九、缺失数据处理

判断数据是否为NaN:pd.isnull(df),pd.notnull(df)

处理方式1:删除NaN所在的行列dropna (axis=0, how=‘any’, inplace=False)
处理方式2:填充数据,t.fillna(t.mean()),t.fiallna(t.median()),t.fillna(0)
处理为0的数据:t[t==0]=np.nan
当然并不是每次为0的数据都需要处理
计算平均值等情况,nan是不参与计算的,但是0会

十、常用统计方法

机器学习-数据科学库(第4节)

标签:

未经允许不得转载:作者:1416-李同学, 转载或复制请以 超链接形式 并注明出处 拜师资源博客
原文地址:《机器学习-数据科学库(第4节)》 发布于2021-02-24

分享到:
赞(0) 打赏

评论 抢沙发

评论前必须登录!

  注册



长按图片转发给朋友

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

Vieu3.3主题
专业打造轻量级个人企业风格博客主题!专注于前端开发,全站响应式布局自适应模板。

登录

忘记密码 ?

您也可以使用第三方帐号快捷登录

Q Q 登 录
微 博 登 录