Python HW12 – DS

1265-张同学

发表文章数:58

首页 » 数据科学库 » 正文

知识点

  1. numpy相关。
import numpy as np
a = [[5,6,7],[4,8,9]]
b = [[1,2,3],[8,9,10]]
numpy.clip(a,5,6)  -> [[5,6,6],[5,6,6]]
numpy.flatten(a)   -> [5,6,7,4,8,9]
numpy.vstack(a,b)  -> [[5,6,7],[4,8,9],[1,2,3],[8,9,10]]
numpy.hstack(a,b)  -> [[5,6,7,1,2,3],[4,8,9,8,9,10]]
numpy.concatenate((a,b),axis=0/1)
numpy.split(a,n,axis=1)   #将a按列划分成n等份
numpy.array_split(a,n,axis) #将a按列不等划分成n份
np.vsplit/np.split #横纵向分割
  1. ipython的好处,可以使用shell命令。pwd, cd等指令,比如%run a.py。
  2. pandas核心数据结构,
    1. pd.Series(data, index=index), data可以是
      • Python字典
      • ndarray对象
      • 一个标量值
    2. pd.DataFrame(data,index=index,columns=columns),data可以是
      • 由一堆numpy数组,list,series构成的字典
      • 二维numpy数组
      • 一个series
      • 另外的dataframe对象
    3. Panel是三维带标签的数组,pandas指的是panel-data-s。
import pandas as pd
data = {'item1':pd.DataFrame(np.random.randn(4,3)),'item2':
pd.DataFrame(np.random.randn(4,2))
}
pn = pd.Panel(data)
  1. df.drop: axis=1丢弃列,axis=0丢弃行。df.apply(): axis = 1应用行,axis=0应用列。
  2. 分组计算三部曲。
    • 拆分,根据什么分组
    • 应用,每个分组进行什么样的计算
    • 合并,把每个分组的计算结果合并起来
  3. 聚合。
d = {'data1':['mean',('range',peak_range)],'data2':'sum'}
df.groupby('key1').agg(d)
  1. 总结
    • 爬虫技术
    • Pandas
    • Pandas
    • Scikit
    • Ternado, Django
      参考资料,https://www.zhihu.com/people/he-ming-ke。

拜师教育学员文章:作者:1265-张同学, 转载或复制请以 超链接形式 并注明出处 拜师资源博客
原文地址:《Python HW12 – DS》 发布于2020-09-06

分享到:
赞(0) 打赏

评论 抢沙发

评论前必须登录!

  注册



长按图片转发给朋友

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

Vieu3.3主题
专业打造轻量级个人企业风格博客主题!专注于前端开发,全站响应式布局自适应模板。

登录

忘记密码 ?

您也可以使用第三方帐号快捷登录

Q Q 登 录
微 博 登 录