数据科学库(HM)——第一节数据分析介绍&matplotlib

1313-徐同学

发表文章数:29

热门标签

首页 » 数据科学库 » 正文

数据分析

定义:

数据分析是用适当的方法对收集来的大量数据进行分析,帮助人们作出判断,以便采取适当行动

为什么要学数据分析?

  1. python数据科学的基础(包含pandas、numpy、matplotlib等python库)
  2. 机器学习课程的基础

数据分析的流程

  1. 提出问题
  2. 准备数据
  3. 整理、分析数据
  4. 获得结论
  5. 成果可视化

matplotlib

matplotlib最流行的Python底层绘图库,主要做数据可视化图表,名字取材于MATLAB,模仿MATLAB构建

为什么学习matplotlib

  • 能将数据进行可视化,更直观的呈现
  • 是数据更加客观、更有说服力

matplotlib折线图的实现

#coding=utf-8
from matplotlib import pyplot as plt   #导入pyplot模块
#import matplotlib.pyplot asplt      另一种导入pyplot模块的方法

import random    #导入随机数模块
import matplotlib

plt.figure(figsize=(20,8),dpi=80)    #设置图片大小
'''1.figure图形图标的意思,在这里指的是我们绘制的图
   2.通过实例化一个figure并且传递参数,能够在后台自动使用该figure实例
   3.在图像模糊的时候可以传入dpi参数,让图像更加清晰'''

#设置显示中文字体
from matplotlib import font_manager
my_font = font_manager.FontProperties(fname=r"D:/anaconda/Lib/site-packages/matplotlib/mpl-data/fonts/ttf/msyh.ttc")

x=range(120)      #在x轴的位置,是一个可迭代的对象,生成[0,119]范围内的120个整数
y=[random.randint(20,35)for i in range(120)]  #random.randint(20,35):生成范围在(20,35)之间的随机数整数
#x轴和y轴的数据一起组成了所有要绘制的坐标点

plt.plot(x,y)    #传入x,y通过plot绘制出折线图

#设置x轴上字符串的刻度
_x_ticks=["10点{}分" .format(i) for i in x if i<60]+["11点{}分" .format(i-60) for i in x if i>60]
#x轴表示10点-12点每一分钟的时刻数

plt.xticks(x[::5],_x_ticks[::5],rotation=45,FontProperties=my_font)   #rotation设置旋转的角度
#设置步长(数字和字符串一一对应),数据的长度一样

#添加描述信息
plt.xlabel("时间",FontProperties=my_font)
plt.ylabel("温度 单位(°C)",FontProperties=my_font)
plt.title("十点到十二点每分钟的气温变化情况",FontProperties=my_font)
#显示中文的地方都需要传入FontProperties参数

plt.savefig("./t1.png")   #保存图片在当前目录下

plt.show()  #展示图形

效果图:

数据科学库(HM)——第一节数据分析介绍&matplotlib

练习题:

假设大家在30岁的时候,根据自己的实际情况,统计出来了你和你同桌各自11岁到30岁每年交的女()朋友的数量如列表ab,在一个图中绘制出该数据的折线图,以便比较自己和同桌20年间的差异,同时分析每年交女()朋友的数量走势

a = [1,0,1,1,2,4,3,2,3,4,4,5,6,5,4,3,3,1,1,1],b=[1,0,3,1,2,2,3,3,2,1 ,2,1,1,1,1,1,1,1,1,1

要求:

    y轴表示个数

    x轴表示岁数,比如11,12岁一直到30岁等

from matplotlib import pyplot as plt
import matplotlib

#设置显示中文字体
from matplotlib import font_manager
my_font = font_manager.FontProperties(fname=r"D:/anaconda/Lib/site-packages/matplotlib/mpl-data/fonts/ttf/msyh.ttc")

plt.figure(figsize=(20,8),dpi=80)    #设置图片大小

a = [1,0,1,1,2,4,3,2,3,4,4,5,6,5,4,3,3,1,1,1]
b = [1,0,3,1,2,2,3,3,2,1 ,2,1,1,1,1,1,1,1,1,1]

x=range(11,31)
plt.plot(x,a,label="自己",linestyle="--",color="red",alpha=0.5)
plt.plot(x,b,label="同桌",linestyle="-",color="orange",alpha=0.5)
#->通过label指定显示的图例内容

_x_ticks=["{}岁" .format(i) for i in x ]
#x轴表示11-30岁的年龄段

plt.xticks(x,_x_ticks,rotation=45,FontProperties=my_font)   #rotation设置旋转的角度

plt.legend(prop=my_font,loc="best")
#->通过prop指定图例的字体
#->通过loc指定图例的位置,默认右上角

plt.show()

效果图:

数据科学库(HM)——第一节数据分析介绍&matplotlib

 

标签:

未经允许不得转载:作者:1313-徐同学, 转载或复制请以 超链接形式 并注明出处 拜师资源博客
原文地址:《数据科学库(HM)——第一节数据分析介绍&matplotlib》 发布于2020-12-12

分享到:
赞(0) 打赏

评论 抢沙发

评论前必须登录!

  注册



长按图片转发给朋友

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

Vieu3.3主题
专业打造轻量级个人企业风格博客主题!专注于前端开发,全站响应式布局自适应模板。

登录

忘记密码 ?

您也可以使用第三方帐号快捷登录

Q Q 登 录
微 博 登 录