机器学习算法基础(5): 分类算法:朴素贝叶斯算法及代码实例

1411-李同学

发表文章数:148

热门标签

, ,
首页 » 算法 » 正文

分类算法-朴素贝叶斯算法

一、概率基础

概率被定义为一件事件发生的可能性

二、联合概率和条件概率

联合概率:包含多个条件,且所有条件同时成立的概率 p(a,b)=p(a)xp(b)

条件概率:就是事件a在另外一个事件b已经发生条件下的发生概率 记作p(a|b), p(a1,a2|b)=p(a1|b)p(a2|b), 次条件概率的成立,是由于a1,a2相互独立的结果

例题

机器学习算法基础(5): 分类算法:朴素贝叶斯算法及代码实例

三、朴素贝叶斯 : 特征之间需要相互独立

文档分类

  • p(科技|文档) 文档1: 词1,词2,词3

  • p(娱乐|文档) 文档2:词a,词b,词c

贝叶斯公式

机器学习算法基础(5): 分类算法:朴素贝叶斯算法及代码实例

举例

机器学习算法基础(5): 分类算法:朴素贝叶斯算法及代码实例
机器学习算法基础(5): 分类算法:朴素贝叶斯算法及代码实例
机器学习算法基础(5): 分类算法:朴素贝叶斯算法及代码实例

属于某个类别为0,不合适

拉普拉斯平滑

机器学习算法基础(5): 分类算法:朴素贝叶斯算法及代码实例
改良后:
机器学习算法基础(5): 分类算法:朴素贝叶斯算法及代码实例

朴素贝叶斯的API

机器学习算法基础(5): 分类算法:朴素贝叶斯算法及代码实例
机器学习算法基础(5): 分类算法:朴素贝叶斯算法及代码实例

算法案例

机器学习算法基础(5): 分类算法:朴素贝叶斯算法及代码实例

算法代码,统计20个新闻稿

from sklearn.neighbors import KNeighborsClassifier
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.datasets import fetch_20newsgroups,load_boston
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.naive_bayes import  MultinomialNB
def naviebayes():
    #朴素贝叶斯进行文本分类
    news=fetch_20newsgroups(subset="all")

    #进行时飓风厄
    x_train,x_test,y_train,y_test=train_test_split(news.data,news.target,test_size=0.25)

    #对数据集进行特征抽取
    tf=TfidfVectorizer()

    #以训练集当中的词的列表进行每篇文章重要性统计["a","b","c","d"]
    x_train=tf.fit_transform(x_train)

    print(tf.get_feature_names())

    x_test=tf.transform(x_test)

    #进行朴素贝叶斯算法的预测
    mlt=MultinomialNB(alpha=1.0)

    print(x_train.toarray())

    mlt.fit(x_train,y_train)

    y_predict=mlt.predict(x_test)

    print("预测的文章类别为:",y_predict)

    #得出准确率
    print("准确率:",mlt.score(x_test,y_test))



if __name__=="__main__":
    naviebayes()

机器学习算法基础(5): 分类算法:朴素贝叶斯算法及代码实例

朴素贝叶斯算法总结

机器学习算法基础(5): 分类算法:朴素贝叶斯算法及代码实例

神经网络会比朴素贝叶斯好一些

未经允许不得转载:作者:1411-李同学, 转载或复制请以 超链接形式 并注明出处 拜师资源博客
原文地址:《机器学习算法基础(5): 分类算法:朴素贝叶斯算法及代码实例》 发布于2020-12-08

分享到:
赞(0) 打赏

评论 抢沙发

评论前必须登录!

  注册



长按图片转发给朋友

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

Vieu3.3主题
专业打造轻量级个人企业风格博客主题!专注于前端开发,全站响应式布局自适应模板。

登录

忘记密码 ?

您也可以使用第三方帐号快捷登录

Q Q 登 录
微 博 登 录