Python 数据挖掘与机器学习实战 (70):回归分析介 3.6.1

阅读数:1 2020 年 1 月 11 日 17:04

Python数据挖掘与机器学习实战(70):回归分析介 3.6.1

Python 数据挖掘与机器学习实战 (70):回归分析介 3.6.1

(构造预测函数)

内容简介
本书作为数据挖掘和机器学习的读物,基于真实数据集进行案例实战,使用 Python 数据科学库,从数据预处理开始一步步介绍数据建模和数据挖掘的过程。书中主要介绍了数据挖掘的基础知识、基本工具和实践方法,通过循序渐进地讲解算法,带领读者轻松踏上数据挖掘之旅。本书采用理论与实践相结合的方式,呈现了如何使用逻辑回归进行环境数据检测,如何使用 HMM 进行中文分词,如何利用卷积神经网络识别雷达剖面图,如何使用循环神经网络构建聊天机器人,如何使用朴素贝叶斯算法进行破产预测,如何使用 DCGAN 网络进行人脸生成等。本书也涉及神经网络、在线学习、强化学习、深度学习和大数据处理等内容。
本书以人工智能主流编程语言 Python 3 版作为数据分析与挖掘实战的应用工具,从 Pyhton 的基础语法开始,陆续介绍了 NumPy 数值计算、Pandas 数据处理、Matplotlib 数据可视化、爬虫和 Sklearn 数据挖掘等内容。全书共涵盖 16 个常用的数据挖掘算法和机器学习实战项目。通过学习本书内容,读者可以掌握数据分析与挖掘的理论知识及实战技能。
本书内容丰富,讲解由浅入深,特别适合对数据挖掘和机器学习算法感兴趣的读者阅读,也适合需要系统掌握深度学习的开发人员阅读,还适合 Python 程序员及人工智能领域的开发人员阅读。编程爱好者、高校师生及培训机构的学员也可以将本书作为兴趣读物或教材使用。

二分类问题的概率与自变量之间的关系图形往往是一个 S 型曲线,如图 3-8 所示,采用 sigmoid 函数实现,函数形式为:

g(z)=11+ez(311)

Python数据挖掘与机器学习实战(70):回归分析介 3.6.1

图 3-8 sigmoid 函数

对于线性边界的情况,边界形式如下:

z=θTx=θ0x0+θ1x1++θnxn=ni=0θixi(312)

最佳参数:

θ=[θ0,θ1,θ2,,θn]T(313)

构造预测函数为:

hθ(x)=g(θTx)=11+eθTx(314)

sigmoid 的函数输出是介于 (0,1) 之间的,中间值是 0.5,公式 hθ(x) 的含义就很好理解了,因为 hθ(x) 输出是介于 (0,1)之间,也就表明了数据属于某一类别的概率。例如,hθ(x)<0.5 则说明当前数据属于 A 类;hθ(x)>0.5 则说明当前数据属于 B 类。所以可以将 sigmoid 函数看成样本数据的概率密度函数。

函数 h(x) 的值有特殊的含义,它表示结果取 1 的概率,因此对于输入 x 分类结果为类别 1 和类别 0 的概率分别为:

p(y=1|x;θ)=hθ(x)(315)

p(y=0|x;θ)=1hθ(x)(316)

Python数据挖掘与机器学习实战(70):回归分析介 3.6.1

购书地址 https://item.jd.com/12623592.html?dist=jd

评论

发布