欢迎购买学习《2022.5月Python心脏病发作预测分析机器学习项目实战视频教程》课程,你将学习数据科学和机器学习——通过真实的心脏病发作分析项目提高你的机器学习、统计技能。
发表于 05/2022
MP4 | 视频:h264, 1280×720 | 音频:AAC,44.1 KHz,2 Ch
类型:eLearning | 语言:英语 + 英语字幕srt | 时长:53 节课(7h 23m)| 大小:2.2 GB
你会学到什么
- 机器学习描述了使用基于真实数据训练的模型进行预测的系统。
- 机器学习不仅对预测短信或智能手机语音识别有用。
- 数据科学使用算法来理解原始数据。数据科学与传统数据分析的主要区别在于其侧重于预测。
- 数据科学包括准备、分析和处理数据。它借鉴了许多科学领域,作为一门科学,它通过创造新的算法而进步
- 数据科学家使用机器学习来发现大量原始数据中的隐藏模式,以阐明实际问题。
- 项目的第一步
- 项目中使用的笔记本设计
- 检查项目主题
- 识别数据集中的变量
- 所需的 Python 库
- 加载数据集
- 对数据集的初步分析
- 检查缺失值
- 检查唯一值
- 分离变量(数值或分类)
- 检查变量的统计
- 数值变量(使用 Distplot 进行分析)
- 分类变量(饼图分析)
- 根据分析结果检查缺失数据
- 数值变量 – 目标变量(使用 FacetGrid 进行分析)
- 分类变量 – 目标变量(计数图分析)
- 检查自身之间的数值变量(配对图分析)
- 使用 Robust Scaler 方法进行特征缩放以实现新的可视化
- 使用 Melt() 函数创建一个新的 DataFrame
- 数值 – 分类变量(使用群图分析)
- 数值 – 分类变量(箱线图分析)
- 变量之间的关系(使用热图分析)
- 删除相关性较低的列
- 可视化异常值
- 处理异常值
- 确定数值变量的分布
- 非对称数据的转换操作
- 将一种热编码方法应用于分类变量
- 使用机器学习算法的鲁棒缩放器方法进行特征缩放
- 将数据分成测试集和训练集
- 逻辑回归
- 逻辑回归算法的交叉验证
- 逻辑回归算法的 Roc 曲线和曲线下面积 (AUC)
- 逻辑回归算法的超参数优化(使用 GridSearchCV)
- 决策树算法
- 支持向量机算法
- 随机森林算法
- 随机森林算法的超参数优化(使用 GridSearchCV)
- 项目总结与分享
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。