欢迎学习《基于决策树和随机森林Scikit-learn库预测分析视频教程》,本课程适用于希望使用决策树或随机森林进行 Scikit-learn 预测的人。这需要实践经验,该课程可帮助您使用 Jupyter NoteBook复习和练习课程主题。
每节课都是一个简短的视频供您观看。大多数课程都通过 Jupyter 笔记本中的示例解释了有关决策树或随机森林的内容。课程资料包括 50 多个Jupyter NoteBook和相应的 Python 代码。您可以下载课程的笔记本进行复习。您还可以使用笔记本尝试决策树和随机森林的其他定义或其他数据以进行进一步练习。
2022年 8 月发布
MP4 | 视频:h264, 1280×720 | 音频:AAC,48.0 KHz
语言:英语 | 大小:1.32 GB | 时长:90 节课 • 3h 38m
你会学到什么
- 了解决策树和随机森林如何做出预测。
- 了解如何使用 Scikit-learn 对决策树和随机森林进行预测,并了解数据集的预测结构。
- 了解如何使用 Scikit-learn 使用决策树和随机森林进行自己的预测项目。
- 了解 Scikit-learn 的 DecisonTreeClassifier 和 RandomForestClassifier 方法的每个参数,以定义您的决策树或随机森林。
- 学习使用 Scikit-learn 的 DecisonTreeClassifier 和 RandomForestClassifier 方法的输出来调查和理解您的预测。
- 了解如何处理数据中不平衡的类值以及噪声数据如何影响随机森林的预测性能。
- 生长决策树:节点分裂、节点杂质、基尼多样性、熵、杂质减少、特征阈值。
- 改进决策树:交叉验证、网格/随机搜索、调整和最小成本复杂度修剪、评估特征重要性。
- 创建随机森林:引导、装袋、随机特征选择、树预测的去相关。
- 改进随机森林:交叉验证、网格/随机搜索、调整、袋外评分、概率估计校准。
要求
- 您应该能够在 Jupyter Note中阅读和遵循表示数据描述、估计或模型拟合和数据分析输出的 Python 代码(使用 Python 库:pandas、numpy、scikit-learn、matplotlib)。
- 要从课程中充分受益,您应该能够运行课程中的Jupyter NoteBook或 Python 程序。
- 您需要了解一些基本统计数据才能学习所有课程(随机变量、概率分布、直方图、箱线图)。如果您已经对监督学习或分类问题有一定的了解,那么这些课程会更容易理解。
描述
本课程的课程帮助您掌握在数据分析项目中使用决策树和随机森林。本课程侧重于决策树分类器和随机森林分类器,因为大多数成功的机器学习应用似乎都是分类问题。课程解释分类问题的决策树。
生长决策树的元素。
用于定义决策树分类器的 sklearn 参数。
使用 Scikit-learn 使用决策树进行预测(拟合、修剪/调整、调查)。
用于定义随机森林分类器的 sklearn 参数。
使用 Scikit-learn 预测随机森林(拟合、调整、调查)。
随机森林预测背后的想法。
拟合决策树和随机森林的特征。
数据的重要性和理解预测性能。
如何使用决策树和随机森林进行预测项目。
本课程专注于分类问题,使用 Python 的 Scikit-learn 库的 DecisionTreeClassifier 和 RandomForestClassifier 方法。它使您为使用决策树和随机森林进行预测和理解数据集的预测结构做好准备。
本课程适用于
- 专业人士、学生以及任何想要使用决策树和随机森林进行数据预测的人。
- 专业人士、学生、任何在项目中使用数据并在初次使用决策树或随机森林后想要了解更多有关决策树或随机森林的人。
- 专业人士、学生、任何有兴趣使用决策树或随机森林使用 Python Scikit-learn 库进行预测项目的人。