本课程是2021版Python集成学习算法(Ensemble Learning)项目实践视频教程,由两位专业的数据科学家设计,以便我们可以分享我们的知识并帮助您以简单的方式学习复杂的理论、算法和编码库。我们将逐步带您进入机器学习的世界。在每个教程中,您都将培养新技能并加深对这个具有挑战性但利润丰厚的数据科学子领域的理解。这门课程既有趣又令人兴奋,但与此同时,我们深入研究了机器学习。
什么是集成学习?
在机器学习和统计学习中, Ensemble Learning(集成学习)是一种将多种学习算法组合在一起以取得更好表现的一种方法。与 Statistical Ensemble(统计总体,通常是无限的)不同,机器学习下的Ensemble 主要是指有限的模型相互组合,而且可以有很多不同的结构。相关的概念有多模型系统、Committee Learning、Modular systems、多分类器系统等等。
Ensemble方法是监督式学习的一种,训练完成之后就可以看成是单独的一个”假设”(或模型),只是该”假设”不一定是在原”假设”空间里的。因此,Ensemble方法具有更多的灵活性。理论上来说,Ensemble方法也比单一模型更容易过拟合。但是,实际中有一些方法(尤其是Bagging)也倾向于避免过拟合。
经验上来说,如果待组合的各个模型之间差异性(diversity )比较显著,那么Ensemble之后通常会有一个较好的结果,因此也有很多Ensemble的方法致力于提高待组合模型间的差异性。尽管不直观,但是越随机的算法(比如随机决策树)比有意设计的算法(比如熵减少决策树)更容易产生强分类器。然而,实际发现使用多个强学习算法比那些为了促进多样性而做的模型更加有效。
本课程结构如下:
- 第 1 节:介绍。
- 第 2 部分:基本机器学习概念
- 第 3 部分:基本集成学习概念
- 第 4 部分:投票方式
- 第 5 部分:堆叠方法
- 第 6 部分:装袋方法
- 第 7 节:提升方法
- 第 8 节:随机森林。
- 第 9 节:聚类
- 第 10 节:预测比特币价格 – 真实世界问题
- 第 11 节:电影推荐系统 – 真实世界问题
此外,该课程还包含基于真实案例的实践练习。因此,您不仅将学习理论,而且还将获得一些构建自己模型的动手实践。有两个大项目和三个小项目来练习你在整个课程中学到的东西。这些项目如下:
- 手写数字。
- 乳腺癌检测
- 糖尿病预测
- 比特币预测
- 电影推荐系统
本课程面向的对象:
- 对深度学习、机器学习和集成学习感兴趣的
- 至少有高中数学知识,并希望开始学习机器学习和集成学习的学生
- 任何了解机器学习基础知识的中级人员,包括线性回归或逻辑回归等经典算法,但他们希望了解更多有关机器学习的知识并探索机器学习的所有不同领域。
- 任何想在数据科学领域开始职业生涯的大学生。
- 希望拓展应用领域的人工智能专家。
- 希望把人工智能技术提升到一个新水平的数据科学家。
- 任何对机器学习和集成学习有热情的人。
Learn to create Ensemble Learning Algorithms in Python with Real World example on practical ways Genre: eLearning | MP4 | Video: h264, 1280×720 | Audio: AAC, 44.1 KHz
Language: English | Size: 6.70 GB | Duration: 15h 55m
What you’ll learn
Support vector machines
Logistic Regression Implementation
Decision trees
K-Nearest Neighbors
K-means
Hard and soft voting
Meta-Learning
Base learners and meta-learner
Bootstrapping
Bagging
AdaBoost
Gradient boosting
XGBoost
Forest trees
Random forests
Extra trees
Keras.
Pandas.
Matplotlib.