资源名称:机器学习系统设计 完整版 PDF

第1章 Python机器学习入门  1
1.1  梦之队:机器学习与Python  1
1.2  这本书将教给你什么(以及不会教什么)  2
1.3  遇到困难的时候怎么办  3
1.4  开始  4
1.4.1  NumPy、SciPy和Matplotlib简介  4
1.4.2  安装Python  5
1.4.3  使用NumPy和SciPy智能高效地处理数据  5
1.4.4  学习NumPy  5
1.4.5  学习SciPy  9
1.5  我们第一个(极小的)机器学习应用  10
1.5.1  读取数据  10
1.5.2  预处理和清洗数据  11
1.5.3  选择正确的模型和学习算法  12
1.6  小结  20
第2章 如何对真实样本分类  22
2.1  Iris数据集  22
2.1.1  第一步是可视化  23
2.1.2  构建第一个分类模型  24
2.2  构建更复杂的分类器  28
2.3  更复杂的数据集和更复杂的分类器  29
2.3.1  从Seeds数据集中学习  29
2.3.2  特征和特征工程  30
2.3.3  最邻近分类  30
2.4  二分类和多分类  33
2.5  小结  34
第3章 聚类:寻找相关的帖子  35
3.1  评估帖子的关联性  35
3.1.1  不应该怎样  36
3.1.2  应该怎样  36
3.2  预处理:用相近的公共词语个数来衡量相似性  37
3.2.1  将原始文本转化为词袋  37
3.2.2  统计词语  38
3.2.3  词语频次向量的归一化  40
3.2.4  删除不重要的词语  41
3.2.5  词干处理  42
3.2.6  停用词兴奋剂  44
3.2.7  我们的成果和目标  45
3.3  聚类  46
3.3.1  K均值  46
3.3.2  让测试数据评估我们的想法  49
3.3.3  对帖子聚类  50
3.4  解决我们最初的难题  51
3.5  调整参数  54
3.6  小结  54
第4章 主题模型  55
4.1  潜在狄利克雷分配(LDA)  55
4.2  在主题空间比较相似度  59
4.3  选择主题个数  64
4.4  小结  65
第5章 分类:检测劣质答案  67
5.1  路线图概述  67
5.2  学习如何区分出优秀的答案  68
5.2.1  调整样本  68
5.2.2  调整分类器  68
5.3  获取数据  68
5.3.1  将数据消减到可处理的程度  69
5.3.2  对属性进行预选择和处理  70
5.3.3  定义什么是优质答案  71
5.4  创建第一个分类器  71
5.4.1  从k邻近(kNN)算法开始  71
5.4.2  特征工程  72
5.4.3  训练分类器  73
5.4.4  评估分类器的性能  74
5.4.5  设计更多的特征  74
5.5  决定怎样提升效果  77
5.5.1  偏差?方差及其折中  77


资源截图:

image.png

本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。

最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量,若小于网盘提示的容量则是这个原因。这是浏览器下载的bug,建议用百度网盘软件或迅雷下载。 若排除这种情况,可在对应资源底部留言,或联络我们。

对于会员专享、整站源码、程序插件、网站模板、网页模版等类型的素材,文章内用于介绍的图片通常并不包含在对应可供下载素材包内。这些相关商业图片需另外购买,且本站不负责(也没有办法)找到出处。 同样地一些字体文件也是这种情况,但部分素材会在素材包内有一份字体下载链接清单。

如果您已经成功付款但是网站没有弹出成功提示,请联系站长提供付款信息为您处理

源码素材属于虚拟商品,具有可复制性,可传播性,一旦授予,不接受任何形式的退款、换货要求。请您在购买获取之前确认好 是您所需要的资源