Need help with statistical-learning-method-solutions-manual?
Click the “chat” button below for chat support from the developer who created it, or find similar developers for support.

About the developer

datawhalechina
429 Stars 88 Forks Other 85 Commits 0 Opened issues

Description

《统计学习方法》(第二版)习题解答,在线阅读地址:https://datawhalechina.github.io/statistical-learning-method-solutions-manual

Services available

!
?

Need anything else?

Contributors list

# 122,495
Python
statist...
Jupyter...
Tensorf...
85 commits

统计学习方法(第二版)习题解答

  李航老师的《统计学习方法》是机器学习领域的经典入门教材之一。
  本书分为监督学习和无监督学习两篇,全面系统地介绍了统计学习的主要方法。包括感知机、k近邻法、朴素贝叶斯法、决策树、逻辑斯谛回归与最大熵模型、支持向量机、提升方法、EM算法、隐马尔可夫模型和条件随机场,以及聚类方法、奇异值分解、主成分分析、潜在语义分析、概率潜在语义分析、马尔科夫链蒙特卡罗法、潜在狄利克雷分配和PageRank算法等。本书通过第1章、第12章、第13章、第22章进行总结,其余每章都介绍一种统计学习方法。叙述从具体问题或实例入手,由浅入深,阐明思路,给出必要的数学推导,便于读者掌握统计学习方法的实质,学会运用。为满足读者进一步学习的需要,书中还介绍了一些相关研究,给出了少量习题,列出了主要参考文献。

使用说明

  统计学习方法习题解答,主要完成了该书的前11章习题,并提供代码和运行之后的截图,里面的内容是以统计学习方法的内容为前置知识,该习题解答的最佳使用方法是以李航老师的《统计学习方法》为主线,并尝试完成课后习题,如果遇到不会的,再来查阅习题解答。
  如果觉得解答不详细,可以点击这里提交你希望补充推导或者习题编号,我们看到后会尽快进行补充。

在线阅读地址

在线阅读地址:https://datawhalechina.github.io/statistical-learning-method-solutions-manual

目录

选用的《统计学习方法》版本

书名:统计学习方法
作者:李航
出版社:清华大学出版社
版次:2019年5月第2版
勘误表:http://blog.sina.com.cn/s/blog_7ad48fee0102yjdu.html

参考文献

  1. 李航《统计学习方法笔记》中的代码、notebook、参考文献、Errata
  2. CART剪枝详解
  3. CART剪枝算法详解

Notebook运行环境配置

  1. Python版本 请使用python3.7.X,如使用其他版本,requirements.txt中所列的依赖包可能不兼容。
  2. 安装相关的依赖包
    shell
    pip install -r requirements.txt
    
  3. 安装graphviz(用于决策树展示)
    可参考博客:https://blog.csdn.net/HNUCSEE_LJK/article/details/86772806

协作规范

  1. 由于习题解答中需要有程序和执行结果,采用jupyter notebook的格式进行编写(文件路径:notebook/notes),然后将其导出成markdown格式,再覆盖到docs对应的章节下。
  2. 目前已完成前11章习题解答,需要进行全部解答校对。
  3. 可按照Notebook运行环境配置,配置相关的运行环境。
  4. 校对过程中,关于数学概念补充,尽量使用初学者(有高数基础)能理解的数学概念,如果涉及公式定理的推导和证明,可附上参考链接。
  5. 当前进度

| 章节号 | 标题 | 进度 | 负责人 | 审核人 | | :----: | :----------------------: | :----: | :----: | :----: | | 1 | 统计学习方法概论 | 审核中 | 胡锐锋 | 王维嘉、毛鹏志、范佳慧 | | 2 | 感知机 | 审核中 | 胡锐锋 | 毛鹏志、范佳慧、王天富、王茸茸 | | 3 | k近邻法 | 审核中 | 胡锐锋 | 王维嘉、毛鹏志、王茸茸 | | 4 | 朴素贝叶斯法 | 审核中 | 胡锐锋、王维嘉 | 王瀚翀、王天富、王茸茸 | | 5 | 决策树 | 审核中 | 胡锐锋、王维嘉 | 王瀚翀、王天富、王茸茸 | | 6 | Logistic回归与最大熵模型 | 审核中 | 胡锐锋 | 毛鹏志、范佳慧、王瀚翀 | | 7 | 支持向量机 | 审核中 | 胡锐锋、王茸茸 | 王维嘉、王瀚翀、王天富 | | 8 | 提升方法 | 审核中 | 胡锐锋、王茸茸 | 王维嘉、毛鹏志、王瀚翀 | | 9 | EM算法及其推广 | 审核中 | 胡锐锋 | 毛鹏志、范佳慧、王瀚翀、王茸茸 | | 10 | 隐马尔可夫模型 | 审核中 | 胡锐锋、王瀚翀 | 王维嘉、范佳慧、王天富、王茸茸 | | 11 | 条件随机场 | 审核中 | 胡锐锋、王瀚翀 | 王维嘉、范佳慧、王天富 |

主要贡献者

@胡锐锋-天国之影-Relph
@王维嘉-king-vega
@王茸茸-CiCi-futurewq
@王瀚翀-MSQ-ERIC

项目结构

codes----------------------------------------------习题代码
|   +---ch02---------------------------------------第2章习题解答代码
|   |   +---perceptron.py--------------------------习题2.2(构建从训练数据求解感知机模型的例子)
|   +---ch03---------------------------------------第3章习题解答代码
|   |   +---k_neighbors_classifier.py--------------习题3.1(k近邻算法关于k值的模型比较)
|   |   +---kd_tree_demo.py------------------------习题3.2(kd树的构建与求最近邻点)
|   |   +---my_kd_tree.py--------------------------习题3.3(用kd树的k邻近搜索算法)
|   +---ch05---------------------------------------第5章习题解答代码
|   |   +---k_neighbors_classifier.py--------------习题5.1(调用sklearn的DecisionTreeClassifier类使用C4.5算法生成决策树)
|   |   +---my_decision_tree.py--------------------习题5.1(自编程实现C4.5生成算法)
|   |   +---my_least_squares_regression_tree.py----习题5.2(最小二乘回归树生成算法)
|   +---ch06---------------------------------------第6章习题解答代码
|   |   +---my_logistic_regression.py--------------习题6.2(实现Logistic回归模型学习的梯度下降法)
|   |   +---maxent_dfp.py--------------------------习题6.3(最大熵模型学习的DFP算法)
|   +---ch07---------------------------------------第7章习题解答代码
|   |   +---svm_demo.py----------------------------习题7.2(根据题目中的数据训练SVM模型,并在图中画出分离超平面、间隔边界及支持向量)
|   +---ch08---------------------------------------第8章习题解答代码
|   |   +---adaboost_demo.py-----------------------习题8.1(使用sklearn的AdaBoostClassifier分类器实现)
|   |   +---my_adaboost.py-------------------------习题8.1(自编程实现AdaBoost算法)
|   +---ch09---------------------------------------第9章习题解答代码
|   |   +---three_coin_EM.py-----------------------习题9.1(三硬币模型的EM算法)
|   |   +---gmm_demo.py----------------------------习题9.3(使用GaussianMixture求解两个分量高斯混合模型的6个参数)
|   |   +---my_gmm.py------------------------------习题9.3(自编程实现求两个分量的高斯混合模型的5个参数)
|   +---ch10---------------------------------------第10章习题解答代码
|   |   +---hidden_markov_backward.py--------------习题10.1(隐马尔可夫模型的后向算法)
|   |   +---hidden_markov_forward_backward.py------习题10.2(隐马尔可夫模型的前向后向算法)
|   |   +---hidden_markov_viterbi.py---------------习题10.3(隐马尔可夫模型的维特比算法)
|   +---ch11---------------------------------------第11章习题解答代码
|   |   +---crf_matrix.py--------------------------习题11.4(使用条件随机场矩阵形式,计算所有路径状态序列的概率及概率最大的状态序列)
docs---------------------------------------习题解答
notebook-----------------------------------习题解答JupyterNotebook格式
requirements.txt---------------------------运行环境依赖包

关注我们

Datawhale,一个专注于AI领域的学习圈子。初衷是for the learner,和学习者一起成长。目前加入学习社群的人数已经数千人,组织了机器学习,深度学习,数据分析,数据挖掘,爬虫,编程,统计学,Mysql,数据竞赛等多个领域的内容学习,微信搜索公众号Datawhale可以加入我们。

LICENSE

知识共享许可协议
本作品采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可。

We use cookies. If you continue to browse the site, you agree to the use of cookies. For more information on our use of cookies please see our Privacy Policy.