統計學習方法(第2版)
作者:李航
分類:心理學
ISBN:9787302517276
出版時間:2019-5-1
出版社:清華大學出版社
標簽: 機器學習 統計學習 人工智能 統計學 計算機 計算機科學 計算科學 MachineLearning
內容簡介
統計學習方法即機器學習方法,是計算機及其應用領域的一門重要學科。本書分為監督學 習和無監督學習兩篇,全面系統地介紹瞭統計學習的主要方法。包括感知機、k 近鄰法、樸素貝葉斯法、決策樹、邏輯斯諦回歸與最大熵模型、支持向量機、提升方法、EM 算法、隱馬爾可夫模型和條件隨機場,以及聚類方法、奇異值分解、主成分分析、潛在語義分析、概率潛在語義分析、馬爾可夫鏈蒙特卡羅法、潛在狄利克雷分配和 PageRank 算法等。除有關統計學習、監督學習和無監督學習的概論和總結的四章外,每章介紹一種方法。敘述力求從具體問題或實例入手, 由淺入深,闡明思路,給出必要的數學推導,便於讀者掌握統計學習方法的實質,學會運用。 為滿足讀者進一步學習的需要,書中還介紹瞭一些相關研究,給出瞭少量習題,列出瞭主要參考文獻。 本書是統計機器學習及相關課程的教學參考書,適用於高等院校文本數據挖掘、信息檢索及自然語言處理等專業的大學生、研究生,也可供從事計算機應用相關專業的研發人員參考。
章節介紹
第一篇 監督學習
第二篇 無監督學習
第13章 無監督學習概論
13.1.1 無監督學習基本原理
13.1.2 基本問題
13.1.3 機器學習三要素
13.1.4 無監督學習方法
第14章 聚類方法
14.1 聚類的基本概念
14.1.1 相似度或距離
14.1.2 類或簇
14.1.3 類與類之間的距離
14.2 層次聚類
14.3 k均值聚類
14.3.1 模型
14.3.2 策略
14.3.3 算法
14.3.4 算法特點
本章概要
繼續閱讀
習題
參考文獻
第15章 奇異值分解
15.1 奇異值分解的定義與性質
15.1.1 定義與定理
15.1.2 緊奇異值分解與截斷奇異值分解
15.1.3 幾何解釋
15.1.4 主要性質
15.2 奇異值分解的計算
15.3 奇異值分解與矩陣近似
15.3.1 弗羅貝尼烏斯范數
15.3.2 矩陣的優近似
15.3.3 矩陣的外積展開式
本章概要
繼續閱讀
習題
參考文獻
第16章 主成分分析
16.1 總體主成分分析
16.1.1 基本想法
16.1.2 定義和導出
16.1.3 主要性質
16.1.4 主成分的個數
16.1.5 規范化變量的總體主成分
16.2 樣本主成分分析
16.2.1 樣本主成分的定義和性質
16.2.2 相關矩陣的特征值分解算法
16.2.3 數據局正的奇異值分解算法
本章概要
繼續閱讀
習題
參考文獻
第17章 潛在語義分析
17.1 單詞向量空間與話題向量空間
17.1.1 單詞向量空間
17.1.2 話題向量空間
17.2 潛在語義分析算法
17.2.1 矩陣奇異值分解算法
17.2.2 例子
17.3 非負矩陣分解算法
17.3.1 非負矩陣分解
17.3.2 潛在語義分析模型
17.3.3 非負矩陣分解的形式化
17.3.4 算法
本章概要
繼續閱讀
習題
參考文獻
第18章 概率潛在語義分析
18.1 概率潛在語義分析模型
18.1.1 基本想法
18.1.2 生成模型
18.1.3 共現模型
18.1.4 模型性質
18.2 概率潛在語義分析的算法
本章概要
繼續閱讀
習題
參考文獻
第19章 馬爾可夫鏈蒙特卡羅法
19.1 蒙特卡羅法
19.1.1 隨機抽樣
19.1.2 數學期望估計
19.1.3 積分計算
19.2 馬爾可夫鏈
19.2.1 基本定義
19.2.2 離散狀態馬爾可夫鏈
19.2.3 連續狀態馬爾可夫鏈
19.2.4 馬爾可夫鏈的性質
19.3 馬爾可夫鏈蒙特卡羅法
19.3.1 基本想法
19.3.2 基本步驟
19.3.3 馬爾可夫鏈蒙特卡羅法與統計學習
19.4 Metropolis-Hastings算法
19.4.1 基本原理
19.4.2 Metropolis-Hastings算法
19.4.3 單分量Metropolis-Hastings算法
19.5 吉佈斯抽樣
19.5.1 基本原理
19.5.2 吉佈斯抽樣算法
19.5.3 抽樣計算
本章概要
繼續閱讀
習題
參考文獻
第20章 潛在狄利克雷分配
20.1 狄利克雷分佈
20.1.1 分佈定義
20.1.2 共軛先驗
20.2 潛在狄利克雷分配模型
20.2.1 基本想法
20.2.2 模型定義
20.2.3 概率圖模型
20.2.4 隨機變量序列的可交換性
20.2.5 概率公式
20.3 LDA的吉佈斯抽樣算法
20.3.1 基本想法
20.3.2 算法的主要部分
20.3.3 算法的後處理
20.3.4 算法
20.4 LDA的變分EM算法
20.4.1 變分推理
20.4.2 變分EM算法
20.4.3 算法推導
20.4.4 算法總結
本章概要
繼續閱讀
習題
參考文獻
第21章 PageRank算法
21.1 PageRank的定義
21.1.1 基本想法
21.1.2 有向圖和隨機遊走模型
21.1.3 PageRank的基本定義
21.1.4 PageRank的一般定義
21.2 PageRank的計算
21.2.1 迭代算法
21.2.2 冪法
21.3.3 代數算法
本章概要
繼續閱讀
習題
參考文獻
第22章 無監督學習方法總結
22.1 無監督學習方法的關系和特點
22.1.1 各種方法之間的關系
22.1.2 無監督學習方法
22.1.3 基礎及其學習方法
22.2 話題模型之間的關系和特點
參考文獻
附錄A 梯度下降法
附錄B 牛頓法和擬牛頓法
附錄C 拉格朗日對偶性
附錄D 矩陣的基本子空間
附錄E KL散度的定義和狄利克雷分佈的性質
索引
網盤地址:
書友評論
- 肉粽的評論 比周志華的西瓜書強瞭不是一星半點,循循善誘,簡直打開瞭任督二脈,強推
- 王小二的評論 已然98一本瞭 不知道是知識漲價瞭 還是出版業無奈的掙紮 隻能理解著去圖書館搶資源瞭。
- Dorian的評論 中式教材,不適合初學者讀。所有算法都是隻講道理,不講故事,如果不瞭解背景故事,真的很難明白到底這些算法能拿來幹嘛。
- 馬臉兔砸的評論 沒有第一版便攜瞭,新增內容大部分是nlp相關,太基礎瞭,失落
- Salooloo的評論 國內最好的教材。
- 搶蘿卜的喵的評論 統計學習教材經典中的經典
- myosotis的評論 特別棒,絕大部分部分內容清晰明瞭,還有非常豐富的擴展閱讀,不過大多都是傳統機器學習內容,如果再加上一本專門講神經網絡深度學習的書的話才算是把目前主流機器學習內容學全。
- Coelacanth的評論 很中國特色的”參考書“。相當言簡意賅,第二版加瞭無監督學習部分以後直接厚瞭快一倍……這本書個人覺得適合拿來回顧夯實基礎串聯知識點。有基礎以後再讀,按著書上思路自己動手推一遍的收獲會相當大。至於拿來入門還是算瞭吧……說起來入門機器學習幹嘛非要扣參考書呢……跟著課程看幻燈片做課後習題難道不是要舒服許多嗎。
- 理性的光輝的評論 嚴謹,詳實,全面,對於想瞭解統計學在機器學習中的應用的人而言是一本較好的參考書
- abyzsin的評論 看到第十六章主成分分析,後面的部分一方面有點難,一方面由於其他原因很難再堅持看下去瞭。但是個人覺得本書要比西瓜書講原理要好很多,希望想走相關領域的兄弟姐妹早早入坑。
- 祝天宏的評論 讀完前16章,經典算法推導詳實,與西瓜書相比在深度上勝之,但廣度不及
- JFan的評論 很中國
- RJW的評論 看過的最棒的機器學習入門書瞭。千萬不要被公式嚇到,一步一步慢慢來,會搞出來的。
- 時間戳的評論 好書
- olostin的評論 沒有第一版驚艷。手推SVM是八股,但真的挺好玩的。
- 夜行山人的評論 偏入門但又很難啃得動的機器學習統計算法書,不過教材確實更好理解。
- The Thing的評論 相比第一版 增加瞭很多新內容 更加豐富瞭
- 量子態的觀測者的評論 從第二篇無監督學習開始新內容
- 的評論 主要看瞭新增的無監督學習部分,說實話新增加的內容有點兒水,價格倒是漲瞭不少。
- 芩年的評論 擁有 但沒仔細讀