深度學習與圖像識別:原理與實踐
作者:魏溪含 塗銘 張修鵬 著
分類:科技
ISBN:9787111630036
出版時間:2019-7-10
出版社:機械工業出版社
標簽: 深度學習 計算機 機器學習 好書,值得一讀 科技 人工智能 python
內容簡介
這是一部從技術原理、算法和工程實踐3個維度系統講解圖像識別的著作,由阿裡巴巴達摩院算法專傢、阿裡巴巴技術發展專傢、阿裡巴巴數據架構師聯合撰寫。
在知識點的選擇上,本書廣度和深度兼顧,既能讓完全沒有基礎的讀者迅速入門,又能讓有基礎的讀者深入掌握圖像識別的核心技術;在寫作方式上,本書避開瞭復雜的數學公式及其推導,從問題的前因後果 、創造者的思考過程,利用簡單的數學計算來做模型分析和講解,通俗易懂。更重要的是,本書不僅僅是聚焦於技術,而是將重點放在瞭如何用技術解決實際的業務問題。
全書一共13章:
第1-2章主要介紹瞭圖像識別的應用場景、工具和工作環境的搭建;
第3-6章詳細講解瞭圖像分類算法、機器學習、神經網絡、誤差反向傳播等圖像識別的基礎技術及其原理;
第7章講解瞭如何利用PyTorch來實現神經網絡的圖像分類,專註於實操,是從基礎向高階的過渡;
第8-12章深入講解瞭圖像識別的核心技術及其原理,包括卷積神經網絡、目標檢測、分割、產生式模型、神經網絡可視化等主題;
第13章從工程實踐的角度講解瞭圖像識別算法的部署模式。
購買本書的讀者請在http://www.hzcourse.com/web/refbook/detail/8376/226
下載源代碼
章節介紹
前言
第1章 機器視覺在行業中的應用1
1.1 機器視覺的發展背景1
1.1.1 人工智能1
1.1.2 機器視覺2
1.2 機器視覺的主要應用場景3
1.2.1 人臉識別3
1.2.2 視頻監控分析4
1.2.3 工業瑕疵檢測5
1.2.4 圖片識別分析6
1.2.5 自動駕駛/駕駛輔助7
1.2.6 三維圖像視覺8
1.2.7 醫療影像診斷8
1.2.8 文字識別9
1.2.9 圖像/視頻的生成及設計9
1.3 本章小結10
第2章 圖像識別前置技術11
2.1 深度學習框架11
2.1.1 Theano11
2.1.2 Tensorflow12
2.1.3 MXNet13
2.1.4 Keras13
2.1.5 PyTorch14
2.1.6 Caffe14
2.2 搭建圖像識別開發環境15
2.2.1 Anaconda15
2.2.2 conda18
2.2.3 Pytorch的下載與安裝19
2.3 Numpy使用詳解20
2.3.1 創建數組20
2.3.2 創建Numpy數組22
2.3.3 獲取Numpy屬性24
2.3.4 Numpy數組索引25
2.3.5 切片25
2.3.6 Numpy中的矩陣運算26
2.3.7 數據類型轉換27
2.3.8 Numpy的統計計算方法28
2.3.9 Numpy中的arg運算29
2.3.10 FancyIndexing29
2.3.11 Numpy數組比較30
2.4 本章小結31
第3章 圖像分類之KNN算法32
3.1 KNN的理論基礎與實現32
3.1.1 理論知識32
3.1.2 KNN的算法實現33
3.2 圖像分類識別預備知識35
3.2.1 圖像分類35
3.2.2 圖像預處理36
3.3 KNN實戰36
3.3.1 KNN實現MNIST數據分類36
3.3.2 KNN實現Cifar10數據分類41
3.4 模型參數調優44
3.5 本章小結48
第4章 機器學習基礎49
4.1 線性回歸模型49
4.1.1 一元線性回歸50
4.1.2 多元線性回歸56
4.2 邏輯回歸模型57
4.2.1 Sigmoid函數58
4.2.2 梯度下降法59
4.2.3 學習率的分析61
4.2.4 邏輯回歸的損失函數63
4.2.5 Python實現邏輯回歸66
4.3 本章小結68
第5章 神經網絡基礎69
5.1 神經網絡69
5.1.1 神經元70
5.1.2 激活函數72
5.1.3 前向傳播76
5.2 輸出層80
5.2.1 Softmax80
5.2.2 one-hotencoding82
5.2.3 輸出層的神經元個數83
5.2.4 MNIST數據集的前向傳播83
5.3 批處理85
5.4 廣播原則87
5.5 損失函數88
5.5.1 均方誤差88
5.5.2 交叉熵誤差89
5.5.3 Mini-batch90
5.6 最優化91
5.6.1 隨機初始化91
5.6.2 跟隨梯度(數值微分)92
5.7 基於數值微分的反向傳播98
5.8 基於測試集的評價101
5.9 本章小結104
第6章 誤差反向傳播105
6.1 激活函數層的實現105
6.1.1 ReLU反向傳播實現106
6.1.2 Sigmoid反向傳播實現106
6.2 Affine層的實現107
6.3 Softmaxwithloss層的實現108
6.4 基於數值微分和誤差反向傳播的比較109
6.5 通過反向傳播實現MNIST識別111
6.6 正則化懲罰114
6.7 本章小結115
第7章 PyTorch實現神經網絡圖像分類116
7.1 PyTorch的使用116
7.1.1 Tensor116
7.1.2 Variable117
7.1.3 激活函數118
7.1.4 損失函數120
7.2 PyTorch實戰122
7.2.1 PyTorch實戰之MNIST分類122
7.2.2 PyTorch實戰之Cifar10分類125
7.3 本章小結128
第8章 卷積神經網絡129
8.1 卷積神經網絡基礎129
8.1.1 全連接層129
8.1.2 卷積層130
8.1.3 池化層134
8.1.4 批規范化層135
8.2 常見卷積神經網絡結構135
8.2.1 AlexNet136
8.2.2 VGGNet138
8.2.3 GoogLeNet140
8.2.4 ResNet142
8.2.5 其他網絡結構144
8.3 VGG16實現Cifar10分類145
8.3.1 訓練146
8.3.2 預測及評估149
8.4 本章小結152
8.5 參考文獻152
第9章 目標檢測153
9.1 定位+分類153
9.2 目標檢測155
9.2.1 R-CNN156
9.2.2 Fast R-CNN160
9.2.3 Faster R-CNN162
9.2.4 YOLO165
9.2.5 SSD166
9.3 SSD實現VOC目標檢測167
9.3.1 PASCAL VOC數據集167
9.3.2 數據準備170
9.3.3 構建模型175
9.3.4 定義Loss178
9.3.5 SSD訓練細節181
9.3.6 訓練186
9.3.7 測試189
9.4 本章小結190
9.5 參考文獻191
第10章 分割192
10.1 語義分割193
10.1.1 FCN193
10.1.2 UNet實現裂紋分割196
10.1.3 SegNet209
10.1.4 PSPNet210
10.2 實例分割211
10.2.1 層疊式212
10.2.2 扁平式212
10.3 本章小結213
10.4 參考文獻214
第11章 產生式模型215
11.1 自編碼器215
11.2 對抗生成網絡215
11.3 DCGAN及實戰217
11.3.1 數據集218
11.3.2 網絡設置220
11.3.3 構建產生網絡221
11.3.4 構建判別網絡223
11.3.5 定義損失函數224
11.3.6 訓練過程224
11.3.7 測試227
11.4 其他GAN230
11.5 本章小結235
11.6 參考文獻235
第12章 神經網絡可視化236
12.1 卷積核236
12.2 特征層237
12.2.1 直接觀測237
12.2.2 通過重構觀測239
12.2.3 末端特征激活情況243
12.2.4 特征層的作用244
12.3 圖片風格化245
12.3.1 理論介紹245
12.3.2 代碼實現247
12.4 本章小結255
12.5 參考文獻255
第13章 圖像識別算法的部署模式257
13.1 圖像算法部署模式介紹257
13.2 實際應用場景和部署模式的匹配262
13.3 案例介紹264
13.4 本章小結265
網盤地址:
書友評論
- 傑尼惡霸的評論 別的錯我都能忍,可是說好的源碼的github地址是錯的,這個就很過分瞭
- 花灑灑的評論 模型超多!模型超多!模型超多!重要的問題說三遍!這本書真的是我讀過的最好讀的瞭,一點都不費力氣,都是具現化的模型,也沒有很復雜的那種滿篇的計算過程和代碼,基本上是從思想上培育架構的,對於我這種半吊子來說真是太舒服瞭。
- 迷信的鴿子的評論 8月8號的評論點進個人主頁一看全是該出版社的五星評論,這套叢書好多都是有水軍在刷分,還賣的死貴死貴。
- 喜努比的評論 (讀文學書沒用,確實沒用。沒用就沒用在讓你覺得自己比別人有文化。但其實不過是比普通人多知道一些“就算不知道也餓不死”的事實而已。)而讀專業書有用,真的有用。有用就有用在讀瞭半天,能發現自己真的是個傻子。人還是貴在自知。我天天這樣讀到半夜,今天突然頓悟瞭:原來我沒長腦子。
- DreamAndDead的評論 不夠深入,應用樣例值得一看
- xiaopangpang的評論 很貴,花瞭近100塊,在學校時候買的,光看達摩院招牌瞭。pytorch入門也可以,稍微瞭解下深度學習也還行,代碼還好,就是有些小差錯,少瞭import或者少瞭些function註明。
- 這裡沒有一言堂的評論 書讀完瞭,內容非常不錯,給五星。前半部分內容淺顯易懂,很適合入門,後半部分內容比較有深度,貼合實際的實戰場景。
- 康生的評論 真的不行,就這本書還能上8我看是水軍刷上去的吧。首先講得很淺,其次沒有把原理講清楚,沒有重點,隻是流水賬式的堆砌步驟和公式。,最後整本書感覺像是東拼西湊出來的。
- Cursed的評論 代碼錯誤先不提,源碼地址也錯瞭,唯一可取就是講解的還行
- 王見現的評論 這本書用代碼完整實現瞭各種深度學習的算法,非常簡潔明瞭,讓人看過就會想動手實操,優秀的作品。
- Teemo的評論 買瞭塗銘老師寫的《Python自然語言裡處理實戰》,內容不錯,這本書也果斷買瞭,內容質量又上瞭一個新臺階,已經成為塗銘老師的忠粉瞭。
- 天天好心情的評論 書收到瞭,還沒來得及看,彩色印刷,很精致,很漂亮,紙張也不錯,難怪價格有點貴,希望內容不要讓我失望。
- Ethan井的評論 讀著讀著,發現作者在圖像識別領域都是好年輕的“老司機”啊!字裡行間充滿瞭豐富的工程經驗,而且越往後越深度挖掘瞭深度學習的內涵,佩服佩服!
- 千明的評論 日常生活中越來越多的應用場景中用到瞭深度學習,正好想看看相關的圖書充充電。這本書是圖像識別領域的交叉作品,原理算法和實踐結合得挺好,哪怕是當個案例書讀讀都比較長見識,挺不錯的。
- 小超的評論 這本書還算不錯,但是源代碼網站打不開……
- sissi的評論 這本書有些部分的內容講得有些淺顯,可能是照顧到沒有太多基礎的讀者,不過並不會覺得幼稚。對圖像識別的各種應用場景以及神經網絡的分類都進行瞭詳述,算是詳略得當吧,有基礎的讀者建議對照目錄挑著感興趣的模塊來看,實戰性蠻強的。
- 溫洪亮的評論 作為一個圖像識別方面的新人,感覺這本書就是為我量身定做的,看起來毫無障礙。
- plugin1689的評論 書的前半部分是抄襲的, 後面更是各種examples拼湊起來, 但是你倒提供個有效的github鏈接啊, 難道作者自己心虛不成? 各種解釋不清, 比如第十章分割用瞭一個馬路crack detection的數據集, seg文件在哪用起來的? 這麼重要的mask提都沒提, 怎麼讓人復現, 那麼薄的一本書賣那麼貴, 還到處抄襲, 到處錯誤, 到處缺這缺那, 騙錢而已…
- 薑湖成哥的評論 絕對不推薦的一本書。。。 寫的真的很一般的一本書,價格還死貴的。類似的書這兩年沒有出版100本,至少也出版瞭幾十本。第一章簡介,網上隨便搜一下博客就很多;第二章隻要是深度學習、機器學習的書都會講一點(框架、numpy);第三章KNN算法,這個很多深度學習實戰的書基本上都會講到;4、5、6三章基礎內容,機器學習、深度學習的書都會介紹;後面100來頁的8、9、10、11、12、13章基本上也是介紹現有的一些論文、框架、實現方法等,沒有自我的什麼幹貨。估計國內高校勤奮一點的研究生、博士生整整論文也能寫出類似的東東。 達摩院出這樣的書,看不出跟網上培訓機構的深度學習、機器視覺視頻課程有什麼大的區別。
- Coxswain的評論 這本書下面日期在2019-08-08左右的評論都不用看瞭,水軍一票