智能風控:原理 算法與工程實踐
作者:梅子行
分類:勵志
ISBN:9787111643531
出版時間:2020-1-1
出版社:機械工業出版社
標簽: 金融
內容簡介
內容介紹
本書基於Python全面介紹瞭機器學習在信貸風控領域的應用與實踐,從原理、算法與工程實踐3個維度全面展開,包含21種實用算法和26個解決方案。
作者是智能風控、人工智能和算法領域的資深專傢,曾在多加知名金融科技企業從事風控算法方面的研究與實踐,經驗豐富,本書得到瞭風控領域9位專傢的高度評價。
全書一共8章,每個章節都由問題、算法、案例三部分組成,具有系統性和實戰性。
第1-2章講解瞭信貸業務的基礎知識以及常用的規則引擎、信用評估引擎的建模方法。
第3章以項目冷啟動為背景,講解瞭風控領域應用廣泛的遷移學習方法。
第4-5章介紹瞭幸存者偏差與不均衡學習中所使用的無監督學習與半監督學習方法。
第6章闡述瞭無監督的異常識別算法,該算法常用於數據清洗與冷啟動項目,是反欺詐引擎中常用的個體欺詐檢測方法。
第7章分享瞭一些經作者實踐證明效果較好的模型優化方法,並對模型融合的思路進行瞭較為詳細的介紹。
第8章重點講解瞭知識圖譜相關的復雜網絡基礎知識及網絡表示學習方法,其中的社區發現算法常用於團夥欺詐檢測。此外,本章中的部分方法對信用評估模型的優化也有很大幫助。
章節介紹
推薦序
前言
第1章 風控建模與規則挖掘 / 1
1.1 信貸與風險 / 1
1.1.1 信貸業務與互聯網金融風控體系 / 1
1.1.2 信貸風險與控制 / 4
1.2 工業建模流程 / 5
1.2.1 抽象業務 / 6
1.2.2 定義標簽 / 6
1.2.3 樣本選取 / 7
1.2.4 特征工程與模型調優 / 9
1.2.5 上線監控與評估報表 / 10
1.3 規則挖掘方案 / 13
1.4 本章小結 / 20
第2章 集成模型評分卡 / 21
2.1 特征工程解析 / 21
2.1.1 特征與模型 / 22
2.1.2 信用模型的特征 / 22
2.2 特征衍生方案 / 24
2.3 離散處理 / 27
2.3.1 one-hot編碼 / 27
2.3.2 WOE編碼 / 28
2.4 迭代特征篩選方案 / 33
2.5 自動化調參 / 38
2.5.1 自動化調參策略 / 38
2.5.2 參數搜索方案 / 39
2.5.3 調參框架搭建 / 40
2.6 遞歸特征刪除方案 / 43
2.7 評分卡制作 / 44
2.7.1 邏輯回歸評分卡 / 45
2.7.2 集成模型的評分映射 / 55
2.7.3 針對業務改寫評價函數 / 59
2.8 本章小結 / 60
第3章 遷移學習與冷啟動 / 61
3.1 遷移學習基礎 / 61
3.1.1 應用場景 / 62
3.1.2 概念介紹 / 62
3.2 遷移學習方法論 / 63
3.2.1 三類常見算法 / 63
3.2.2 遷移的實現方法 / 64
3.3 少量有標簽樣本的遷移方案 / 65
3.3.1 TrAdaBoost模型 / 65
3.3.2 跨場景遷移模型 / 67
3.4 無標簽樣本遷移之JDA / 76
3.4.1 JDA模型 / 76
3.4.2 模型應用 / 79
3.5 無標簽樣本遷移之DTELM / 80
3.5.1 ELM模型 / 81
3.5.2 DTELM模型 / 82
3.5.3 模型應用 / 84
3.6 遷移樣本篩選方案 / 88
3.6.1 背景介紹 / 88
3.6.2 算法框架概覽 / 88
3.6.3 搭建融合框架 / 89
3.7 本章小結 / 93
第4章 幸存者偏差 / 95
4.1 幸存者偏差的含義 / 95
4.2 增量學習 / 96
4.3 生成對抗網絡 / 97
4.3.1 GAN模型介紹 / 98
4.3.2 GAN與幸存者偏差 / 99
4.4 高斯混合模型 / 100
4.4.1 GMM算法原理 / 101
4.4.2 GMM簡單應用 / 103
4.4.3 GMM中的概率模型 / 104
4.4.4 GMM樣本生成 / 107
4.5 信息準則 / 110
4.5.1 赤池信息準則 / 110
4.5.2 貝葉斯信息準則 / 111
4.5.3 AIC與BIC比較 / 111
4.6 本章小結 / 112
第5章 不均衡學習 / 113
5.1 樣本不均衡 / 113
5.2 代價敏感加權方案 / 114
5.3 插值過采樣方案 / 115
5.3.1 SMOTE算法 / 115
5.3.2 過采樣算法實踐 / 116
5.4 半監督學習方案 / 121
5.4.1 前提假設 / 122
5.4.2 S3VM / 122
5.4.3 LP / 127
5.5 本章小結 / 130
第6章 異常檢測 / 132
6.1 離群點與欺詐檢測 / 133
6.2 z-score檢驗 / 134
6.3 LOF異常檢測法 / 134
6.3.1 原理與算法流程 / 135
6.3.2 LOF樣本清洗方案 / 137
6.4 IF異常檢測法 / 139
6.4.1 原理與算法流程 / 139
6.4.2 PreA模型與冷啟動 / 141
6.5 本章小結 / 144
第7章 模型優化 / 145
7.1 多損失函數分段預測 / 145
7.1.1 兩種損失函數 / 146
7.1.2 融合流程 / 146
7.2 樹模型特征衍生 / 149
7.2.1 GBDT離散化 / 149
7.2.2 融合方案詳解 / 150
7.2.3 特征衍生細節 / 151
7.2.4 案例 / 151
7.3 時間序列建模 / 160
7.3.1 RNN / 160
7.3.2 LSTM / 163
7.3.3 門控結構 / 164
7.3.4 LSTM行為評分卡案例 / 166
7.4 高維稀疏數據建模 / 170
7.4.1 算法原理 / 171
7.4.2 算法應用 / 172
7.5 模型融合 / 173
7.5.1 模型融合基礎 / 173
7.5.2 模型篩選 / 174
7.5.3 業務應用方案 / 181
7.6 本章小結 / 183
第8章 知識圖譜 / 184
8.1 復雜網絡基礎 / 184
8.2 中心度與相似性 / 187
8.3 節點分類 / 193
8.3.1 樸素節點分類 / 193
8.3.2 鄰節點加權投票 / 195
8.3.3 一致性標簽傳播 / 197
8.4 社區發現算法 / 200
8.4.1 基礎概念 / 200
8.4.2 Girvan-Newman算法 / 201
8.4.3 Louvain算法 / 202
8.4.4 社區評估 / 204
8.5 網絡表示學習 / 206
8.5.1 矩陣分解 / 207
8.5.2 節點嵌入 / 210
8.6 圖卷積神經網絡 / 215
8.6.1 卷積神經網絡 / 215
8.6.2 傅裡葉變換 / 217
8.6.3 拉普拉斯算子 / 219
8.6.4 GCN中的圖卷積 / 221
8.7 本章小結 / 225
參考文獻 / 226
網盤地址:
書友評論
- wiz的評論 實際上,目前市面上關於風控算法的書,內容的廣度和深度都比較缺乏。如果能夠從更高的視角去構建整個風控安全體系,把整體的面鋪開,從規則策略開始,講到模型算法,再到更加智能化自動化的方案,這才具備廣度;如果涉及每一類核心算法的基本概念、關鍵推導、工業應用和學術界研究進展,這才具備深度。希望不久的將來,有這樣的大作可以拜讀。
- asdf的評論 和國內兩個名詞做題目的書一樣,抄抄博客就是書。發現這行的人都神神叨叨,說不通瞭就是業務。學成瞭敢去p2p就業麼。不過可以說是××系p100,有些話說多瞭自己就信瞭。#什麼是敬畏#你行你上#網紅經濟
- Nyktalgia的評論 概念性的都寫瞭一遍吧,實操比較少~
- 淳平的評論 大多都是講個很淺的概念,但優點是覆蓋的面很廣。要吸收消化還是要碼一遍代碼
- SHOUGOUGOU的評論 資深從業者寫的,有幹貨
- Locke的評論 風控的一些行業經驗,雖然在其他ML算法崗來看有些野路子的感覺,但風控這邊的一些獨立思考和經驗還是有可借鑒的地方的。
- 小知識點的評論 整體來說,每個階段劃分的不是很清醒,前面大部分都涉及到貸前的模型,後面的知識圖譜涉及到比較多貸後。從模型的角度來說,還是涉及到一部分常用的模型的,但其實對風控涉及的不是特別深,比較適合新手入門吧。
- Ethan井的評論 這是一本實操性非常強的書,作者實戰經驗豐富,書中對一些細節看似簡單的修改,就能收到大不相同的效果,很受啟發。
- 切克鬧的評論 文中的算法講解基本來自於各個博客和西瓜書,敢情現在抄抄抄就能出書瞭。另外,評論裡的水軍也刷得太明顯瞭。
- 都閑人的評論 瞭解一下
- 鹿晗粉絲的評論 相比於市面上海量的濫竽充數的機器學習書,這本書是相當有良心的瞭。
- Utopia的評論 版式設計很用心,業務流程和算法配瞭漫畫風格的大圖,還有代碼高亮,爽心悅目,讀起來非常爽。當然,這本書的幹貨也多,推薦。
- 二樓讀書人的評論 對這本書關註瞭很久,終於第二時間拿到手,無論是內容還是配圖設計,都超預期。梅老師非常熱心,解答瞭我的好幾個問題。希望借這本書在風控這條路上更進一步
- 迷糊的評論 作為一本技術書,沒有堆砌專業術語,配圖很有愛,理論與實踐兼顧,作者的文字是比較平實的那種,讀起來沒有壓力。推薦給對風控有初步瞭解的同學。