
Python數(shù)據(jù)挖掘和分析培訓
Python基礎(chǔ)和數(shù)據(jù)科學基礎(chǔ)
1. Python語言和開發(fā)環(huán)境簡介
2. 數(shù)據(jù)科學概述
3. 數(shù)據(jù)分析流程和步驟
4. 數(shù)據(jù)獲取路徑
5. 法律法規(guī)
6. Python語言和數(shù)據(jù)科學
7. 理解基本的字符串函數(shù)
8. 選擇合適的數(shù)據(jù)結(jié)構(gòu)
9. 通過列表推導(dǎo)式理解列表
10. 使用計數(shù)器,使用文件和網(wǎng)絡(luò)
11. 使用正則表達式實現(xiàn)模式匹配
12. globbing文件名與其他字符串
13. Pickling和Unpickling數(shù)據(jù)
14. 文本數(shù)據(jù)的處理
15. 數(shù)據(jù)庫數(shù)據(jù)的處理
16. 通用函數(shù)和各類聚合函數(shù)
Python數(shù)據(jù)分析基礎(chǔ)
1. 搭建Python開發(fā)平臺
2. 所要考慮的問題
3. 基礎(chǔ)平臺的搭建
4. Python使用入門
5. 運行方式
6. 基本命令
7. 數(shù)據(jù)結(jié)構(gòu)
8. 庫的導(dǎo)入與添加
9. Python數(shù)據(jù)分析工具
10. ?Numpy
11. ?Scipy
12. ?Matplotlib
13. ?Pandas
14. ?StatsModels
15. ?Scikit-Learn
16. ?Keras
17. ?Gensim
數(shù)據(jù)探索
1. 數(shù)據(jù)質(zhì)量分析
2. 缺失值分析
3. 異常值分析
4. 一致性分析
5. 數(shù)據(jù)特征分析
6. 分布分析
7. 對比分析
8. 統(tǒng)計量分析
9. 周期性分析
10. 貢獻度分析
11. 相關(guān)性分析
12. Python主要數(shù)據(jù)探索函數(shù)
13. 基本統(tǒng)計特征函數(shù)
14. 拓展統(tǒng)計特征函數(shù)
15. 統(tǒng)計作圖函數(shù)
數(shù)據(jù)預(yù)處理
1. 數(shù)據(jù)清洗60
2. 缺失值處理60
3. 異常值處理64
4. 數(shù)據(jù)集成64
5. 實體識別64
6. 冗余屬性識別65
7. 數(shù)據(jù)變換65
8. 簡單函數(shù)變換65
9. 規(guī)范化66
10. 連續(xù)屬性離散化68
11. 屬性構(gòu)造70
12. 小波變換71
13. 數(shù)據(jù)規(guī)約74
14. 屬性規(guī)約74
15. 數(shù)值規(guī)約77
16. Python主要數(shù)據(jù)預(yù)處理函數(shù)80
數(shù)據(jù)挖掘建模
1. 分類與預(yù)測83
2. 實現(xiàn)過程83
3. 常用的分類與預(yù)測算法84
4. 回歸分析85
5. 決策樹89
6. 人工神經(jīng)網(wǎng)絡(luò)95
7. 5.1.6?分類與預(yù)測算法評價100
8. 5.1.7?Python分類預(yù)測模型特點103
9. 5.2?聚類分析104
10. 5.2.1?常用聚類分析算法104
11. 5.2.2?K-Means聚類算法105
12. 5.2.3?聚類分析算法評價111
13. 5.2.4?Python主要聚類分析算法111
14. 5.3?關(guān)聯(lián)規(guī)則113
15. 5.3.1?常用關(guān)聯(lián)規(guī)則算法114
16. 5.3.2?Apriori算法114
17. 5.4?時序模式119
18. 5.4.1?時間序列算法120
19. 5.4.2?時間序列的預(yù)處理120
20. 5.4.3?平穩(wěn)時間序列分析122
21. 5.4.4?非平穩(wěn)時間序列分析124
22. 5.4.5?Python主要時序模式算法132
23. 5.5?離群點檢測134
24. 5.5.1?離群點檢測方法135
25. 5.5.2?基于模型的離群點檢測方法136
26. 5.5.3?基于聚類的離群點檢測方法138
數(shù)據(jù)挖掘?qū)崙?zhàn)項目一—客戶價值分析
1. 背景與挖掘目標164
2. 7.2?分析方法與過程166
3. 7.2.1?數(shù)據(jù)抽取168
4. 7.2.2?數(shù)據(jù)探索分析168
5. 7.2.3?數(shù)據(jù)預(yù)處理169
6. 7.2.4?模型構(gòu)建173
數(shù)據(jù)挖掘?qū)崙?zhàn)項目二--電子商務(wù)網(wǎng)站用戶行為分析及服務(wù)推薦
1. 背景與挖掘目標238
2. 12.2?分析方法與過程240
3. 12.2.1?數(shù)據(jù)抽取242
4. 12.2.2?數(shù)據(jù)探索分析244
5. 12.2.3?數(shù)據(jù)預(yù)處理251
6. 12.2.4?模型構(gòu)建256
協(xié)議分析
1. Web端協(xié)議分析
2. 網(wǎng)頁登錄POST分析
3. 隱藏表單分析
4. 加密數(shù)據(jù)分析
5. 驗證碼問題
6. IP代理
7. Cookie登錄
8. 傳統(tǒng)驗證碼識別
9. 人工打碼
10. 滑動驗證碼
11. PC客戶端抓包分析
12. HTTP Analyzer簡介
13. 蝦米音樂PC端API實戰(zhàn)分析
14. App抓包分析
15. Wireshark簡介
16. 酷我聽書App端API實戰(zhàn)分析
17. API爬蟲:爬取mp3資源信息
Scrapy爬蟲框