今天高清视频免费播放动漫,天天爽夜爽免费精品视频,精品国产免费第一区二区,《爆乳女教师BD高清》

當前位置: 首頁 > 內訓課程 > 課程內容
廣告1
相關熱門公開課程更多 》
相關熱門內訓課程更多 》
相關最新下載資料

Python實現大數據挖掘技術培訓

課程編號:32156

課程價格:¥26000/天

課程時長:5 天

課程人氣:384

行業類別:行業通用     

專業類別:大數據 

授課講師:傅一航

  • 課程說明
  • 講師介紹
  • 選擇同類課
【培訓對象】
業務支持部、IT系統部、大數據系統開發部、大數據分析中心、網絡運維部等相關技術人員。

【培訓收益】


第一部分:Python語言基礎
目的:掌握基本的Python編程思想與編程語句,熟悉常用數據結構的操作
1、Python簡介
2、開發環境搭建
Python的安裝
擴展庫的安裝
3、掌握Python的簡單數據類型
 字符串的使用及操作
整數、浮點數
4、掌握基本語句:
if、while、for、print等
基本運算:
函數定義、參數傳遞、返回值
5、掌握復雜的數據類型:列表/元組
列表操作:訪問、添加、修改、刪除、排序
列表切片、復制等
列表相關的函數、方法
元組的應用
6、復雜數據類型:字典
創建、訪問、修改、刪除、遍歷
字典函數和方法
7、復雜數據類型:集合
8、掌握面向對象編程思想
創建類、繼承類
模塊
9、函數定義、參數傳遞、返回值
10、標準庫與擴展庫的導入
11、異常處理:try-except塊
演練:基本的Python編程語句

第二部分:Python擴展庫
目的:掌握數據集結構及基本處理方法,進一步鞏固Python語言
1、數據挖掘常用擴展庫介紹
Numpy數組處理支持
Scipy矩陣計算模塊
Matplotlib數據可視化工具庫
Pandas數據分析和探索工具
StatsModels統計建模庫
Scikit-Learn機器學習庫
Keras深度學習(神經網絡)庫
Gensim文本挖掘庫
2、數據集讀取與操作:讀取、寫入
讀寫文本文件
讀寫CSV文件
讀寫Excel文件
從數據庫獲取數據集
3、數據集的核心數據結構(Pandas數據結構)
DataFrame對象及處理方法
Series對象及處理方法
演練:用Python實現數據的基本統計分析功能

第三部分:數據可視化處理
目的:掌握作圖擴展庫,實現數據可視化
1、常用的Python作圖庫
Matplotlib庫
Pygal庫
2、實現分類匯總
演練:按性別統計用戶人數
演練:按產品+日期統計各產品銷售金額
3、各種圖形的畫法
直方圖
餅圖
折線圖
散點圖
4、繪圖的美化技巧
演練:用Python庫作圖來實現產品銷量分析,并可視化

第四部分:數據理解和數據準備
目的:掌握數據預處理的基本環節,以及Python的實現
1、數據預處理
異常值處理:3σ準則,IQR準則
缺失值插補:均值、拉格朗日插補
數據篩選/抽樣
數據的離散化處理
變量變換、變量派生
2、數據的基本分析
相關分析:原理、公式、應用
方差分析:原理、公式、應用
卡方分析:原理、公式、應用
主成分分析:降維
案例:用Python實現數據預處理及數據準備

第五部分:分類預測模型實戰
1、常見分類預測的模型與算法
2、如何評估分類預測模型的質量
查準率
查全率
ROC曲線
3、邏輯回歸分析模型
邏輯回歸的原理
邏輯回歸建模的步驟
邏輯回歸結果解讀
案例:用sklearn庫實現銀行貸款違約預測
4、決策樹模型
決策樹分類的原理
決策樹的三個關鍵問題
決策樹算法與實現
案例:電力竊漏用戶自動識別
5、決策樹算法
最優屬性選擇算法:ID3、ID4.0、ID5.0
連續變量分割算法
樹剪枝:預剪枝、后剪枝
6、人工神經網絡模型(ANN)
神經網絡概述
神經元工作原理
常見神經網絡算法(BP、LM、RBF、FNN等)
案例:神經網絡預測產品銷量
7、支持向量機(SVM)
SVM基本原理
維災難與核心函數
案例:基于水質圖像的水質評價
8、貝葉斯分析
條件概率
常見貝葉斯網絡

第六部分:數值預測模型實戰
1、常用數值預測的模型
通用預測模型:回歸模型
季節性預測模型:相加、相乘模型
新產品預測模型:珀爾曲線與龔鉑茲曲線
2、回歸分析概念
3、常見回歸分析類別
4、回歸分析常見算法
梯度上升/下降法
普通最小二乘法OLS
局部加權線性回歸LWLR
嶺回歸(RR)
套索回歸Lasso
ElasticNet回歸
第七部分:聚類分析(客戶細分)實戰
1、客戶細分常用方法
2、聚類分析(Clustering)
聚類方法原理介紹及適用場景
常用聚類分析算法
聚類算法的評價
案例:使用SKLearn實現K均值聚類
案例:使用TSNE實現聚類可視化
3、RFM模型分析
RFM模型,更深入了解你的客戶價值
RFM模型與市場策略
案例:航空公司客戶價值分析

第八部分:關聯規則分析實戰
1、關聯規則概述
2、常用關聯規則算法
Apriori算法
發現頻繁集
生成關聯規則
FP-Growth算法
構建FP樹
提取規則
3、時間序列分析
案例:使用apriori庫實現關聯分析
案例:中醫證型關聯規則挖掘

第九部分:案例實戰
1、客戶流失預測和客戶挽留模型
2、銀行欠貸風險預測模型

結束:課程總結與問題答疑。 

咨詢電話:
0571-86155444
咨詢熱線:
  • 微信:13857108608
聯系我們
<var id="zybgy"><center id="zybgy"></center></var>
<form id="zybgy"><strong id="zybgy"><acronym id="zybgy"></acronym></strong></form>

    <ul id="zybgy"></ul>
  • 主站蜘蛛池模板: 博爱县| 志丹县| 土默特左旗| 柘荣县| 深州市| 修武县| 五家渠市| 赤水市| 福海县| 保德县| 巴彦淖尔市| 中山市| 磴口县| 安康市| 罗田县| 桐城市| 保山市| 光泽县| 甘洛县| 盐池县| 晋州市| 锡林郭勒盟| 信宜市| 商水县| 菏泽市| 石渠县| 紫金县| 嘉祥县| 永定县| 宣化县| 府谷县| 茂名市| 阜新市| 合川市| 阿拉善左旗| 梓潼县| 凌海市| 仁化县| 白银市| 雅安市| 宁陕县|