1.點(dian)擊下面按鈕復制微信號(hao)
點擊復制微信號
上(shang)海威才企業(ye)管理咨(zi)詢有限公司
商(shang)(shang)業(ye)數(shu)(shu)據(ju)(ju)挖掘分析是通過算法(fa)對大量商(shang)(shang)業(ye)數(shu)(shu)據(ju)(ju)進行探索并最終找出(chu)隱藏于數(shu)(shu)據(ju)(ju)背后(hou)的(de)高(gao)價值(zhi)信息(xi)及知識的(de)方法(fa)。數(shu)(shu)據(ju)(ju)挖掘分析方法(fa)是一種商(shang)(shang)業(ye)決策(ce)支持過程,它可以高(gao)度自動化地對企業(ye)商(shang)(shang)業(ye)數(shu)(shu)據(ju)(ju)進行分析,做出(chu)歸納性推理,從(cong)中挖掘出(chu)潛(qian)在模(mo)式規(gui)律,最終幫(bang)助決策(ce)者(zhe)做出(chu)正(zheng)確經營決策(ce)。
近年來,數據挖掘引起了信息產業界的極大關注,其主要原因是企業存在大量可廣泛應用的有效數據,并且迫切需要將這些數據轉換成有用的信息和知識。獲取的信息和知識可以廣泛應用于企業生產經營中的各個方面,包括但不限于生產管理、質量控制、市場分析、營銷管理、運營管理、財務管理、人力管理等……學習該課程可以系統培養數據分析人員的數據挖掘分析能力,幫助企業從數據中:
● 發現數據背后深層(ceng)業務問題
● 找到突破業務(wu)增長瓶(ping)頸的突破口
● 找到業務行為(wei)模(mo)式的最(zui)優解
● 洞察(cha)市場先機以及(ji)經營風險,預(yu)測未來經營走勢
● 掌握數據挖掘分析工具Python的使用方法;
● 掌握Python數據清洗方法;
● 掌握統計分(fen)析方法;
● 掌握多種算法(fa)模型的使用方法(fa);
● 掌握商(shang)業(ye)數據(ju)挖掘分析(xi)實戰方(fang)法。
Python語言基礎(chu):幫助學員掌握Python語言的基礎編程方法,掌握應用Python進行數據加載、數據整理、數據清洗、數據可視化等方法,本節內容為后續內容奠定工具應用基礎;
1. Python編程基礎(Python安裝啟動、數據類型、控制流操作、函數、面向對象編程、文件操作)
2. Python加在數據(向量\矩陣\數組、加在樣本數據集、加在數據文件數據、查詢SQL數據庫)
3. Python數(shu)(shu)據(ju)(ju)整理(li)(創建及瀏覽數(shu)(shu)據(ju)(ju)幀、處理(li)缺失(shi)值、數(shu)(shu)據(ju)(ju)替換、連(lian)接及合(he)并數(shu)(shu)據(ju)(ju)幀、數(shu)(shu)據(ju)(ju)分組聚(ju)合(he)、更(geng)改數(shu)(shu)據(ju)(ju)類型等)
4. Python數據清洗(Numpy應用方法、Pandas應用方法)
5. Python數據可視化(Matplotlib繪圖、Pandas繪圖、Pyecharts交互式圖表繪制)
6. 綜合(he)案(an)例應用
時間序列分析:時間序列分析(xi)是一種重(zhong)要的定(ding)量(liang)預測(ce)分析(xi)方法(fa),本(ben)節將(jiang)幫助學(xue)員系統(tong)掌握時間序列分析(xi)方法(fa);
1. Pandas時(shi)間序列處理
2. 時間序列特征
3. 時間序列模型應用(AR、MA、ARMA、ARIMA)
4. 時間序列建模
5. 綜合案(an)例應用
機器學習與(yu)數據(ju)挖(wa)掘基礎(chu):本(ben)節內容將(jiang)為(wei)大家介紹機器學習與數據挖掘的基礎理(li)論知識,并針對有監督(du)學習算法以及無監督(du)學習算法進(jin)行展開介紹;
1. 機器(qi)學(xue)習(xi)與數(shu)據(ju)挖掘(jue)理論基(ji)礎(chu)(數(shu)據(ju)挖掘(jue)概要(yao)(yao),數(shu)據(ju)挖掘(jue)方(fang)法(fa)論,機器(qi)學(xue)習(xi)基(ji)本思想、常用(yong)算法(fa)分(fen)類、主要(yao)(yao)解(jie)決的問(wen)題,機器(qi)學(xue)習(xi)流(liu)程,模型評價指標(biao),算法(fa)庫(ku)等)
2. 有監督學習算法入門(KNN基本原理,函數詳解,KNN數據結構實現,KNN算法實例)
3. 無監督學習算法入門(聚類分析入門,K-Means快速聚類基本原理,K-Means快速聚類手動實現,K-Means模型評估指標及穩定性討論,輪廓系數)
機器學習與(yu)數據(ju)挖(wa)掘進(jin)階:本(ben)節將(jiang)為(wei)大家(jia)進(jin)一步介紹機器學習與數據挖掘的進(jin)階(jie)算(suan)法以及應用案例;
1. 常用有監督學習算法(線性回歸(線性回歸模型的推導和求解,梯度下降法,帶正則項的線性回歸),邏輯回歸(邏輯回歸的引入,sigmoid函數,模型的求解,多分類問題),貝葉斯(樸素貝葉斯,貝葉斯網絡),SVM支持向量機分類和支持向量機回歸(線性SVM,硬邊距與軟邊距,非線性SVM,核函數的理解)
2. 有監督學習算法進階(決策樹模型(C4.5、C5.0和CART樹,決策樹的可視化),集成學習基礎(集成學習思想,分類,boosting和bagging聯系與區別),集成算法之Bagging類算法(Bagging、隨機森林等),集成算法之Boosting類算法(Adaboosting、GBDT梯度提升樹、XgBoost等)
3. 無監督學習算法進階(聚類分析:DBSCAN密度聚類、層次聚類等,數據降維方法(PCA主成分分析和SVD奇異值分解)
4. 特(te)(te)(te)(te)(te)征(zheng)(zheng)工程與(yu)高級數據預處理(特(te)(te)(te)(te)(te)征(zheng)(zheng)工程的目的與(yu)重要性,特(te)(te)(te)(te)(te)征(zheng)(zheng)預處理(無量(liang)綱化,分(fen)析(xi),編碼(ma),統計編號,特(te)(te)(te)(te)(te)征(zheng)(zheng)組合(he)),特(te)(te)(te)(te)(te)征(zheng)(zheng)構(gou)(gou)(gou)造(zao)(時(shi)間(jian)和時(shi)間(jian)序列特(te)(te)(te)(te)(te)征(zheng)(zheng)構(gou)(gou)(gou)造(zao),空(kong)間(jian)特(te)(te)(te)(te)(te)征(zheng)(zheng)構(gou)(gou)(gou)造(zao),用(yong)戶行為特(te)(te)(te)(te)(te)征(zheng)(zheng)構(gou)(gou)(gou)造(zao),文本特(te)(te)(te)(te)(te)征(zheng)(zheng)構(gou)(gou)(gou)造(zao),圖像特(te)(te)(te)(te)(te)征(zheng)(zheng)構(gou)(gou)(gou)造(zao)),特(te)(te)(te)(te)(te)征(zheng)(zheng)選擇(ze)(特(te)(te)(te)(te)(te)征(zheng)(zheng)選擇(ze)標準,方法分(fen)類),特(te)(te)(te)(te)(te)征(zheng)(zheng)轉換與(yu)特(te)(te)(te)(te)(te)征(zheng)(zheng)學習)
文本分析:文本數據中包含大量有用信息,使用文本分析方法可以有效提取這部分信息為商業決策提供幫助。本節內容將幫助學員系統掌握應用Python進行文本分析的方法;
1. 文(wen)本(ben)分析概述(文(wen)本(ben)數據與文(wen)本(ben)挖掘,自(zi)然語(yu)言處理(li)的(de)流派(pai),文(wen)本(ben)挖掘常見商業應用,自(zi)然語(yu)言處理(li)的(de)層(ceng)次(ci),流程與挑戰)
2. 獲(huo)取文本(ben)數據(語(yu)料(liao)(liao)和語(yu)料(liao)(liao)庫(ku),常見語(yu)料(liao)(liao)庫(ku),語(yu)料(liao)(liao)庫(ku)的獲取,文本(ben)的爬取)
3. 文本向量化(離散化表示方法(詞集模型,詞袋模型,TF-IDF),分布式表示方法(word2vec,glove))
4. 文本分類(lei)與聚類(lei)(百度(du)數據(ju)聚類(lei),新聞分類(lei),情感分類(lei))
5. 基于深度學習的文本分析(深度學習在文本分析中的應用,基于LSTM的情感分析,基于深度學習的新聞分類)
圖像(xiang)處理(li)與分析(xi):除(chu)了文(wen)本(ben)數據(ju)之外,圖像數據(ju)同樣蘊藏了大量有價值的信息與知識(shi),本(ben)節將幫助(zhu)學員系統掌握圖像數據(ju)的處理與分析(xi)方法;
1. 圖像處理基本概念(位圖,灰度,通道,深度,色相,色調,圖像分辨率,顏色模型(RGB,HSI,HSV))
2. 基于OpenCV的圖像處理(OpenCV基本介紹,圖像和視頻的獲取,圖像裁剪、通道獲取邊界填充,圖像計算,調亮圖片,改變圖像大小圖像融合,閾值處理,圖像濾波,圖像運算,圖像金字塔)
3. 圖像特征的理解與計算(顏色特征,形狀特征,LBP特征,HAAR特征,HOG特征)
4. 基于卷(juan)積(ji)神(shen)(shen)經網絡(luo)的圖(tu)像處理(li)(卷(juan)積(ji)神(shen)(shen)經網絡(luo)的模型搭(da)建和訓練,常見卷(juan)積(ji)神(shen)(shen)經網絡(luo)結構分析(xi))
5. 基于(yu)卷積(ji)神(shen)經網(wang)絡的圖像分類實(shi)戰(zhan)(基于(yu)卷積(ji)神(shen)經網(wang)絡的人臉識別實(shi)戰(zhan))
綜合(he)應用案例(大綱(gang)只列舉部(bu)分典(dian)型案例,可以(yi)根據企業實際需求進行選擇或(huo)定(ding)制):本節通過(guo)多個實戰案例將(jiang)前邊相關知識進(jin)行串(chuan)聯、鞏固與提高,幫助(zhu)學員將(jiang)所學應用到實際(ji)商業場(chang)景下,掌握(wo)商業數據挖(wa)掘(jue)分析的(de)全流程方(fang)法;
1. 電商(shang)案例分(fen)析(xi)(統計(ji)描述(shu)性,宏觀市場(chang)和微觀市場(chang)分(fen)析(xi),波士頓矩陣分(fen)析(xi))
2. 航空客戶價值分析(RFM分析,客戶畫像,聚類分析,精準營銷)
3. 保(bao)險行業(ye)用戶畫像,精準營銷(決(jue)策樹應(ying)用)
4. 航班動態(tai)延誤預(yu)測(隨機森林,集成學習應(ying)用)
5. 基于不同場景之下共享單車投放量的精準預測(嶺回歸,lasso回歸)
6. 京東用戶商品購買預測(xgboost集成學習)
7. 電商銷(xiao)售商品數據(ju)分析(xi)(關聯規則應用(yong))
8. 門戶(hu)網站新聞分(fen)(fen)類(lei)分(fen)(fen)析(貝葉斯應用)
9. 手寫數字識別案例(邏輯回歸,knn應用)
10. 人臉識別與分類案例(SVM應用)
11. 圖像分類(CNN應用)
12. 電商文本情感分析(LSTM應用)
13. 數(shu)字化(hua)人(ren)力資源之員工流失風險預警(邏輯回歸應用)
14. 基于(yu)用于(yu)欺(qi)詐檢測的(de)綜(zong)合財務數據集預測金融支(zhi)付服務中(zhong)的(de)欺(qi)詐行為(wei)(集成學習(xi)應用)
15. 信用評(ping)分卡案(an)例
例: 講解獲取外部數據
例(li): 講解(jie)應用文本分析(xi)對網站注冊用戶特征需求進(jin)行分析(xi)
聯系電話:4006-900-901
微信咨詢:威才客服
企業郵箱:
深耕中國制造業
助力企業轉型
2021年度咨(zi)詢客戶數(shu)
資深實戰導師
客戶滿意度
續單和轉介紹