- 課程詳情
- 學(xué)習(xí)評價(4)
- 上課校區(qū)(1)
【培訓(xùn)背景】
隨著信息技術(shù)和互聯(lián)網(wǎng)的快速發(fā)展,數(shù)據(jù)正在成為現(xiàn)代社會的一項重要資源。而大數(shù)據(jù)和數(shù)據(jù)挖掘技術(shù)則是能夠幫助人們更好地利用數(shù)據(jù)資源的關(guān)鍵工具。這些技術(shù)的普及應(yīng)用,加上信息社會不斷向數(shù)據(jù)驅(qū)動型社會的轉(zhuǎn)型,大教據(jù)和數(shù)據(jù)挖掘的市場需求量也日益增大。因此,大數(shù)據(jù)和數(shù)據(jù)挖掘領(lǐng)域的發(fā)展迫切需要大批合格的人才來滿足市場的需求。
【授課形式】線下面授班(公開課、企業(yè)內(nèi)訓(xùn)均可)
【配套服務(wù)】提供培訓(xùn)課程講義,班主任教學(xué)管理、學(xué)員在線交流、視頻一年無限次回放。
【近期開班】
2023年
北京 12月24-26
2024年
北京 3月26-28
昆明 6月27-29
南京 武漢 蘇州 蘭州 沈陽 濟南 大連......
此課程全國常年巡回開班,另有線上直播、錄播課程隨報隨學(xué)
(滿10人即可申請加開當?shù)孛媸冢?/p>
【培訓(xùn)對象】
各企事業(yè)單位、大(專)院校數(shù)據(jù)開發(fā)、挖掘分析工程師、人工智能架構(gòu)師、系統(tǒng)開發(fā)設(shè)計人員等;以及其它對大數(shù)據(jù)分析與挖掘感興趣的人員。
【培訓(xùn)收益】
1.數(shù)據(jù)分析實戰(zhàn)
2.數(shù)據(jù)挖掘理論及核心技術(shù)
3.大數(shù)據(jù)算法原理及案例實現(xiàn)
4.****on應(yīng)用實戰(zhàn)
【培訓(xùn)安排】(3天,每次6-7小時)
時間知識模塊授課內(nèi)容
第一天
上午數(shù)據(jù)分析實戰(zhàn)第一天 零基礎(chǔ)學(xué)Python
講解Python背景、國內(nèi)發(fā)展狀況、基礎(chǔ)語法、數(shù)據(jù)結(jié)構(gòu)及繪圖操作等內(nèi)容。特別針對向量計算這塊,著重介紹Python在這方面的優(yōu)勢及用法。
第二講 數(shù)據(jù)分析方法 論
講解統(tǒng)計分析基礎(chǔ),包括統(tǒng)計學(xué)基本概念,假設(shè)檢驗,置信區(qū)間等基礎(chǔ),并結(jié)合數(shù)據(jù)案例說明其使用場景和運用方法。介紹數(shù)據(jù)分析流程和常見分析思路,并結(jié)合案例進行講解。
第三講 數(shù)據(jù)處理技法
從數(shù)據(jù)接入、數(shù)據(jù)統(tǒng)計、數(shù)據(jù)轉(zhuǎn)換等幾個方面進行講解。數(shù)據(jù)接入包含接入MySQL、Oracle、Hadoop等常見數(shù)據(jù)庫操作;數(shù)據(jù)統(tǒng)計包含Pandas包的具體用法和講解;數(shù)據(jù)轉(zhuǎn)換包含對數(shù)據(jù)集的關(guān)聯(lián)、合并、重塑等操作。此外,針對海量數(shù)據(jù)的情況下,介紹在Spark平臺上的數(shù)據(jù)處理技術(shù),并結(jié)合真實環(huán)境進行操作講解。
第一天
下午數(shù)據(jù)挖掘理論及核心技術(shù)第四講 認識數(shù)據(jù)挖掘
講解數(shù)據(jù)挖掘基本概念,細致講解業(yè)務(wù)理解、數(shù)據(jù)理解、數(shù)據(jù)準備、建立模型、模型評估、模型部署各環(huán)節(jié)的工作內(nèi)容及相關(guān)技術(shù);結(jié)合業(yè)界經(jīng)典場景,講解數(shù)據(jù)挖掘的實施流程和方法體系。
第五講 數(shù)據(jù)挖掘核心技術(shù)
細致講解抽樣、分區(qū)、樣本平衡、特征選擇、訓(xùn)練模型、評估模型等數(shù)據(jù)挖掘核心技術(shù)原理,并結(jié)合案例講解其具體實現(xiàn)和用法。尤其針對樣本平衡,重點講解人工合成、代價敏感等算法;針對特征選擇,重點講解特征選擇的核心思路,并結(jié)合Python進行案例演示。
第二天
上午大數(shù)據(jù)算法原理及案例實現(xiàn)(1)第六講 特征降維算法及Python實現(xiàn)
降維是大數(shù)據(jù)分析非常重要的算法,它可以在降低極少信息量的情況下,極大地縮小數(shù)據(jù)規(guī)模。主要講解主成分、LDA以及t-SNE原理,并結(jié)合案例進行Python實現(xiàn)。特別地,針對海量數(shù)據(jù)情況下的應(yīng)用場景,講解實現(xiàn)思路和Python案例。
第七講 決策樹算法及Python實現(xiàn)
決策樹是非常經(jīng)典的算法,一般常見于小數(shù)據(jù)的挖掘。由于決策樹具有極強的可解釋性,針對海量數(shù)據(jù)仍然是非常重要的實用價值。主要講解ID3、C4.5、C5.0以及CART決策樹算法的實現(xiàn)原理,并結(jié)合案例進行Python實現(xiàn)。
第八講 好萊塢百萬級影評數(shù)據(jù)分析與電影推薦實現(xiàn)
實戰(zhàn)部分:基于好萊塢百萬級的影評數(shù)據(jù),對數(shù)據(jù)進行建模、清洗、透視表操作。然后根據(jù)用戶畫像分析不同的用戶喜好通過機器學(xué)習(xí)算法對不同性別、年齡階段的用戶進行定制化的電影推薦,最后把推薦的電影進行可視化的展示操作
第二天
下午大數(shù)據(jù)算法原理及案例實現(xiàn)(2)第九講 因果推理算法及Python實現(xiàn)
大數(shù)據(jù)分析技術(shù)可以幫助我們?nèi)グl(fā)現(xiàn)、解決一些業(yè)務(wù)問題,然而如何去判斷我們的改進是否生效,是否在業(yè)務(wù)指標上呈現(xiàn)過一定的因果邏輯,則是一個重要問題和分析方向。本節(jié)主要介紹因果推理算法,包括貝葉斯推理、狀態(tài)空間模型以及CausalImpact工具等內(nèi)容,并結(jié)合案例進行Python實現(xiàn)。
第十講 深度學(xué)習(xí)算法及Python實現(xiàn)
對于大數(shù)據(jù)的建模任務(wù),我們可以基于深度學(xué)習(xí)來實現(xiàn),不僅能夠針對海量數(shù)據(jù)進行建模,其效果也非常不錯。本節(jié)主要講解深度學(xué)習(xí)的發(fā)展歷程,DBN、DNN等經(jīng)典深度學(xué)習(xí)算法,深度學(xué)習(xí)優(yōu)化算法以及一些技巧。同時,介紹Keras、OpenCV庫的使用方法,并結(jié)合案例進行Python實現(xiàn)。
第十一講 采用OpenCV實現(xiàn)計算機視覺技術(shù)
實戰(zhàn)部分:基于OpenCV面部模型,完成對圖片和視頻的人臉識別,實戰(zhàn)中會講解OpenCV的重要類和函數(shù)。主要內(nèi)容包括OpenCV庫的安裝和部署、圖像增強、像素操作、圖形分析等各種技術(shù),并且詳細介紹了如何處理來自文件或攝像機的視頻,以及如何檢測和跟蹤移動對象。
第三天
上午Python應(yīng)用實戰(zhàn)(一)第十二講 Python自然語言處理原理及案例
目前文檔數(shù)據(jù)已經(jīng)成為很多企業(yè)重要的資產(chǎn),通過對文檔數(shù)據(jù)進行解析、建模、分析、挖掘、可視化,我們能夠發(fā)現(xiàn)不一樣的洞察。本節(jié)主要講解自然語言處理基本概念和技法,包含分詞、關(guān)鍵字提取、文摘提取、文本分類、主題模型、word2vec等內(nèi)容。介紹在深度學(xué)習(xí)的加持下,與傳統(tǒng)做法的區(qū)別,并使用Python進行案例講解。
第十三講 數(shù)據(jù)分析圖表及Python案例
數(shù)據(jù)可視化是大數(shù)據(jù)分析的重要手段,通過合理地使用圖表,不僅可以簡潔地表達數(shù)據(jù)的含義,高效地發(fā)現(xiàn)問題,還可以為報告的編寫以及數(shù)據(jù)分析web應(yīng)用增色不少。本節(jié)主要講解常用的數(shù)據(jù)分析圖表及其使用場景,介紹數(shù)據(jù)可視化的方法 論,避免生搬硬套的使用圖表,針對不同的業(yè)務(wù)場景和需求,合理選擇可視化方法。介紹的工具不限于matplotlib、pycha、pyecharts、ggplot、Bokeh、HoloViews、mpld3、plotly、pygal等常用可視化庫。
第三天
下午Python應(yīng)用實戰(zhàn)(二)第十四講 使用Notebook編寫數(shù)據(jù)分析報告
數(shù)據(jù)分析報告在大數(shù)據(jù)分析過程中具有重要價值,它體現(xiàn)了大數(shù)據(jù)分析的目的、過程和結(jié)果,以及對發(fā)現(xiàn)問題的解讀、改進方案等等,本節(jié)主要講解使用Notebook編寫數(shù)據(jù)分析報告的具體方法,以及編寫數(shù)據(jù)分析報告的方法 論,并結(jié)合案例講解其用法。
第十五講 Seaborn可視化開發(fā)實戰(zhàn)
Seaborn是一款不錯的可視化框架,它和 Pandas一樣是建立在 Matplotlib 之上的。可以基于Seaborn快速開發(fā)一個輕量級的數(shù)據(jù)分析web應(yīng)用。在網(wǎng)頁中嵌入圖表、數(shù)據(jù)以及分析的算法,非常適合打造企業(yè)內(nèi)部的敏捷數(shù)據(jù)分析工具集。本節(jié)主要介紹Pie、Scatter、Radar等等各種可視化解決方案,同時講解一個用Seaborn實現(xiàn)數(shù)據(jù)分析功能(兼圖表)的實際案例,搭建服務(wù)器,在企業(yè)內(nèi)部實現(xiàn)輕量級數(shù)據(jù)分析應(yīng)用。
【培訓(xùn)講師】
劉老師 10多年的IT領(lǐng)域相關(guān)技術(shù)研究和項目開發(fā)工作,在長期軟件領(lǐng)域工作過程中,對軟件企業(yè)運作模式有深入研究,熟悉軟件質(zhì)量保障標準ISO9003和軟件過程改進模型CMM/CMMI,在具體項目實施過程中總結(jié)經(jīng)驗,有深刻認識。通曉多種軟件設(shè)計和開發(fā)工具。對軟件開發(fā)整個流程非常熟悉,能根據(jù)項目特點定制具體軟件過程,并進行項目管理和監(jiān)控,有很強的軟件項目組織管理能力。
【培訓(xùn)講師】
劉老師 10多年的IT領(lǐng)域相關(guān)技術(shù)研究和項目開發(fā)工作,在長期軟件領(lǐng)域工作過程中,對軟件企業(yè)運作模式有深入研究,熟悉軟件質(zhì)量保障標準ISO9003和軟件過程改進模型CMM/CMMI,在具體項目實施過程中總結(jié)經(jīng)驗,有深刻認識。通曉多種軟件設(shè)計和開發(fā)工具。對軟件開發(fā)整個流程非常熟悉,能根據(jù)項目特點定制具體軟件過程,并進行項目管理和監(jiān)控,有很強的軟件項目組織管理能力。
-
孟*林
2024.07.31已經(jīng)報名了,課程體驗還不錯
報名課程:TOGAF培訓(xùn)認證-TOGAF線上培訓(xùn)課
報名學(xué)費: ¥2500
-
中培偉業(yè)培訓(xùn)考試中心
地址:夏家胡同育芳園東里
電話:400-029-0976 轉(zhuǎn) **** 查看號碼
中培IT培訓(xùn)資深顧問方老師
掃碼+微信咨詢各類課程問題和學(xué)校情況 微信號:139******35
關(guān)于我們 詳情
中培IT培訓(xùn)為您提供優(yōu)質(zhì)的IT認證、IT技術(shù)實戰(zhàn)培訓(xùn)與咨詢服務(wù)。我們堅持以協(xié)助企業(yè)發(fā)展,提升員工職業(yè)技能為己任。力求打造從IT培訓(xùn)、IT規(guī)劃咨詢、到IT技術(shù)支撐的落地服務(wù)閉環(huán)。熱門課程:CISP/ITIL/TOGAF/CDMP,CDGA,CDGP/PMP/NPDP/CCSK/ITSS/軟考/CISAW..實踐課程:數(shù)據(jù)治理,企業(yè)數(shù)字化轉(zhuǎn)型,大數(shù)據(jù),項目管理,軟件開發(fā),系統(tǒng)運維,人工智能......