傅一航,傅一航講師,傅一航聯(lián)系方式,傅一航培訓(xùn)師-【中華講師網(wǎng)】
大數(shù)據(jù) 數(shù)據(jù)分析 數(shù)據(jù)挖掘 數(shù)據(jù)建模
56
鮮花排名
0
鮮花數(shù)量
傅一航:大數(shù)據(jù)平臺(tái):Hadoop大數(shù)據(jù)解決方案平臺(tái)技術(shù)基礎(chǔ)培訓(xùn)
2017-03-22 2842
對(duì)象
網(wǎng)絡(luò)部、大數(shù)據(jù)系統(tǒng)開(kāi)發(fā)部、大數(shù)據(jù)中心、網(wǎng)絡(luò)運(yùn)維部等相關(guān)技術(shù)人員。
目的
掌握Hadoop平臺(tái)中常用模塊的工作原理及開(kāi)發(fā)應(yīng)用技術(shù)
內(nèi)容

第一部分:Hadoop的基本框架

1、大數(shù)據(jù)時(shí)代面臨的問(wèn)題

2、當(dāng)前解決大數(shù)據(jù)的技術(shù)方案

3、Hadoop架構(gòu)和云計(jì)算

4、Hadoop簡(jiǎn)史及安裝部署

5、Hadoop設(shè)計(jì)理念和生態(tài)系統(tǒng)


第二部分:HDFS分布式文件系統(tǒng):海量數(shù)據(jù)存儲(chǔ)的搖籃

1、HDFS的設(shè)計(jì)目標(biāo)

2、HDFS的基本架構(gòu)

? ?NameNode名稱(chēng)節(jié)點(diǎn)

? ?SecondaryNameNode第二名稱(chēng)節(jié)點(diǎn)

? ?DataNode數(shù)據(jù)節(jié)點(diǎn)

3、HDFS的存儲(chǔ)模型

? ?數(shù)據(jù)塊存儲(chǔ)

? ?元數(shù)據(jù)存儲(chǔ)(空間鏡像與編輯日志)

? ?多副本存儲(chǔ)

4、多副本放置策略

5、多數(shù)據(jù)節(jié)點(diǎn)管理機(jī)制與交互過(guò)程

6、文件系統(tǒng)操作與管理

? ?讀文件過(guò)程

? ?寫(xiě)文件過(guò)程(數(shù)據(jù)流管道)

7、數(shù)據(jù)完整性機(jī)制

? ?數(shù)據(jù)校驗(yàn)和

? ?數(shù)據(jù)完整性掃描線程

? ?元數(shù)據(jù)備份與合并

8、數(shù)據(jù)可靠性設(shè)計(jì)

? ?安全模式(數(shù)據(jù)塊與節(jié)點(diǎn)映射關(guān)系管理)

? ?心跳檢測(cè)機(jī)制(節(jié)點(diǎn)失效管理)

? ?租約機(jī)制(多線程并發(fā)控制)

9、其它

? ?HDFS的安全機(jī)制

? ?負(fù)載均衡

? ?文件壓縮

10、 ? ?操作接口與編程接口

? ?HDFS Shell

? ?HDFS Commands

? ?WebHDFS REST API

? ?HDFS Java API

演練:HDFS文件操作命令

演練:HDFS編程示例


第三部分:MapReduce分布式計(jì)算系統(tǒng):海量數(shù)據(jù)處理的利器

1、MapReduce的三層設(shè)計(jì)理念

? ?分布治之的設(shè)計(jì)思想(Map與Reduce)

? ?數(shù)據(jù)處理引擎(編程模型)

? ?運(yùn)行時(shí)環(huán)境(任務(wù)調(diào)度與執(zhí)行)

2、MapReduce的基本架構(gòu)

? ?JobTracker作業(yè)跟蹤器

? ?TaskTracker任務(wù)跟蹤器

? ?MapReduce與HDFS的部署關(guān)系

3、MapReduce編程模型概述

? ?編程接口介紹

? ?Hadoop工作流實(shí)現(xiàn)原理

4、MapReduce作業(yè)調(diào)度機(jī)制

? ?MapReduce作業(yè)生命周期

? ?作業(yè)調(diào)度策略

? ?靜態(tài)資源管理方案

5、數(shù)據(jù)并行處理機(jī)制(五步驟)

? ?Input階段實(shí)現(xiàn)

? ?Map階段實(shí)現(xiàn)

? ?Shuffle階段實(shí)現(xiàn)

? ?Reduce階段實(shí)現(xiàn)

? ?Output階段

6、MapReduce容錯(cuò)機(jī)制

? ?任務(wù)失敗與重新嘗試

? ?節(jié)點(diǎn)失效與重調(diào)度

? ?單點(diǎn)故障

7、MapReduce性能優(yōu)化

? ?優(yōu)化方向與思路

? ?磁盤(pán)IO性能優(yōu)化

? ?分片優(yōu)化

? ?線程數(shù)量?jī)?yōu)化

? ?內(nèi)存優(yōu)化

? ?壓縮優(yōu)化

8、MapReduce操作接口

? ?Job Shell

? ?Web UI

案例演練:MapReduce編程示例


9、YARN:下一代通用資源管理系統(tǒng)

? ?MRv1的局限性

? ?YARN基本框架

? ?NN HA:解決單點(diǎn)故障

? ?HDFS Federation:解決擴(kuò)展性問(wèn)題


第四部分:HBase非關(guān)系型數(shù)據(jù)庫(kù):海量數(shù)據(jù)的黎明

1、HBase的使用場(chǎng)景

2、HBase的基本架構(gòu)

? ?Zookeeper分布式協(xié)調(diào)服務(wù)器

? ?Master主控服務(wù)器

? ?Region Server區(qū)域服務(wù)器

3、HBase的數(shù)據(jù)模型

? ?HBase的表結(jié)構(gòu)

? ?行鍵、列鍵、時(shí)間戳

4、HBase的存儲(chǔ)模型

? ?基本單位Region

? ?存儲(chǔ)格式HFile

5、數(shù)據(jù)分裂機(jī)制Split

6、數(shù)據(jù)合并機(jī)制Compaction

? ?minor compaction

? ?major compaction

7、HLog寫(xiě)前日志

8、數(shù)據(jù)庫(kù)讀寫(xiě)操作

? ?數(shù)據(jù)庫(kù)寫(xiě)入

? ?數(shù)據(jù)庫(kù)讀取

? ?三次尋址

9、HBase操作接口

? ?Native Java API

? ?HBase Shell

? ?批量加載工具

? ?HiveQL操作

10、 ? ?HBase性能優(yōu)化

? ?寫(xiě)速度優(yōu)化

? ?讀速度優(yōu)化

11、 ? ?HBase集群監(jiān)控與管理

案例演練:HBase命令操作實(shí)例


第五部分:Hive分布式數(shù)據(jù)倉(cāng)庫(kù):高級(jí)的編程語(yǔ)言

1、Hive是什么

2、Hive與關(guān)系數(shù)據(jù)庫(kù)的區(qū)別

3、Hive系統(tǒng)架構(gòu)

? ?用戶接口層

? ?元數(shù)據(jù)存儲(chǔ)層

? ?驅(qū)動(dòng)層

4、Hive常用服務(wù)

5、Hive元數(shù)據(jù)的三種部署模式

6、Hive的命名空間

7、Hive數(shù)據(jù)類(lèi)型與存儲(chǔ)格式

? ?數(shù)據(jù)類(lèi)型

? ?TextFile/SequenceFile/RCFile

8、Hive的數(shù)據(jù)模型

? ?管理表

? ?外部表

? ?分區(qū)表

? ?桶表

9、HQL語(yǔ)言命令實(shí)例

? ?DDL數(shù)據(jù)定義語(yǔ)言

? ?DML數(shù)據(jù)操作語(yǔ)言

? ?QUERY數(shù)據(jù)查詢語(yǔ)言

10、 ? ?Hive自定義函數(shù)

? ?基本函數(shù)(UDF)

? ?聚合函數(shù)(UDAF)

? ?表生成函數(shù)(UDTF)

11、 ? ?Hive性能優(yōu)化

? ?動(dòng)態(tài)分區(qū)

? ?壓縮

? ?索引

? ?JVM重用

案例演練:Hive命令操作實(shí)例


第六部分:Sqoop數(shù)據(jù)交互工具:Hadoop與傳統(tǒng)數(shù)據(jù)庫(kù)的橋梁

1、Sqoop是什么

2、Sqoop的架構(gòu)和功能

? ?Sqoop1架構(gòu)

? ?Sqoop2架構(gòu)

3、數(shù)據(jù)雙向交換

? ?數(shù)據(jù)導(dǎo)入過(guò)程

? ?數(shù)據(jù)導(dǎo)出過(guò)程

4、數(shù)據(jù)導(dǎo)入工具與命令介紹

案例演練:Sqoop數(shù)據(jù)導(dǎo)入/導(dǎo)出實(shí)際操作


第七部分:Pig數(shù)據(jù)流處理引擎:數(shù)據(jù)腳本語(yǔ)言

1、Pig介紹

2、命令行交互工具Grunt

3、Pig數(shù)據(jù)類(lèi)型

4、Pig Latin腳本語(yǔ)言介紹

? ?基礎(chǔ)知識(shí)

? ?輸入和輸出

? ?關(guān)系操作

? ?調(diào)用靜態(tài)Java函數(shù)

5、Pig Latin高級(jí)應(yīng)用

6、開(kāi)發(fā)與測(cè)試Pig Latin腳本

? ?開(kāi)發(fā)工具

? ?任務(wù)狀態(tài)監(jiān)控

? ?調(diào)試技巧

7、腳本性能優(yōu)化

8、用戶自定義函數(shù)UDF

案例演練:Pig Latin腳本編寫(xiě)、測(cè)試與運(yùn)行操作


結(jié)束:課程總結(jié)與問(wèn)題答疑。


全部評(píng)論 (0)
熱門(mén)領(lǐng)域講師
互聯(lián)網(wǎng)營(yíng)銷(xiāo) 互聯(lián)網(wǎng) 新媒體運(yùn)營(yíng) 短視頻 電子商務(wù) 社群營(yíng)銷(xiāo) 抖音快手 新零售 網(wǎng)絡(luò)推廣 領(lǐng)導(dǎo)力 管理技能 中高層管理 中層管理 團(tuán)隊(duì)建設(shè) 團(tuán)隊(duì)管理 高績(jī)效團(tuán)隊(duì) 創(chuàng)新管理 溝通技巧 執(zhí)行力 阿米巴 MTP 銷(xiāo)售技巧 品牌營(yíng)銷(xiāo) 銷(xiāo)售 大客戶營(yíng)銷(xiāo) 經(jīng)銷(xiāo)商管理 銷(xiāo)講 門(mén)店管理 商務(wù)談判 經(jīng)濟(jì)形勢(shì) 宏觀經(jīng)濟(jì) 商業(yè)模式 私董會(huì) 轉(zhuǎn)型升級(jí) 股權(quán)激勵(lì) 納稅籌劃 非財(cái)管理 培訓(xùn)師培訓(xùn) TTT 公眾演說(shuō) 招聘面試 人力資源 非人管理 服裝行業(yè) 績(jī)效管理 商務(wù)禮儀 形象禮儀 職業(yè)素養(yǎng) 新員工培訓(xùn) 班組長(zhǎng)管理 生產(chǎn)管理 精益生產(chǎn) 采購(gòu)管理 易經(jīng)風(fēng)水 供應(yīng)鏈管理 國(guó)學(xué) 國(guó)學(xué)文化 國(guó)學(xué)管理 國(guó)學(xué)經(jīng)典 易經(jīng) 易經(jīng)與管理 易經(jīng)智慧 家居風(fēng)水 國(guó)際貿(mào)易
鮮花榜
頭像
+6107朵
頭像
+6098朵
頭像
+6087朵
頭像
+6087朵
頭像
+6065朵
頭像
+6059朵
頭像
+6054朵
頭像
+6049朵
頭像
+6019朵

Copyright©2008-2025 版權(quán)所有 浙ICP備06026258號(hào)-1 浙公網(wǎng)安備 33010802003509號(hào) 杭州講師網(wǎng)絡(luò)科技有限公司
講師網(wǎng) www.kasajewelry.com 直接對(duì)接10000多名優(yōu)秀講師-省時(shí)省力省錢(qián)
講師網(wǎng)常年法律顧問(wèn):浙江麥迪律師事務(wù)所 梁俊景律師 李小平律師