Hadoop筆記02_HDFS(Hadoop分散式檔案系統)_架構初探











HDFS(Hadoop分散式檔案系統)特色:


預設的blocksize為128M
假設文件 test.log ->200M 
拆分為2個block分別是 block1 : 128M , block2:72M
副本默認有三個,可能分散在不同節點上。但用戶去存取時不需要去知道從哪個node抓取到。
node1:block1 block2
node2:
node3:block2
node4:block1 block2
node5:block1
倘若某節點掛掉還有其他節點能代替做存取。


Data Replication

以上述圖來看,檔案拆分為part0 , part1
r代表副本有幾個,Datanode也就是儲存數據的節點。
part0就有針對1,3各自於不同節點有2份副本
part1則針對2,4,5各自於不同節點共3份副本。


Ref:
The Google File System 論文筆記
https://hackmd.io/@Chang-Chia-Chi/GFS
Google 檔案系統 (GFS) 與 Hadoop 分散式檔案系統 (HDFS)
https://www.geeksforgeeks.org/google-file-system-gfs-vs-hadoop-distributed-file-system-hdfs/
HDFS Architecture Guide

留言

這個網誌中的熱門文章

何謂淨重(Net Weight)、皮重(Tare Weight)與毛重(Gross Weight)

Architecture(架構) 和 Framework(框架) 有何不同?_軟體設計前的事前規劃的藍圖概念

經得起原始碼資安弱點掃描的程式設計習慣培養(五)_Missing HSTS Header