發表文章

目前顯示的是 2025的文章

CDH Hadoop集群虛擬機本地配置搭建筆記_part2_配置yum local repo

圖片
  CDH安裝就不同客戶環境提供多種安裝方式 1.是透過Cloudera官方網站,來直接進行完全自動化安裝。 (目前這條路已不通,除非付費跟註冊有會員訂閱) CDH官網沒提供免費早期CDH5,CDH6(Cloudera Manager也無法免費用)下載的因應策略 https://coolmandiary.blogspot.com/2025/01/cdhcdh5cdh6cloudera-manager.html 2.使用者的集群環境可能屬於公司內網,不可以訪問外網。 則須在集群內部來建立一個軟體repo,再來進行自動化集群部署。 一般大部分私人企業內部網路管制十分嚴謹,任何軟體安裝都會先掃毒過後才允許放行安裝到主機上,這邊就模擬情境假設這些抓好的軟體包都已成熟在使用於企業內主機環境。 企業內部自己去搭建yum local repo方式。 這邊會將CDH yum原始軟體repo存放在host1節點。 這邊先在節點來FTP上傳(透過WinSCP)上傳到Linux VM host1這台環境中。 Step1.將httpd相關rpm從本地上傳到VM host1上。 透過本地安裝方式來把httpd裝好 yum -y localinstall ./*.rpm    完成安裝後就可以來啟動httpd服務 Step2.啟動httpd服務。 systemctl start httpd  systemctl status httpd systemctl enable httpd 在宿主主機外部windows瀏覽器訪問則可看到Apache Web Server預設網頁有成功跑起來 http://192.168.80.81/ Step3.上傳createrepo指令、和其他Linux常用的相關rpm包(包含CDH的RPM) 先回到/root/目錄 刪除剛已安裝好的rpm 上傳createrepo的rpm額外單獨先安裝 在/root/ 運行 yum -y localinstall ./*.rpm 額外創建目錄/var/www/html/sam666 將檔案透過WinSCP上傳 /var/www/html/sam666 會存放其他節點可能也會共用的一些工具安裝包 jdk的rpm (比較大要等一陣子) oracle-j2sdk1.8-1.8.0+update18...

CDH Hadoop集群虛擬機本地配置搭建筆記_part1透過VMWare創建3台虛擬機(各節點的網路配置)

圖片
  Cloudera Manager Cluster規劃 正式環境中至少要有三個節點 由於硬體成本昂貴在此就透過虛擬機方式來模擬,這邊會建立三個虛擬主機節點。 配置規格如下: host1 (192.168.80.81): 會配置並安裝CM Agent ,也會用來當作CM Server。 所以會配置比較大的空間與記憶體給它,大約16G RAM , 60G disk , 1個CPU。  host2 (192.168.80.82): 4G RAM , 30G disk , 1個CPU。只配置安裝CM Agent。 host3 (192.168.80.83): 4G RAM , 30G disk , 1個CPU。只配置安裝CM Agent。 http://docs.cloudera.com.s3-website-us-east-1.amazonaws.com/documentation/enterprise/6/release-notes/topics/rg_hardware_requirements.html#sizing_cm_server_storagereqs 這邊我的物理機是用2021年時期購買的筆電 Acer Predator PH315-54-72VQ 電競筆記型電腦 https://store.acer.com/zh-tw/ph315-54-72vq 處理器:Intel® Core™ i7-11800H 記憶體:16GB DDR4 3200MHz Memory 硬碟:512GB PCIe NVMe SSD 顯卡:NVIDIA® GeForce RTX™ 3070 本身外接了1TB硬碟來配備實驗環境 Step1.設置虛擬路由器IP 192.168.80.1 Step2.物理機網卡設置也一樣在80同樣網段 打開控制台 Step3.建立第一台虛擬機(用來做 CM的安裝)並複製另外兩台虛擬機,將安裝好centos。 配置16GRAM , 60G硬碟 ,1CPU 當配置好後再Reboot確認OK就在關機。 接續透過host1去複製另外兩台,節省重新安裝配置時間。 等他跑出下面結果才算完成。 host3也比照host2做法,透過host1去clone出來。 分別針對host2,host3調整memory配置降為4G, disk維持60G就好了,有需要再...