HDFS指令和cloudera manager網頁管理介面筆記(二)_MapReduce莎士比亞txt檔案分析實作
從起初尚未上傳莎士比亞 txt檔案 執行HDFS指令上傳莎士比亞 txt檔案 hdfs dfs -put /home/cloudera/shakespeare.txt 如果不指定hdfs端目錄,則使用家目錄 shakespeare.txt 此檔案約為5.18MB 顯示/user/cloudera/shakespeare.txt由那些hdfs區塊組成 檢查shakespeare.txt的區塊個數 用指令 hdfs fsck -blocks -files /user/cloudera/shakespeare.txt hdfs fsck /user/cloudera/shakespeare.txt -files -blocks 使用Cloudera Manager -> HDFS -> NameNode WebUI WordCout範例 (運行前要確保要被計數的檔案必須存在於HDFS,輸出目錄不能事先存在於HDFS。) ls -l /opt/cloudera/parcels/CDH-6.3.2-1.cdh6.3.2.p0.1605554/lib/hadoop-mapreduce/hadoop-mapreduce-examples.jar yarn jar /opt/cloudera/parcels/CDH-6.3.2-1.cdh6.3.2.p0.1605554/lib/hadoop-mapreduce/hadoop-mapreduce-examples.jar hdfs dfs -ls /user/cloudera/wordcount_output/ 來源檔案(位在HDFS,必須已經存在) wordcount的輸出目錄(位在HDFS,但不能已經存在) wordcount_output此檔案位於執行yarn所在機器,不需要事先上傳到HDFS,運行時由resource manager將程式碼傳送到所有執行此操作的Yarn Container中 yarn jar /opt/cloudera/parcels/CDH-6.3.2-1.cdh6.3.2.p0.1605554/lib/hadoop-mapreduce/hadoop-mapreduce-examples.jar wordcount /user/cloudera/shakespeare.txt /u...