Hadoop 2.x伪分布式环境搭建详细步骤

数据库 2024/4/27 佚名

3 1 2

快活林资源网 Design By www.csstdc.com

本文以图文结合的方式详细介绍了Hadoop 2.x伪分布式环境搭建的全过程，供大家参考，具体内容如下

1、修改hadoop-env.sh、yarn-env.sh、mapred-env.sh

方法：使用notepad++(beifeng用户)打开这三个文件

添加代码：export JAVA_HOME=/opt/modules/jdk1.7.0_67

2、修改core-site.xml、hdfs-site.xml、yarn-site.xml、mapred-site.xml配置文件

1）修改core-site.xml

<configuration>
　　<property>
　　　　<name>fs.defaultFS</name>
　　　　<value>hdfs://Hadoop-senior02.beifeng.com:8020</value>
　　</property>
　　<property>
　　　　<name>hadoop.tmp.dir</name>
　　　　<value>/opt/modules/hadoop-2.5.0/data</value>
　　</property>
</configuration>

2）修改hdfs-site.xml

<configuration>
　　<property>
　　　　<name>dfs.replication</name>
　　　　<value>1</value>
　　</property>
　　<property>
　　　　<name>dfs.namenode.http-address</name>
　　　　<value>Hadoop-senior02.beifeng.com:50070</value>
　　</property>
</configuration>

3）修改yarn-site.xml

<configuration>
　　<property>
　　　　<name>yarn.nodemanager.aux-services</name>
　　　　<value>mapreduce_shuffle</value>
　　</property>
　　<property>
　　　　<name>yarn.resourcemanager.hostname</name>
　　　　<value>Hadoop-senior02.beifeng.com</value>
　　</property>
　　<property>
　　　　<name>yarn.log-aggregation-enable</name>
　　　　<value>true</value>
　　</property>
　　<property>
　　　　<name>yarn.log-aggregation.retain-seconds</name>
　　　　<value>86400</value>
　　</property>
</configuration>

4）修改mapred-site.xml

<configuration>
　　<property>
　　　　<name>mapreduce.framework.name</name>
　　　　<value>yarn</value>
　　</property>
　　<property>
　　　　<name>mapreduce.jobhistory.webapp.address</name>
　　　　<value>0.0.0.0:19888</value>
　　</property>
</configuration>

3、启动hdfs

1）格式化namenode:$ bin/hdfs namenode -format

2）启动namenode:$sbin/hadoop-daemon.sh start namenode

3）启动datanode:$sbin/hadoop-daemon.sh start datanode

4）hdfs监控web页面：http://hadoop-senior02.beifeng.com:50070

4、启动yarn

1）启动resourcemanager:$sbin/yarn-daemon.sh start resourcemanager

2）启动nodemanager:sbin/yarn-daemon.sh start nodemanager

3）yarn监控web页面：http://hadoop-senior02.beifeng.com:8088

5、测试wordcount jar包

1）定位路径：/opt/modules/hadoop-2.5.0

2）代码测试：bin/yarn jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5.0.jar wordcount /input/sort.txt /output6/

运行过程：

16/05/08 06:39:13 INFO client.RMProxy: Connecting to ResourceManager at Hadoop-senior02.beifeng.com/192.168.241.130:8032
16/05/08 06:39:15 INFO input.FileInputFormat: Total input paths to process : 1
16/05/08 06:39:15 INFO mapreduce.JobSubmitter: number of splits:1
16/05/08 06:39:15 INFO mapreduce.JobSubmitter: Submitting tokens for job: job_1462660542807_0001
16/05/08 06:39:16 INFO impl.YarnClientImpl: Submitted application application_1462660542807_0001
16/05/08 06:39:16 INFO mapreduce.Job: The url to track the job: http://Hadoop-senior02.beifeng.com:8088/proxy/application_1462660542807_0001/
16/05/08 06:39:16 INFO mapreduce.Job: Running job: job_1462660542807_0001
16/05/08 06:39:36 INFO mapreduce.Job: Job job_1462660542807_0001 running in uber mode : false
16/05/08 06:39:36 INFO mapreduce.Job: map 0% reduce 0%
16/05/08 06:39:48 INFO mapreduce.Job: map 100% reduce 0%
16/05/08 06:40:04 INFO mapreduce.Job: map 100% reduce 100%
16/05/08 06:40:04 INFO mapreduce.Job: Job job_1462660542807_0001 completed successfully
16/05/08 06:40:04 INFO mapreduce.Job: Counters: 49

3）结果查看：bin/hdfs dfs -text /output6/par*

运行结果：

hadoop 2
jps 1
mapreduce 2
yarn 1

6、MapReduce历史服务器

1）启动：sbin/mr-jobhistory-daemon.sh start historyserver

2）web ui界面：http://hadoop-senior02.beifeng.com:19888

7、hdfs、yarn、mapreduce功能

1）hdfs：分布式文件系统，高容错性的文件系统，适合部署在廉价的机器上。

hdfs是一个主从结构，分为namenode和datanode，其中namenode是命名空间，datanode是存储空间，datanode以数据块的形式进行存储，每个数据块128M

2）yarn：通用资源管理系统，为上层应用提供统一的资源管理和调度。

yarn分为resourcemanager和nodemanager，resourcemanager负责资源调度和分配，nodemanager负责数据处理和资源

3）mapreduce：MapReduce是一种计算模型，分为Map（映射）和Reduce（归约）。

map将每一行数据处理后，以键值对的形式出现，并传给reduce；reduce将map传过来的数据进行汇总和统计。

以上就是本文的全部内容，希望对大家的学习有所帮助。

Hadoop,2.x,伪分布式,环境搭建

快活林资源网 Design By www.csstdc.com

广告合作：本站广告合作请联系QQ：858582 申请时备注：广告合作（否则不回）
免责声明：本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除！

快活林资源网 Design By www.csstdc.com

评论“Hadoop 2.x伪分布式环境搭建详细步骤”

暂无评论...

www.csstdc.com 快活林资源网

120,135影音资源

344,641技术资源

22,817软件资源

435,032站长资源

最新文章

《恶意不息》沃里克打法技巧

2024/4/27

《恶意不息》属性点数作用介绍

2024/4/27

《消逝的光芒2》1.16版本更新汇总

2024/4/27

《天国拯救2》游戏特色介绍

2024/4/27

《无感染区》开局建家探索心得

2024/4/27

《圣剑传说Visions of Mana》灵器作用介绍

2024/4/27

一句话新闻

苹果官宣WWDC 2024！预计会有大批AI功能 - 2024/4/27

3月27日消息，苹果宣布2024年全球开发者大会（WWDC）将于6月10日至6月14日举行，巧合的是，这次大会与端午假期重合。

苹果官方表示：

在线参加 Apple 每年规模最大的开发者盛会。亲眼见证 Apple 最新平台、技术和工具的发布。了解如何创建和改进你的 App 和游戏。与 Apple 设计师和工程师互动交流，与全球开发者社区建立联系。以上活动均免费在线举行。

探索各种新的工具、框架和功能，助力你打造出理想的 App 和游戏。通过视频讲座学习新技能，与 Apple 专家进行一对一会面，以推进你的项目，完善你的构思。

Swift Student Challenge 旨在支持和鼓舞下一代开发者、创作者和企业家。太平洋时间 3 月 28 日，我们将公布今年的获奖者名单。获奖者将有资格参加在 Apple Park 举办的特别活动。我们还会选出 50 名杰出获胜者，他们将受邀前往库比提诺，获得为期三天的非凡体验，包括参加 Apple Park 的特别活动。

Hadoop 2.x伪分布式环境搭建详细步骤

Mybatis查询延迟加载详解及实例

浅析sql server 公共表达式的简单应用

评论“Hadoop 2.x伪分布式环境搭建详细步骤”

RTX 5090要首发性能要翻倍！三星展示GDDR7显存

更新日志

友情链接

Hadoop 2.x伪分布式环境搭建详细步骤

Mybatis查询延迟加载详解及实例

浅析sql server 公共表达式的简单应用

评论“Hadoop 2.x伪分布式环境搭建详细步骤”

RTX 5090要首发 性能要翻倍！三星展示GDDR7显存

更新日志

友情链接

RTX 5090要首发性能要翻倍！三星展示GDDR7显存