强烈建议你试试无所不能的chatGPT，快点击我

HDFS详细分析一

阅读量：6882 次

发布时间：2019-06-27

本文共 1042 字，大约阅读时间需要 3 分钟。

1. Hadoop启动中遇到的问题以及解决办法：

（1）搭建HDFS集群的时候，NameNode和DataNode这两个进程会挂掉？

查看logs，查看相关的异常信息

a.如果是namenode没有正常启动，原因在启动之前没有格式化，我们需要format

b.如果data没有启动，原因是namespaceID不一样

正确的步骤是：

1.rm -rf 本地的存储目录（/tmp/hadoop-<user_name>）

2.hadoop namenode -format

3.执行脚本 start-dfs.sh

（2）dfsadmin -setQuota的问题

dfsadmin -setQuota 限制文件数量

dfsadmin -setSpaceQuota 限制磁盘空间

（3）什么样的文件算是小文件？在哪里配置？

数据块的默认大小是64M，如果一个文件大小小雨64M，那么它也要占据一个数据块，使用Archive的方式

归并小文件。

数据块大小可以使用dfs.block.size这个属性进行配置。

（4）start-dfs.sh的告警信息

Unable to load native-hadoop library for your platform...

using built-in java classes

没有找到native库，使用内置的java code

（5）重复运行wordcount，提示output目录存在

可以使用命令行或者hdfs API 直接删除

修改源代码，增加强制目录替换功能

（6）默认的hadoop conf路径变成了etc/hadoop

start-dfs.sh之前它会source一下hadoop-config.sh，然后再去执行hadoop-deamon.sh,接下来执行hadoop脚本，执行java程序。

2.

HDFS架构

一个组的存储容量是该组机器最小的存储容量决定的。（木桶效应）

一、常见的分布式文件系统

不同的是MooseFS有一个FUSE，可以将分布式文件系统和本地分布式文件系统结合起来

以文件为基本存储单位：

1.难以并行化处理

一个节点只能处理一个文件

无法同时处理一个文件

2.难以实现负载均衡

文件大小不同，无法实现负载均衡

用户需要自己控制文件大小

二、HDFS文件系统

HDFS读过程：

HDFS写过程：

转载于:https://www.cnblogs.com/litaiqing/p/4614993.html

你可能感兴趣的文章

(十九)WebGIS中I查询的原理及设计(包含AGS、GeoServer、Supermap)

SELECT CAST(GETDATE() AS VARCHAR(10)) 显示不同格式的原因

akka cluster 初体验

HDoj-2524 - 矩形A+B

bootstrap模态框和select2合用时input无法获取焦点

Asp.net MVC Request Life Cycle

Android应用程序模拟手机按键

变革之心——读后感

Linux编辑器vi使用方法详细介绍

【Win 10 应用开发】打印UI元素

Effective C++：规定12：不要忘了复制的对象时，它的每一个组成部分

SSD固态硬盘检测工具AS SSD参数

CentOS7.0 安装JAVA周围环境

关于windows系统里locale、code page、ANSI编码的问题

JQUERY prop与attr差额

多媒体流媒体

iOS当该装置是水平屏，frame和bounds分别

快速设计表单样式

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！-- 愿君每日到此一游！

当前时间: 2025-02-02 09:56:09 当前IP: 3.144.250.42 联系邮箱:javaeecc@qq.com Copyright © 2020 - 2022 baihongyu.com 京ICP备2021015314号-2

强烈建议你试试无所不能的CHAT-GPT，快点击我

强烈建议你试试无所不能的CHAT-GPT，快点击我