E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
#HDFS
hdfs
shell的基本操作以及
hdfs
Web查看文件
在安装好hadoop集群并成功的启动了
hdfs
之后,我们就可以利用
hdfs
对文件进行操作了,一下是对文件的一些基本操作
hdfs
基本操作1、查询命令hadoopdfs-ls/查询/目录下的所有文件和文件夹
音乐与咖啡Bean
·
2023-10-09 02:06
分布式文件系统
HDFS
(林子雨慕课课程)
文章目录3.分布式文件系统
HDFS
3.1分布式文件系统
HDFS
简介3.2
HDFS
相关概念3.3
HDFS
的体系结构3.4
HDFS
的存储原理3.5
HDFS
数据读写3.5.1
HDFS
的读数据过程3.5.2
HDFS
几窗花鸢
·
2023-10-09 00:47
大数据应用
hadoop
hdfs
hadoop
大数据
Hadoop(林子雨慕课课程)
2.4Hadoop集群的部署和使用2.Hadoop2.1Hadoop简介Hadoop可以支持多种编程语言:c,c++,java,pythonHadoop用java语言开发,具有跨平台特性Hadoop两大核心:
HDFS
几窗花鸢
·
2023-10-09 00:05
大数据应用
hadoop
hadoop
大数据
分布式
Hbase 概念扫盲
首先,它大部分的时候,依赖于Hadoop的分布式存储方案
HDFS
,
HDFS
的设计初衷就是为了方便水平扩展。Hbase依赖于它,将物理数据落户
HDFS
。
送过快递的码农
·
2023-10-08 19:01
Flink 状态编程 (十)状态持久化和状态后端
Flink管理机制中,很重要的一个功能就是对状态进行持久化保存,这样就可以在发生故障进行重启恢复,持久化方式为当前状态,拍一个快照,并写入检查点,存储在外部存储系统中,存储介质一般为分步式文件系统(例如
HDFS
Alienware^
·
2023-10-08 17:22
#
Flink
Flink
Hadoop2.x安全:hadoop集群之kerberos认证(一、原理+安装配置)
对你有帮助,欢迎转发朋友圈从微信公众号拷贝过来,格式有些错乱,建议直接去公众号阅读一、为什么启用Kerberos安全认证大家都知道,Hadoop1.0.0或者CDH3版本以前,并没有安全认证的概念,用户与
HDFS
大数据开发运维架构
·
2023-10-08 15:16
修炼k8s+flink+
hdfs
+dlink(一:安装dlink)
一:mysql初始化。mysql-uroot-p123456createdatabasedinky;grantallprivilegesondinky.*to'dinky'@'%'identifiedby'dinky'withgrantoption;flushprivileges;二:上传dinky。上传至目录/opt/app/dlinktar-zxvfdlink-release-0.7.4.ta
宇智波云
·
2023-10-08 12:23
dinky
flink
flink
hdfs
大数据
Hadoop核心组件
Hadoop的三大核心组件分别是:
HDFS
(HadoopDistributeFileSystem):hadoop的数据存储工具。
HZHZHZ
·
2023-10-08 10:16
Hadoop ----
HDFS
MapReduce
HDFS
NameNode负责管理DataNode保存所有的元数据(目录的位置结构存储的磁盘位置)是
HDFS
的核心是单点故障一旦出现问题整个
HDFS
不在对外提供服务·edits操作日志文件fsimage元数据文件
烟解愁、酒上头
·
2023-10-08 07:55
hadoop
分布式
离线数仓
hadoop
mapreduce
hdfs
分布式
大数据技术之Hadoop-
HDFS
架构
大数据技术之Hadoop-
HDFS
架构官方网站简介假设与目标硬件故障流式数据访问大数据集简单一致性模型“移动计算比移动数据便宜”跨异构硬件和软件平台的可移植性NameNode和DataNodes文件系统命名空间数据副本第一步
只要学不死就往死里学-致自己
·
2023-10-08 07:55
大数据技术之Hadoop
Hadoop之
HDFS
及MapReduce详解,以及HA集群搭建
一、概述大数据大数据(bigdata)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产大数据的5V特点(IBM提出):Volume(大量)Velocity(高速)Variety(多样)Value(低价值密度)Veracity(真实性)Hadoop是什么?http://hadoop.
Mayz梅子子子
·
2023-10-08 07:55
Hadoop
hadoop
mapreduce
hdfs
hadoop之
HDFS
一、背景1、企业存储系统a.存储设备硬盘·硬盘是计算机的主要存储硬件,可用来存储数据·市面上流行的硬盘多少是TB级·硬盘分类:机械硬盘HDD、固态硬盘SSD、混合硬盘SSHD机械硬盘的特点:体积大、价格便宜、读写速度慢、内部有马达和风扇、寿命长固态硬盘的特点:体积小、价格贵、读写速度快、寿命短RAID磁盘队列磁盘队列由很多独立磁盘组合成容量巨大的磁盘组,存储和容错性能提升b.存储架构类型DAS直连
测试开发知识积累
·
2023-10-08 07:53
技术类
大数据
大数据
BigData5:Hadoop之
HDFS
的Edits和Fsimage文件
Edits相关知识当执行格式化指令时,会在指定的tmp目录下,生成dfs/name目录。此目录是namenode服务器存储元数据的目录当格式化后,启动HFDS前,会生成一个最初的fsimage_0000000000000000000文件在dfs/data目录,这是datanode节点存储数据块的目录。元数据的存储目录和数据节点的目录的路径可以分开指定在dfs/name/in_use.lock,这个
程序员大魔王
·
2023-10-08 07:23
Hadoop
大数据学习
hdfs
hadoop
大数据
hadoop系列(二)常用配置、启动方式、
HDFS
,YARN配置文件
Hadoop(二)常用配置、启动方式、
HDFS
,YARN配置文件概述:来自Hadoop官网的介绍NowyouarereadytostartyourHadoopclusterinoneofthethreesupportedmodes
故山归梦远
·
2023-10-08 07:53
hadoop
hdfs
大数据
Hadoop之
hdfs
简介
Hadoop的
hdfs
简介hadoop2x三大核心:
hdfs
、yarn、mapreduce.hadoop四大模块:HadoopCommon:为其他Hadoop模块提供基础设施。
墙角的枫叶
·
2023-10-08 07:53
hadoop学习笔记
hdfs简介
Hadoop详解系列——一文读懂
HDFS
目录一、概述二、
HDFS
核心设计2.1、
HDFS
心跳机制2.2、
HDFS
安全模式(SafeMode)2.2.1、NameNode进入SafeMode的方式2.2.2、如何退出SafeMode2.2.3安全模式常用命令总结
iwen513
·
2023-10-08 07:22
Hadoop系列文章
hadoop
big
data
hdfs
hadoop报错java.io.IOException: Incompatible clusterIDs in /usr/local/hadoop/tmp/dfs/data: namenode clu
没有启动2.查看日志,发现datanode和namenode的CID对不上问题原因1.namenode格式化次数过多,导致子节点datanode和namenode的CID不一致了解决方案1.cat切入
hdfs
.site.xml
JSU_曾是此间年少
·
2023-10-08 07:52
hadoop
Hadoop
HadoopHadoop安装集群部署规划hadoop-3.1.3/etc/hadoop/core-site.xmlhadoop-3.1.3/etc/hadoop/
hdfs
-site.xmlhadoop-
FangSai_ovo
·
2023-10-08 07:51
大数据生态圈
hadoop
hdfs
big
data
【Hadoop】
HDFS
——分布式文件系统
文章目录一、Hadoop分布式文件系统架构1概念1.1文件存放在一个磁盘上效率低1.2字节数组1.3切分数据1.4拼接数据1.5偏移量1.6数据存储的原理2.Block拆分标准2.1拆分的数据块需要等大2.2数据块block2.3注意事项2.4Block数据安全2.5Block的管理效率二、Hadoop伪分布式搭建三、NomeNode四、DataNode五、SecondaryNameNode1传统
嗯,哦,呵呵。
·
2023-10-08 07:21
大数据
大数据—Hadoop之
HDFS
架构
HDFS
架构一、
HDFS
访问流程读取数据操作:用户进行读取数据请求,首先传入Namenode数据块,Namenode将读写信息传给Client,再由Client根据Namenode所给的信息找到数据所在的
擎宇T
·
2023-10-08 07:21
大数据
HDFS
大数据
Hadoop
分布式存储
Hadoop-
HDFS
基础回顾
一.block
HDFS
作为一种文件系统,当然也需要有‘block’的概念。不过
HDFS
的block一般比较大,默认为128MB。
码虫码农
·
2023-10-08 07:50
hadoop
Hadoop(6)
HDFS
Hadoop(6)
HDFS
文章目录Hadoop(6)
HDFS
HDFS
HDFS
介绍
HDFS
的定义
HDFS
的优缺点
HDFS
的应用场景
HDFS
的组成配置Hadoop开发环境
HDFS
的Shell命令
HDFS
操作
Alaskyed
·
2023-10-08 07:20
大数据
#
Hadoop
大数据
hadoop
hdfs
Hadoop设置
hdfs
全局指令
bashrc然后添加如下内容exportPATH=$PATH:/usr/local/hadoop/bin添加到你的hadoop下载目录的bin目录为止就可以了重新激活一下配置文件source~/.bashrc
hdfs
JSU_曾是此间年少
·
2023-10-08 07:20
hadoop
hdfs
Flume如何把日志写到HA的
HDFS
中
第二步复制hadoop下的
hdfs
-site.xml到flume的conf文件夹下。flume会自动读取这2各配置文件内容作为flume的初始化或者过程中的值使用。
明明德撩码
·
2023-10-08 04:02
sqoop
它包括以下两个方面:可以使用Sqoop将数据从关系型数据库管理系统(如MySql)导入到Hadoop系统(如
HDFS
、Hive、HBase)中;将数据从Hadoop系统中抽取并导出到关系型数据库(如MySql
小小大数据
·
2023-10-08 01:52
Sqoop
sqoop
hadoop
大数据
解决:hadoop无法访问50070端口
解决首先换成ip:50070是否成功其次手动修改配置文件设置默认端口修改
hdfs
.xmlvietc/hadoop/
hdfs
-site.xmldfs.http.address0.0.0.0:50070先关闭
燕山北
·
2023-10-07 23:09
错误解决
IDEA 2022没有VM option,无法设置虚拟机用户
最近学习
HDFS
的客户端(client)与虚拟机(
HDFS
)的交互,需要改虚拟机参数的时候,发现新版IDEA没有VMoptions这一选项,解决的方式如下:1.IDEA--->右键>@选择ModifyRunConfigurations
北方569
·
2023-10-07 22:36
intellij-idea
java
hadoop
大数据 | Pyspark基本操作
它的优势有三个方面:通用计算引擎能够运行MapReduce、数据挖掘、图运算、流式计算、SQL等多种框架;基于内存数据可缓存在内存中,特别适用于需要迭代多次运算的场景;与Hadoop集成能够直接读写
HDFS
RichardsZ_
·
2023-10-07 21:10
机器学习
大数据
hive 导出数据
1.导出到
hdfs
insertoverwritedirectory'$
hdfs
_dir'selectdistinctconcat(query,'\t',query_hash)fromtable_namewhereday
吹洞箫饮酒杏花下
·
2023-10-07 21:55
Spark基础
spark基础1、为什么使用SparkⅠ、MapReduce编程模型的局限性(1)繁杂只有Map和Reduce两个操作,复杂的逻辑需要大量的样板代码(2)处理效率低Map中间结果写磁盘,Reduce写
HDFS
罗刹海是市式市世视士
·
2023-10-07 17:51
spark
大数据
分布式
大数据软件系统开发框架
1.ApacheHadoop:Hadoop是一个开源的分布式数据存储和处理框架,它包括Hadoop分布式文件系统(
HDFS
)和MapReduce编程模型。Hadoop可以处理大规模数据集的
defdsdddev
·
2023-10-07 15:54
大数据
Hadoop 2.7.4
HDFS
+YRAN HA部署
实验环境主机名称IP地址角色统一安装目录统一安装用户sht-sgmhadoopnn-01172.16.101.55namenode,resourcemanager/usr/local/hadoop(软连接)/usr/local/hadoop-2.7.4/usr/local/zookeeper(软连接)/usr/local/zookeeper-3.4.9rootsht-sgmhadoopnn-021
天为我蓝
·
2023-10-07 11:10
大数据
java
运维
浅析
HDFS
FairCallQueue
背景Hadoop服务组件,尤其是NameNode,处理来自Client的RPC请求时,往往承受较重的负载。默认情况下,各种请求在FIFO的队列中进行处理(具体实现为java.util.concurrent.LinkedBlockingQueue)。此时如果某个用户执行的I/O操作较多,那么相比其他I/O操作较少的用户,他将获得更多服务。在这种情况下,FIFO有失公平性,并且会导致其它用户的延迟大大
yukikaze_nanoda
·
2023-10-07 11:10
大数据
java
开发语言
大数据笔/面试题
一.Hadoop1.
hdfs
写流程2.
hdfs
读流程3.
hdfs
的体系结构4.一个datanode宕机,怎么一个流程恢复5.hadoop的namenode宕机,怎么解决6.namenode对元数据的管理
四月天03
·
2023-10-07 11:09
大数据(其他)
hadoop
hdfs
big
data
那些在CDH5中是bug,到了CDH6版本就修复了的问题
涉及到Hadoop、
HDFS
、YARN、HBASE、hive、hue、impala、kudu、oozie、solr、spark、kafka、parquet、zookeeper等组件。
ClouderaHadoop
·
2023-10-07 11:09
Cloudera
impala
hdfs
大数据
hadoop
spark
HDFS
之Fair Call Queue优化
文章目录FairCallQueue加权机制基于Cost的扩展配置FairCallQueueNamenode作为集群的管理角色,是RPC请求的中心,会承载来自所有客户端的RPC请求。默认的队列实现是FIFO,在这种情况下,如果某个用户的请求数量过多,可能会造成整个系统中其他所有用户的阻塞。FairCallQueue特性的出现就是为了解决该问题。加权机制客户端的请求会首先放入一个ListenQueue
zincooo
·
2023-10-07 11:39
HDFS
hdfs
大数据
hadoop
大数据学习,涉及哪些技术?
分布式存储系统:如Hadoop
HDFS
、AmazonS3、GoogleCloudStorage等。数据仓库:如AmazonRedshift
金木讲编程
·
2023-10-07 08:14
大数据
学习
一文快速学会Hadoop伪分布式环境搭建,很详细
文章目录一、准备工作二、配置ssh免密登录三、修改hadoop的配置文件四、格式化namenode节点,启动
hdfs
,启动yarn一、准备工作配置hadoop模板虚拟机(学习篇)CentOS7安装jdkcentos7
小雨凉如水
·
2023-10-07 06:12
hadoop
hadoop
分布式
hdfs
Hadoop伪分布式环境搭建过程
1.下载解压安装hadoop,JDK2.配置SSH免密码登录3.将JDK和hadoop的安装目录添加到环境变量中4.配置hadoop-env.sh5.配置core-site.xml6.配置
hdfs
-site.xml7
SELECT *
·
2023-10-07 06:11
hadoop
分布式
hdfs
Hive的分桶详解
Hive分桶通俗点来说就是将表(或者分区,也就是
hdfs
上的目录而真正的数据是存储在该目录下的文件)中文件分成几个文件去存储。
piziyang12138
·
2023-10-07 01:00
hive 修改cluster by算法_Hive入门实战(二)DDL数据定义
一、数据仓库--DDL数据定义1、创建数据库(1)创建一个数据库,数据库在
HDFS
上的默认存储路径是/user/hive/warehouse/*.db。
weixin_39879651
·
2023-10-06 22:42
hive
修改cluster
by算法
hive查看表中列的信息命令
hadoop - 常用命令
启动NameNodehadoop-daemon.shstartnamenode
hdfs
--daemonstartnamenode关闭NameNodehadoop-daemon.shstopnamenode
hdfs
静水流深ylyang
·
2023-10-06 20:46
大数据的生态圈
首先,我先带大家看下整个的hadoop的生态圈2针对每一个组件,我们进行详细的介绍:1、
HDFS
(Hadoop分布式文件系统)源自于Google的GFS论文,发表于2003年10月,
HDFS
是GFS克隆版
myHope2017
·
2023-10-06 18:41
hdfs
命令
ls格式:
hdfs
dfs-lsURI作用:类似于Linux的ls命令,显示文件列表
hdfs
dfs-ls/lsr格式:
hdfs
dfs-lsrURI作用:在整个目录下递归执行ls,与UNIX中的ls-R类似
吾为天帝乎
·
2023-10-06 13:34
大数据hadoop问题汇总【Hadoop/
HDFS
/Yarn篇】
2021年初的时候,关于Hadoop要退休淘汰的PR文章甚嚣尘上。其中MapReduce思想最为人所诟病,因为其并不友好的写代码方式,高昂的维护成本以及较差的运行效率。然而MapReduce作为一种编程范式,要被淘汰恐怕也没有那么容易。很多人说你看Spark速度那么快,也很稳定啊,这不是可以淘汰掉Hadoop的MapReduce了吗?是这样吗?所谓的快和慢是根据需求来的,基于RDD的处理比MapR
程序员的隐秘角落
·
2023-10-06 13:00
DataX 的配置及使用
DataX是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括MySQL、SQLServer、Oracle、PostgreSQL、
HDFS
、Hive、HBase、OTS、ODPS等各种异构数据源之间高效的数据同步功能
Q以梦为马
·
2023-10-06 13:50
hadoop系列安装小记
cdh独立下载hadoop各个组件再安装比较繁琐(
hdfs
+yarn+hbsae+zk+hive),没有选好版本可能会冲突,CDH的版本都是选定好的,安装和升级文档齐全,非常方便5.1.0各版本信息5.1.0
陈涛_滴滴
·
2023-10-06 10:26
在大数据相关技术中,HBase是个分布的、面向列的开源数据库,是一个适合于非结构化数据存储的数据库。
HDFS
,适合运行在通用硬件上的分布式文件系统,是一个高度容错性的系统,适合部署在廉价的机器上。Hbase,是一个分布式的、面向列的开源数据库,适合于非结构化数据存储。
晨晨渝奇
·
2023-10-05 09:18
大数据
数据库
hbase
大数据实战 Linux Ubuntu 20.04.1 hadoop 2.8.5 在MapReduce平台 编写单词计数程序
su-angel主节点进程从节点进程2.3建立测试文档测试文档的路径是/home/angelvim.tinysw1.txtvim.tinysw2.txt2.4建立测试文件夹并上传到集群在集群中查看文件
hdfs
dfs-ls
十旬叶大叔
·
2023-10-05 07:42
Linux
大数据
hadoop
mapreduce
java
HDFS
基础
搭建
HDFS
后简单介绍下这个分布式文件管理系统。块名称节点和数据节点在搭建hadoop集群时配置core-site.xml文件配置了hadoop.tmp.dir是NameNode的主目录。
_小许_
·
2023-10-05 05:15
大数据
hdfs
dfs
大数据
上一页
46
47
48
49
50
51
52
53
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他