E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
#HDFS
HDFS
集群NameNode高可用改造
文章目录背景高可用改造方案实施环境准备配置文件修改应用配置集群状态验证高可用验证背景假定目前有3台zookeeper服务器,分别为zk-01/02/03,DataNode服务器若干;目前
HDFS
集群的Namenode
qq184861643
·
2023-10-26 07:25
中间件
#
Hadoop
hdfs
hadoop
大数据
Hadoop3.0大数据处理学习2(
HDFS
)
一、简介
HDFS
:HadoopDistributedFileSystem。Hadoop分布式存储系统一种允许文件通过网络在多台主机上分享的文件系统,可以让多机器上的用户分享文件和存储空间。
Huathy-雨落江南,浮生若梦
·
2023-10-26 07:25
Hadoop
大数据
hdfs
hadoop
大数据测试v 1.0
本次测试从6-12到7-12号整整历时1个月,除去休息,真正大约20个工作日,在这20个工作日里面,中途周末加过几次班,满打满算应该20多天,接触并经历了大数据功能测试、一体机性能测试、大数据Hadoop
HDFS
武晓兵
·
2023-10-26 06:17
大数据
云计算
第五课 Hbase存储详解
是建立的
hdfs
之上,提供高可靠性、高性能、列存储、可伸缩、实时读写的数据库系统。它介于nosql和RDBMS之间,仅能通过主键(rowkey)和主键的range来检索数据,仅支持单行事务。
Arroganter
·
2023-10-26 05:38
大数据系列之Spark集群环境部署
Spark作为一种大数据分布式计算框架,已经构建SparkStreaming、SparkSQL、SparkML等组件,与文件系统
HDFS
、资源调度YARN一起,构建了Spark生态体系,如下图所示:以下部分将主要介绍
solihawk
·
2023-10-26 04:51
大数据系列
#
spark
大数据
spark
HBase 压缩策略DateTieredCompactionPolicy
HBase是采用Log-StructuredMergeTree的架构,随着Flush阶段的不断触发,生成许多的HFile(默认128M),而不管是对于
HDFS
还是现有的HDD磁盘,大量的文件都会产生许多的问题
凡尔Issac
·
2023-10-26 03:44
linux查询日志命令加过滤,Linux记录-筛选日志sed、find、tail,du,awk命令
1.查看某一段时间的日志#cat
hdfs
-audit.log|sed-n'/2018-04-1110:00:00/,/2018-04-1110:01:00/p'|more---直接使用时间段#cat
hdfs
-audit.log
长亮不灭
·
2023-10-26 02:44
linux查询日志命令加过滤
hadoop集群搭建
hadoop有三种部署方式1、Local(Standalone)Mode(单机模式)数据存储在本地2、Pseudo-DistributedMode(伪集群模式)数据存储在
HDFS
3、Fully-DistributedMode
有人看我吗
·
2023-10-25 16:51
#
hadoop
hadoop
大数据
分布式
MR——worldcount案例
junitjunitRELEASEorg.apache.logging.log4jlog4j-core2.8.2org.apache.hadoophadoop-common2.6.0org.apache.hadoophadoop-client2.6.0org.apache.hadoophadoop-
hdfs
2.6.02
尘缘未了-
·
2023-10-25 13:57
hadoop
java
Spark-Core
依赖关系2.1查看血缘关系2.2查看依赖关系2.3窄依赖2.4宽依赖2.5Stage任务划分3、RDD持久化3.1Cache缓存3.2CheckPoint检查点3.3缓存和检查点区别3.4检查点存储到
HDFS
ha_lydms
·
2023-10-25 09:56
大数据
1024程序员节
spark-core
spark
Hadoop核心机制详细解析
Hadoop核心机制详细解析Hadoop的核心机制是通过
HDFS
文件系统和MapReduce算法进行存储资源、内存和程序的有效利用与管理。
Amao_come_on
·
2023-10-25 09:18
1024程序员节
【大数据】Hadoop
文章目录概述Hadoop组成
HDFS
MapReduce写MapReduce程序(Hadoopstreaming)YARNHadoop启动工作方式Hadoop的主从工作方式Hadoop的守护进程运行模式本地运行模式伪分布式运行模式完全分布式运行模式
软泡芙
·
2023-10-25 06:22
开发
1024程序员节
hadoop
大数据
大数据 - (六-2)- HBase
2)⽀持好多列HBase的特点海量存储:底层基于
HDFS
存储海量数据列式存储:HBase表的数据是基于列族进⾏存储的,⼀个列族包含若⼲列极易扩展:底层依赖
HDFS
,当磁盘空间不⾜的时候,只需要动态增加DataNode
啦啦啦喽啰
·
2023-10-25 04:38
未找到 ‘
hdfs
‘ 命令,您要输入的是否是: 命令 ‘hfs‘ 来自于包 ‘hfsutils-tcltk‘ (universe) 命令 ‘hdfls‘ 来自于包 ‘hdf4-tools‘ ....
在学习中碰到这个问题,问了老师,老师说是要配置bin的路径,找到了方法:Firstofall,在这之前,一定要做好备份!!!:直接复制你的虚拟机,粘贴在D盘里,然后打开粘贴后的虚拟机来修改,如果后面出错可以打开你那个原来的虚拟机。then,你需要:vim~/.bashrc你需要在开头加入【但,先将你这里面原先的内容复制一份txt到桌面,以防万一。并且记住你修改的这个文件的位置在哪里。】:expor
ZYT_庄彦涛
·
2023-10-25 03:31
大数据
linux
vim
linux
大数据
你想了解的分布式文件系统
HDFS
,看这一篇就够了
1、分布式文件系统计算机集群结构分布式文件系统把文件分布存储到多个节点(计算机)上,成千上万的计算机节点构成计算机集群。分布式文件系统使用的计算机集群,其配置都是由普通硬件构成的,与用多个处理器和专用高级硬件的并行化处理装置相比,前者大大降低了硬件上的开销。分布式文件系统的结构分布式文件系统在物理结构上是由众多阶段及节点构成的,而这些节点中分为两类。一类是主节点(MasterNode),又被称为名
与李_han
·
2023-10-25 01:48
hive知识点总结
Hive一、Hive简介什么是HiveHive由FaceBook实现并开源基于Hadoop的数据仓库工具可以将结构化的数据映射为一张数据库表并提供HQL(HiveSql)查询功能底层数据是存储在
HDFS
看着天上飞的猪
·
2023-10-25 01:53
大数据开发
hive
hadoop
大数据
Hadoop+Hive+Spark+Hbase开发环境练习
1.练习一1.数据准备在
hdfs
上创建文件夹,上传csv文件[root@kb129~]#
hdfs
dfs-mkdir-p/app/data/exam查看csv文件行数[root@kb129~]#
hdfs
dfs-cat
不吃香菜lw
·
2023-10-24 23:45
hadoop
hive
spark
hbase
HDFS
分布式文件系统设计原理
Hadoop分布式文件系统(
HDFS
)是一种被设计成适合运行在通用硬件上的分布式文件系统。
HDFS
是一个高度容错性的系统,适合部署在廉价的机器上。
zhaohong_bo
·
2023-10-24 19:34
学习笔记
HDFS
分布式文件系统
设计原理
<官网学大数据>Hive
Hive简介Hive是简历在Hadoop
HDFS
上的数据仓库基础架构Hive可以用来进行数据提取转化加载(ETL),通过sqoop加载数据Hive定义了简单的sql查询语言HqlHive是SQL解析引擎
kangapp
·
2023-10-24 16:48
2021年 全网最细大数据学习笔记(二):Hadoop 伪分布式安装
伪分布式安装1、Ubuntu20.04.2.0安装jdk2、配置SSH无密码登录3、Hadoop的下载与安装4、Hadoop环境配置5、启动与关闭Hadoop6、查看Hadoop的基本信息6.1、查看
HDFS
Web
Amo Xiang
·
2023-10-24 16:17
大数据开发
hadoop
大数据
linux
hadoop 伪分布式模式学习笔记
我采用的是hadoop-2.8.0,它主要包含3大块:
hdfs
:分布式存储系统
HDFS
(HadoopDistributedFileSystem)分布式存储层map
金曜软件工程师
·
2023-10-24 16:44
大数据
大数据
大数据学习
hadoop
人工智能
day_01小笔记----本地运行Hadoop 案例、伪分布式运行Hadoop 案例
0、hadoop1.x和hadoop2.x区别Hadoop1.x的核心组件与Hadoop2.x核心组件不一样Hadoop1.x:
hdfs
、common、mapreduce(mapreduce同时处理业务逻辑运算和资源调度
web15285868498
·
2023-10-24 16:12
java
java
后端
Hadoop伪分布式集群笔记
1、基本介绍以下是从其他地方抄过来了,目的是对即将要学的东西做一个基本的了解
HDFS
(分布式文件系统):解决海量数据存储YARN(作业调度和集群资源管理框架):解决资源任务调度MAPREDUCE(分布式运算变成框架
爆炒八酱
·
2023-10-24 16:40
hadoop
hadoop
分布式
大数据
分布式集群上安装hive及问题解决
因为hive是数据仓库,它主要就是将执行的sql语句转化为mapreduce任务,存储结构化数据,其实数据还是存储在
hdfs
上的,所以依赖hadoop集群,在此我们将hive安装到master节点。
技多不压身
·
2023-10-24 15:10
hive
hive
mysql
hadoop
【hadoop——
HDFS
操作常用的Shell命令】
1.Hadoop分布式文件系统(HadoopDistributedFileSystem,
HDFS
)是Hadoop核心组件之一,我们已经安装好了Hadoop2.7.1,其中已经包含了
HDFS
组件,不需要另外安装最基本的
所 爱
·
2023-10-24 14:34
hadoop
hadoop
hdfs
Hadoop单点安装FAQ
安装源:yuminstallepel-release-yQ1:Startingnamenodeson[localhost]ERROR:Attemptingtolaunch
hdfs
namenodeasrootERROR
DoNotStop
·
2023-10-24 11:08
hadoop
hadoop
hadoop启动报错:Attempting to operate on
hdfs
namenode as root
解决方案1:在环境变量中添加如下几个配置:vim/etc/profile添加export
HDFS
_NAMENODE_USER=rootexport
HDFS
_DATANODE_USER=rootexport
HDFS
_SECONDARYNAMENODE_USER
hzp666
·
2023-10-24 11:36
Hadoop
hadoop
hdfs
大数据技术学习笔记(三)—— Hadoop 的运行模式
执行分发操作3.3集群配置3.3.1集群部署规划3.3.2配置文件说明3.3.3修改配置文件3.3.4分发配置信息3.4SSH无密登录配置3.4.1配置ssh3.4.2无密钥配置3.5单点启动集群3.5.1启动
HDFS
夏木夕
·
2023-10-24 09:06
大数据
大数据
分布式
hadoop
笔记
Hadoop3教程(三十五):(生产调优篇)
HDFS
小文件优化与MR集群简单压测
文章目录(168)
HDFS
小文件优化方法(169)MapReduce集群压测参考文献(168)
HDFS
小文件优化方法小文件的弊端,之前也讲过,一是大量占用NameNode的空间,二是会使得寻址速度变慢。
经年藏殊
·
2023-10-24 08:30
大数据技术
hdfs
mr
hadoop
Greenplum Hadoop视频教程_Hadoop应用案例剖析
基于GreenplumHadoop分布式平台的大数据解决方案及商业应用案例剖析适合人群:高级课时数量:96课时用到技术:MapReduce、
HDFS
、Map-Reduce、Hive、Sqoop涉及项目:
xiarilove
·
2023-10-24 08:30
大数据
Hadoop视频教程
Hadoop应用案例
大数据技术——Hadoop3.X入门搭建+安装调优(2.
HDFS
)
文章目录一、
HDFS
概述1.1
HDFS
产出背景及定义1.2
HDFS
优缺点1.3
HDFS
组成架构1.4
HDFS
文件块大小(面试重点)二、
HDFS
的Shell操作(开发重点)2.1基本语法2.2命令大全2.3
虚神公子
·
2023-10-24 08:56
大数据
HDFS
Hadoop3教程(三十六):(生产调优篇)企业开发场景中的参数调优案例概述
文章目录(170)企业开发场景案例
HDFS
参数调优MapReduce参数调优YARN参数调优执行程序参考文献(170)企业开发场景案例这章仅做兴趣了解即可。需求:从1G数据中,统计每个单词出现次数。
经年藏殊
·
2023-10-24 08:54
大数据技术
大数据
hadoop
三台跨机群学生机云服务器搭建Hadoop分布式的性能测试
在配置了一个master两个slave,
hdfs
副本数设置为2的情况下,测试文件大小为400M左右,做一个简单的wordcount分析,文件从maste
xiaocxyczh
·
2023-10-24 04:17
大数据
【Hadoop】在云服务器上部署Hadoop2.7.1伪分布式集群
查看是否安装成功2、将hadoop添加到环境变量(1)在文件末尾添加以下内容(2)保存文件,刷新配置二、伪分布式配置文件设置1、修改`hadoop-env.sh`2、修改`core-site.xml`3、修改`
hdfs
-site.xml
櫆溟
·
2023-10-24 04:47
hadoop
分布式
服务器
手把手带你搭建Hadoop分布式集群
地址映射三台机子--时钟同步三台机子--添加普通用户三台机子--定义同一目录三台机子hadoop用户免登三台机子--关机重启安装jdk环境Hadoop下载安装服务部署规划修改core-site.xml
hdfs
-site
J1ay
·
2023-10-24 04:46
hadoop
分布式
hdfs
大数据中的分布式文件系统
HDFS
的选择题
一.单选题(共10题,50分)(单选题)分布式文件系统指的是什么?A.把文件分布存储到多个计算机节点上,成千上万的计算机节点构成计算机集群B.用于在Hadoop与传统数据库之间进行数据传递C.一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统D.一种高吞吐量的分布式发布订阅消息系统,可以处理消费者规模的网站中的所有动作流数据我的答案:A:把文件分布存储到多个计算机节点上,成千上万的计算
不想做程序猿的员
·
2023-10-24 02:39
大数据
hdfs
hadoop
HDFS
的基本操作(创建目录或文件、查看目录或文件、上传和拷贝文件到
HDFS
上、追加数据到
HDFS
上、从
HDFS
上下载文件到Linux本地、合并
HDFS
文件)
文章目录前言一、
HDFS
的相关命令1、在
HDFS
创建目录2、查看当前目录3、查看目录与子目录4、查看文件的内容5、创建文件6、上传和拷贝文件7、追加数据到
HDFS
文件中8、下载文件到Linux本地系统9
歪~懒羊羊
·
2023-10-24 01:41
hdfs
linux
hadoop
大数据
在mac上进行hadoop集群搭建
环境说明软件版本环境&软件版本操作系统&macOs11.2.1虚拟机&VMwareFusion12.1服务器&CentOS7.8jdk1.8hadoop2.9.2集群规划框架linux01linux02linux03
HDFS
NameNode
大鱼1995
·
2023-10-24 01:40
hadoop
hadoop
怎样在
hdfs
上创建多级目录文件夹_【Hadoop】如何在
hdfs
根目录下创建文件夹
shell命令创建文件夹启动
hdfs
,终端输入:start-dfs.sh在
hdfs
中创建一个input文件夹:hadoopfs-mkdir/input/1使用参数-p创建多级目录:hadoopfs-mkdir-p
林小摸
·
2023-10-24 01:09
利用Java api实现
hdfs
的上传、下载、创建目录
利用Javaapi实现
hdfs
的上传、下载、创建目录下载:download.javapackagecom.company;importorg.apache.hadoop.conf.Configuration
木易臣已灬
·
2023-10-24 01:37
hdfs
java
hadoop
HDFS
的文件夹创建、文件上传、文件下载、文件夹删除,文件更名、文件详细信息、文件类型判断(文件夹或者文件)
摘要:本篇文章主要介绍的是hadoop
hdfs
的基础api的使用。包括Windows端依赖配置,Maven依赖配置。
小雏菊的成长
·
2023-10-24 01:35
大数据开发相关技术学习笔记
hadoop
hdfs
大数据
intellij
idea
maven
Hdfs
常用命令
hdfs
常用命令
HDFS
操作命令也可用:
hdfs
dfs[-command]命令名称命令格式作用-cathadoopfs-cat查看
HDFS
文件系统里的文件内容-lshadoopfs-ls查看
HDFS
文件系统的目录
JACK-JIE
·
2023-10-24 01:04
大数据
hdfs
hadoop
大数据
《Hbase原理与实践》读书笔记——1.HBase概述
1.1HBase前世今生Google当年风靡一时的“三篇论文”:GFS->
HDFS
,Mapreduce->hadoopmapreduce,bigTable->HBase。
凯哥多帅哦
·
2023-10-24 01:33
hbase
大数据
hbase
大数据
hadoop用
HDFS
java api在
HDFS
上创建文件
/my
hdfs
”前面的“./”无法执行问题5.总结1.在IDER中创建
db_qxx_2026
·
2023-10-24 01:01
hadoop
hdfs
java
HDFS
API编程:第一个应用程序的开发:创建一个目录
使用javaapi操作
HDFS
文件系统创建一个目录:1)创建Configuration2)获取FileSystem3)一系列
HDFS
API操作packagecom.haglife.bigdata.hadoop.
hdfs
糯米君_
·
2023-10-24 01:29
大数据
hdfs
hadoop
大数据
java
HDFS
基本命令
目录1.上传文件到
HDFS
文件系统2.
雷神乐乐
·
2023-10-24 01:57
Hadoop3
hdfs
hadoop
大数据
HDFS
常用命令汇总
HDFS
常用命令汇总一、前言信息二、帮助信息查看1、查看帮助信息2、帮助文档(附带命令的详细说明)三、常用命令1、创建目录2、查看目录下的内容3、上传文件4、上传并删除源文件5、查看文件内容6、查看文件开头内容
GreaterBuilder
·
2023-10-24 01:55
hadoop
hdfs
hadoop
大数据
命令
hadoop调用
HDFS
java api实现在
HDFS
上创建文件夹
目录一、前期准备1、Hadoop集群已配置完毕2、Linux系统安装jdk3、安装并破解IntelliJIDEA二、通过JAVAAPI操纵
HDFS
1.在IDEA中创建项目2.在
hdfs
项目的src->main
db-冯春香-2064
·
2023-10-24 01:55
hadoop
java
hdfs
分布式
Apache Doris 入门教程09:数据导入之导入场景
按场景划分数据源导入方式对象存储(s3),
HDFS
使用Broker导入数据本地文件导入本地数据Kafka订阅Kafka数据Mysql、PostgreSQL,Oracle,SQLServer通过外部表同步数据通过
sunjian286
·
2023-10-23 22:23
apache
数据仓库
大数据
kafka
mysql
hadoopCDHStart
/bin/bashforiinhadoop101hadoop102doif[$i="hadoop101"]thenecho------------$iisstarting
hdfs
------------
白纸糊
·
2023-10-23 21:23
上一页
39
40
41
42
43
44
45
46
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他