E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hdfs租约
ZooKeeper在Hadoop中的协同应用:从NameNode选主到分布式锁实现
其核心架构主要包含
HDFS
(HadoopDistributedFileSystem)和YARN(YetAnotherResourceNegotiator)两大模块。
码字的字节
·
2025-07-29 04:29
hadoop布道师
分布式
zookeeper
hadoop
分布式锁
HDFS
常用命令
常用命令说明:-put和-get:上传和下载文件,是
HDFS
和本地文件系统交互的关键命令。-rm和-mkdir:删除和创建文件/目录,-rm支持递归删除。
BenChuat
·
2025-07-28 07:22
大数据学习
hdfs
hadoop
大数据
Hadoop中MapReduce和Yarn相关内容详解
接上一章写的
HDFS
说,Hadoop是一个适合海量数据的分布式存储和分布式计算的一个平台,上一章介绍了分布式存储,这一章介绍一下分布式计算——MapReduce。
·
2025-07-28 06:47
大数据领域Hadoop集群搭建的详细步骤
大数据领域Hadoop集群搭建的详细步骤关键词:Hadoop集群、
HDFS
、YARN、大数据平台、分布式系统、集群配置、故障排查摘要:Hadoop作为大数据领域的基石框架,其集群搭建是数据工程师和运维人员的核心技能
AI天才研究院
·
2025-07-27 20:02
ChatGPT
实战
ChatGPT
AI大模型应用入门实战与进阶
大数据
hadoop
分布式
ai
Hive/Spark小文件解决方案(企业级实战)–参数和SQL优化
重点是后面的参数优化一、小文件的定义在Hadoop的上下文中,小文件的定义是相对于Hadoop分布式文件系统(
HDFS
)的块(Block)大小而言的。
陆水A
·
2025-07-26 08:05
大数据
hive
hadoop
spark
python
C++与Hive、Spark、lib
hdfs
、ACID交互技巧
假设使用lib
hdfs
或thrift接口实现,部分示例需要结合Hive环境配置。
KENYCHEN奉孝
·
2025-07-26 05:49
C++
开发语言
spring
C++
hive
spark
Spark大数据处理讲课笔记4.8 Spark SQL典型案例
文章目录零、本讲学习目标一、使用SparkSQL实现词频统计(一)提出任务(二)实现任务1、准备数据文件2、创建Maven项目3、修改源程序目录4、添加依赖和设置源程序目录5、创建日志属性文件6、创建
HDFS
酒城译痴无心剑
·
2025-07-24 08:07
#
Spark基础学习笔记(1)
spark
笔记
sql
【大数据学习 | Spark-Core】RDD的概念与Spark任务的执行流程
但是,目前的MapReduce框架都是把中间结果写入到
HDFS
中,带来了大量的数据复制、磁盘IO和序列化开销。显然,如果能将结果保存在内存当中,就可以大量减少IO。
Vez'nan的幸福生活
·
2025-07-24 07:35
大数据
spark
oracle
sql
json
数据库和数据仓库区别
HIve与Mysql对比HiveMysql数据存储位置
HDFS
本地磁盘数据格式用户定义系统决定数据更新不支持(不支持修改和删除)支持(支持增删改查)索引有,但较弱,一般很少用有,经常使用的执行MapReduceExecutor
hhhecker
·
2025-07-23 14:42
Hadoop学习
数据仓库
数据库
hive
Spark RDD 之 Partition
一份待处理的原始数据会被按照相应的逻辑(例如jdbc和
hdfs
的split逻辑)切分成n份,每份数据对应到RDD中的一个Partition,Partition的数量决定了task的数量,影响着程序的并行度支持保存点
博弈史密斯
·
2025-07-23 06:19
深入解析Hadoop中的Region分裂与合并机制
其架构核心由
HDFS
(HadoopDistributedFileSystem)和MapReduce组成,前者负责数据的分布式存储,后者实现分布式计算。
码字的字节
·
2025-07-23 00:45
hadoop布道师
hadoop
大数据
分布式
Region
分裂
合并
大数据技术关键技术组件
大数据技术的关键组件通常包括:分布式存储系统:HadoopDistributedFileSystem(
HDFS
):一个高度可扩展
·
2025-07-23 00:12
大数据领域
HDFS
的集群资源管理优化
大数据领域
HDFS
的集群资源管理优化关键词:
HDFS
;集群资源管理;存储优化;性能调优;副本策略;负载均衡;NameNode优化摘要:
HDFS
(Hadoop分布式文件系统)作为大数据领域的基石,承载着海量数据的存储与管理重任
大数据洞察
·
2025-07-23 00:40
大数据与AI人工智能
大数据AI应用
大数据
hdfs
hadoop
ai
深入探索Hadoop技术:全面学习指南
本文旨在为初学者和进阶者提供一份详尽的Hadoop技术学习指南,涵盖
HDFS
、MapReduce、YARN等核心组件,以及Hive、Pig、HBase等生态系统工具,助您踏上H
·
2025-07-23 00:09
HDFS
文件系统
HDFS
文件系统是hadoop生态系统的核心,主要用于分布式文件存储,它具备高可用,流式读取,文件结构简单,跨平台的特点,它的集群采用的是主从结构,分为命名节点和数据节点,命名节点主要用于元数据管理(例如对目录
·
2025-07-22 15:16
Flink-Hadoop实战项目
1.2技术栈流处理引擎:ApacheFlink1.18.1存储系统:
HDFS
(Hadoop分布式文件系统)数据
Dylan_muc
·
2025-07-22 14:12
hadoop
hdfs
flink
大数据集群运维常见的一些问题以及处理方式
若为节点整体宕机:排查电源和网络,重启节点后,依次启动
HDFS
、YARN等服务进程,确认数据块完整性(避免因节点宕机导致副本不足)。
·
2025-07-22 14:09
hadoop 集群问题处理
1.1.JournalNode的作用在
HDFS
HA配置中,为了实现两个NameNode之间的状态同步和故障自动切换,Hadoop使用了一组JournalNode来管理共享的编辑日志。
一切顺势而行
·
2025-07-22 04:53
hadoop
大数据
分布式
sqoop从mysql导数据到
hdfs
,出现java.lang.ClassNotFoundException: Class QueryResult not found
运行sqoop从postgresql/mysql导入数据到
hdfs
,结果出现如下错误:2025-07-1816:59:13,624INFOorm.CompilationManager:HADOOP_MAPRED_HOMEis
无级程序员
·
2025-07-22 04:53
大数据
sqoop
mysql
hdfs
hive的sql优化思路-明白底层运行逻辑
一、首先要明白底层map、shuffle、reduce的顺序之中服务器
hdfs
数据文件在内存与存储之中是怎么演变的,因为hive的性能瓶颈基本在内存,具体参考以下他人优秀文章:1.HiveSQL底层执行过程详细剖析
ycllycll
·
2025-07-21 18:50
hive
sql
hadoop
六、深度剖析 Hadoop 分布式文件系统(
HDFS
)的数据存储机制与读写流程
深度剖析Hadoop分布式文件系统(
HDFS
)的数据存储机制与读写流程在当今大数据领域当中,Hadoop分布式文件系统(
HDFS
)作为极为关键的核心组件之一,为海量规模的数据的存储以及处理构筑起了坚实无比的根基
·
2025-07-21 16:05
大数据处理技术:分布式文件系统
HDFS
目录1实验名称:2实验目的3实验内容4实验原理5实验过程或源代码5.1
HDFS
的基本操作5.2
HDFS
-JAVA接口之读取文件5.3
HDFS
-JAVA接口之上传文件5.4
HDFS
-JAVA接口之删除文件
茜茜西西CeCe
·
2025-07-21 12:08
hdfs
hadoop
大数据
HDFS-JAVA接口
文件
头歌
Java
cdh6.3.2的hive使用apache paimon格式只能创建不能写报错的问题
解决方法 原带的jars下的zstd开头的包旧了,重新下载zstd较新的包单独放到每个节点的hive/lib下; 然后将
hdfs
yarn用户下的mr-framework.tar.gz中的zstdjar
明天,今天,此时
·
2025-07-20 05:26
hive
paimon
Hadoop与云原生集成:弹性扩缩容与OSS存储分离架构深度解析
Hadoop与云原生集成的必要性Hadoop在大数据领域的基石地位作为大数据处理领域的奠基性技术,Hadoop自2006年诞生以来已形成包含
HDFS
、YARN、MapReduce三大核心组件的完整生态体系
·
2025-07-19 16:49
ETL可视化工具 DataX -- 简介( 一)
DataX实现了包括MySQL、Oracle、OceanBase、SqlServer、Postgre、
HDFS
、Hive、ADS、
dazhong2012
·
2025-07-12 12:58
软件工具
数据仓库
datax
ETL
Hive简介
数据类型Hive简介1、Hive由Facebook实现并开源2、是基于Hadoop的一个数据仓库工具3、可以将结构化的数据映射为一张数据库表4、并提供HQL(HiveSQL)查询功能5、底层数据是存储在
HDFS
·
2025-07-12 05:29
ftp文件服务器有连接数限制,查看ftp服务器连接数命令
obs-connectorgeneric-jdbc-connectorftp-connector或sftp-connectorhbase-connector、
hdfs
-connector或hive-connectorOBS
赵承铭
·
2025-07-11 08:07
ftp文件服务器有连接数限制
ClickHouse高频面试题
OLAP数据库,存在哪些不足4、ClickHouse有哪些表引擎5、介绍下Log系列表引擎应用场景共性特点不支持6、简单介绍下MergeTree系列引擎7、简单介绍下外部集成表引擎ODBCJDBCMySQL
HDFS
KafkaRabbitMQ8
野老杂谈
·
2025-07-10 03:05
数据库
HDFS
伪分布模式搭建与使用全攻略(适合初学者 & 开发测试环境)
HDFS
(HadoopDistributedFileSystem)作为Hadoop生态系统的核心组件,广泛应用于海量数据的分布式存储场景。
huihui450
·
2025-07-09 08:27
hdfs
hadoop
大数据
MapReduce学习笔记
实体四:
HDFS
,用来在其它实体间共享作业文件。3.编写MapRed
·
2025-07-09 07:23
关于有时候使用VPN后,关闭系统代理后短时间无法正常使用网络的原因及解决办法
DHCP
租约
续期延迟校园网/DHCP服务器可能需要时间重新分配IP或更
·
2025-07-09 02:46
Hadoop核心组件最全介绍
文章目录一、Hadoop核心组件1.
HDFS
(HadoopDistributedFileSystem)2.YARN(YetAnotherResourceNegotiator)3.MapReduce二、数据存储与管理
Cachel wood
·
2025-07-07 12:54
大数据开发
hadoop
大数据
分布式
spark
数据库
计算机网络
数据仓库技术及应用(Hive 产生背景与架构设计,存储模型与数据类型)
1.Hive产生背景传统Hadoop架构存在的一些问题:MapReduce编程必须掌握Java,门槛较高传统数据库开发、DBA、运维人员学习门槛高
HDFS
上没有Schema的概念,仅仅是一个纯文本文件Hive
娟恋无暇
·
2025-07-07 12:49
数据仓库
笔记
hive
大数据 ETL 工具 Sqoop 深度解析与实战指南
异构数据源连接:支持关系型数据库(如MySQL、Oracle)与Hadoop生态(
HDFS
、H
·
2025-07-06 12:18
Hadoop之
HDFS
Hadoop之
HDFS
HDFS
的Shell操作启动Hadoop集群(方便后续测试)[atguigu@hadoop102~]$sbin/start-dfs.sh[atguigu@hadoop102~]$sbin
只年
·
2025-07-06 10:02
大数据
Hadoop
HDFS
hadoop
hdfs
大数据
HDFS
中fsimage和edits究竟是什么
fsimage和edits是Hadoop
HDFS
(Hadoop分布式文件系统)中的两个关键组件,用于存储文件系统的元数据,以确保文件系统的持久性和一致性。
清平乐的技术博客
·
2025-07-05 20:55
大数据运维
hdfs
hadoop
大数据
【Hadoop】Hadoop车辆数据存储
Hadoop车辆数据存储本作业旨在实现将车辆数据按天存储到Hadoop分布式文件系统(
HDFS
)中,并根据数据文件大小分割成多个文件进行存储。数据格式为JSON。
db_hjx_2066
·
2025-07-05 12:29
java
hadoop
HDFS
与HBase有什么关系?
1、
HDFS
文件存储系统和HBase分布式数据库
HDFS
是Hadoop分布式文件系统。HBase的数据通常存储在
HDFS
上。
HDFS
为HBase提供了高可靠性的底层存储支持。
lucky_syq
·
2025-07-04 13:58
hdfs
hbase
hadoop
Hbase和关系型数据库、
HDFS
、Hive的区别
目录1.Hbase和关系型数据库的区别2.Hbase和
HDFS
的区别3.Hbase和Hive的区别1.Hbase和关系型数据库的区别关系型数据库Hbase存储适合结构化数据,单机存储适合结构化和半结构数据的松散数据
别这么骄傲
·
2025-07-04 13:58
hive
hbase
数据库
大数据基础知识-Hadoop、HBase、Hive一篇搞定
HadoopHadoop是一个由Apache基金会所开发的分布式系统基础架构,其核心设计包括分布式文件系统(
HDFS
)和MapReduce编程模型;Hadoop是一个开源的分布式计算框架,旨在帮助用户在不了解分布式底层细节的情况下
原来是猪猪呀
·
2025-07-04 13:28
hadoop
大数据
分布式
Hadoop、
HDFS
、Hive、Hbase区别及联系
Hadoop、
HDFS
、Hive和HBase是大数据生态系统中的关键组件,它们都是由Apache软件基金会管理的开源项目。下面将深入解析它们之间的区别和联系。
静心观复
·
2025-07-04 13:27
大数据
hadoop
hdfs
hive
大数据(1)-
hdfs
&hbase
hbase&
hdfs
一、体系结构
HDFS
是一个标准的主从(Master/Slave)体系结构的分布式系统;
HDFS
集群包含一个或多个NameNode(NameNodeHA会有多个NameNode)和多个
viperrrrrrr
·
2025-07-04 13:26
大数据
hdfs
hbase
Hadoop入门案例
Hadoop的运行流程:客户端向
HDFS
请求文件存储或使用MapReduce计算。NameNode负责管理整个
HDFS
系统中的所有数据块和元数据信息;DataNode则实际存储和管理数据块。
'Wu'
·
2025-07-04 01:12
学习日常
大数据
hadoop
hdfs
大数据
Hadoop、Spark、Flink 三大大数据处理框架的能力与应用场景
一、技术能力与应用场景对比产品能力特点应用场景Hadoop-基于MapReduce的批处理框架-
HDFS
分布式存储-容错性强、适合离线分析-作业调度使用YARN-日志离线分析-数据仓库存储-T+1报表分析
·
2025-07-02 13:45
使用datax进行mysql的表恢复
DataXDataX是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括MySQL、SQLServer、Oracle、PostgreSQL、
HDFS
、Hive、HBase、OTS、ODPS等各种异构数据源之间高效的数据同步功能
是桃萌萌鸭~
·
2025-06-29 22:14
mysql
数据库
【头歌】MapReduce基础实战 答案
答案:需要先在命令行启动
HDFS
#命令行start-dfs.sh再在代码文件中写入以下代码#代码文件importjava.io.IOException;importjava.util.S
Seven_Two2
·
2025-06-29 14:07
头歌大数据实验答案
c#
开发语言
HDFS
(Hadoop分布式文件系统)总结
文章目录一、
HDFS
概述1.定义与定位2.核心特点二、
HDFS
架构核心组件1.NameNode(名称节点)2.DataNode(数据节点)3.Client(客户端)4.SecondaryNameNode
Cachel wood
·
2025-06-26 22:40
大数据开发
hadoop
hdfs
大数据
散列表
算法
哈希算法
spark
Hadoop的部分用法
Hadoop的核心是
HDFS
(HadoopDistributedFileSystem)和MapReduce编程模型。1.Hadoop环境搭建在开始使用Hadoop之前,你需要搭建Hadoop环境。
覃炳文20230322027
·
2025-06-26 16:30
hadoop
hive
大数据
分布式
Hadoop 版本进化论:从 1.0 到 2.0,架构革命全解析
Hadoop版本hadoop1.x版本由三部分组成Common(辅助工具)
HDFS
(数据存储)MapReduce(计算和资源调度)存在的问题JobTracker同时具备了资源管理和作业控制两个功能,成为了系统的最大瓶颈采用了
拾光师
·
2025-06-25 18:02
大数据
后端
合并小文件汇总(Hive/Spark)
合并小文件的原因:过多的小文件会导致
HDFS
上元数据负载增加。并且小文件也会导致计算性能下降。
有数的编程笔记
·
2025-06-25 15:06
Spark/Hive
hive
spark
hadoop
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他