E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
#HDFS
架构设计之大数据架构(Lambda架构、Kappa架构)
结构图4.2优缺点4.3实际案例五.Lambda架构与Kappa架构对比其它相关推荐:系统架构之微服务架构系统架构设计之微内核架构鸿蒙操作系统架构所属专栏:系统架构设计师一.大数据技术生态存储:主要包括
HDFS
Elaine猿
·
2023-11-03 02:30
系统架构设计师
大数据
架构
系统架构
软考
大数据架构
HDFS
的安全模式
如果
HDFS
处于安全模式,则表示
HDFS
是只读状态。当集群启动的时候,会首先进入安全模式。当系统处于安全模式时会检查数据块的完整性。
Summer_1981
·
2023-11-03 02:35
大数据Hadoop面试题(二)——
HDFS
1、
HDFS
中的block默认保存几份?默认保存3份2、
HDFS
默认BlockSize是多大?默认64MB3、负责
HDFS
数据存储的是哪一部分?
蓦然1607
·
2023-11-02 22:53
Hive报错
报错如下:CannotobtainblocklengthforLocatedBlockimpala.error.OperationalError:DiskI/Oerror:Failedtoopen
HDFS
file
hdfs
米卡啦
·
2023-11-02 20:54
理论学习--【Hadoop生态原理学习】
一、Hadoop原理1.核心:
HDFS
(存储)、MapReduce(分析)解决大量数据存储与处理的问题离线分析:hive实现查询:hbaseBI分析:Mahout2.版本1.0mapreduce还进行资源调度
zenas_yuan
·
2023-11-02 18:31
Hadoop
hadoop
spark 只基于内存计算
因为有种缓存策略叫,即基于内存,又基于磁盘(也就是
hdfs
)例如,如果前面我们经过了一大堆transformations算子的计算,想把结果缓存下来,但是内存又不够,此时如果我们选择只存入内存,那么没有存下的部
scandly
·
2023-11-02 17:46
HashData与
HDFS
的高效数据交换
背景与挑战在对象存储技术出现和普及之前,
HDFS
(Hadoop分布式文件系统)是市场上为数不多的开源、免费、高性价比(相对于昂贵的SAN系统)PB级存储系统,大量用于企业数据归档场景。
HashData酷克数据
·
2023-11-02 16:06
产品动态
数据仓库
HDFS
高级-架构原理
文章目录1
HDFS
架构剖析1.1集群角色介绍1.2
HDFS
重要特性2
HDFS
WebInterfaces2.1模块功能解读OverviewdatanodesDatanodeVolumeFailuresSnapshotSatartupprogressUtilitiesBrowsethefilesystemLogs
火 玄
·
2023-11-02 15:34
hadoop
hdfs
架构
hadoop
HDFS
- 架构图详细解析
HDFS
:我们至少应该学习以下内容
Hdfs
架构设计
Hdfs
优缺点
Hdfs
如何读取文件
Hdfs
如何写入文件
Hdfs
副本存放策略
hdfs
访问命令
Hdfs
数据复制
Hdfs
空间回收Namenode的热备NN&2NN
piepis
·
2023-11-02 15:00
大数据-Hadoop脉络
hdfs
架构图
hadoop
HDFS
读写架构
一、组成架构1、NameNode(NN):集群的Master,它是一个主管,管理者(1)管理
HDFS
的命名空间(2)配置副本策略(3)管理数据块(Block)映射信息(4)处理客户端读写请求2、DataNode
Agatha方艺璇
·
2023-11-02 15:55
大数据
Hadoop
hdfs
架构
hadoop
Apache Doris (二十六):Doris 数据导入(四)Broker Load -2 案例及注意事项
目录1.BrockerLoad案例1.1导入
HDFS
数据到Doris表1.2通配符导入
HDFS
数据,并指定列顺序
IT贫道
·
2023-11-02 12:46
大数据OLAP体系技术栈
doris
olap
实时数仓
数据仓库
大数据
分布式数据库
clickhouse 在
hdfs
和本地推数据
hadoopfs-cat/test001/zgh/tmp/demoaaa/*|clickhouse-client--query="insertintotest.demoaaa"hadoopfs-cat
hdfs
早点起床晒太阳
·
2023-11-02 12:09
Hadoop
HDFS
(分布式文件系统)
一、Hadoop
HDFS
(分布式文件系统)为什么要分布式存储数据假设一个文件有100tb,我们就把文件划分为多个部分,放入到多个服务器靠数量取胜,多台服务器组合,才能Hold住数据量太大,单机存储能力有上限
syst1m'
·
2023-11-02 10:06
大数据
hadoop
hdfs
大数据
HDFS
集群环境部署(超级详细!!)
一、部署Hadoop的关键点1.上传,解压到/export/server,配置软链接2.修改4个配置文件,workers,hadoop.env.sh,core-stie.xml,
hdfs
-site.xml3
syst1m'
·
2023-11-02 10:06
大数据
hdfs
hadoop
大数据
Hadoop相关知识点
初识Hadoop四、三种模式的区别4.1、单机模式与伪分布式模式的区别4.2、特点4.3、配置文件的差异4.3.1、单机模式4.3.2、伪分布式模式4.3.3、完全分布式模式五、问答题六、shell访问
hdfs
浪漫的诗人
·
2023-11-02 07:15
hadoop
大数据
分布式
HDFS
架构介绍
数新网络_让每个人享受数据的价值浙江数新网络有限公司是一家开源开放、专注于云数据智能操作系统和数据价值流通的服务商。公司自主研发的DataCyber云数据智能操作系统,主要包括数据平台CyberData、人工智能平台CyberAI、数据智能引擎CyberEngine、数据安全平台CyberSecurity。数新网络可提供大数据开发管理、安全合规、建模分析、价值流通等多种服务,让大数据、AI和数据价
数新网络
·
2023-11-02 05:50
架构
hdfs
4
HDFS
常用命令 2018-05-24
jps2034NameNode2148DataNode2633NodeManager5129Jps2521ResourceManager2364SecondaryNameNode查看详细进程[hadoop@hadoop003~]$jps-l2034org.apache.hadoop.
hdfs
.server.namenode.NameN
lizhigang
·
2023-11-02 05:28
《HBase原理与实践》阅读笔记(六)
学习笔记(13-14章)1.HBase系统调优1.1.HBase-
HDFS
调优1.2.HBase读写性能调优1.2.1.HBase读取性能优化1.2.2.HBase写入性能优化1.3.HBase操作系统调优
TNTZS666
·
2023-11-02 04:12
大数据学习
HBase
大数据复习(day03)
HDFS
特点总结
HDFS
特点1、分布式存储架构,支持海量数据存储。(GB、TB、PB级别数据)2、高容错性,数据块拥有多个副本(副本冗余机制)。副本丢失后,自动恢复。
快乐咸鱼Y
·
2023-11-02 04:05
大数据
大数据
Hadoop 面试知识点整理
面试知识点整理整理来源https://www.cnblogs.com/yunkaifa/p/3538154.htmlhttp://www.aboutyun.com/thread-5337-1-1.html一句话知识点负责
HDFS
hakase_nano
·
2023-11-02 02:39
Hive常见面试题汇总
比如可以结合平时使用hive的经验作答,也可以结合下图从数据的读入、解析、元数据的管理,数据的存储等角度回答:1.MetaStoreMetaStore并不存储真实的数据,只是存储数据库的元数据信息,数据是存储在
HDFS
weixin_45675924
·
2023-11-01 21:42
hive
Hive精选高频面试题
Hive架构HQL编译为MR任务流程介绍HQL转换为MR核心流程2.Hive和数据库比较1)数据存储位置Hive存储在
HDFS
。
数据行
·
2023-11-01 21:36
大数据开发面试
hive
大数据
hive复习题、面试题
)、WEBUI(浏览器访问hive)元数据:Metastore包括表名、表所属的数据库、表的拥有者、列/分区字段、表的类型、表数据所在的目录等(自带个derby数据库,推荐配置到MySQL)底层存储:
HDFS
梧桐林.
·
2023-11-01 20:32
hive
hive
big
data
流计算处理系统入门
流计算框架Hadoop:批处理框架:采集的数据全存入
HDFS
,并使用MapReduce进行批处理。处理结果存储在
HDFS
/分布式数据库中。需要时候使用Hive查询spark:微批处理框架。
叩钉吧zz
·
2023-11-01 13:42
知识点总结
hadoop
big
data
spark
2.Spark的工作与架构原理
如下图图中中间部分是spark集群,也可以是基于yarn的,图上可以理解为spark的standalone集群,集群中有6个节点左边是spark的客户端节点,这个节点主要的任务是向spark集群提交任务,左边的
hdfs
流月up
·
2023-11-01 10:05
spark
spark
大数据
工作原理
架构原理
NoSQL数据库原理与应用综合项目——MongoDB篇
NoSQL数据库原理与应用综合项目——MongoDB篇文章目录NoSQL数据库原理与应用综合项目——MongoDB篇0、写在前面1、本地数据或
HDFS
数据导入到MongoDB2、MongoDB数据库表操作
WHYBIGDATA
·
2023-11-01 08:32
大数据项目
数据库
nosql
mongodb
数据库
报错:-bash: /usr/local/jdk/bin/java: Permission denied
问题:在搭hadoop集群格式化
hdfs
时的报错,-bash:/usr/local/jdk/bin/java:Permissiondenied,发现jdk用不了,/usr/local/jdk/bin/java
黄丕理
·
2023-11-01 07:52
报错
java
bash
hadoop
大数据环境搭建
创建用户并赋予权限ssh免密登录配置编写集群分发脚本xsync安装jdk集群所有进程查看脚本hadoop环境配置Hadoop集群Hadoop环境hadoop集群节点核心配置文件core-site.xml配置
hdfs
-site.xml
yulishi12
·
2023-11-01 07:36
大数据框架
大数据
linux
运维
hadoop
hive
java将
hdfs
上的图片转为base64返回给前端
将
hdfs
上面的图片转化为base64传给前端publicstaticvoidmain(String[]args)throwsIOException{String
hdfs
Path="
hdfs
://192.168.0.0
Alex_81D
·
2023-11-01 04:55
java基础
java
java 读取
hdfs
上的文件内容
用java读取
hdfs
的文件直接撸代码:packagecom.nature.base.util;importcom.nature.component.process.vo.DebugDataResponse
Alex_81D
·
2023-11-01 04:24
大数据基础
java基础
读取文件
flume使用
HDFS
Sink将数据导入到Hive中
整体流程:avroSource获取数据,然后通过SPILLABLEMEMORYchannel,再然后使用
hdfs
sink将数据落地到
hdfs
中,最后通过调度系统执行脚本导入到hive中。
码道功成
·
2023-10-31 22:16
大数据
hive
flume
大数据
hadoop权威指南第四版
问题1磁盘损坏–备份数据
HDFS
问题2读取多个磁盘用于分析,数据容易出错--MR编程模型1.2衍生品1在线访问的组件是hbase。一种使用
hdfs
底层存储的模型。
春风不会绿大地
·
2023-10-31 17:11
hadoop
大数据
分布式
(四)大数据集群运维
大数据集群运维ES常见运维命令windows和linux常用命令文章目录大数据集群运维1:集群扩容均衡1.1:
hdfs
均衡1.2:kafka均衡1.3:es均衡2:hadoop集群服务角色汇总2.1:
hdfs
2.2
猿来如此dj
·
2023-10-31 12:39
hadoop专栏
运维
hadoop
大数据
hdfs
6个人如何维护上千规模的大数据集群?
其中6人的离线团队需要维护大数据集群规模如下:Hadoop集群规模1300+
HDFS
存量数据40+PB,Read3.5PB+/天,Write500TB+/天14WMRJob/天,10WSparkJob/
郭首志
·
2023-10-31 12:05
HBase集群的搭建
://hbase.apache.org/考虑点:版本选择企业常用的:0.96,0.98,hbase-2.x,这里我们选择1.2.12版本兼容问题hadoop-2.7.7hbase-1.2.12依赖环境
HDFS
顾子豪
·
2023-10-31 10:53
分布式存储系统Ceph应用组件介绍
具有可靠性高,性能优良,可伸缩,与
HDFS
不同的地方在于,该架构中没有中心节点。
exitgogo
·
2023-10-31 06:30
分布式
ceph
读书笔记:MIT 6.824
分布式的基础设施:存储常见的
HDFS
通信计算常见的如MapReduce实现上:RPC线程并发控制分布式关注的重点:性能(Performance)可拓展性(Scalability)2倍的机器,2倍的性能容错
elon_wen
·
2023-10-31 01:03
尚硅谷Flume
1.2.2Source1.2.3Sink1.2.4Channel1.2.5Event(事件)二、Flume入门2.1监控端口数据官方案例2.1.1配置好flume-netcat-logger.conf文件2.2实时监控单个追加文件2.2.1配置好flume-file-
hdfs
.conf
小新学java
·
2023-10-30 19:03
hadoop生态圈
flume
Flume入门必看
2.Flume优点①可以和任意存储进程集成②输入的数据速率大于写入目的存储的速率,flume会进行缓冲,减小
hdfs
的压力。
郎er
·
2023-10-30 19:02
大数据
flume
大数据
Flume日志采集框架
uFlume可以采集文件,socket数据包等各种形式源数据,又可以将采集到的数据输出到
HDFS
、hbase、hive、kafka等众多外部存储系统中u一般的采集需求,通过对flume的简单配置即可实现
freefish_yzx
·
2023-10-30 19:30
flume
Flume的安装部署
flume入门指导
Flume 快速入门【概述、安装、拦截器】
它的主要目的是帮助用户将大规模数据从各种数据源(如日志文件、网络数据源、消息队列等)采集、传输和加载到数据存储系统(如Hadoop
HDFS
、ApacheH
月亮给我抄代码
·
2023-10-30 19:55
flume
大数据
kafka
hadoop
hdfs
Checkpoint复杂流程
下图左侧是CheckpointCoordinator,是整个Checkpoint的发起者,中间是由两个source,一个sink组成的Flink作业,最右侧的是持久化存储,在大部分用户场景中对应
HDFS
bigdata张凯翔
·
2023-10-30 19:57
本地windows操作虚拟机中的
HDFS
(伪分布式)
本文章是配合厦门大学林子雨的《大数据技术原理与应用》使用的本篇文章使用的环境如下:虚拟机:Ubuntu18.04百度网盘地址Hadoop:hadoop3.3.0阿里云网盘地址迅雷网盘地址windows:win10JDK:1.8强烈建议是1.8阿里云网盘地址迅雷网盘地址JDK已在windows中安装的,且非1.8的,建议安装两个版本的JDK(一个原有的,一个1.8)0.安装虚拟机后,配置网络参考之前
CMCST
·
2023-10-30 18:10
BigData学习日志
hadoop
hdfs
读写过程
hdfs
文件写入过程Client发起文件上传请求,通过RPC与NameNode建立通讯,NameNode检查目标文件是否已存在,父目录是否存在,返回是否可以上传Client请求第一个block该传输到哪些
吾为天帝乎
·
2023-10-30 16:36
两个重要的端口号
http://ip:50070——Windows进入
hdfs
的端口号,ip为启动的机器iphttp://ip:8088——Windows进入yarn的端口号,ip为启动的机器ip
怀夕
·
2023-10-30 14:41
Spark core通过textFile读取
Hdfs
文件blockSize如何设置?
一、概述其实Sparkcore无论是读取
hdfs
还是读取本地文件都会以hadoopfile的形式进行读取,不同点在于读取本地文件时可以通过在resources文件中放入
hdfs
-site.xml文件设置
客舟听雨2
·
2023-10-30 10:52
spark
hdfs
大数据
hadoop组件及各自的功能
Hadoop=
HDFS
+Yarn+MapReduce+Hbase+Hive+Pig+…1.
HDFS
:分布式文件系统2.Yarn:分布式资源管理系统,3.MapReduce:Hadoop的编程框架4.Pig
ZK_0705
·
2023-10-30 10:17
大数据
hadoop
大数据
spark集群配置
目录1.集群部署规划2.安装Spark3.文件配置4.分发文件5.启动集群6.查看集群1.集群部署规划表1-1集群部署规划主机名masterslave1slave2
HDFS
NameNodeDataNodeSecondaryNameNodeDataNodeDataNodeYARNResourceManagerNodeManageNodeManageNodeManagerSparkMasterWork
EsmeZhao
·
2023-10-30 08:39
Spark
spark
HDFS
(一)
HDFS
基本介绍
HDFS
基本介绍
HDFS
的Master-Slave结构
HDFS
角色作用简介
HDFS
分块存储抽象成数据块的好处
HDFS
副本机制名字空间(NameSpace)NameNode功能DataNode功能机架感知原理
红叶゜
·
2023-10-30 07:27
学习笔记
#
HDFS
大数据
hdfs
java.lang.RuntimeException: The root scratch dir: /tmp/hive on
HDFS
should be writable.
Exceptioninthread“main”java.lang.RuntimeException:Therootscratchdir:/tmp/hiveon
HDFS
shouldbewritable.Currentpermissionsare
红叶゜
·
2023-10-30 07:57
报错
hadoop
linux
大数据
hive
上一页
37
38
39
40
41
42
43
44
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他