E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
#HDFS
Apache 原生 Hadoop 运维命令
Hadoop1、检查原生hadoop和压缩库是否可用hadoopchecknative2、打印hadoop环境的配置路径hadoopclasspath
HDFS
1、查看
hdfs
文件系统的状态
hdfs
dfsadmin-report2
bigdata-rookie
·
2023-09-19 07:29
Hadoop
apache
hadoop
运维
大数据
linux
服务器
Flink相关
知乎实时数仓架构演进_天池技术圈-阿里云天池关于flink实时数仓的实际问题_flinkdatastream按天,小时写入
hdfs
_一个写湿的程序猿的博客-CSDN博客基于Flink+Hudi的实时数仓在
丢雷劳谋
·
2023-09-19 07:24
大数据
flink
大数据
Hadoop-sqoop
Hadoop(Hive)与传统的数据库(mysq1.postgresql..)间进行数据的传递,可以将一个关系型数据库(例如:MySQL,Oracle,Postgres等)中的数据导进到Hadoop的
HDFS
不吃香菜lw
·
2023-09-19 07:59
hadoop
sqoop
大数据
Hadoop NameNode执行命令工作流程
HadoopNameNode执行命令工作流程客户端API或者CLI与NameNode的交互命令数据的格式(1)预处理流程(2)创建NameNode与NameNodePrcServer流程(3)
HDFS
API
lastembryoXX
·
2023-09-19 07:27
java
hadoop
hive 创建 s3 外表
背景有个比较大的技术侧需求:将数据从
HDFS
迁移到s3。
xiaoliizi
·
2023-09-19 06:23
大数据
hive
hadoop
数据仓库
HBase(hbase-0.96.2) 安装
一、检查hadoop是否已安装且能正常运行方法一:检查hadoop相关进程是否都存在方法二:能否通过浏览器访问
hdfs
与mapred对应的端口二、安装HBase1、下载安装包:http://mirror.esocc.com
数大招疯
·
2023-09-19 04:16
hadoop
HBase
0.96.2
安装
配置
HDFS
集群的机架感知
HDFS
集群的机架感知1、背景1.1、Hadoop的设计目的1.2、Hadoop的设计考虑1.3、副本存放策略2、配置机架感知2.1、修改配置文件core-site.xml2.2、验证机架感知3、补充3.1
.道不虚行
·
2023-09-18 18:39
hadoop
hadoop
hdfs
集群的机架感知
第6章 MapReduce应用开发-管理配置
假设有如下三个配置:fs.defaultFSfile:///mapreduce.framework.namelocalfs.defaultFS
hdfs
://localhostmapreduce.fr
主君_05c4
·
2023-09-18 16:48
分析
hdfs
文件变化及监控小文件
1、文档编写目的目前各个企业都在利用Hadoop大数据平台,每天都会通过ETL产生大量的文件到
hdfs
上,如何有效的去监测数据的有效性,防止数据的无限增长导致物理资源跟不上节奏,我们必须控制成本,让有限的资源发挥大数据的极致功能
jhonshonjs
·
2023-09-18 15:48
Spark-Shell的启动与运行
启动spark2.启动hadoop3.启动spark二、SparkRdd的简单操作1.从文件系统加载数据创建ADD(1)从Linux本地文件系统加载数据创建RDD——textFile(path)(2)从
HDFS
LMY~~
·
2023-09-18 08:40
spark
大数据
hadoop
hive数据仓库
mysql服务3.启动hive4.hive的操作(1)创建数据库(2)查找hive数据库(3)设置属性信息(4)修改属性(5)删除数据库5.内部表与外部表(1)编写xxx.txt文件(2)hadoop的操作
hdfs
LMY~~
·
2023-09-18 08:40
mysql
hive
hdfs
的JavaAPI操作
hdfs
的JavaAPI操作一、在window下安装hadoop-(一)安装-(二)配置环境变量二、
hdfs
的JavaAPI操作1.常用类2.
HDFS
API开发的步骤(1)在
HDFS
上创建文件夹(2)在
LMY~~
·
2023-09-18 08:09
hadoop
大数据
java
Doris进阶——数据导入
BrokerLoad导入方式:通过Broker进程访问读取外部数据源(
HDFS
)的数据导入到Doris中,数据量在几十到百GB级别。通过SHOWLOAD命令查看导入结果。
小眼睛的Ayuan
·
2023-09-18 08:08
Doris
笔记
大数据
big
data
数据库
database
sql
hadoop
HDFS
分布式计算概述,MapReduce概述,YARN概述
1、分布式计算概述1.1、什么是(数据)计算我们一直在提及:分布式计算,分布式暂且不论,“计算”到底是指什么呢?大数据体系内的计算,举例:销售额统计、区域销售占比、季度销售占比利润率走势、客单价走势、成本走势品类分析、消费者分析、店铺分析等等一系列,基于数据得出的结论。这些就是我们所说的计算。1.2、分布式(数据)计算分布式计算:顾名思义,即以分布式的形式完成数据的统计,得到需要的结果。1.2.1
新征程,再出发
·
2023-09-18 03:30
大数据
mapreduce
大数据
hadoop
hdfs
分布式
MapReduce & YARN 的部署
1、部署说明Hadoop
HDFS
分布式文件系统,我们会启动:NameNode进程作为管理节点DataNode进程作为工作节点SecondaryNamenode作为辅助同理,HadoopYARN分布式资源调度
新征程,再出发
·
2023-09-18 03:30
大数据
mapreduce
大数据
yarn
hdfs
flume快速使用及简单配置
快速使用做数据挖掘往往会接触各种不同来源的日志数据,比较高效的是将其定时写入如es、
hdfs
、hive等集群中进行统一分析,挖掘。这里简单进行一个示例,为flume监控本地日志到
hdfs
。
达达爱吃肉
·
2023-09-18 00:27
flume
hdfs
hadoop
安装伪分布的Hadoop时SHUTDOWN_MSG: Shutting down NameNode at master及Hadoop namenode节点无法启动的问题解决
namenode一直无法启动如果是这种情况就去看虚拟机的hostname的名称是否和虚拟机的vi/etc/hosts中的ip是否配的一致,如果没有的话,就修改下名称或者ip然后重启网络namenode的配置文件重新
hdfs
namenode-format
zhaozuoyou
·
2023-09-17 22:46
mysql
大规模数据处理之架构图
1.画出文件系统
HDFS
架构的图,并写出各部件的功能。①NameNode:维护文件元数据FsImage和操作日志EditLog。②SecondaryNameNode:NameNode的备份的进程。
JerryTom
·
2023-09-17 20:19
mapReduce
离线数据同步平台datax+报表可视化平台metabase
dataxDataX是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括MySQL、Oracle、SqlServer、Postgre、
HDFS
、Hive、ADS、HBase、TableStore
liaomin416100569
·
2023-09-17 19:33
大数据
SQL练习题二十一-Hive练习题
这里的题目都是之前博客篇hive实践里面的题目,来源于csdn公众号,其中的题目都是常规题,较好的巩固了casewhen语法高级聚合函数行转列/列转行窗口函数/窗口大小hive远程连接步骤:要开启
hdfs
冰菓_
·
2023-09-17 12:07
HDFS
的存储原理
1、存储原理1.1、
HDFS
分布式文件存储将文件分为集群节点的部分数,分别存入每个节点中。
新征程,再出发
·
2023-09-17 09:55
大数据
hdfs
hadoop
大数据
hdfs存储原理
HDFS
的Shell操作
1、进程启停管理1.1、一键启停脚本Hadoop
HDFS
组件内置了
HDFS
集群的一键启停脚本。
新征程,再出发
·
2023-09-17 09:23
大数据
hdfs
hadoop
大数据
六、HADOOP-HA(zookeeper之后)
一、
HDFS
的HAHSFS传统集群只有一个NameNode,当此Manager宕机后,整个集群就宕机了,只有等管理员手动重启修复了NameNode之后,才会恢复。
一种依耐丶从未离开
·
2023-09-17 08:17
spark运行级别问题详解
executor中;计算数据的task由executor执行,数据在executor的BlockManager中;性能最好NODE_LOCAL节点本地化,代码和数据在同一个节点中;比如说,数据作为一个
HDFS
block
君子慎独焉
·
2023-09-16 22:20
Hive
Hive产生背景MapReduce编程的不便性
HDFS
上的文件缺少SchemaHive是什么1)由Facebook开元,最初用于解决海量结构化的日志数据统计问题2)构建在Hadoop之上的数据仓库3)Hive
捕猎者
·
2023-09-16 16:51
hdfs
清理空间
thoughbelowI'vedetailedtherelatedcommandstoseewhatisgoingon:$hadoopfs-df-hFilesystemSizeUsedAvailableUse%
hdfs
A文艺钦年
·
2023-09-16 15:41
DataX 概述、部署、数据同步运用示例
DataX设计框架DataX核心架构DataX部署DataX数据同步(MySQL—>
HDFS
)什么是DataX?DataX是阿里巴巴集团开源的、通用的数据抽取工具,广泛使用的离线数据同步工具/平台。
月亮给我抄代码
·
2023-09-16 13:04
hadoop
数据仓库
hdfs
mysql
DataX
数据同步
HBASE知识点
利用
HDFS
作为其文件存储系统,利用MapReduce来处理HBase中的海量数据。利用Zookeeper作为其分布式协同服务。用于存储非结构化和半结构化的松散数据。
小小的人儿居然已存在
·
2023-09-16 07:10
大数据
hbase
【问题解决】Hadoop集群启动后执行JPS没有DataNode或NameNode
引言最近在尝试在搭建Hadoop集群并测试集群是否搭建成功,但是第一次格式化NameNode并启动
HDFS
和YARN时发现一会儿有DataNode或者NameNode但是后面就没有了,二者没有同时存在,
wydxry
·
2023-09-16 07:27
大数据
Hadoop
遇到的Bug
hadoop
hdfs
大数据
hadoop启动报错:Attempting to operate on
hdfs
namenode as root
/usr/bin/envbash
HDFS
_DATANODE_USER=rootHADOOP_SECURE_DN_USER=
hdfs
HDFS
_NAMENODE_USER=root
HDFS
_SECONDARYNAMENODE_USER
Agatha方艺璇
·
2023-09-16 02:44
大数据
Hadoop
hadoop
hdfs
大数据
ubuntu系统安装hadoop
Hadoop分布式计算平台,核心是分布式文件系统
HDFS
ubantu下安装jdkwgethttps://repo.huaweicloud.com/openjdk/18.0.1.1/openjdk-18.0.1.1
shigen01
·
2023-09-16 02:30
大数据
ubuntu
hadoop
linux
大数据
python模拟生成新能源车辆数据
前言:本文是在python中用随机函数来生成新能源汽车数据,最后传入
HDFS
中目录前言:一、程序可达成的目的二、制作程序1、导入需要的库2、生成随机车架号、行驶总里程、车速、车辆状态、充电状态、剩余电量
db_yhx_2035
·
2023-09-15 23:02
python
开发语言
来了来了,2023年某中大厂真实面经!
Hdfs
小文件危害,元数据压垮namenode,怎么处理?5. 为什么开启map—join后会减小
王知无(import_bigdata)
·
2023-09-15 16:40
实验二
HDFS
的Shell命令操作,和
HDFS
的API操作
文章目录实验目的一、实验原理二、实验准备实验内容步骤项目1
HDFS
常见命令练习列出
HDFS
当前用户家目录下的文件及文件夹:列出
HDFS
文件下名为directory的文件夹中的文件:上传文件,将本地目录file1
洛水鱼
·
2023-09-15 14:06
Hadoop
hdfs
hadoop
大数据
hive location更新&hive元数据表详解
1.hivelocation更新方式一、通过修改表DDL:altertabletable_namesetlocation'
hdfs
://nm:8020/table_path'二、直接修改hive的metainfo
ZhaoYingChao88
·
2023-09-15 13:24
hive
spark
大数据
在Linux中修改profile文件出错导致所有命令不能使用
在搭建
hdfs
文件的时候,由于自己的疏忽导致,在profile文件中多添加了一个引号,然后导致linux命令全部不能使用,系统重启也不能进行用户登陆这个时候,我们可以先稳住不慌,因为有办法可以抢救回来,
weidajiangjiang
·
2023-09-15 12:19
linux
profile
命令
基于VM与Hadoop的完全分布式安装
其中完全分布式模式环境的配置需要在三台虚拟机上都做一次,本人也是第一次做,有很多不会的地方查了很多资料也走了很多弯路文章目录基于VM与Hadoop的完全分布式安装完全分布式运行模式环境配置配置JDK与Hadoop集群配置部署规划配置核心文件配置
HDFS
凯撒袁六兽
·
2023-09-15 11:26
Hadoop
hadoop
ssh
linux
一百七十六、Kettle——Kettle配置
HDFS
输出控件能不能加GZIP等压缩方式?
一、目的为了尽可能减少磁盘资源的消耗,因此需要对从Kafka到
HDFS
的写入数据进行数据压缩。
天地风雷水火山泽
·
2023-09-15 10:52
Kettle
Hadoop
hdfs
大数据
kettle
《十小时入门大数据》学习笔记之初识Hadoop
笔记内容概括Hadoop概述1.1Hadoop名字的由来1.2Hadoop介绍1.3Hadoop能做什么Hadoop核心组件2.1
HDFS
(分布式文件系统)2.2YARN(资源调度系统)2.3MapReduce
腊月的梅花
·
2023-09-15 08:36
4.
hdfs
ha脚本检测failover时,发送邮件预警
4.
hdfs
ha脚本检测failover时,发送邮件预警1)脚本#!
赛尔木
·
2023-09-15 05:19
虚拟机搭建hadoop集群报java.net.ConnectException: 拒绝连接
问题描述我的core-site.xml的文件如下fs.defaultFS
hdfs
://node1:9000hadoop.tmp.dir/tmp/hadoop-2.8.5node1是我
hdfs
的主节点,然后在
捞月亮的阿汤哥
·
2023-09-15 04:59
模拟生成新能源车辆数据
文章目录前言摘要一、分析二、步骤2.1安装软件2.2定义新能源汽车的基本信息2.2.1生成新能源车辆行驶数据2.3保存数据2.4部署到
HDFS
总结前言当今社会,新能源汽车已经成为了人们关注的热点话题之一
db_wjj_2079
·
2023-09-15 02:52
java
hadoop
datax和datax-web编译安装和使用
DataX是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括MySQL、Oracle、SqlServer、Postgre、
HDFS
、Hive、ADS、HBase、OTS、ODPS等各种异构数据源之间高效的数据同步功能
shangjg3
·
2023-09-15 00:54
数据中台
大数据
数据仓库
etl
Spark
实验室所开源的类HadoopMapReduce的通用并行计算框架,Spark拥有HadoopMapReduce所具有的优点;但不同于MapReduce的是Job中间输出结果可以缓存在内存中,从而不再需要读写
HDFS
HikZ.919
·
2023-09-14 23:29
hadoop
spark
解决hadoop使用put上传报错问题
hadoop使用put上传报错WARN
hdfs
.DataStreamer:DataStreamerExceptionorg.apache.hadoop.ipc.RemoteException(java.io.IOException
我最爱吃鱼香茄子
·
2023-09-14 20:46
BUG笔记
hadoop
大数据
分布式
Hadoop下载安装及
HDFS
配置教程
Hadoop下载安装及
HDFS
配置教程前言Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。
Mekeater
·
2023-09-14 19:16
大数据
hadoop下载安装
hadoop配置
hdfs配置
hadoop单机版集群配置
hadoop安装教程
离线安装python
hdfs
在http://mirrors.aliyun.com/pypi/simple/下载docopt-0.6.2.tar.gz和
hdfs
-2.6.0.tar.gz,解压先安装docopt,执行python3setup.pyinstall
Woople
·
2023-09-14 18:40
大数据上机基础—
HDFS
文件操作
本文为在校学习大数据课程期间,对厦门大学林子雨老师大数据技术原理与应用第三章分布式文件系统
HDFS
学习指南一文进行的整理,方便自己学习查看原文地址为大数据技术原理与应用第三章分布式文件系统
HDFS
学习指南操作系统为
Lucky-Niu
·
2023-09-14 17:14
hdfs
big
data
hadoop
Flink特性
可以将状态存储在
HDFS
,内存,RockDB。五、支持高度灵活的窗口,比如:sessionwindow,滚动窗口,滑动窗口等。六、反压,当下流算子处理不
嘿嘿hhahaah
·
2023-09-14 14:57
OushuDB 安装与升级之安装
HDFS
安装
HDFS
由于hadoop依赖于特定版本的snappy,请先卸载snappy确保安装的顺利进行:hawqssh-fhostfile-e'yumremove-ysnappy'HAWQ的
HDFS
采用HA的方式进行安装配置
北漂一号
·
2023-09-14 14:46
上一页
51
52
53
54
55
56
57
58
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他