E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
#HDFS
2021-02-08a
29.hive/impala/
hdfs
/kudu的区别hive和impala则更偏向于查询分析,需要基于
hdfs
或kuduImpala即可操作
hdfs
上的数据,又可操作kudu上的数据Hive只可操作
hdfs
saluch
·
2023-11-05 11:10
Hadoop
HDFS
体系结构.JPG
HDFS
体系结构2.JPG创建目录hadoopfs-mkdir在
HDFS
中创建"/user"目录hadoopfs-mkdir/user在
HDFS
中创建"/user/hadoop"
寻找灯下黑
·
2023-11-05 10:49
使用 Spark 跨集群同步
HDFS
数据
importorg.apache.log4j.{Level,Logger}importorg.apache.spark.{SparkConf,SparkContext}importorg.apache.spark.rdd.RDDimportorg.apache.spark.sql.SparkSessionobjectTestFileCopy{defmain(args:Array[String]):
lei_charles
·
2023-11-05 09:09
2019-02-20
tHiveConnectiontJava:自己写代码tHiveInputtRowGeneratort
HDFS
OutputtHiveRow查看文件列表!
FlyingPeter
·
2023-11-05 06:27
The root scratch dir: /tmp/hive on
HDFS
should be writable.(已解决)
因为修正完毕,没有进行完整错误展示,仅展示部分错误内容:Therootscratchdir:/tmp/hiveon
HDFS
shouldbewritable.解决方案:进入到/tmp目录下,使用chmod-R777
Han_Lin_
·
2023-11-05 03:21
pyspark
Spark
Hive
大数据
java.lang.IllegalArgumentException: java.net.UnknownHostException:XXX 已解决
在
HDFS
和Hive在安装过程中出现这样的问题,主要是在
HDFS
的
hdfs
-site.xml中添加相应的参数:dfs.client.failover.proxy.provider.nsorg.apache.hadoop.
hdfs
.server.namenode.ha.ConfiguredFailoverProxyProvider
Han_Lin_
·
2023-11-05 03:21
java
hive
hadoop
Hadoop Hive Spark 之间的关系
HDFS
(HadoopDistributedFileSystem)的设计本质上是为
Jarkata
·
2023-11-05 02:32
【大数据】搭建Hadoop集群,超级详细
目录搭建完全分布式运行模式(开发重点)1.1Hadoop部署1.2配置集群1.3配置历史服务器1.4配置日志的聚集1.5分发Hadoop1.6群起集群1.7Hadoop群起脚本第2章调优2.2.1项目经验之
HDFS
小 源
·
2023-11-05 00:29
hadoop
hdfs
大数据
Hadoop集群搭建(超级详细)
tar.gz(提取码:6k1i)、hadoop-3.1.3.tar.gz(提取码:07p6)1集群规划安装VMware,使用三台Ubuntu18.04虚拟机进行集群搭建,下面是每台虚拟机的规划:主机名IP用户
HDFS
YARNhadoopMaster
阮哈哈哈哈哈
·
2023-11-05 00:26
hadoop
搭建hadoop集群
免登录将公钥复制到其他机器中2,安装环节进入文件夹存放安装包解压更改环境变量更新环境变量验证安装修改配置文件修改core-site.xml文件修改hadoop-env.sh文件修改yarn-env.sh文件修改
hdfs
-site.xml
陆卿之
·
2023-11-05 00:54
服务器
大数据
hadoop
大数据
hdfs
hdfs
小文件使用fsimage分析实例
hdfs
小文件使用fsimage分析实例1小文件来源分析1.1数据主要来源:2处理方案2.1实时计算任务2.2hive做优化,小文件做合并:2.2.1已有数据2.2.2新接入数据做数据合并后在load进
Direction_Wind
·
2023-11-05 00:18
集群分析优化与开发工具
hdfs
性能优化
Hadoop学习总结(Shell操作)
HDFS
Shell参数命令参数功能描述-ls查看指定路径的目录结构-du统计目录下所有文件大小-mv移动文件-cp复制文件-rm删除文件/空白文件夹-put上传文件-cat查看内容文件-text将源文件输出文本格式
Qinqin.J
·
2023-11-04 18:31
hadoop
学习
大数据
HDFS
Yarn HA架构图及架构区别
HDFS
HA架构图
HDFS
HA架构图.jpg1.各组件说明activenn(NameNode)接收client的rpc请求并处理,同时自己editlog写一份,也向JN的共享存储上的editlog写一份
cllblogs
·
2023-11-04 18:36
9.17 hive高级语法01
hive高级语法数据库(Database)表的集合,
HDFS
中表现为一个文件夹默认在hive.metastore.warehouse.dir属性目录下如果没有指定数据库,默认使用default数据库createdatabaseifnotexistsmyhivebook
伱来打硪啊
·
2023-11-04 15:43
hadoop
hive
大数据
hdfs
sqoop数据迁移
导入数据:MySQL,Oracle导入数据到Hadoop的
HDFS
、HIVE、HBASE等数据存储系统;导出数据:从Hadoop的文件系统中导出数据到关系数据库mysql等工作机制:是将导入和导出的命令翻译成
lsy107816
·
2023-11-04 14:04
大数据
sqoop
sqoop
数据迁移
表导入导出
hadoop集群搭建之运行环境准备以及群启
HDFS
,YARN集群
hadoop入门-运行环境的搭建前期准备工作:制作了一模拟机hadoop101,然后在hadoop101的基础上,进行克隆,制作了一台hadoop102的服务器,配置好了jdk1.8以及hadoop3的环境变量hadoop安装目录介绍[
[email protected]
]$lldrwxr-xr-x.2atguiguatguigu40969月122019bindrwxr-xr
倔强的耗子
·
2023-11-04 11:26
hadoop
big
data
hdfs
yarn
【Hadoop】一、Apache Hadoop、
HDFS
一、ApacheHadoop、
HDFS
md笔记1、ApacheHadoop概述Hadoop介绍狭义上Hadoop指的是Apache软件基金会的一款开源软件。
陌上人如玉এ
·
2023-11-04 11:55
大数据
hadoop
hdfs
apache
hadoop进程启停管理(看这一篇就足够了!)
一、一键启停脚本Hadoop
HDFS
组件内置了
HDFS
集群的一键启停脚本$HADOP_HOME/sbin/start-all.sh,一键启动
HDFS
集群执行原理:在执行此脚本的机器上,启动SecondaryNameNode
syst1m'
·
2023-11-04 11:54
大数据
hadoop
大数据
分布式
Hdoop入门之Flume
Channel组件提供临时的存储,保存Source组件发送过来的信息,Sink负责读取Channel中临时存储的信息,保存到
HDFS
等,并删除Channel中的临时信息。
lurenjia
·
2023-11-04 10:01
Ubuntu18安装Hadoop,zookeeper,hbase--记录
三台电脑都需要统一安装首先安装hadoop下载:Indexof/dist/hadoop/common/hadoop-2.7.7上传文件,并解压cd到haddop目标,创建目录Haddop配置:保存退出:fs.defaultFS
hdfs
嘟嘟Listing
·
2023-11-04 09:33
解决问题
hbase
hadoop
java-zookeeper
大数据之非常详细Sqoop安装和基本操作
安装和基本操作目录大数据Sqoop1、上传解压2、配置环境变量配置sqoop环境变量配置sqoop-env.sh3、加入mysql的jdbc驱动包4、验证验证是否安装成功验证启动5、导入mysql表数据到
HDFS
6
派大星子fff
·
2023-11-04 09:33
大数据
大数据
sqoop
hadoop
mysql
sql
Sqoop-day03_export-从
hdfs
中到出数据到MySQL中_小总结
export-从
hdfs
中到出数据到MySQL中
HDFS
ToMySQL编写脚本,并保存为
HDFS
ToMySQL.conf在往关系型数据库中导出的时候我们要先在关系型数据库中创建好库以及表,这些sqoop
a-tao必须奥利给
·
2023-11-04 09:33
mysql
sqoop
hdfs
数据库
hive
数据转换工具sqoop安装和使用
一、Sqoop概述Sqoop是Apache一款开源工具,主要用于在
HDFS
、Hive、HBase等数据存储系统与关系性数据库之间传输数据。
七羽319
·
2023-11-04 09:03
大数据
sqoop
hive
mysql
hadoop
CentOS7 Sqoop 安装和使用
核心的功能有两个:导入、迁入导出、迁出导入数据:MySQL,Oracle导入数据到Hadoop的
HDFS
、HIVE、HBASE等数据存储系统导出数据:从Hadoop的文件系统中导出数据到关系数据库mysql
fangwei1234
·
2023-11-04 09:01
sqoop
Sqoop的安装和使用
目录一.安装二.导入1.全量导入一.MySQL导入
HDFS
二.MySQL导入Hive2.增量导入一.过滤导入
hdfs
/hive二.导出一.安装1.下载地址:sqoop下载地址2.解压tar-zxvf.
小辉懂编程
·
2023-11-04 09:31
sqoop
sqoop
hadoop
hive
Impala 入门
Cloudera公司推出,提供对
HDFS
、Hbase数据的高性能、低延迟的交互式SQL查询功能。基于Hive,使用内存计算,兼顾数据仓库、具有实时、批处理、多并发等优点。
djm猿
·
2023-11-04 09:26
CDH/CDP中开启kerberos后如何访问
HDFS
/YARN/HIVESERVER2 等服务的webui
CDH/CDP中开启kerberos后如何访问
HDFS
/YARN/HIVESERVER2等服务的webui在CDH/CDP等大数据平台中,当开启kerberos安全后,如何访问
HDFS
/YARN/HIVESERVER2
明哥的IT随笔
·
2023-11-04 08:16
大数据平台
数据安全
hive
hdfs
hive
0706-6.2.0-Windows Kerberos客户端配置并访问CDH
推荐关注微信公众号:“Hadoop实操”,ID:gh_c4c535955d0f1文档编写目的在使用CDH的过程中,集群启用了Kerberos认证后,集群中的一些组件的WebUI也会启用Kerberos认证,例如
HDFS
Hadoop_SC
·
2023-11-04 08:16
Hadoop实操
Windows 开启 Kerberos 的火狐 Firefox 浏览器访问yarn、
hdfs
背景:类型为IPA或者MITKDC,windows目前只支持firefox+MITKerberos客户端的形式,其他windows端浏览器IE、chrome、edge,没有办法去调用MITKerberosWindows客户端的GSSAPI验证方式,所以均无法使用Windows开启Kerberos的浏览器设置目前只支持火狐Firefox浏览器1、打开浏览器,地址栏输入about:config2、在搜
墨卿风竹
·
2023-11-04 07:45
firefox
hdfs
前端
yarn
hadoop
大数据
Hive如何使用Java自定义函数
udf函数1.在hive命令行中使用addjarjar包路径即可加载到临时系统中2.createtemporaryfunction函数名()as‘方法的全类名’永久udf函数1.在liunx命令行使用
hdfs
lz_N_one
·
2023-11-04 06:17
Hive基础
数据仓库
hive
java
hadoop
实时处理练习
文章目录1提出任务1.1实时数据采集2完成任务2.1创建Flume运行的配置文件2.2安装netcat2.3启动flume2.4启动netcat2.5Kafka消费数据2.5查看
HDFS
上的备份数据1提出任务
howard2005
·
2023-11-04 06:59
探索大数据世界
flume
nc
kafka
hdfs
10亿数据如何快速插入MySQL?
假设和面试官明确后,有如下约束10亿条数据,每条数据1Kb数据内容是非结构化的用户访问日志,需要解析后写入到数据库数据存放在
Hdfs
或S3分布式文件存储里10亿条数据并不是1个大文件,而是被近似切分为100
yue_stack
·
2023-11-04 05:42
后端
大数据之Spark(6)- SparkStreaming
而结果也能保存在很多地方,如
HDFS
,数据库
jackyan163
·
2023-11-04 03:34
hadoop
hdfs
的API调用,在mall商城代码中添加api的调用
在网上下载了现成的商城代码的源码本次旨在熟悉
hdfs
的api调用,不关注前后端代码的编写,所以直接下载现成的代码,代码下载地址。
wmy102125
·
2023-11-04 03:07
Hadoop
hadoop
hdfs
大数据
HDFS
原理篇
**
hdfs
的工作机制**(工作机制的学习主要是为加深对分布式系统的理解,以及增强遇到各种问题时的分析解决能力,形成一定的集群运维能力)注:很多不是真正理解hadoop技术体系的人会常常觉得
HDFS
可用于网盘类应用
NickYS
·
2023-11-04 01:50
Apache Doris导出数据到
HDFS
部署broker配置文件为apache_
hdfs
_broker/conf/apache_
hdfs
_broker.conf注意:Broker没有也不需要priority_networks参数,Broker
贾斯汀玛尔斯
·
2023-11-03 18:04
hadoop
Doris
hdfs
doris
Doris之数据导出
该功能可以将用户指定的表或分区的数据,以文本的格式,通过Broker进程导出到远端存储上,如
HDFS
/BOS等。FE:Frontend,Doris的前端节点。负责元数据管理和请求接入。
墨卿风竹
·
2023-11-03 18:32
big
data
hadoop
java
用CentOS搭建hadoop
hadoop是一个开源的大数据框架;hadoop是一个的分布式计算的解决方案;hadoop=
HDFS
(分布式文件操作系统)+MapReduce(分布式计算)。
我一定要研究生毕业.
·
2023-11-03 15:09
hadoop
centos
hdfs
mapreduce
centos安装配置hadoop超详细过程(含故障排除)
以Hadoop分布式文件系统(
HDFS
,HadoopDistributedFilesystem)和MapReduce(GoogleMapReduce的开源实现)为核心的Hadoop为用户提供了系统底层细节透明的分布式基础架构
格格巫 MMQ!!
·
2023-11-03 15:09
liunx
centos
Centos7搭建Hadoop集群(V3.3.4)
hosts映射3、关闭防火墙4、同步时间5、关闭selinux6、配置ssh免密登陆7、重启二、安装所需环境1、jdk安装2、hadoop安装三、修改配置hadoop-env.shcore-site.xml
hdfs
-site.xmlmapred-site.xmlyarn-site.xmlworkers
GreaterBuilder
·
2023-11-03 15:38
hadoop
hadoop
大数据
分布式
CentOS-7 Hadoop集群部署
Hadoop集群部署环境Hadoop目录结构Hadoop集群规划Hadoop下载Hadoop安装配置解压文件夹重命名赋予权限设置软连接配置环境变量配置文件修改
HDFS
集群workershadoop-env.shcore-site.xml
hdfs
-site.xmlYARN
HeZaoCha
·
2023-11-03 15:37
大数据基础
Linux
centos
hadoop
linux
Hive 工作机制
Hive工作机制将清洗过的数据放入到
HDFS
中,就可以进行各种统计了Hive运行时,元数据信息存储在关系型数据库里面,如Mysql,derby。Hive中的元数据
你看这人,真菜
·
2023-11-03 14:04
Hive
hive工作中分享总结
1.2.数据仓库1.3.Hive与传统数据库的区别1.4.Hive的优缺点1.5.Hive使用场景1.6.
Hdfs
运行机制1.7.Mapreduce运行机制1.8.SQL转化成MapReduce过程1.9
利剑 -~
·
2023-11-03 14:29
数据仓库
hive的工作机制
hive的工作机制1、在hive中建一个库---在hive的元数据库中记录---在
hdfs
的默认路径下/user/hive/warehouse/建一个以"库名.db"为名字的文件夹2、在hive的库中建表
小小哭包
·
2023-11-03 14:27
大数据
hive
hadoop
数据仓库
大数据复习考试
填空题—范围(10*2)1.大数据概念,2.Hadoop概念及两个配置文件:hadoop-env.sh,core-site.xml3.
HDFS
概念及底层结构,4.HBASE数据模型及原理简答题—范围(10
我叫小武,不是跳舞的舞
·
2023-11-03 14:19
大数据
hadoop
spark
经验分享
[Hive] 查询结果保存
文章目录1.插入新表追加2.插入
hdfs
文件系统1.插入新表使用INSERTOVERWRITE语句的情况:整个表:可以使用INSERTOVERWRITETABLEtable_name语句将查询结果直接覆盖整个表中的数据
言之。
·
2023-11-03 12:43
hive
hadoop
数据仓库
shell 获取hive建表语句并修改orc格式为textfile格式
背景在hive中orc格式会自动将string类型的数据,
hdfs
文件加载成数据类型,就导致使用多表关联jiononid="11"时报错,或查询不出来结果,或者这外部表时造成表结构与实际数据类型不符。
jzy3711
·
2023-11-03 12:09
hive
大数据
linux
hive
linux
big
data
HDFS
架构师3.1-元数据管理流程2(日志同步及fsimage互传)
19}20}21}22}元数据源码剖析.png1、内存里面的元数据刷盘image.png19}接上期——1.1.1.1》FSEditLog.logSync()——1.1.1.1.1》EditLogOutputStream.flush()▼//第一次:FileJouranlManager->EditLogFileOutputStream//第二次:QuorumJounalManager->Quoru
fat32jin
·
2023-11-03 06:11
【大数据基础平台】星环TDH社区集群版本部署
目录一、概述二、环境配置三、安装Manager四、配置集群五、安装服务六、基本配置6.1开启安全6.2安装TDH客户端6.3集群外使用hadoopclient6.3.1使用hadoop/
hdfs
6.3.2
开着拖拉机回家
·
2023-11-03 06:43
大数据运维
大数据底座
大数据平台
国产化
信创
TDH
大数据解决方案
4、Spark概要
一、基本特性1、与MapReduce的不同不同于MapReduce的是Job中间输出和结果可以“保存在内存”中,从而不再需要读写
HDFS
,(1)、基于内存mapreduce任务后期再计算的时候,每一个job
Tu_jc
·
2023-11-03 05:08
上一页
36
37
38
39
40
41
42
43
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他