E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
#HDFS
大数据基础设施搭建 - 数据装载
文章目录一、概述二、数据装载(
HDFS
->Hive)2.1创建Hive表2.1.1业务全量表建表语句2.1.2业务增量表建表语句2.1.3流量增量表建表语句2.2数据装载2.2.1初始化装载省份和地区表
m0_46218511
·
2023-12-04 17:50
大数据基础设施搭建
大数据
数据装载
头歌大数据作业二:搭建Hadoop环境及
HDFS
课外作业二:搭建Hadoop环境及
HDFS
作业详情内容阿里云-云起实验室-《搭建Hadoop环境》-Hadoop-2.10.1伪分布式:1.截图本实验ECS的公网IP地址,并添加彩色框标注,如下图所示:
别叫哥喜羊羊
·
2023-12-04 15:42
hadoop
大数据
hdfs
(图文详细)云计算与大数据实训作业答案(之篇三
HDFS
和MapReduce实训 )
HDFS
和MapReduce实训第1关:WordCount词频统计第2关:
HDFS
文件读写第3关:倒排索引第4关:网页排序——PageRank算法
HDFS
和MapReduce实训Hadoop是一个由Apache
Sunny蔬菜小柠
·
2023-12-04 15:11
云计算与大数据
云计算与大数据实训作业答案
大数据生态圈及分布式文件系统
HDFS
实践-part1
Hadoop入门第一章大数据概述1.1大数据概念“人类正在从IT时代走向DT时代”。大数据(BigData):指的是传统数据处理应用软件不足以处理(存储和计算)它们的大而复杂的数据集。主要解决,海量数据的存储和海量数据的运算问题。1.2大数据特征容量大,种类多,速度快,价值高1、容量(Volume):数据的大小决定所考虑的数据的价值和潜在的信息微博,5亿用户,每天上亿条微博朋友圈,10亿用户,每天
落叶飘雪2014
·
2023-12-04 15:40
Hadoop
大数据
Hadoop
HDFS
大数据实训笔记3:
hdfs
HDFS
(HadoopDistributedFileSystem)是一个文件系统,用于存储文件,通过目录树来定位文件。它是分布式的,由很多服务器联合起来实现其功能,集群中的服务器有各自的角色。
Roslin_v
·
2023-12-04 15:39
hdfs
大数据
hadoop
Java操作
Hdfs
(分布式文件系统)完成文件上传、下载和删除
Java操作
Hdfs
(分布式文件系统)文件上传实现创建Maven项目,项目命名Hadoop_
hdfs
导入pom.xml依赖4.0.0hadoophadoop0.0.1-SNAPSHOThadoop_learnorg.apache.hadoophadoop-client3.2.0
菜鸟小党
·
2023-12-04 15:39
hadoop
hdfs
java
hadoop
HDFS
分布文件系统(1)Shell操作
/article/details/127170478文章目录一、三种Shell命令方式二、FileSystemShell文档三、常用Shell命令四、实例练习1、创建目录2、查看目录3、上传本地文件到
HDFS
4
Kox2021
·
2023-12-04 15:09
大数据
hdfs
hadoop
大数据
HDFS
和MapReduce综合实训:构建大数据处理应用
摘要:本文将介绍如何使用Hadoop分布式文件系统(
HDFS
)和MapReduce框架来构建大数据处理应用。
IbtnLisp
·
2023-12-04 15:09
hdfs
mapreduce
hadoop
【头歌实训】分布式文件系统
HDFS
文章目录第1关:
HDFS
的基本操作任务描述相关知识
HDFS
的设计分布式文件系统NameNode与DataNode
HDFS
的常用命令编程要求测试说明答案代码第2关:
HDFS
-JAVA接口之读取文件任务描述相关知识
撕得失败的标签
·
2023-12-04 15:08
【头歌实训】
hdfs
npm
hadoop
分布式
大数据
HADOOP::Fsimage和Edits解析
curent目录中产生如下文件fsimage_0000000000000000000fsimage_0000000000000000000.md5seen_txidVERSION(1)Fsimage文件:
HDFS
星星失眠️
·
2023-12-04 09:15
大数据开发技术
hdfs
大数据
hadoop
Presto基础学习--学习笔记
1,Presto背景2011年,FaceBook的数据仓库存储在少量大型hadoop/
hdfs
集群,在这之前,FaceBook的科学家和分析师一直靠hive进行数据分析,但hive使用MR作为底层计算框架
祈愿lucky
·
2023-12-04 09:21
大数据
学习
笔记
大数据
【大数据】区分
hdfs
dfs -ls 与
hdfs
dfs -ls /
区分
hdfs
dfs-ls与
hdfs
dfs-ls/1.
hdfs
dfs-ls
hdfs
dfs-ls表示
HDFS
中的当前用户目录,即/user/用户名。
G皮T
·
2023-12-04 07:19
#
Hadoop
大数据
hdfs
hadoop
带你涨姿势,Hbase 概念原理扫盲 !
Hbase是一个高可靠性(存储在
hdfs
上,有副本机制),高性能,面向列,
码农小光
·
2023-12-04 07:06
阅读 Flink 源码前必会的知识 - 命令行解析库 Apache Commons Cli
一、介绍一下ApacheCommonsCli,有一个感官的认识我们在使用一些开源项目时,会敲一些命令,有简单的,比如hadoopversion;有复杂的,比如flinkrun…,
hdfs
dfs-ls,等等
KK架构
·
2023-12-04 06:22
Flink
flink
flink源码
命令行
解析
Apache
Commons
flink-connector-mysql-cdc_2.0.2
ververica.github.io/flink-cdc-connectors/master/content/connectors/mysql-cdc.html1、测试步骤:1)开启MySQLBinlog并重启MySQL2)启动
HDFS
ykqidev
·
2023-12-04 06:49
flink
flink
mysql
java
Hadoop——分布式存储
HDFS
HDFS
集群环境部署VMware虚拟机中部署一、https://hadoop.apache.org中下载安装包二、环境分配三、上传、解压确认服务器创建、固定IP、防火墙关闭、Hadoop用户创建、SSH
A尘埃
·
2023-12-04 06:13
hadoop
分布式
hdfs
大数据技术合集(持续更新)
0.大数据技术演变史(来自通信院)1.起源:Google的三驾马车1.1GFS1.2BigTable1.3MapReduce2.开源大数据文件、对象、块存储2.1分布式文件系统:
HDFS
、Ceph、GlusterFS
amuseme_lu
·
2023-12-04 05:39
BigData
大数据
九、
hdfs
中Namenode元数据处理
1、元数据的由来在
hdfs
文件系统中,用户的每一次操作,都会对文件系统产生响应的影响,那么谁来记录这些影响呢?
弦之森
·
2023-12-04 05:37
Hadoop
hdfs
hadoop
大数据
八、
hdfs
文件系统副本块数量的配置
1、配置方式2、实际操作演示(1)在Hadoop用户的根目录下创建text.txt文件(2)上传文件hadoop@node1:~$
hdfs
dfs-ls
hdfs
://node1:8020/Found4itemsdrwxr-xr-x-hadoopsupergroup02023
弦之森
·
2023-12-04 05:05
Hadoop
hdfs
hadoop
大数据
04数据平台Flume
Flume功能Flume主要作用,就是实时读取服务器本地磁盘数据,将数据写入到
HDFS
。Flume是Cloudera提供的高可用,高可靠性,分布式的海量日志采集、聚合和传输的系统工具。
kk_io
·
2023-12-04 04:20
数据仓库
数据仓库
flume
大数据
LeetCode刷题 -- DFS
深度优先搜索算法,depth-first-searc
hDFS
,是一种用于遍历或者搜索树、图的算法,这个算法会尽可能深的去搜索树的分支。
材料小菜鸟
·
2023-12-04 04:02
深度优先
leetcode
算法
大数据基础设施搭建 - 业务数据同步策略
文章目录一、全量同步1.1梳理需要全量同步的业务表1.2Sqoop:MySQLTo
HDFS
1.2.1开发脚本1.2.2授予脚本执行权限1.2.3执行脚本1.2.4定时调度二、增量同步2.1梳理需要增量同步的业务表
m0_46218511
·
2023-12-03 16:42
大数据基础设施搭建
大数据
业务数据同步
Hadoop 1 ~ Hadoop 3 的发展史
Hadoop1的核心设计就是
HDFS
(HadoopDistributedFileSystem)和Map
大数据狂人
·
2023-12-03 14:34
hadoop
大数据开发:
HDFS
Erasure Coding机制
Hadoop的分布式文件系统
HDFS
,其冗余备份机制,确保了数据存储的容错,但是同时也增加了冗余存储成本。今天的大数据开发分享,我们就来讲讲
HDFS
ErasureCoding机制。
成都加米谷大数据
·
2023-12-03 14:29
Hbase与Hive的区别与联系
Hive,通过元数据来描述
HDFS
上的结构化文本数据。因此,严格地讲,Hive并非数据库,主要是让开发人员能够通过SQL(HQL语
阿乐_822e
·
2023-12-03 12:13
Hive----基本概念
3、本质是:将HQL转化成MapReduce程序1)Hive处理的数据存储在
HDFS
2)Hive分析数据底层的实现是MapReduce3)执行程序运行在Yarn上4.Hive的优缺点优点1)操作接口采用类
Hi杯酒故人
·
2023-12-02 21:21
Hadoop架构---
HDFS
补充知识点---三个模式/机制
1.安全模式在安全模式下不允许
HDFS
客户端进行任何修改文件的操作,包括上传文件,删除文件等操作。
Yan_bigdata
·
2023-12-02 19:29
hadoop
架构
hdfs
学习
Hive环境准备[重点学习]
1.前提启动hadoop集群hadoop在统一虚拟机中已经配置了环境变量启动
hdfs
和yarn集群命令:start-all.sh[root@node1/]#start-all.sh启动mr历史服务命令:
Yan_bigdata
·
2023-12-02 19:59
hive
学习
hadoop
Hadoop进阶学习---
HDFS
分布式文件存储系统
1.
hdfs
分布式文件存储的特点分布式存储:一次写入,多次读取
HDFS
文件系统可存储超大文件,时效性较差.
HDFS
基友硬件故障检测和自动快速恢复功能.
HDFS
为数据存储提供很强的扩展能力.
HDFS
存储一般为一次写入
Yan_bigdata
·
2023-12-02 19:59
hadoop
分布式
学习
hdfs
推荐系统lambda架构学习笔记之Hadoop、
HDFS
、YARN&MapReduce(三)
HadoopHadoop介绍Hadoop名字的由来作者:DougcuttingHadoop项目作者的孩子给一个棕黄色的大象样子的填充玩具的命名Hadoop的概念:Apache™Hadoop®是一个开源的,可靠的(reliable),可扩展的(scalable)分布式计算框架允许使用简单的编程模型跨计算机集群分布式处理大型数据集可扩展:从单个服务器扩展到数千台计算机,每台计算机都提供本地计算和存储可
吃一口桃酥
·
2023-12-02 19:50
笔记
hadoop
hdfs
mapreduce
Hadoop之MapReduce学习笔记(一)
1、mapreduce整体工作机制介绍回顾第
HDFS
第一天单词统计实例(
HDFS
版wordcount):统计
HDFS
的/wordcount/input/a.txt文件中的每个单词出现的次数——wordcount
weixin_30752377
·
2023-12-02 19:50
大数据
操作系统
java
hadoop学习笔记——NO.4_HADOOP集群搭建与使用初步
HADOOP集群搭建与使用初步HADOOP集群搭建集群简介HADOOP集群具体来说包含两个集群:
HDFS
集群和YARN集群,两者逻辑上分离,但物理上常在一起
HDFS
集群:负责海量数据的存储,集群中的角色主要有
蔡茂昌
·
2023-12-02 19:20
hadoop学习笔记
Hdoop学习笔记(HDP)-Part.20 安装Flume
Part.06安装OracleJDKPart.07安装MySQLPart.08部署Ambari集群Part.09安装OpenLDAPPart.10创建集群Part.11安装KerberosPart.12安装
HDFS
Part
这啥命啊
·
2023-12-02 19:46
hadoop
学习
笔记
flume
hadoop
Hdoop学习笔记(HDP)-Part.17 安装Spark2
Part.06安装OracleJDKPart.07安装MySQLPart.08部署Ambari集群Part.09安装OpenLDAPPart.10创建集群Part.11安装KerberosPart.12安装
HDFS
Part
这啥命啊
·
2023-12-02 19:45
hadoop
学习
笔记
spark
hadoop
Hdoop学习笔记(HDP)-Part.18 安装Flink
Part.06安装OracleJDKPart.07安装MySQLPart.08部署Ambari集群Part.09安装OpenLDAPPart.10创建集群Part.11安装KerberosPart.12安装
HDFS
Part
这啥命啊
·
2023-12-02 19:45
hadoop
学习
笔记
flink
hadoop
Hdoop学习笔记(HDP)-Part.11 安装Kerberos
Part.06安装OracleJDKPart.07安装MySQLPart.08部署Ambari集群Part.09安装OpenLDAPPart.10创建集群Part.11安装KerberosPart.12安装
HDFS
Part
这啥命啊
·
2023-12-02 19:15
hadoop
学习
笔记
hadoop
Hdoop学习笔记(HDP)-Part.12 安装
HDFS
Part.06安装OracleJDKPart.07安装MySQLPart.08部署Ambari集群Part.09安装OpenLDAPPart.10创建集群Part.11安装KerberosPart.12安装
HDFS
Part
这啥命啊
·
2023-12-02 19:15
hadoop
学习
笔记
hdfs
hadoop
Hdoop学习笔记(HDP)-Part.19 安装Kafka
Part.06安装OracleJDKPart.07安装MySQLPart.08部署Ambari集群Part.09安装OpenLDAPPart.10创建集群Part.11安装KerberosPart.12安装
HDFS
Part
这啥命啊
·
2023-12-02 19:15
hadoop
学习
笔记
kafka
hadoop
Hdoop学习笔记(HDP)-Part.10 创建集群
Part.06安装OracleJDKPart.07安装MySQLPart.08部署Ambari集群Part.09安装OpenLDAPPart.10创建集群Part.11安装KerberosPart.12安装
HDFS
Part
这啥命啊
·
2023-12-02 19:14
hadoop
hadoop
学习
笔记
Hdoop学习笔记(HDP)-Part.09 安装OpenLDAP
Part.06安装OracleJDKPart.07安装MySQLPart.08部署Ambari集群Part.09安装OpenLDAPPart.10创建集群Part.11安装KerberosPart.12安装
HDFS
Part
这啥命啊
·
2023-12-02 19:44
hadoop
学习
笔记
hadoop
Hdoop学习笔记(HDP)-Part.02 核心组件原理
Part.06安装OracleJDKPart.07安装MySQLPart.08部署Ambari集群Part.09安装OpenLDAPPart.10创建集群Part.11安装KerberosPart.12安装
HDFS
Part
这啥命啊
·
2023-12-02 19:14
hadoop
学习
笔记
hadoop
Hdoop学习笔记(HDP)-Part.05 Yum源配置
Part.06安装OracleJDKPart.07安装MySQLPart.08部署Ambari集群Part.09安装OpenLDAPPart.10创建集群Part.11安装KerberosPart.12安装
HDFS
Part
这啥命啊
·
2023-12-02 19:14
hadoop
学习
笔记
hadoop
Hdoop学习笔记(HDP)-Part.07 安装MySQL
Part.06安装OracleJDKPart.07安装MySQLPart.08部署Ambari集群Part.09安装OpenLDAPPart.10创建集群Part.11安装KerberosPart.12安装
HDFS
Part
这啥命啊
·
2023-12-02 19:14
hadoop
学习
笔记
mysql
hadoop
Hdoop学习笔记(HDP)-Part.08 部署Ambari集群
Part.06安装OracleJDKPart.07安装MySQLPart.08部署Ambari集群Part.09安装OpenLDAPPart.10创建集群Part.11安装KerberosPart.12安装
HDFS
Part
这啥命啊
·
2023-12-02 19:14
hadoop
学习
笔记
ambari
hadoop
Hadoop Core -
HDFS
, MapReduce, YARN
HadoopCore-
HDFS
,MapReduce,YARN参加拉勾教育大数据训练营课程笔记引用:《Hadoop-TheDefinitiveGuide,4thEdition》,《拉勾导师笔记》简介大数据特性
DataPeak
·
2023-12-02 19:13
大数据
hadoop
big
data
java
Hdoop学习笔记(HDP)-Part.03 资源规划
Part.06安装OracleJDKPart.07安装MySQLPart.08部署Ambari集群Part.09安装OpenLDAPPart.10创建集群Part.11安装KerberosPart.12安装
HDFS
Part
这啥命啊
·
2023-12-02 19:43
hadoop
学习
笔记
hadoop
Hdoop学习笔记(HDP)-Part.06 安装OracleJDK
Part.06安装OracleJDKPart.07安装MySQLPart.08部署Ambari集群Part.09安装OpenLDAPPart.10创建集群Part.11安装KerberosPart.12安装
HDFS
Part
这啥命啊
·
2023-12-02 19:43
hadoop
学习
笔记
hadoop
Hdoop学习笔记(HDP)-Part.04 基础环境配置
Part.06安装OracleJDKPart.07安装MySQLPart.08部署Ambari集群Part.09安装OpenLDAPPart.10创建集群Part.11安装KerberosPart.12安装
HDFS
Part
这啥命啊
·
2023-12-02 18:40
hadoop
学习
笔记
hadoop
HDFS
JAVA API的应用
(简答题)使用
HDFS
的JAVAAPI进行编程:(1)获取自己
HDFS
集群下的所有文件和目录;//获取自己
HDFS
集群下的所有文件和目录;importorg.apache.hadoop.conf.Configuration
星星失眠️
·
2023-12-02 16:28
大数据开发技术
hdfs
java
hadoop
HIVE SQL 、Hive MR参数设置
1、知识点回顾hive数据库是
hdfs
上的文件夹,表也是文件夹,表里的数据是文件hive建表createtable表名(字段1类型1,字段2类型2……)rowformatdelimitedfieldsterminatedby
故里良田
·
2023-12-02 15:39
上一页
26
27
28
29
30
31
32
33
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他