E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Mapreduce
【大数据之Hive】二十七、HQL之Fetch抓取、本地模式、并行执行、严格模式
1Fetch抓取 Fetch抓取是指Hive中对某些情况的查询可以不必使用
MapReduce
计算。
阿宁呀
·
2023-07-22 22:30
hive
hive
大数据
hadoop
HiveSQL和SparkSQL的区别和联系
一、SparkSQL和Hive对比二、HiveSQL和SparkSQL的对比sql生成
mapreduce
程序必要的过程:解析(Parser)、优化(Optimizer)、执行(Execution)三、spark
万里长江横渡
·
2023-07-22 14:52
大数据
hive
hadoop
大数据
FAILED: Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask
ExecutionErrorreturncode2fromorg.apache.hadoop.hive.ql.exec.mr.MapRedTask解决办法、1、调大虚拟机内存,单台节点至少1G可用,调大虚拟机内存不需要关机,调小需要关机,如果上限只有XG,不能调大,关机再调,再调节
MapReduce
聚精会神搞学习
·
2023-07-22 10:08
大数据
hadoop
hive
yarn
linux
万字最全Spark内存管理详解
今天和大家介绍Spark的内存模型,干货多多,不要错过奥~与数据频繁落盘的
Mapreduce
引擎不同,Spark是基于内存的分布式计算引擎,其内置强大的内存管理机制,保证数据优先内存处理,并支持数据磁盘存储
大数据兵工厂
·
2023-07-22 09:11
大数据
spark
内存管理
Hive架构原理
Hive底层提供了
mapreduce
模板,将HQL转化为
mapreduce
程序,Hive处理的数据保存在hdfs上,执行计算程序通过
mapreduce
,程序运行在yarn上。
大伟伟
·
2023-07-22 06:21
HIVE
hive
大数据
Hive——原理架构
本质是:将HQL转化成
MapReduce
程序,可以看做是hadoop的客户端一、Hive架构Hive是建立在Hadoop上的数据仓库基础构架(①数据存储在hdfs上②数据计算用
mapreduce
)。
温一杯酒
·
2023-07-22 06:19
Hive
Hive
Hive架构和原理(图形化通俗易懂)
Hive处理的数据存储在HDFS,分析数据底层的实现是
MapReduce
,可以简单理解Hive是Hadoop的客户端,提
lovelife110
·
2023-07-22 06:19
大数据
hive
hadoop
架构
Hive3.1.2伪分布式安装
https://downloads.apache.org/hive/hive-3.1.2/apache-hive-3.1.2-bin.tar.gz解压安装前置条件开整之前再多bb一句,hive是依托hdfs+
MapReduce
MrZhangBaby
·
2023-07-22 01:05
谈笑间学会HDFS
大数据
大数据组件安装部署
分布式
基于大数据技术推荐系统算法案例实战视频教程
基于大数据技术推荐系统算法案例实战视频教程大数据,云计算,架构,数据分析师,Hadoop,Spark,Storm,Docker,
Mapreduce
,Kafka,Flume,OpenStack,Hive,
平蝶与波澜
·
2023-07-21 23:26
大数据基础篇--
MapReduce
工作原理
文章目录理解什么是map,什么是reduce,为什么叫
mapreduce
Map详解Reduce详解
MapReduce
详解分片、格式化数据源执行MapTask执行Shuffle过程执行ReduceTask
在路上的小y
·
2023-07-21 14:41
大数据
大数据
云计算期末冲刺
超大规模,虚拟化,高可靠性,通用性,高可伸缩性云计算按服务类型:Iaas,Paas,Saas云计算体系结构:物理资源层,资源池层,管理中间件层,SOA构建层1.Google云计算包括哪些内容:答:GFS,
MapReduce
learning_ing_ing
·
2023-07-21 14:38
笔记
3.1 python版
MapReduce
基础实战
输入文件在你每次点击评测的时候,平台会为你创建,无需你自己创建,只需要启动HDFS,编写python代码即可。第1关:成绩统计mapper.py#!/usr/bin/python3importsysdefmain():forlineinsys.stdin:line=line.strip()mapper(line)#使用name,age分别表示姓名和年龄defmapper(line):#######
问问问你的心
·
2023-07-21 00:59
头歌大数据作业
hadoop
python
mapreduce
educoder--
MapReduce
基础实战各关卡通关答案
第1关:成绩统计:任务描述相关知识什么是
MapReduce
如何使用
MapReduce
进行运算代码解释编程要求测试说明任务描述本关任务:使用Map/Reduce计算班级中年龄最大的学生。
刘向阳啊
·
2023-07-21 00:59
educoder-大数据
大数据
hadoop
python
第7章
MapReduce
实战
第1关:年龄统计编程要求使用
MapReduce
计算班级每个学生的最好成绩,输入文件路径为/user/test/input,请将计算后的结果输出到/user/test/output/目录下。
伯尔尼微笑的蛋黄
·
2023-07-21 00:58
python
mapreduce
大数据
hadoop
java
MapReduce
编程基础
1.WordCount示例及
MapReduce
程序框架2.
MapReduce
程序执行流程3.深入学习
MapReduce
编程(1)4.参考资料及代码下载.WordCount示例及
MapReduce
程序框架首先通过一个简单的程序来实际运行一个
weixin_30455661
·
2023-07-21 00:58
大数据
python
操作系统
当HBase遇上
MapReduce
头歌答案
文章目录第1关:HBase的
MapReduce
快速入门第2关:HBase的
MapReduce
使用第1关:HBase的
MapReduce
快速入门packagecom.processdata;importjava.io.IOException
随兴随缘
·
2023-07-21 00:27
hadoop
mapreduce
hbase
hadoop
MapReduce
计算班级/全体分数的均值与最值
实验环境:hadoop-3.1.0java-1.8.172centOS7IDEA问题引入:中文表述:假设有N个班级在学习一门课程,第i个班级有M[i]个学生。课程成绩按照班级,分别存放在单独的文本文件中,如File1.txt是1班的成绩,File2.txt是2班的成绩,以此类推。(1)在本地文件系统中,首先使用随机数生成N个班级的成绩文件,包括学生的学号、姓名、成绩。注意:成绩要在[0,100]范
自说自画
·
2023-07-21 00:26
MapReduce
基础编程
MapReduce
基础编程快速解法合并去重整合排序信息挖掘快速解法跟着茂神的节奏,直接打印合并去重importjava.io.IOException;importorg.apache.hadoop.conf.Configuration
登峰造極,永往无前。
·
2023-07-21 00:23
mapreduce
大数据技术原理与应用(第3版)期末复习
(单选30判断10简答10操作30编程20)编程掌握:HDFS文件操作
MapReduce
程序HBase数据库命令操作U1大数据的4v特征数据量大、处理快、数据类型多、价值密度低大数据完全颠覆了传统的思维方式
Blancness
·
2023-07-21 00:21
big
data
大数据
数据仓库
头歌大数据——
MapReduce
基础实战 答案 无解析
第1关:成绩统计编程要求使用
MapReduce
计算班级每个学生的最好成绩,输入文件路径为/user/test/input,请将计算后的结果输出到/user/test/output/目录下。
蓝莓奶油饺子·
·
2023-07-21 00:20
头歌实验平台
大数据实验
mapreduce
大数据
hadoop
Hadoop程序运行一直卡在INFO
mapreduce
.Job: Running job: job_1578474456005_0034
以前Hadoop集群运行jar包都没问题的,但是昨天突然出现了这个问题,网上查阅了很多,大部分说是配置的问题(yarn-site.xml、mapred-site.xml配置错误),但是既然我的环境以前能运行程序就应该不是环境的问题,于是查阅了很多终于解决了问题,希望对各位有所帮助:有太多任务在排队,需要1用hadoopjob-list查看正在运行的job2用hadoopjob-killjobId杀
百味珍果糖
·
2023-07-20 12:40
hadoop
mapreduce
bug
mapreduce
编程 内存溢出OutOfMemoryError: Java heap space错误
运行
mapreduce
程序,出现OutOfMemoryError:Javaheapspace的错误。
百味珍果糖
·
2023-07-20 12:40
2.Hadoop 生态圈及核心组件简介
Hadoop的核心组件是HDFS、
MapReduce
。
墨家先生
·
2023-07-20 11:33
Hadoop
hadoop
big
data
spark
datawork节点分类
术语解释SHELL一种用于与操作系统进行交互的命令行界面OPEN_MR开放式
MapReduce
,用于并行处理大规模数据集ODPS_SQL阿里云的开放数据处理服务中使用的类似SQL的语法ODPS_MR阿里云的开放数据处理服务中的
静听山水
·
2023-07-20 10:12
Datawork
sql
实训笔记7.18
实训笔记7.187.18一、座右铭二、Hadoop大数据技术大数据软件一般都要求7*24小时不宕机三、Hadoop的组成3.1HDFS3.2
MapReduce
3.3YARN3.4HadoopCommon
cai-4
·
2023-07-20 00:00
实训
笔记
大数据
mapreduce
hdfs
Hadoop基本信息
框架内容狭义解释核心组件HDFS分布式文件系统-解决海量数据存储
MAPREDUCE
分布式运算编程框架-解决海量数据计算YARN作业调度和集群资源管理的框架-解决资源任务调度广义解释Hadoop的生态圈HUE
枫叶梨花
·
2023-07-19 18:29
hadoop
大数据
分布式
Hive基本操作
介绍Hive本质是将SQL转换为
MapReduce
的任务进行运算,底层由HDFS来提供数据存储,简单来说Hive可以理解为一个将SQL转换为
MapReduce
的任务的工具,甚至可以说Hive就是
MapReduce
枫叶梨花
·
2023-07-19 18:26
Hive知识圈
hive
hadoop
数据仓库
Hive SQL转化为
MapReduce
的过程
Hive将SQL转化为
MapReduce
任务,整个编译过程分为六个阶段: 词法、语法解析:Antlr定义SQL的语法规则,完成SQL词法,语法解析,将SQL转化为抽象语法树ASTTreeAntlr
逆水行舟如何
·
2023-07-19 17:10
hive
hive
sql
mapreduce
Hive概述
Hive本质:将SQL语句转换为
MapReduce
任务运行,使不熟悉
MapReduce
的用户很方便
Wzideng
·
2023-07-19 15:13
#
hive
hive
hadoop
数据仓库
hive参数调优
256000000;--每个job允许最大的reduce个数sethive.exec.reducers.max=1009;–计算reduce个数公式reduce个数=min(参数2,总输入数量/参数1)注意:
mapreduce
.job.re
likemebee
·
2023-07-19 06:29
大数据
hive
大数据
hadoop
Hive的更新和删除
但是,这些操作的执行方式与传统的关系型数据库不同,因为Hive使用Hadoop的
MapReduce
框架来处理数据。更新数据:Hive中的更新操作实际上是替换记录的过程。
、小H
·
2023-07-19 02:48
hive
hadoop
数据仓库
Shuffle的作用以及
MapReduce
的Shuffle过程
Shuffle的设计为什么需要Shuffle?Shuffle的本质是基于磁盘划分来解决分布式大数据量的全局分组、全局排序、重新分区【增大】等问题因为单台机器的资源处理不了分布式大数据量全局分区/排序/分组所以需要通过Shuffle对每一台机器的数据构建一个Task来做分区的标记(通过Hash或Ranger分区器)这样所有的数据被标记后就可以根据标记进入指定分区,实现全局分区/分组/排序功能举例说明
Kazi_1024
·
2023-07-19 01:51
Hadoop
mapreduce
大数据
hadoop
hadoop3-新特征
DataNode内部添加了负载均衡diskbalancer-实现磁盘之间的负载均衡
MapReduce
任务级本地优化
MapReduce
内存参数自动推断基于cgroup的内存隔离和I
葵恩
·
2023-07-18 21:37
Yarn调度
MapReduce
当我们执行这条命令时:hadoopjarhadoop-
mapreduce
-examples-2.7.3.jarwordcount/input/outputhadoop为我们做了那些事情?
忆华灯纵博
·
2023-07-18 21:11
Flink是什么
早期一般都是采用批量数据分析的方式1.1把数据丢到HDFS中,然后写
mapReduce
任务进行批数据分析(需要编写代码,麻烦)1.2将HDFS的数据映射到HIVE中,通过写HQL来完成数据的分析,背后的逻辑
狼与自由
·
2023-07-18 20:14
flink
大数据
MapReduce
在Zookeeper集群上鉴权失败
MapReduce
在Zookeeper集群上鉴权失败这是zookeeper上的一封邮件问答。内容比较简单,请大家直接查看正文。
羽飞
·
2023-07-18 18:22
其它
zookeeper
mapreduce
hadoop
三、Hadoop核心
MapReduce
1、基本概念:分而治之Job&TaskJobTackerTaskTracker一个job会被拆成多个task,会有maptask和reducetask
mapreduce
作业执行过程
MapReduce
容错机制
骑猴摘月亮
·
2023-07-18 14:17
spark-core从hbase中读写数据
spark交互HBaseSpark可以从HBase表中读写(Read/Write)数据,底层采用TableInputFormat和TableOutputFormat方式,与
MapReduce
与HBase
undo_try
·
2023-07-18 13:12
#
spark
spark
big
data
深入理解Spark中的Cache和Checkpoint
Spark中的Cache和Checkpoint机制与Hadoop
MapReduce
的区别Hadoop
MapReduce
在执行job的时候,不停地做持久化,每个task运行结束做一次,每个job运行结束做一次
undo_try
·
2023-07-18 13:11
#
spark
spark
hdfs
Hive简介及源码编译
Hive简介:Hive是一个基于Hadoop的数据仓库,可以将结构化数据映射成一张表,并提供类SQL的功能,最初由Facebook提供,使用HQL作为查询接口、HDFS作为存储底层、
MapReduce
作为执行层
K_un
·
2023-07-18 09:42
hive底层原理 sql执行过程_[Hive]HiveSQL解析原理
通过向社区的咨询和自己的努力,在解决这些问题的同时我们对Hive将SQL编译为
MapReduce
的过程有了比较深入
weixin_39605835
·
2023-07-18 08:48
hive底层原理
sql执行过程
大数据技术笔试题库--带答案
AA、ipconfigB、findC、ifconfigD、arp-a2、在
MapReduce
程序中,map()函数接收的数据格式是(D)。
码农小C
·
2023-07-18 08:03
大数据
大数据
分布式NoSQL数据库HBase介绍
Hadoop使用分布式文件系统,用于存储大数据,并使用
MapReduce
来处理。Hadoop擅长于存储各种格式的庞大的数据,任意的格式甚至非结构化的处理。
顾子豪
·
2023-07-17 22:24
Spark编程模型
Spark简述下图是Spark和
MapReduce
进行逻辑回归机器学习的性能比较,Spark比
MapReduce
快100多倍。
do_young
·
2023-07-17 10:41
HDFS 分布式文件系统
------分布式文件系统架构(核心是HDFS和
MapReduce
)2,HDFS是什么?--------分布式文件系统1,计算机集群与分布式文件系统?
一 乐
·
2023-07-17 09:18
大数据
hadoop
hdfs
大数据
hdfs分布式系统
分布式
【Hadoop 复习笔记】hadoop入门
——分布式文件系统(GFS),可用于处理海量网页的存储——分布式计算框架
MAPREDUCE
,可用于处理海
holysll
·
2023-07-17 06:46
大数据
Hadoop
MapReduce
HDFS
HBase
Hive
大数据计算分析技术:批处理、流计算、OLAP引擎
目录一、批处理的基石:
MapReduce
1.工作流程2.实例分析二、流计算的代表:storm、sparkstreaming和flink
青果HA
·
2023-07-17 02:37
大数据处理技术和大数据测试
批处理和流计算
Haddop入门架构图解
Hadoop项目的四个模块hadoopcommon(为其他hadoop模块提供基础设施)hdfs(一个高可靠,高吞吐量的分布式文件系统)
mapreduce
(一个分布式离线的并行计算框架)yarn(任务调度和资源管理
小东西的东西
·
2023-07-17 01:13
java
hadoop
架构
hdfs
开发语言
dubbo
第三节 Hadoop学习案例——
MapReduce
课程设计 好友推荐功能
提示:文章内容主要以案例为主目录前言项目说明一,程序需求1.需求2.数据二,编码操作1.项目建包目录2.FriendsRecommend.java3.FriendsRecommendMapper.java4.FriendsRecommendReduce.java三,Xshell运行的步骤1.创建目录2.上传程序3.分布式文件系统上传测试数据4.执行程序5.查看结果总结前言项目说明互为推荐关系非好友
羙橘
·
2023-07-16 23:13
大数据
hadoop
mapreduce
学习
Hadoop 组成
3)高效性:在
MapReduce
的思想下,Hadoop是并行工作的,以加快任务处理速度。4)高容错性:能够自动将失败的任务重新分配。
YOLO数据集工作室
·
2023-07-16 20:24
学习笔记
hadoop
大数据
分布式
上一页
38
39
40
41
42
43
44
45
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他