E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
spark(scala)
Spark
---
Spark
Core(一)
一、术语与宽窄依赖1、术语解释1、Master(standalone):资源管理的主节点(进程)2、ClusterManager:在集群上获取资源的外部服务(例如:standalone,Mesos,Yarn)3、WorkerNode(standalone):资源管理的从节点(进程)或者说管理本机资源的进程4、DriverProgram:用于连接工作进程(Worker)的程序5、Executor:是
30岁老阿姨
·
2023-11-25 01:20
Spark
spark
大数据
分布式
Spark
---补充算子
一、
Spark
补充Transformation算子1、join,leftOuterJoin,rightOuterJoin,fullOuterJoin作用在K,V格式的RDD上。
30岁老阿姨
·
2023-11-25 01:50
Spark
spark
大数据
分布式
spark
任务提交方式yarn-client和yarn-cluster对比
spark
中yarn模式有两种任务提交方式,分别是yarn-client模式和yarn-cluster模式,其区别如下:一、yarn-client任务提交方式1、yarn-client模式提交任务后,会在客户端启动
伊一cherry大数据
·
2023-11-25 01:18
spark
大数据
hadoop
Spark
-----第 2 章
Spark
部署模式
Spark
支持多种集群管理器(ClusterManager),分别为:Standalone:独立模式,
Spark
原生的简单集群管理器,自带完整的服务,可单独部署到一个集群中,无需依赖任何其他资源管理系统
Wzideng
·
2023-11-25 01:18
#
spark
spark
大数据
分布式
spark
yarn 提交_
Spark
系列--提交任务流程
1.
Spark
基于StandaLone的任务提交模式StandaLone提交任务有两种模式,一种是基于客户端Client提交任务,另一种是集群cluster提交任务。
谷俊丽
·
2023-11-25 01:18
spark
yarn
提交
Spark
on YARN运行过程,YARN-Client和YARN-Cluster
Spark
onYARN运行过程YARN是一种统一资源管理机制,在其上面可以运行多套计算框架。
高个子男孩
·
2023-11-25 01:17
Spark
spark
大数据
hadoop
Spark
on yarn——
Spark
提交任务到yarn集群源码分析
目录一、入口类——
Spark
Submit二、
Spark
Application启动——JavaMainApplication、YarnClusterApplication三、
Spark
Context初始化四
编程小王子啊
·
2023-11-25 01:17
CSDN大数据专栏
spark
大数据
hdfs
java
架构
实战py
spark
基于yarn模式提交任务成功踩坑
1.背景最近的项目使用yarn提交py
spark
的任务,遇到了不少坑,目前已经成功地跑通了基于client和cluster两种模式的任务提交。特此记录一下。
euler1983
·
2023-11-25 01:16
pyspark
spark
大数据
hadoop
spark
submit——yarn模式参数调优
spark
官网上的参数默认值设置:https://
spark
.apache.org/docs/latest/configuration.html#
spark
-streaming此处记录一下最近整理的
spark
凌寒独自开
·
2023-11-25 01:16
大数据
spark
yarn
大数据
Spark
on Yarn提交任务过程
这篇文章将从源码的角度向大家展示
Spark
是如何提交任务到Yarn上执行的,如有错误,还请各位指出。
枫_Maple
·
2023-11-25 01:46
大数据
spark
yarn
大数据
什么是
spark
,
spark
运行模式,local模式,使用
spark
-shell,Standalone模式,Yarn模式,案例实操WordCount程序
目录第1部分
Spark
基础第1章
Spark
概述1.1什么是
Spark
1.2.1快速1.2.2易用1.3.1集群管理器(ClusterManager)第2章
Spark
运行模式2.1Local模式2.1.1
长岛山没有雪
·
2023-11-25 01:45
spark
yarn
大数据
分布式
开源
数据分析
spark
-yarn-cluster任务提交方式Logs出现Fails且无法访问
/
spark
-submit--masteryarn--deploy-modecluster--classorg.apache.
spark
.examples.
Spark
Pi..
CoreDao
·
2023-11-25 01:45
Spark
java
spark
scala
分布式
大数据
1.
spark
源码分析(基于yarn cluster模式)-任务提交
首先声明,这个系列研究的源码基于
spark
-2.4.6我们在使用
spark
-shell提交任务的时候,一般采用如下模式提交任务:park-submit--classxxxxx--name'test_xxxx
Leo Han
·
2023-11-25 01:45
大数据
spark
scala
big
data
yarn
Spark
---基于Yarn模式提交任务
/
spark
-submit--masteryarn--classorg.apache.
spark
.examples.
Spark
Pi..
30岁老阿姨
·
2023-11-25 01:14
Spark
spark
大数据
分布式
Spark
是什么?以及它有哪些应用场景呢?
首先说说
Spark
的起源:
Spark
是UCBerkeleyAMPlab所开源的类HadoopMapReduce的通用的并行计算框架,
Spark
基于mapreduce算法实现的分布式计算,拥有HadoopMapReduce
陈影鸿在进步
·
2023-11-25 01:07
大数据处理
WhatsApp技术
容器
Apache Linkis 修复多个漏洞
编译:代码卫士ApacheLinkis是一款热门的计算中间件,用于弥合上层应用程序和底层引擎之间的差距,从而能够无缝访问多个引擎如MySQL、
Spark
、Hive、Presto和Flink。
奇安信代码卫士
·
2023-11-24 23:31
apache
大数据
hive
hadoop
数据仓库
最新AI创作系统ChatGPT系统运营源码,支持GPT-4图片对话能力,上传图片并识图理解对话,支持DALL-E3文生图
一、AI创作系统
Spark
Ai是目前国内一款的ChatGPT对接OpenAI软件系统。那么如何搭建部署AI创作ChatGPT?小编这里写一个详细图文教程吧!
只恨天高
·
2023-11-24 22:17
人工智能
系统源码
chatgpt
chatgpt
人工智能
源码软件
AI写作
AI作画
机器学习 之分类
spark
.mllib支持两种线性分类方法:线性支持向量机(SVM)和逻辑回归。线性SVM仅支持二进制分类,而逻辑回归支持二进制和多类分类问题。
辣椒种子
·
2023-11-24 22:01
机器学习
机器学习
分类
人工智能
机器学习之基本的统计工具
除此之外,
spark
.mllib库也提供了一些其他的基本的统计分析工具,包括相关性、分层抽样、假设检验,随机数生成等。
辣椒种子
·
2023-11-24 22:30
机器学习
机器学习
人工智能
docker安装部署Apache Griffin
1)下载docker镜像dockerpullapachegriffin/griffin_
spark
2:0.3.0dockerpullapachegriffin/elasticsearchdockerpullapachegriffin
柒柒钏
·
2023-11-24 21:35
安装教程
docker
apache
Griffin
01-详细介绍函数式接口和Lambda表达式语法
该接口可以包含其他非抽象方法)接口上使用@FunctionalInterface注解可以验证该接口是否为函数式接口,javadoc生成的文档时也会保留该注解,若接口中有多个抽象方法编译器会报错随着Python,
Scala
echo 云清
·
2023-11-24 20:41
Java8
开发语言
Java8
函数式接口
Lambda表达式
HTML5之SVG的使用
SVG指可伸缩矢量图形(
Scala
bleVectorGraphics);SVG用于定义用于网络的基于矢量的图形;SVG使用XML格式定义图形;SVG图像在放大或改变尺寸的情况下其图形质量不会有损失;SVG
暖A暖
·
2023-11-24 20:29
vue使用SVG矢量图
SVG(
Scala
bleVectorGraphics,可缩放矢量图形)是一种使用XML标记语言描述二维图形和图形应用的开放标准,其核心特性是可缩放性,即使放大缩小都不会失去清晰度和质量。
我的椰子啊
·
2023-11-24 19:53
vue
vue.js
前端
javascript
乐字节-Java8核心特性实战-Lambda表达式
很多语言(Groovy、
Scala
等)从设计之初就支持Lambda表达式。但是java中使
乐字节
·
2023-11-24 19:52
如何在vue项目中引入svg图标
概述svg,即
Scala
bleVectorGraphics,可缩放矢量图形。相对于jpg,png图标,svg可以在任意分辨率下保证不会模糊,即便是网页缩放了。
别说小李
·
2023-11-24 19:49
前端
vue.js
javascript
elementui
Vue新项目中如何使用SVG矢量图
SVG指可伸缩矢量图形(
Scala
bleVectorGraphics)SVG用来定义用于网络的基于矢量的图形SVG使用XML格式定义图形SVG图像在放大或改变尺寸的情况下其图形质量不会有所损失SVG是万维网联盟的标准二
run-Ameng
·
2023-11-24 19:18
vue
项目
前端
Java与
Scala
中的偏函数与偏应用函数
在Java和
Scala
中,偏函数(PartialFunction)和偏应用函数(PartialApplicationFunction)是函数式编程中常用的概念。它们可以帮助简化代码并增加代码的可读性。
HackLogic
·
2023-11-24 18:11
java
scala
开发语言
Java
ARTS-第八周第九周
Tips/Technology一、Kerberos与hadoop生态相关配置与操作HDFS使用kerberosYARN、
Spark
、Hive使用kerberoskerberos+LDA
梧上擎天
·
2023-11-24 17:02
Serverless 在数据处理场景下的最佳应用
我们知道传统的数据处理无外乎涉及Kafka、Logstash、FileBeats、
Spark
、Flink、CLS、COS等组件。
Serverless
·
2023-11-24 17:49
Serverless
serverless
云计算
spark
源码分析之三 -- LiveListenerBus介绍
LiveListenerBus官方说明如下:Asynchronouslypasses
Spark
ListenerEventstoregistered
Spark
Listeners.即它的功能是异步地将
Spark
ListenerEvent
weixin_30457465
·
2023-11-24 16:08
大数据
Spark
重要源码解读
Spark
Conf类/***Configurationfora
Spark
application.Usedtosetvarious
Spark
parametersaskey-valuepairs.
Winyar Wen
·
2023-11-24 16:08
大数据
spark源码
Spark
一级资源调度Shedule机制及SpreadOut模式源码深入剖析
本套系列博客从真实商业环境抽取案例进行总结和分享,并给出
Spark
源码解读及商业实战指导,请持续关注本套博客。版权声明:本套
Spark
源码解读及商业实战归作者(秦凯新)所有,禁止转载,欢迎学习。
weixin_34210740
·
2023-11-24 16:38
大数据
Spark
事件监听总线流程分析-
Spark
商业环境实战
本套系列博客从真实商业环境抽取案例进行总结和分享,并给出
Spark
源码解读及商业实战指导,请持续关注本套博客。版权声明:本套
Spark
源码解读及商业实战归作者(秦凯新)所有,禁止转载,欢迎学习。
weixin_34268753
·
2023-11-24 16:38
大数据
ui
spark
源码:
Spark
Context初始化需要启动的组件
spark
源码分析之
Spark
Context1.
Spark
Context简介2初始化
Spark
Context需要启动的组件2.0
Spark
Context私有的可变成员变量2.1SpaekEnv2.2LiveListenerBus2.3
Spark
UI2.4
Spark
StatusTracker2.5ConsoleProgressBar2.6DAGScheduler2.7TaskScheduler2.8
weixin_38842855
·
2023-11-24 16:38
spark
spark
streaming2.4.0 任务启动源码剖析
官方案例首先以官方启动入手object
Spark
StreamingTest{defmain(args:Array[String]):Unit={valconf=new
Spark
Conf().setAppName
乾坤瞬间
·
2023-11-24 16:07
spark
大数据
spark
streaming
【源码解读】|
Spark
Context源码解读
【源码解读】|
Spark
Context源码解读导读须知一、CallSite创建什么叫CallSite?CallSite有什么用?
857技术社区
·
2023-11-24 16:06
Spark
Core
Spark
大数据
Spark源码
SparkContext
Spark
UI实现原理与事件监听机制
Spark
UI实现原理与事件监听机制一、引言
Spark
UI是了解
spark
任务运行情况的入口,也是进行
spark
任务性能优化与调试必不可少的工具。
涛声依旧(竞涛)
·
2023-11-24 16:35
spark
Spark
UI
event
listener
source
Spark
Task执行流程源码分析系列之二: 任务构建&调度&资源分配
上一节我们介绍了Task各个环节用到的主要数据结构,本节我们来看看
Spark
中一个Task是如何构建起来的,又是如何获取到资源,然后提交给集群相应的资源进行启动的。
小白数据猿
·
2023-11-24 16:04
Spark
大数据
spark
Spark
异步事件总线机制源码分析
收录于话题#大数据常用技术15#大数据17#
spark
2
Spark
事件总线贯彻整个应用,TaskScheduler、Executor、JobScheduler、SQLExecution等关键交互逻辑离不开
跃ge
·
2023-11-24 16:03
spark
Spark
核心机制总结
文章目录1.RDD2.与MapReduce对比3.
Spark
的各大组件4.
Spark
执行流程5.执行过程中的一些细节6.
Spark
的部署模式和作业提交部署模式
Spark
的作业提交7.宽窄依赖DAGScheduler
Icedzzz
·
2023-11-24 16:33
Spark
大数据
spark
Spark
读取外部数据的原理解读
收录于话题#
spark
2#大数据17#大数据常用技术15为了简化理解,该文尝试使用
Spark
Context.textFile()为入口进行分析。
跃ge
·
2023-11-24 16:33
spark
【
Spark
源码分析】事件总线机制分析
Spark
事件总线机制采用
Spark
2.11源码,以下类或方法被@DeveloperApi注解额部分,可能出现不同版本不同实现的情况。
Spark
中的事件总线用于接受事件并提交到对应的监听器中。
顧棟
·
2023-11-24 16:02
Spark
spark
大数据
大数据集群报错集锦及解决方案
4Azkaban4.1Azkaban页面登陆乱码5Oozie5.1Oozie初始化失败5.2脚本修改之后Oozie任务执行失败6Kerberos6.1启用Kerberos之后,hdfs浏览器打开鉴权失败7
Spark
7.1Spa
陈舟的舟
·
2023-11-24 16:22
大数据
大数据
Doris系列之高级功能-Rollup操作
Doris系列注:大家觉得博客好的话,别忘了点赞收藏呀,本人每周都会更新关于人工智能和大数据相关的内容,内容多为原创,PythonJava
Scala
SQL代码,CVNLP推荐系统等,
Spark
FlinkKafkaHbaseHiveFlume
陈万君Allen
·
2023-11-24 16:31
Java和大数据
大数据
数据库
Doris系列之物化视图操作
Doris系列注:大家觉得博客好的话,别忘了点赞收藏呀,本人每周都会更新关于人工智能和大数据相关的内容,内容多为原创,PythonJava
Scala
SQL代码,CVNLP推荐系统等,
Spark
FlinkKafkaHbaseHiveFlume
陈万君Allen
·
2023-11-24 16:31
Java和大数据
大数据
数据库
实时分析海量新数据的难点 和解决方案
解决方案:使用分布式计算和存储技术,如Hadoop、
Spark
、Kafka等,将数据分散存储在多个节点上,同时进行分布式计算和处理,以实现数据的实时处理和分析。2.数据质量的保障:海量新
29597739c454
·
2023-11-24 15:56
kafka常见面试问题(1)
这个消息传递应用程序是用“
scala
”编码的。基本上,这个项目是由Apache软件启动的。Kafka的设计模式主要基于事务日志设计。问题2:Kafka中有哪几个组件?
Computer_hello
·
2023-11-24 15:18
kafka
Rust语言入门教程(四) - 标量数据类型
标量类型(
Scala
rTypes)在Rust中,一共有4中标量类型,也就是基本数据类型,分别是:整型(Integers)浮点型(Floats)布尔型(Boolean)字符型(Characters)整型无符号整型
eponia
·
2023-11-24 14:19
Rust教程
rust
开发语言
后端
【2019-06-04】
scala
抽象成员
不完全定义的类或特质的成员为抽象成员。抽象成员将被声明类的子类实现。四种抽象成员:val、var、方法及类型抽象类型val定义形式://指定了val的名称和类型,不指定值。valinitial:String//值必须由子类的具体val定义提供classConcreteextendsAbstract{typeT=Stringdeftransform(x:String)=x+xvalinitial="
BigBigFlower
·
2023-11-24 12:43
【
spark
on kubernetes】
spark
operator部署安装 v1beta2-1.2.0-3.0.0
最近开始研究
spark
onkubernetes,经过调研,
spark
onkubernetes有两种方案,一种是官方的
spark
提供的原生支持按照
spark
-submit方式提交任务,第二种是google
秦拿希
·
2023-11-24 11:18
spark
kubernate
spark
kubernetes
big
data
上一页
81
82
83
84
85
86
87
88
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他