E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
---SparkCore
Spark Streaming 2.1.0 Programming Guide 个人理解与翻译
https://spark.apache.org/docs/2.1.0/streaming-programming-guide.htmlOverviewSparkStreaming(下称streaming)是
Sparkcore
chenfh5
·
2017-11-10 10:42
SparkCore
知识点 (一)
SparkCore
基于内存的分布式计算框架官网:http://spark.apache.org/文档:http://spark.apache.org/docs/1.6.1/官方博客:https://databricks.com
James__Tao
·
2017-10-24 13:16
Spark组件介绍
的设计理念交互式和迭代式在集群多点内存中运行的分布式计算容错数据集合同时Spark还支持使用不同的语言编程(Java,Scala,R,Python)可以从不同的数据源获取数据(HDFS,Cassandra,HBase)实现不同的功能
SparkCore
C_FuL
·
2017-10-23 10:16
Spark
DMP用户画像系统(SparkGraphX
SparkCore
SparkSQL)
DMP用户画像系统(SparkGraphXSparkCoreSparkSQL)课程观看地址:http://www.xuetuwuyou.com/course/221课程出自学途无忧网:http://www.xuetuwuyou.comDMP系统用户画像也称人物角色,是根据用户社会属性、生活习惯和消费行为等信息而抽象出的一个标签化的用户模型,即真实用户的虚拟代表。通过用户调研去了解用户,根据他们的目
含笑三步
·
2017-10-18 09:35
DMP
SparkCore
解析json数据fastjson
importcom.alibaba.fastjson.JSONimportorg.apache.spark.{SparkConf,SparkContext}importorg.apache.spark.rdd.RDDobjectsimple{defmain(args:Array[String]){valconf=newSparkConf().setAppName("WordCount").setM
小小的_我
·
2017-09-23 17:52
RDD的创建与操作
然后在创建了初始的RDD之后,才可以通过
SparkCore
提供的transformation算子,对该RDD进行转换,来获取其他的RDD。
象在舞
·
2017-08-30 20:21
Spark
Spark Streaming 调优指南
SparkStreaming是架构在
SparkCore
上的一个“应用”,SparkStreaming主要由DStreamGraph、Job的生成、数据的接收和导入以及容错四大模块组成,我们今天就从这四大模块入手
_和_
·
2017-08-19 16:12
Spark Streaming遇到问题分析
github.com/lw-lin/Coo...2、Spark的Job与Streaming的Job有区别及StreamingJob并发控制:先看看SparkStreaming的JobSet,Job,与
SparkCore
xbynet
·
2017-07-17 00:00
java
spark-streaming
spark
[置顶] Spark 2.1.0 大数据平台源码分析:章节序列
SparkCore
(二)Driver上的Task的生成、分配、调度
SparkCore
(三)Executor上是如何launchtaskSparkCore(四)用LogQuery的例子来说明Executor
raintungli
·
2017-05-09 17:00
spark
源码分析
大数据:Spark Shuffle(一)ShuffleWrite:Executor如何将Shuffle的结果进行归并写到数据文件中去
1.前序关于Executor如何运行算子,请参考前面博文:大数据:
SparkCore
(四)用LogQuery的例子来说明Executor是如何运算RDD的算子,当Executor进行reduce运算的时候
raintungli
·
2017-04-27 11:00
spark
归并
shuffle
executor
shufflewrite
spark的生态圈
Spark系统中,其核心框架是
sparkcore
,同时涵盖支持结构化数据SQL查询与分析的查询引擎SparkSQL和shark,提供机器学习功能的系统MLbase及底层的分布式机器学习库MLlib,并行图计算框架
蜗牛0
·
2017-04-11 19:08
Spark
Spark Streaming 不同Batch任务可以并行计算么?
关于SparkStreaming中的任务有如下几个概念:BatchJobStageTask其实Stage,Task都是
SparkCore
里就有的概念,Job在Streaming和
SparkCore
里的概念则是不一致的
祝威廉
·
2017-02-11 23:00
spark 窗口函数row_number练习以及用spark core实现
示例数据如下:class190class256class187class176class288class195class174class287class267class2771、直接使用
Sparkcore
a11a2233445566
·
2017-01-23 16:12
spark
Spark入门实战
核心是
SparkCore
组件,它实现了Spark的基本功能,包括:任务调度、内存管理、错误恢复、与
datashrimp
·
2017-01-21 15:36
实战分析
Redbear DUO初体验
RedbearDUO初体验2013年在seeedstudio上买过一块
SparkCore
开发板,作为物联网元年的产品,开发板上TI那块号称Smart(Link)Config的WIFI芯片CC3000当时可谓红极一时
飞行的鱼
·
2017-01-01 20:16
嵌入式
Spark Streaming源码解读之RDD生成全生命周期彻底研究和思考
SparkStreaming源码解读之RDD生成全生命周期彻底研究和思考-http://www.jianshu.com/p/e3ab39e61cc7RDD的三个问题1.RDD到底是怎么生成的2.具体执行的时候,是否和基于
SparkCore
葡萄喃喃呓语
·
2016-12-12 17:52
Spark 基础
Spark核心引擎的特点——速度快、通用大一统的软件栈,其组件——
SparkCore
、SparkSQL(结构化数据)、SparkStreaming(实时计算)、MLib(机器学习)、GraphX(图计算
九七学姐
·
2016-11-29 09:19
spark sql 深入解读
目前与
SparkCore
还是耦合的,对此user邮件组里有人对此提出疑问,见mail。以下是Catalyst较早时候的架构图,展示的是代码结构和处理流程。
Codlife一王家二公子
·
2016-10-01 20:19
Spark Streaming源码解读之RDD生成全生命周期彻底研究和思考
2、执行时是否与
SparkCore
上的RDD执行有什么不同的3、运行之后对RDD要怎么处理为什么有第三点:是因为SparkStreaming中会随着相关触发条件,窗口Window滑动的时候都会不断的产生
二府村
·
2016-09-03 10:29
SparkDream
Spark Core通过log信息由浅到深分析架构原理和工作流程
本文完全从0开始了解spark到深入理解
sparkcore
一,概念,基础================================================================1
gao634209276
·
2016-08-27 18:17
spark
通过案例对SparkStreaming透彻理解(1)
Spark最开始只有
SparkCore
,没有目前的这些子框架。这些子框架是构建于
SparkCore
之上的。没有哪个子
二府村
·
2016-08-23 16:58
SparkDream
spark-2.0-从RDD到DataSet
spark未来基本是要在DataSet上扩展了,因为spark基于
sparkcore
关注的东西很多,整合内部代码是必然的。1、加载文件valrdd=sparkContext.textFile(".
youdianjinjin
·
2016-07-31 15:00
Spark中saveAsTextFile至stage划分和job提交的源代码分析
现在回过头来,打算看一下
sparkcore
部分代码,就先找了下saveAsTextFile这个方法作为入口,看一下是怎么保存文档到hadoop中,并且怎么切分stage以及提交Task。
humingminghz
·
2016-07-29 14:00
scala
spark
hadoop
Spark中saveAsTextFile至stage划分和job提交的源代码分析
现在回过头来,打算看一下
sparkcore
部分代码,就先找了下saveAsTextFile这个方法作为入口,看一下是怎么保存文档到hadoop中,并且怎么切分stage以及提交Task。
humingminghz
·
2016-07-29 14:00
scala
spark
hadoop
SparkStreaming之Accumulators和Broadcast
在
SparkCore
中经常广播一些环境变量,目的是使得在同一时间集群中的每台机器的环境变量都更新。它的功能是用于有效地给每个节点输入一个环境变量或者数据集副本,這样可以减少通信的开销。
legotime
·
2016-07-06 07:00
源码
大数据
SparkStreaming
[0.0.0] 大型spark项目实战
参考电商用户行为分析大数据平台-中华石杉DT大数据梦工厂-王家林spark官网文档场景在项目实战中理解:1、
sparkcore
、sql、streaming以及机器学习与图计算相关的知识点2、性能调优、troubleshooting
彭宇成
·
2016-06-27 00:24
项目总结
第12课:Spark Streaming源码解读之Executor容错安全性
SparkStreaming是基于
SparkCore
之上的,如果能够确保数据安全可好的话,在SparkStreaming生成Job的时候里面是基于RDD,即使运行的时候出现问题,那么SparkStreaming
zhou_yuefei
·
2016-05-31 22:38
spark
kafka
executor
Streaming
数据安全
receiver
第16课:Spark Streaming源码解读之数据清理内幕彻底解密
本期内容:SparkStreaming数据清理原因和现象SparkStreaming数据清理代码解析对SparkStreaming解析了这么多课之后,我们越来越能感知,SparkStreaming只是基于
SparkCore
lqding1980
·
2016-05-31 16:30
Streaming
数据清理
第16课:Spark Streaming源码解读之数据清理内幕彻底解密
本期内容:SparkStreaming数据清理原因和现象SparkStreaming数据清理代码解析对SparkStreaming解析了这么多课之后,我们越来越能感知,SparkStreaming只是基于
SparkCore
lqding1980
·
2016-05-31 16:30
Streaming
数据清理
Spark源码定制课程
第12课:Spark Streaming源码解读之Executor容错安全性
SparkStreaming是基于
SparkCore
之上的,如果能够确保数据安全可好的话,在SparkStreaming生成Job的时候里面是基于RDD,即使运行的时候出
love205088
·
2016-05-30 23:24
spark
第7课:Spark Streaming源码解读之JobScheduler内幕实现和深度思考
一:JobSheduler的源码解析1.JobScheduler是SparkStreaming整个调度的核心,相当于
SparkCore
上的DAGScheduler.2.SparkStreaming为啥要设置两条线程
love205088
·
2016-05-30 23:50
spark
第7课:Spark Streaming源码解读之JobScheduler内幕实现和深度思考
一:JobSheduler的源码解析1.JobScheduler是SparkStreaming整个调度的核心,相当于
SparkCore
上的DAGScheduler.2.SparkStreaming为啥要设置两条线程
love205088
·
2016-05-30 23:24
spark
第8课:Spark Streaming源码解读之RDD生成全生命周期彻底研究和思考
Dstream与rdd关系彻底研究Dstream中rdd生成彻底研究从整个sparkstreaming角度来考虑,rdd分为三个方面的内容:a.怎么生成的,依靠什么生成的;b.runtime角度,具体执行的时候与
sparkcore
MichaelLi916
·
2016-05-29 00:00
spark
第12课:Spark Streaming源码解读之Executor容错安全性
SparkStreaming是基于
SparkCore
之上的,如果能够确保数据安全可好的话,在SparkStreaming生成Job的时候里面是基于RDD,即使运行的时候出现问题,那么SparkStreaming
飞帅记忆
·
2016-05-28 23:41
第12课:Spark Streaming源码解读之Executor容错安全性
SparkStreaming是基于
SparkCore
之上的,如果能够确保数据安全可好的话,在SparkStreaming生成Job的时候里面是基于RDD,即使运行的时候出现问题,那么SparkStream
zhou_yuefei
·
2016-05-28 23:00
spark
Streaming
数据安全
Kafka
Executor
Receiver
第12课:Spark Streaming源码解读之Executor容错安全性
SparkStreaming是基于
SparkCore
之上的,如果能够确保数据安全可好的话,在SparkStreaming生成Job的时候里面是基于RDD,即使运行的时候出现问题,那么SparkStream
zhou_yuefei
·
2016-05-28 23:00
spark
Streaming
数据安全
Kafka
Executor
Receiver
Spark 定制版:008~Spark Streaming源码解读之RDD生成全生命周期彻底研究和思考
上节回顾上节课,我们重点给大家揭秘了JobScheduler内幕;可以说JobScheduler是整个SparkStreming的调度的核心,其地位相当于
SparkCore
中的DAGScheduler。
zisheng_wang_DATA
·
2016-05-25 23:00
源码
spark
RDD
Streaming
DStream
第12课:Spark Streaming源码解读之Executor容错安全性
SparkStreaming是基于
SparkCore
之上的,如果能够确保数据安全可好的话,在SparkStreaming生成Job的时候里面是基于RDD,即使运行的时候出
snail_gesture
·
2016-05-24 15:00
java
hadoop
scala
spark
数据安全
(版本定制)第12课:Spark Streaming源码解读之Executor容错安全性
原因是计算的时候SparkStreaming是借助于
SparkCore
上RDD的安全容错的,所以天然的安全可靠的。
Spark_2016
·
2016-05-23 16:29
Executor
Spark
Streaming
Spark版本定制
(版本定制)第12课:Spark Streaming源码解读之Executor容错安全性
原因是计算的时候SparkStreaming是借助于
SparkCore
上RDD的安全容错的,所以天然的安全可靠的。
18610086859
·
2016-05-23 16:29
spark
executor
Streaming
第2课:通过案例对SparkStreaming 透彻理解三板斧之二:解密SparkStreaming运行机制和架构
与其说sparkstreaming是
sparkcore
上
MichaelLi916
·
2016-05-23 11:00
spark
DT大数据梦工厂Spark 定制班笔记(003)
注意:这里的Job不是
SparkCore
中所指的Job,它只是基于DStreamGraph而
ry076
·
2016-05-21 15:19
DT大数据梦工厂Spark 定制班笔记(002)
概述SparkStreaming是Spark的一个子框架,但我们也可以把它看作是一个在
SparkCore
应用程序。SparkStreaming在启动时运行了几个的job,并且job之间相互配合。
ry076
·
2016-05-21 14:22
(版本定制)第7课:Spark Streaming源码解读之JobScheduler内幕实现和深度思考
本期内容:1、JobScheduler内幕实现2、JobScheduler深度思考JobScheduler是SparkStreaming的调度核心,地位相当于
SparkCore
上调度中心的DAGScheduler
Spark_2016
·
2016-05-20 06:14
Spark
Streaming
JobScheduler
Spark版本定制
(版本定制)第7课:Spark Streaming源码解读之JobScheduler内幕实现和深度思考
本期内容: 1、JobScheduler内幕实现 2、JobScheduler深度思考JobScheduler是SparkStreaming的调度核心,地位相当于
SparkCore
上调度中心的DAGScheduler
18610086859
·
2016-05-20 06:14
spark
Streaming
JobScheduler
第7课:Spark Streaming源码解读之JobScheduler内幕实现和深度思考
一:JobSheduler的源码解析1.JobScheduler是SparkStreaming整个调度的核心,相当于
SparkCore
上的DAGScheduler.2.SparkStreaming为啥要设置两条线程
snail_gesture
·
2016-05-18 22:00
java
hadoop
scala
spark
大数据
6.Spark streaming技术内幕 : Job动态生成原理与源码解析
转载请注明:转载自周岳飞博客(http://zhou-yuefei.iteye.com/)Sparkstreaming程序的运行过程是将DStream的操作转化成RDD的操作,SparkStreaming和
SparkCore
zhou_yuefei
·
2016-05-17 23:00
spark
Streaming
Job动态生成
JobScheduler
源码分析
6.Spark streaming技术内幕 : Job动态生成原理与源码解析
转载请注明:转载自周岳飞博客(http://zhou-yuefei.iteye.com/)Sparkstreaming程序的运行过程是将DStream的操作转化成RDD的操作,SparkStreaming和
SparkCore
zhou_yuefei
·
2016-05-17 23:00
spark
Streaming
Job动态生成
JobScheduler
源码分析
6.Spark streaming技术内幕 : Job动态生成原理与源码解析
转载请注明:转载自周岳飞博客(http://zhou-yuefei.iteye.com/) Sparkstreaming程序的运行过程是将DStream的操作转化成RDD的操作,SparkStreaming和
SparkCore
zhou_yuefei
·
2016-05-17 23:00
spark
源码分析
Streaming
JobScheduler
Job动态生成
6.Spark streaming技术内幕 : Job动态生成原理与源码解析
转载自 周岳飞博客(http://zhou-yuefei.iteye.com/) Sparkstreaming程序的运行过程是将DStream的操作转化成RDD的操作,SparkStreaming和
SparkCore
zhou_yuefei
·
2016-05-17 23:00
spark
原理
job
源码解析
Streaming
JobScheduler
上一页
10
11
12
13
14
15
16
17
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他