E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
sparkSQL
Spark-
SparkSQL
深入学习系列八(转自OopsOutOfMemory)
/**
SparkSQL
源码分析系列文章*/ 在SQL的世界里,除了官方提供的常用的处理函数之外,一般都会提供可扩展的对外自定义函数接口,这已经成为一种事实的标准。
youdianjinjin
·
2016-05-11 19:00
Spark-
SparkSQL
深入学习系列七(转自OopsOutOfMemory)
/**
SparkSQL
源码分析系列文章*/ 接上一篇文章
SparkSQL
Catalyst源码分析之PhysicalPlan,本文将介绍PhysicalPlan的toRDD的具体实现细节: 我们都知道一段
youdianjinjin
·
2016-05-11 19:00
Spark-
SparkSQL
深入学习系列六(转自OopsOutOfMemory)
/**
SparkSQL
源码分析系列文章*/ 前面几篇文章主要介绍的是Spark sql包里的的
sparksql
执行流程,以及Catalyst包内的SqlParser,Analyzer和Optimizer
youdianjinjin
·
2016-05-11 19:00
Spark-
SparkSQL
深入学习系列五(转自OopsOutOfMemory)
/**
SparkSQL
源码分析系列文章*/ 前几篇文章介绍了Spark SQL的Catalyst的核心运行流程、SqlParser,和Analyzer 以及核心类库TreeNode,本文将详细讲解
SparkSQL
youdianjinjin
·
2016-05-11 19:00
Spark-
SparkSQL
深入学习系列四(转自OopsOutOfMemory)
/**
SparkSQL
源码分析系列文章*/ 前几篇文章介绍了Spark SQL的Catalyst的核心运行流程、SqlParser,和Analyzer,本来打算直接写Optimizer的,但是发现忘记介绍
youdianjinjin
·
2016-05-11 19:00
Spark-
SparkSQL
深入学习系列三(转自OopsOutOfMemory)
/**
SparkSQL
源码分析系列文章*/ 前面几篇文章讲解了
SparkSQL
的核心执行流程和Spark SQL的Catalyst框架的SqlParser是怎样接受用户输入sql,经过解析生成UnresolvedLogicalPlan
youdianjinjin
·
2016-05-11 19:00
Spark-
SparkSQL
深入学习系列二(转自OopsOutOfMemory)
/**
SparkSQL
源码分析系列文章*/ Spark SQL的核心执行流程我们已经分析完毕,可以参见
SparkSQL
核心执行流程,下面我们来分析执行流程中各个核心组件的工作职责。
youdianjinjin
·
2016-05-11 19:00
Spark-
SparkSQL
深入学习系列一(转自OopsOutOfMemory)
/**
SparkSQL
源码分析系列文章*/ 自从去年Spark Submit2013MichaelArmbrust分享了他的Catalyst,到至今1年多了,
SparkSQL
的贡献者从几人到了几十人
youdianjinjin
·
2016-05-11 19:00
spark
Spark Sql,Dataframe和数据集指南
概述
SparkSQL
是一个spark模块,主要用于结构化数据的处理。不像基础的sparkRDD的API那么抽象,该接口能够对数据和数据的计算提供更多的信息。
u013676711
·
2016-05-10 23:00
网易视频云技术分享:一个
SparkSQL
的作业的一生
现在,网易视频云的技术专家给大家分享一则技术文:一个
SparkSQL
的作业的一生。Spark是时下很火的计算框架,由UCBerkeley
vcould163
·
2016-05-10 16:00
技术开发
视频云
网易视频云
云直播
Spark-
SparkSql
SparkSql
允许spark执行sql语句,hivesql,scala的描述的基于关系的查询。其实是封装了新的RDD-SchemaRDD,由行对象组成,有一个模式描述每列的数据类型。
youdianjinjin
·
2016-05-09 22:00
spark
Spark中文手册7:Spark-sql由入门到精通【续】
2.
SparkSQL
CLI的作用是什么?3.
SparkSQL
数据类型有哪些。如何访问它们?性能调优对于某些工作负载,可以在通过在内存中缓存数据或者打开一些实验选项来提高性能。
wanmeilingdu
·
2016-05-09 21:00
spark
第2课:通过案例对 spark streaming 透彻理解三板斧之二:spark streaming运行机制
SparkStreaming架构2.SparkStreaming运行机制Spark大数据分析框架的核心部件:sparkCore、sparkStreaming流计算、GraphX图计算、MLlib机器学习、
SparkSQL
kaden
·
2016-05-09 20:12
大数据工程师技能图谱(转)
大数据工程师技能图谱大数据通用处理平台 Spark Flink Hadoop分布式存储 HDFS资源调度 Yarn Mesos数据分析/数据仓库(SQL类) Pig Hive kylin
SparkSQL
zhuyuping
·
2016-05-09 19:00
spark
大数据
Learning Spark (Python版) 学习笔记---工作原理、调优与Spark SQL
这三章主要讲Spark的运行过程(本地+集群),性能调优以及
SparkSQL
相关的知识,如果对Spark不熟的同学可以先看看之前bbs.chinaacc.com/forum-2-26/topic-5629794
a7564951
·
2016-05-09 04:00
Spark学习五:spark sql
Spark学习五:
sparksql
标签(空格分隔):SparkSpark学习五
sparksql
一概述二Spark的发展历史三
Sparksql
和hive对比四
sparksql
架构五sprksql访问hive
youfashion
·
2016-05-09 00:00
spark
【原】Learning Spark (Python版) 学习笔记(三)----工作原理、调优与Spark SQL
这三章主要讲Spark的运行过程(本地+集群),性能调优以及
SparkSQL
相关的知识,如果对Spark不熟的同学可以先看看之前总结的两篇文章:【原】LearningSpark(Python版)学习笔记
Charlotte77
·
2016-05-08 21:00
【原】Learning Spark (Python版) 学习笔记(三)----工作原理、调优与Spark SQL
这三章主要讲Spark的运行过程(本地+集群),性能调优以及
SparkSQL
相关的知识,如果对Spark不熟的同学可以先看看之前总结的两篇文章:【原】LearningSpark(Python版)学习笔记
Charlotte77
·
2016-05-08 21:00
基于案例一节课贯通Spark Streaming流计算框架的运行源码
在线动态计算分类最热门商品案例回顾与演示基于案例贯通SparkStreaming的运行源码使用SparkStreaming+
SparkSQL
来在线动态计算电商中不同类别中最热门的商品排名,例如手机这个类别下面最热门的三款手机
cary_1991
·
2016-05-08 15:00
spark
spark
大数据
Streaming
IMF
Spark版本定制
day63-Spark SQL下Parquet内幕深度解密
DT大数据梦工厂联系方式:新浪微博:www.weibo.com/ilovepains/微信公众号:DT_Spark博客:http://.blog.sina.com.cn/ilovepains 一:
sparkSQL
·
2016-05-08 13:00
day62-Spark SQL下的Parquet使用最佳实践和代码实战
大数据梦工厂:DT大数据梦工厂联系方式:新浪微博:www.weibo.com/ilovepains/微信公众号:DT_Spark博客:http://.blog.sina.com.cn/ilovepains
SparkSQL
·
2016-05-08 13:00
day61-Spark SQL数据加载和保存内幕深度解密实战
SparkSQL
加载数据
SparkSQl
数据输入输入输出主要是DataFrame,DataFrame提供了一些通用的load和save操作。
·
2016-05-08 13:00
第1课:通过案例对SparkStreaming 透彻理解三板斧之一
Spark目前有四个
SparkSQL
,SparkStreaming,MLlib(machinelearning),Grap
freshghost1
·
2016-05-08 10:00
spark
第1课:通过案例对SparkStreaming 透彻理解三板斧之一
Spark最开始没有其他子框架,只有一个原始的SparkCore.SparkStreaming本身是Core上的一个框架,透过一个框架的彻底研究肯定可以精通Spark力量的源泉和所有问题的解决之道;2)
SparkSQL
chinsun_1
·
2016-05-07 10:00
第1课:通过案例对SparkStreaming 透彻理解三板斧之一:解密SparkStreaming另类实验及SparkStreaming本质解析
SparkStreaming的流式处理非常强大的一个功能是可以在线处理,ML,
SparkSQL
等流进来的数据,这也是Spark提供的一体化,多元化的技术架构设计带来的优势。 3.Spa
snail_gesture
·
2016-05-06 11:00
java
scala
spark
数据
大数据
基于SPARK SQL 读写ORACLE 的简单案例分析常见问题
一、概述本文主要内容包含
SparkSQL
读写Oracle表数据的简单案例,并针对案例中比较常见的几个问题给出解决方法。
九指码农
·
2016-05-05 16:09
spark及问题解决
基于SPARK SQL 读写ORACLE 的简单案例分析常见问题
一、概述本文主要内容包含
SparkSQL
读写Oracle表数据的简单案例,并针对案例中比较常见的几个问题给出解决方法。
qq_14950717
·
2016-05-05 16:00
oracle
sql
spark
spark版本定制一
比如 SparkStreaming、
SparkSQL
、GraphX 、MLlib选择sparkstreaming做为源码定制的出发点的原因:从依赖的专业知识上讲,相对于其他API,无需引入过多的专业领域的依赖知识
数据china
·
2016-05-05 09:00
Spark 定制版:001~Spark Streaming(一)
a.Spark最初只有SparkCore,通过逐步的发展,扩展出了
SparkSQL
、SparkStreaming、SparkMLlib(machinelearn
zisheng_wang_DATA
·
2016-05-05 00:00
sql
源码
spark
扩展
Streaming
第97课: 使用Spark Streaming+Spark SQL实现在线动态计算出特定时间窗口下的不同种类商品中的热门商品排名
第97课:使用SparkStreaming+
SparkSQL
实现在线动态计算出特定时间窗口下的不同种类商品中的热门商品排名本节课将在之前学习的
SparkSQL
和DataFrames彻底剖析的基础上,使用
duan_zhihua
·
2016-05-04 20:00
Spark函数扩展功能介绍
问题导读1.UDF对
sparksql
的作用是什么?2.用Scala编写的UDF与普通的Scala函数唯一的区别在什么地方?3.如何在spark中使用UDF?
MaLiang
·
2016-05-04 09:25
Spark函数扩展功能介绍
问题导读1.UDF对
sparksql
的作用是什么?2.用Scala编写的UDF与普通的Scala函数唯一的区别在什么地方?3.如何在spark中使用UDF?
MaLiang
·
2016-05-04 09:25
sparksql
演示
//启动spark-shellbin/spark-shell--masterspark://hadoop1:7077--executor-memory3g//RDD演示valsqlContext= neworg.apache.spark.sql.SQLContext(sc)importsqlContext._caseclassPerson(name:String,age:Int)valpeop
泡海椒
·
2016-05-03 20:00
Spark Shuffle FetchFailedException解决方案
报错提示
SparkSQL
shuffle操作带来的报错org.apache.spark.shuffle.MetadataFetchFailedException: Missinganoutputlocationforshuffle0org.apache.spark.shuffle.FetchFailedException
lsshlsw
·
2016-05-03 18:00
spark
shuffle
spark排错
第1课:通过案例对Spark Streaming透彻理解三板斧之一Spark Streaming另类实验及本质解析
Spark一开始并没我们今天看到的
SparkSQL
,SparkStreaming,MLlib(machinelearning),GraphX(graph),SparkR等相关内容,只有原始的SparkCore
love205088
·
2016-05-02 22:17
spark
第1课:通过案例对SparkStreaming 透彻理解三板斧之一
SparkStreaming和
SparkSQL
是目前最流行的框架,从研究角度而言,
SparkSQL
有太多涉及到SQL优化的问题,不太适应用来深入研究。
葛晨鑫
·
2016-05-02 17:00
spark
SparkStreaming
spark 版本定制 20160501 通过案例对SparkStreaming透彻理解之一
比如 SparkStreaming、
SparkSQL
、GraphX 、MLlib选择sparkstreaming做为源码定制的出发点的原因:从依赖的专业知识上讲,相对于其他API,无需引入过多的专业领域的依赖知识
柯里昂
·
2016-05-02 14:00
第56课:解密Spark SQL与DataFrame的本质
本篇博文主要讲解内容如下:1.
SparkSQL
与DataFrame2.RDD与DataFrame3.
SparkSQL
企业级最佳实践一:
SparkSQL
与DataFrame1.
SparkSQL
非常强大主要体现在一下几点
snail_gesture
·
2016-05-02 11:00
sql
spark
Spark-Avro学习1之使用
SparkSQL
读取AVRO文件
更多Spark学习examples代码请见:https://github.com/xubo245/SparkLearning1.安装:https://repo.maven.apache.org/maven2/com/databricks/spark-avro_2.10/2.0.1/导入到Spark项目里文件:https://github.com/databricks/spark-avro/raw/
bob601450868
·
2016-05-02 10:00
(版本定制)第1课:Spark Streaming另类在线实验及Spark Streaming本质理解
SparkStreaming和
SparkSQL
是目前最流行的框架,从研究角度而言,
SparkSQL
有太多涉及到SQL优化的问题,不太适合用来深入研究
18610086859
·
2016-05-02 09:16
spark
Streaming
本质理解
(版本定制)第1课:Spark Streaming另类在线实验及Spark Streaming本质理解
SparkStreaming和
SparkSQL
是目前最流行的框架,从研究角度而言,
SparkSQL
有太多涉及到SQL优化的问题,不太适合用来深入研究。而SparkStrea
Spark_2016
·
2016-05-02 09:16
Spark
Streaming
本质理解
Spark版本定制
第1课:SparkStreaming 三板斧之一:解密SparkStreaming另类实验及SparkStreaming本质解析
SparkStreaming和
SparkSQL
是目前最流行的框架,从研究角度而言,
SparkSQL
有太多涉及到SQL优化的问题,不太适应用来深入研究。而SparkStreami
lqding1980
·
2016-05-01 16:30
解析
Streaming
本质
第1课:SparkStreaming 三板斧之一:解密SparkStreaming另类实验及SparkStreaming本质解析
SparkStreaming和
SparkSQL
是目前最流行的框架,从研究角度而言,
SparkSQL
有太多涉及到SQL优化的问题,不太适应用来深入研究。而SparkStreamin
lqding1980
·
2016-05-01 16:30
本质
解析
Streaming
Spark源码定制课程
day56-Spark SQL和DataFrame的本质
以下内容来源于DT大数据梦工厂:
SparkSQL
于DtaFrameDataFrame与RDD企业实践一、
SparkSql
于DataFrame
sparkSql
之所以是出了sparkcore以外最大的和最受欢迎组件原因是
·
2016-05-01 15:00
博客汇总
SparkIMF课程:第56课:
SparkSQL
和DataFrame的本质http://lqding.blog.51cto.com/9123978/1751056第57课:
SparkSQL
onHive配置及实战
lqding1980
·
2016-05-01 13:29
博客
汇总
博客汇总
SparkIMF课程:第56课:
SparkSQL
和DataFrame的本质http://lqding.blog.51cto.com/9123978/1751056第57课:
SparkSQL
onHive配置及实战
lqding1980
·
2016-05-01 13:29
博客
汇总
day55-hive实战:
1、hive是分布式数据仓库,同时又是数据查询引擎,所以
SparkSql
取代只是Hive查询引擎,实际企业生产环境下Hive+
sparksql
是最为经典的组合。
·
2016-04-30 23:00
基于Spark SQL 读写Oracle 的简单案例分析常见问题
1概述本文主要内容包含
SparkSQL
读写Oracle表数据的简单案例,并针对案例中比较常见的几个问题给出解决方法。
harli
·
2016-04-28 14:36
Spark
Spark组件之Spark Streaming学习3--结合
SparkSQL
的使用(wordCount)
更多代码请见:https://github.com/xubo245/SparkLearning1.通过建立一个对象来获取Streaming的单例对象valsqlContext=SQLContextSingleton.getInstance(rdd.sparkContext) importsqlContext.implicits._objectSQLContextSingleton{ @trans
bob601450868
·
2016-04-26 17:00
Stream
Spark组件之Spark
Kafka+Spark Streaming+Redis实时计算整合实践
基于Spark通用计算平台,可以很好地扩展各种计算类型的应用,尤其是Spark提供了内建的计算库支持,像SparkStreaming、
SparkSQL
、MLlib、GraphX,这些内建库都提供了高级抽象
·
2016-04-26 16:00
上一页
80
81
82
83
84
85
86
87
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他