E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
spark(scala)
hive sql 和
spark
sql的区别
HiveSQL和
Spark
SQL都是用于在大数据环境中处理结构化数据的工具,但它们有一些关键的区别:底层计算引擎:HiveSQL:Hive是建立在Hadoop生态系统之上的,使用MapReduce作为底层计算引擎
深度学习研究员
·
2024-01-11 07:08
hive
sql
spark
数据库
2024.1.10
Spark
SQL ,函数分类,
Spark
on HIVE,底层执行流程
目录一.开窗函数二.
Spark
SQL函数定义1.HIVE_SQL用户自定义函数2.
Spark
原生UDF3.pandasUDF4.pandasUDAF三.
Spark
onHIVE四.
Spark
SQL的执行流程一
白白的wj
·
2024-01-11 07:08
大数据
spark
sql
python
hive
hadoop
mapreduce
spark
分布式解压工具
spark
分布式解压工具文章目录
spark
分布式解压工具一、目标二、详细设计三、操作说明1.提交模式2.压缩输出路径支持2种方式3.操作命令及说明3.1操作命令3.2命令说明四、操作案例4.1案例1一、
侠客刀
·
2024-01-11 06:56
分布式
spark
eclipse
分布式全局id
分布式全局idsnowflake算法是twitter开源的分布式id生成算法,采用
Scala
语言实现,是把一个64位的long型的id,1个bit是不用的,用其中的41bits作为毫秒数,用10bits
程序员三木
·
2024-01-11 06:46
大后端
分布式
初探
Spark
SQL catalog缓存机制
先说结论:
Spark
SQLcatalog中对表结构的缓存一般不会自动更新。实验如下:在pg中新建一张表t1,其中只有一列c1int在
Spark
SQL中注册这张表,并从中查询数据.
archimekai
·
2024-01-11 06:54
spark
【Kafka-3.x-教程】-【六】Kafka 外部系统集成 【Flume、Flink、SpringBoot、
Spark
】
【Kafka-3.x-教程】专栏:【Kafka-3.x-教程】-【一】Kafka概述、Kafka快速入门【Kafka-3.x-教程】-【二】Kafka-生产者-Producer【Kafka-3.x-教程】-【三】Kafka-Broker、Kafka-Kraft【Kafka-3.x-教程】-【四】Kafka-消费者-Consumer【Kafka-3.x-教程】-【五】Kafka-监控-Eagle【K
bmyyyyyy
·
2024-01-11 06:50
Kafka
kafka
flume
flink
spark
#kafka集成外部系统
使用Springboot+websocket+kafka模拟实时数据传输
Springboot+websocket+kafka模拟实时数据传输环境准备数据源读取WebSocket服务器网页启动使用Springboot+websocket+kafka模拟实时数据传输环境准备环境:本地
Spark
叶梦璃愁
·
2024-01-11 06:36
websocket
springboot
kafka
spring
boot
websocket
Flink|《Flink 官方文档 - DataStream API - 状态与容错 - 数据类型以及序列化 - 概览》学习笔记
以下7种不同的数据类型:JavaTuplesand
Scala
CaseClasses元组(tuples)是一个包含固定数量的
长行
·
2024-01-11 05:59
Flink
flink
数据类型
序列化
泛型
Kubernets(K8S)启动和运行01 快速入门
Kubernetesisanopensourceorchestratorfordeployingcontainerizedapplications.ItwasoriginallydevelopedbyGoogle,inspiredbyadecadeofexperiencedeploying
scala
ble
Python私教
·
2024-01-11 04:32
k8s
kubernetes
容器
云原生
Hadoop与
Spark
:大数据处理框架的比较与选择
Hadoop与
Spark
:大数据处理框架的比较与选择在大数据的时代背景下,数据处理和分析的需求日益增长。
乌龙饼干
·
2024-01-11 01:14
hadoop
spark
大数据
2022-01-23 深度学习笔记
①Regression——Theoutputofthefunctionisa
scala
r.②BinaryClassification——OnlyoutputYesorNo.举例:输入句子,输出句子positive
Luo_淳
·
2024-01-11 01:14
专业学习
深度学习
人工智能
Elastic Stack学习
组件Elasticsearch — Ahighly
scala
blefreeandopenfull-textsearchandanalyticsengine.Kibana — AnanalyticsandvisualizationplatformdesignedtoworkwithElasticsearch.IntegrationsServer
平沙落雁子
·
2024-01-10 22:31
学习
jenkins
运维
Phoenix基本使用
1.2Phoenix特点容易集成:如
Spark
,Hive,Pig,Flume和MapReduce。
有语忆语
·
2024-01-10 22:30
大数据之Hive
Phoenix
YOLOv5改进之BiFPN(含代码,超详细哦)
BiFPN论文论文地址:[1911.09070]EfficientDet:
Scala
bleandEfficientObjectDetection(arxiv.org)BiFPN简介BiFPN即“双向特征金字塔网络
kay_545
·
2024-01-10 21:45
YOLO
深度学习
yolov5
81、
Spark
Streaming之DStream以及基本工作原理
Spark
Streaming简介
Spark
Streaming是
Spark
CoreAPI的一种扩展,它可以用于进行大规模、高吞吐量、容错的实时数据流的处理。
ZFH__ZJ
·
2024-01-10 20:43
讯飞版大模型来了,现场发布四大行业应用成果
文章目录人工智能福利文章前言
Spark
Desk讯飞星火认知大模型简介语言理解知识问答逻辑推理数学题解答代码理解与编写亲自体验写在最后✍创作者:全栈弄潮儿个人主页:全栈弄潮儿的个人主页️个人社区,欢迎你的加入
全栈弄潮儿²⁰²⁴
·
2024-01-10 19:10
AI大模型
人工智能
机器学习
AI大模型
chatgpt
讯飞星火认知大模型
Scala
操作HDFS
通过
Scala
对HDFS的一些操作,包括创建目录,删除目录,上传文件,文件读取,删除文件,Append文件等等;importjava.io.
SunnyMore
·
2024-01-10 18:13
Spark
- 升级版数据源JDBC2
>在
spark
的数据源中,只支持Append,Overwrite,ErrorIfExists,Ignore,这几种模式,但是我们在线上的业务几乎全是需要upsert功能的,就是已存在的数据肯定不能覆盖,
kikiki5
·
2024-01-10 17:53
基于JavaWeb+BS架构+SpringBoot+Vue+
Spark
的共享单车数据存储系统的设计和实现
基于JavaWeb+BS架构+SpringBoot+Vue+
Spark
的共享单车数据存储系统的设计和实现文末获取源码Lun文目录前言主要技术系统设计功能截图订阅经典源码专栏Java项目精品实战案例《500
FREE技术
·
2024-01-10 16:56
计算机专业毕业设计
springboot
Spark
Spark
Core阶段练习
阶段练习查看数据集格式明确需求明确步骤读取文件抽取需要的列以年月为基础,进行reduceByKey统计Dongsi地区的PM排序获取结果编码拷贝数据集data.rar(已上传资源——
Spark
Core阶段练习数据集
我像影子一样
·
2024-01-10 16:44
Spark
大数据
spark
大数据
RDD算子——概念及部分操作
RDD的算子分类特点
Spark
中所有的Transformations是Lazy(惰性)的,它们不会立即执行获得结果,相反,它们只会记录在数据集上要应用的操作.只有当需要返回结果给Driver时,才会执行这些操作
我像影子一样
·
2024-01-10 15:06
Spark
大数据
spark
大数据
《Py
Spark
大数据分析实战》-26.数据可视化图表Seaborn介绍
对大数据技术栈Hadoop、Hive、
Spark
、Kafka等有深入研究,对Data
wux_labs
·
2024-01-10 14:58
PySpark大数据分析实战
数据分析
数据挖掘
大数据
数据科学
PySpark
Spark
Core--加强
主要作用:提升
Spark
程序的计算效率注意事项:RDD的缓存可以存储在内存或者是磁盘上,甚至可以存储在Executor进程的堆外内存中。主要是放在内存中,因此缓存的数据是不太稳定可靠。
小希 fighting
·
2024-01-10 14:06
spark
大数据
分布式
Apache Doris (六十三):
Spark
Doris Connector - (3)-配置型及列映射关系
个人主页:IT贫道-CSDN博客私聊博主:私聊博主加WX好友,获取更多资料哦~博主个人B栈地址:豹哥教你学编程的个人空间-豹哥教你学编程个人主页-哔哩哔哩视频目录1.
Spark
操作Doris配置项
IT贫道
·
2024-01-10 14:35
大数据OLAP体系技术栈
Apache
Doris
apache
spark
大数据
doris
Spark
避坑系列一(基础知识)
大家想了解更多大数据相关内容请移驾我的课堂:大数据相关课程剖析及实践企业级大数据数据架构规划设计大厂架构师知识梳理:剖析及实践数据建模剖析及实践数据资产运营平台
Spark
作为大数据领域离线计算的王者,在分布式数据处理计算领域有着极高的处理效率
garagong
·
2024-01-10 14:04
大数据
spark
大数据
分布式
Flink集群安装部署(Standalone,Yarn模式)
FlinkOnYarn一.环境准备需要提前安装配置JDK,Hadoop二.Flink集群安装步骤1.下载安装包下载地址:Indexof/dist/flink(apache.org)根据自己所需选择版本,一个是
scala
MJK祺
·
2024-01-10 12:03
大数据
hadoop
flink
【
Scala
】——面向对象
1
Scala
包1.1包风格
Scala
有两种包的管理风格。
那时的样子_
·
2024-01-10 12:45
scala
bigdata
scala
开发语言
【
Scala
】——函数式编程
•对象:用户•行为:登录、连接JDBC、读取数据库•属性:用户名、密码
Scala
语言是一个完全面向对象编程语言。
那时的样子_
·
2024-01-10 12:44
scala
bigdata
scala
开发语言
后端
【
Scala
】——流程控制
执行代码块1}else{执行代码块2}1.3多分支if(条件表达式1){执行代码块1}elseif(条件表达式1){执行代码块2}......else{执行代码块n}1.4if-else表达式返回值•
Scala
那时的样子_
·
2024-01-10 12:40
scala
bigdata
scala
开发语言
后端
5.MapReduce之Combiner-预聚合
目录概述本地预计算Combiner意义实践前提代码日志观察结束概述在MR、
Spark
、Flink中,常用的减少网络传输的手段。
流月up
·
2024-01-10 12:49
大数据
mapreduce
大数据
Combiner
预聚合
4.MapReduce 序列化
序列化序列化对象-->字节序例:存储到磁盘或者网络传输MR、
Spark
、Flink:分布式的执行框架必然会涉及到网络传输ja
流月up
·
2024-01-10 12:46
大数据
mapreduce
大数据
序列化
实践
spark
sql写入mysql报错:Caused by: java.lang.IllegalArgumentException: Can‘t get JDBC type for void
一、问题描述
spark
sql写入mysql报错:Causedby:java.lang.IllegalArgumentException:Can’tgetJDBCtypeforvoidCausedby:java.lang.IllegalArgumentException
RayBreslin
·
2024-01-10 09:31
spark
sql
mysql
Failed to execute goal org.
scala
-tools:maven-
scala
-plugin:2.15.2:compile (
scala
-compile-first
一、问题描述
spark
项目编译,报错Failedtoexecutegoalorg.
scala
-tools:maven-
scala
-plugin:2.15.2:compile(
scala
-compile-first
RayBreslin
·
2024-01-10 09:00
scala
maven
开发语言
Spark
初级编程实践
什么是
Spark
?
Spark
是一个快速、通用、可扩展的大数据处理引擎,最初由加州大学伯克利分校的AMPLab开发。它提供了高级API,用于在大规模数据集上执行并行处理。
cwn_
·
2024-01-10 08:28
大数据
spark
大数据
分布式
深入理解 Flink(一)Flink 架构设计原理
大数据分布式计算引擎设计实现剖析MapReduceMapReduce执行引擎解析MapReduce的组件设计实现图
Spark
执行引擎解析
Spark
相比于RM的真正优势的地方在哪里:(Simple、Fast
我很ruo
·
2024-01-10 08:57
大数据
flink
大数据
分布式
Windows中处理Py
Spark
报错:
Spark
Exception: Python worker failed to connect back
Windows中处理Py
Spark
报错:
Spark
Exception:Pythonworkerfailedtoconnectback这个问题可能是发送在windows10以上的版本,使用datafram
就是喜欢看不惯你又干不掉你的样子
·
2024-01-10 08:55
spark
python
Apache Doris (六十二):
Spark
Doris Connector - (2)-使用
个人主页:IT贫道-CSDN博客私聊博主:私聊博主加WX好友,获取更多资料哦~博主个人B栈地址:豹哥教你学编程的个人空间-豹哥教你学编程个人主页-哔哩哔哩视频目录1.将编译jar包加入本地Maven仓库
IT贫道
·
2024-01-10 08:54
大数据OLAP体系技术栈
apache
spark
大数据
doris
2024 1.9
Spark
_SQL , 数据清洗API , 写出操作
目录一.DataFrame详解1.数据清洗API1.去重:2.去除空:3.填充替换:2.
Spark
SQL的shuffle分区设置3.
Spark
SQL数据写出操作3.1写出到文件系统3.2写出到数据库一.
白白的wj
·
2024-01-10 08:53
spark
大数据
分布式
hadoop
sql
etl工程师
2024.1.9
Spark
SQL day06 homework
目录一.
Spark
SQL中数据清洗的API有哪些,各自作用是什么?二.设置
Spark
SQL的shuffle分区数的方式有哪几种三.数据写出到数据库需要注意什么?
白白的wj
·
2024-01-10 08:53
spark
大数据
分布式
Spark
SQL基础知识
一.DataFrame详解1.清洗相关的API去重API:dropDuplicates总结:用来删除重复数据,如果没有指定参数subset,那么要比对行中的所有字段内容,如果全部相同,就认为是重复数据,会被删除;如果有指定参数subset,那么只比对subset中指定的字段范围,如果指定不存在的字段会报错.删除缺失值的API:dropna总结:1-如果不传递任何参数,只要有任意一个字段值为null
MSJ3917
·
2024-01-10 08:51
spark
大数据
分布式
记一次
spark
-sql数据倾斜解决方案
spark
-sql数据倾斜解决方案背景今天在做一张埋点事实表,需要关联几张维表,补充一些维度属性。
王糍粑的小夕
·
2024-01-10 08:20
spark
spark
sql
大数据
Spark
避坑系列二(
Spark
Core-RDD编程)
大家想了解更多大数据相关内容请移驾我的课堂:大数据相关课程剖析及实践企业级大数据数据架构规划设计大厂架构师知识梳理:剖析及实践数据建模Py
Spark
避坑系列第二篇,该篇章主要介绍
spark
的编程核心RDD
garagong
·
2024-01-10 08:19
大数据
spark
大数据
分布式
【
spark
】基于
Spark
的电影推荐系统+[详细代码及配置]
基于
Spark
的电影推荐系统项目架构组件版本及配置名称版本Hadoop2.8.5Hive2.1.0
Spark
1.6.3Kafka2.10_0.8.21MariaDB(Mysql)5.5.64
Scala
2.10.6Java1.8.0
BIG*BOSS
·
2024-01-10 06:25
Spark
spark
2024最新AI系统ChatGPT商业运营网站源码,支持Midjourney绘画AI绘画,GPT语音对话+ChatFile文档对话总结+DALL-E3文生图
一、前言
Spark
Ai创作系统是基于ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
白云如幻
·
2024-01-10 06:12
人工智能
ChatGPT
AIGC
人工智能
chatgpt
语音识别
midjourney
AI作画
最新ChatGPT源码,AI绘画Midjourney绘画系统,GPT-4V识图理解+GPT语音对话+ChatFile文档对话总结+DALL-E3文生图+自定义知识库一站式解决方案
一、前言
Spark
Ai创作系统是基于ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
白云如幻
·
2024-01-10 06:41
人工智能
AIGC
ChatGPT
人工智能
chatgpt
语音识别
midjourney
AI作画
gpt
libtorch 中
Scala
r 歧义性
是使用libtorch构建c++推理程序中,因为使用opencv的
Scala
r类型,导致和libtorch命名空间的
Scala
r冲突:image.pngimage.png相关版本:libtorch:1.5.1cuda
熙熙江湖
·
2024-01-10 06:36
安装配置Flink
/flink-1.14.0-bin-
scala
_2.12.tgz/usr/local/src/3.修改环境变量vi~/.bashrc#往最后加入exportFLINK_HOME=/usr/local/src
叶子上的考拉
·
2024-01-10 05:28
flink
linux
大数据
Java大数据学习~Hadoop初识三Yarn模式
Hbase做自己的,
Spark
也是做自己的,等等。这样的话就会造成资源的浪费,不能充分的把资源给利用
胖琪的升级之路
·
2024-01-10 05:55
Flink任务实战优化
一、Flink任务优化分析1.1参考
Spark
的优化方式对于任何的技术发展,后来的的技术架构都可以参考之前优秀竞品的设计思想或缺陷,然后
i7杨
·
2024-01-10 01:06
Flink
flink
大数据
大数据OLAP引擎发展原因及特性分析
在大数据高速发展时期,多个技术团队基于OLAP的应用需求,开发出多种OLAP技术,如Hive、
Spark
Sql、FlinkSql、Impala、Kylin、ClickHouse、Doris等,或者在实现其他应用需求的时候
i7杨
·
2024-01-10 01:31
大数据技术分析
大数据
上一页
52
53
54
55
56
57
58
59
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他