E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
java调用spark
【
Spark
】基础知识点
大数据开发复习课程-
Spark
11、
spark
11.1、
spark
介绍11.2、
spark
与Hadoop的区别11.3、
spark
的特点11.4、
spark
的运行模式1.local本地模式(单机)--开发测试使用
浪里小飞侠
·
2023-11-07 05:03
知识点
数据科学
spark
spark
基础知识点
1.
Spark
是一个基于内存的用于处理、分析大数据的集群计算框架。他提供了一套简单的编程接口,从而使得应用程序开发者方便使用集群节点的CPU、内存、存储资源来处理大数据。
叫我三少爷
·
2023-11-07 05:01
spark
shuffle
spark
rdd
Spark
基础知识点、三种模式安装
环境说明centos7.5
spark
-2.1.1
Spark
内置模块
Spark
local模式安装直接解压即可,无需配置(
spark
-2.1.1-bin-hadoop2.7.tgz集成hadoop环境包)local
得过且过1223
·
2023-11-07 05:01
大数据
#
Spark
Spark
知识点概要
Spark
知识点一、基本特性1、
spark
与MapReduce的不同①计算中间结果:mapreduce是基于磁盘维护,磁盘IO及序列化代价大;而
spark
是基于内存的维护,基于DAG计算模型,会减少Shaffer
TUJC
·
2023-11-07 05:31
大数据知识总结
spark
大数据
java
Spark
知识点全总结
1.
spark
生态:
Spark
Core
spark
的核心计算,用于通用分布式数据处理的引擎。不依赖于任何其他组件,可以运行在任何商用服务器集群上。
Poolweet_
·
2023-11-07 05:30
spark
大数据
知识点
spark
大数据
Spark
核心知识点
1,RDD的原理:1,RDD是
Spark
中最基本的运算模式,它只负责处理运算逻辑,不存储数据本身,通过转化换算子链式的去处理数据,转换算子在执行程序过程中是不加载数据的(算子:scala中的map,flatmap
飞翔的梦~~~
·
2023-11-07 05:29
spark
Spark
基础知识点
Spark
基础本文来自B站黑马程序员-
Spark
教程:原地址什么是
Spark
什么是
Spark
1.1定义:Apache
Spark
是用于大规模数据(large-scaladata)处理的统一(unified
Am98
·
2023-11-07 05:28
spark
大数据
分布式
AI系统ChatGPT程序源码+AI绘画系统源码+支持GPT4.0+Midjourney绘画
一、AI创作系统
Spark
Ai创作系统是基于OpenAI很火的ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
只恨天高
·
2023-11-07 05:26
人工智能
chatgpt
程序源码
人工智能
chatgpt
AI作画
源码软件
midjourney
Java调用
Lua,Lua调用Java
目录1.背景2.实现原理3.案例3.1.引入luaj.jar包3.2.案例java代码3.3.案例lua代码3.4.测试3.完美!1.背景在实际开发中,有时候我们需要修改了的代码可以马上生效,不需要打包、发布、启动等使用Lua这种嵌入式语言作为策略实现,Java则是宿主语言,Lua提供模板方法,其中需要的一些具体实现则有宿主语言Java提供。可以完美的实现动态修改代码,动态生效!2.实现原理Lua
zhishidi
·
2023-11-07 04:23
问题解决
lua
java
用
Spark
+ TensorFlow训练和应用深度学习模型
TimHunter在databricks博客发布博文,演示如何使用TensorFlow和
Spark
一起训练和应用深度学习模型。
周建丁
·
2023-11-07 03:36
TensorFlow
Spark
深度学习
k8s提交
spark
应用消费kafka数据写入elasticsearch7
spark
版本时3.3.3k8s部署单节点的zookeeper、kafka、elasticsearch7二、
spark
源码https://download.csdn.net/download/TT1024167802
青春不流名
·
2023-11-06 23:50
kubernetes
spark
kafka
【数据开发】大数据平台架构,Hive / THive介绍
1、大数据引擎大数据引擎是用于处理大规模数据的软件系统,常用的大数据引擎包括Hadoop、
Spark
、Hive、Pig、Flink、Storm等。
小哈里
·
2023-11-06 23:12
#
后端开发
大数据
架构
hive
Azure 机器学习 - 使用Python SDK训练模型
四、本地计算机五、远程虚拟机六、Apache
Spark
池七、AzureHDInsight八、AzureBatch九、AzureDatabricks十、AzureDataLakeAnalytics十一、Azure
TechLead KrisChang
·
2023-11-06 21:43
azure
机器学习
人工智能
microsoft
Flink(一)【WordCount 快速入门】
前言学完了Hadoop、
Spark
,本想着先把Kafka、Flume这些工具先学完的,但想了想还是把核心的技术先学完最后再去把那些工具学学。
让线程再跑一会
·
2023-11-06 20:51
Flink
flink
大数据
大数据毕业设计选题推荐-设备环境监测平台-Hadoop-
Spark
-Hive
✨作者主页:IT毕设梦工厂✨个人简介:曾从事计算机专业培训教学,擅长Java、Python、微信小程序、Golang、安卓Android等项目实战。接项目定制开发、代码讲解、答辩教学、文档编写、降重等。☑文末获取源码☑精彩专栏推荐⬇⬇⬇Java项目Python项目安卓项目微信小程序项目文章目录一、前言二、开发环境三、系统界面展示四、部分代码设计五、论文参考六、系统视频结语一、前言随着工业4.0和物
IT毕设梦工厂
·
2023-11-06 18:03
大数据项目
大数据
hadoop
spark
hive
毕业设计
YARN实战学习笔记
所以YARN可以实现HADOOP集群的资源共享,不仅仅可以跑MapRedcue,还可以跑
Spark
、Flink。YARN架构分析YARN主
小崔的技术博客
·
2023-11-06 18:16
学习
笔记
java
(2)
spark
streaming滚动窗口和滑动窗口演示
1.png在
spark
streaming中,滚动窗口需要设置窗口大小和滑动间隔,窗口大小和滑动间隔都是StreamingContex
NBI大数据可视化分析
·
2023-11-06 17:13
Spark
(Scala)-示例程序
1.版本system:windows10jdk:1.8.0_141scala:2.10.5
spark
:
spark
-2.0.2-bin-hadoop2.6IntelliJ:15.0.62.基本环境安装下载安装
陪你一起debug
·
2023-11-06 17:47
spark
课程大纲
Spark
环境搭建Centos
Spark
单机版伪分布式模式
Spark
单机版intelij开发(maven)
Spark
完全分布式集群搭建
Spark
historyserver配置使用二种方法实现
Spark
计算
张明洋_4b13
·
2023-11-06 15:41
7.
spark
sql编程
概述
spark
版本为3.2.4,注意RDD转DataFrame的代码出现的问题及解决方案本文目标如下:RDD,Datasets,DataFrames之间的区别入门
Spark
Session创建DataFramesDataFrame
流月up
·
2023-11-06 10:10
spark
spark
sql
大数据
spark
sql
RDD转DataFrame
数据倾斜解决实例【适用于reduceByKey】
packagecom.imooc;importorg.apache.
spark
.
Spark
Conf;importorg.apache.
spark
.api.java.JavaPairRDD;importorg.apache.
spark
.api.java.JavaRDD
Aluha_f289
·
2023-11-06 09:34
【py
spark
】expected zero arguments for construction of ClassDict
记录一次py
spark
数据插入到hive表里net.razorvine.pickle.PickleException:expectedzeroargumentsforconstructionofClassDict
sdbhewfoqi
·
2023-11-06 09:01
Hive
&
Sql
&
Spark
spark
spark
sql根据某个数字字段进行排序失效问题
举个例子,我的一个dataframe表里有uid,day,cnt三个字段,如果我要根据cnt进行倒序排列,首先要确保cnt的类型是integer,否则
spark
sql的orderbycnt是不会生效的。
机灵鬼鬼
·
2023-11-06 07:51
Android
Spark
lingWater 水气泡、水波纹、水浪冒泡特效。Bessel曲线实现锅炉、水箱、热水沸腾、水下气泡上升。仿360、迅雷进度条
Spark
lingWater气泡水1、效果展示锅炉特效file_boiler.gif水浪特效file_bubble.gif附上Github地址:https://github.com/Victory-Over
VictoryOver
·
2023-11-06 06:40
计算机大数据毕设选题推荐Hadoop项目,
Spark
,Hive,Flink
3、基于
Spark
的医疗保险欺诈检测:使用
Spark
进行医疗保险数据分析,以检测欺诈索赔、虚假医疗账单和保险欺诈行为。4、基于Hadoop和Hive的政府数据透明
大数据毕设辅导员
·
2023-11-06 05:52
hadoop
大数据
spark
hive
flink
大数据毕业设计选题推荐-无线网络大数据平台-Hadoop-
Spark
-Hive
✨作者主页:IT毕设梦工厂✨个人简介:曾从事计算机专业培训教学,擅长Java、Python、微信小程序、Golang、安卓Android等项目实战。接项目定制开发、代码讲解、答辩教学、文档编写、降重等。☑文末获取源码☑精彩专栏推荐⬇⬇⬇Java项目Python项目安卓项目微信小程序项目文章目录一、前言二、开发环境三、系统界面展示四、部分代码设计五、论文参考六、系统视频结语一、前言随着无线通信技术的
IT毕设梦工厂
·
2023-11-06 05:51
大数据项目
大数据
hadoop
spark
hive
毕业设计
VM虚拟机
大数据毕业设计选题推荐-智慧小区大数据平台-Hadoop-
Spark
-Hive
✨作者主页:IT研究室✨个人简介:曾从事计算机专业培训教学,擅长Java、Python、微信小程序、Golang、安卓Android等项目实战。接项目定制开发、代码讲解、答辩教学、文档编写、降重等。☑文末获取源码☑精彩专栏推荐⬇⬇⬇Java项目Python项目安卓项目微信小程序项目文章目录一、前言二、开发环境三、系统界面展示四、代码参考五、论文参考六、系统视频结语一、前言随着信息技术的快速发展,智
IT研究室
·
2023-11-06 04:50
大数据项目
大数据
hadoop
spark
hive
毕业设计
VM虚拟机
kylin版本_如何在 Kylin 中优雅地使用
Spark
前言Kylin用户在使用
Spark
的过程中,经常会遇到任务提交缓慢、构建节点不稳定的问题。为了更方便地向
Spark
提交、管理和监控任务,有些用户会使用Livy作为
Spark
的交互接口。
weixin_39995943
·
2023-11-06 04:45
kylin版本
spark
to()
spark
while
使用pb90引入已有应用
Spark
任务常见错误以及解决方案
目前一直在做大数据平台的开发,所以有机会看到全公司的小伙伴们提交
spark
任务的时候,常见的错误。
小小小黄鸡
·
2023-11-06 04:43
spark
开发
调试
spark
大数据
一、
Spark
2.4.0 源码编译
1.环境准备JAVAjava的话,直接安装个1.8就行了,配置好环境变量和JAVA_HOME,在cmd当中java一下,确认java安装好即可。scalascala安装和java类似,把Scala安装包解压,然后配置好Windows环境变量中的path当中还有SCALA_HOME,这里根据你想要阅读的源码,选择合适的scala版本,我用的是scala2.11版本,然后scala-version一下
小小小黄鸡
·
2023-11-06 04:12
spark
spark
二、用IDEA导入
spark
源码,并在本地运行standlone
2遇到的问题1.导入到idea当中,
spark
-p
小小小黄鸡
·
2023-11-06 04:12
spark
spark
Python大数据处理库 Py
Spark
实战 总结一
Python大数据处理库Py
Spark
实战大数据时代分析工具
Spark
核心组件重要概念部署模式基本操作这是《Python大数据处理库Py
Spark
实战》一书的总结归纳大数据时代大数据的特点:大量、高速、
jialun0116
·
2023-11-06 04:42
大数据
Python大数据处理库
PySpark实战
分布式
大数据
hadoop
Py
Spark
优雅的解决依赖包管理
背景平台所有的
Spark
任务都是采用
Spark
onyarncluster的模式进行任务提交的,driver和executor随机分配在集群的各个节点,py
Spark
由于python语言的性质,所以py
Spark
小小小黄鸡
·
2023-11-06 04:09
spark
on
yarn
spark
spark
pySpark
Spark
的作业调度机制
简介
Spark
调度机制可以理解为两个层面的调度。
lei_charles
·
2023-11-06 02:47
Pandas 2.0来了~
随着现在数据量越来越多,pandas的局限性也日渐凸显,在处理大数据时非常恼火,从而选择更加合适的工具,如py
spark
等大数据处理框架。
菜鸟学Python
·
2023-11-06 00:17
pandas
python
数据分析
numpy
开发语言
Spark
系列—
spark
简介
最近比较空,总结一下
spark
相关的知识。一、
Spark
简介
spark
是一种大规模数据处理的统一分析引擎,且基于内存计算的大数据并行计算框架。
数据小白的进阶之路
·
2023-11-05 23:19
Spark
spark
大数据
大数据之
spark
_
spark
简介
什么是
Spark
Spark
是一种快速、通用、可扩展的大数据分析引擎,2009年诞生于加州大学伯克利分校AMPLab,2010年开源,2013年6月成为Apache孵化项目,2014年2月成为Apache
普罗米修斯之火
·
2023-11-05 23:42
spark
spark
第一章 Iceberg入门介绍
应用场景①面向大表:单表包含数十个PB的数据②分布式引擎非必要:不需要分布式SQL引擎来读取或查找文件③高级过滤:使用表元数据,使用分区和列级统计信息修建数据文件1.2、集成方式:通过Lib与Flink、
Spark
随缘清风殇
·
2023-11-05 23:41
#
Iceberg专题
java
大数据
开发语言
数据湖Iceberg介绍和使用(集成Hive、
Spark
SQL、FlinkSQL)
文章目录简介概述作用特性数据存储、计算引擎插件化实时流批一体数据表演化(TableEvolution)模式演化(SchemaEvolution)分区演化(PartitionEvolution)列顺序演化(SortOrderEvolution)隐藏分区(HiddenPartition)镜像数据查询(TimeTravel)支持事务(ACID)基于乐观锁的并发支持文件级数据剪裁其他数据湖框架的对比存储结
迷雾总会解
·
2023-11-05 22:25
大数据
数据库
hive
数据仓库
数据湖
lceberg
Spark
学习之路——9.
Spark
ML
一、简介基于RDD的API
spark
.mllib已进入维护模式。
Nelson_hehe
·
2023-11-05 22:40
Spark
Spark
ML
Java调用
打印机打印pdf
要在Java中调用打印机打印PDF,可以使用Java打印API和第三方库,如ApachePDFBox或iTextPDF。以下是使用Java打印API打印PDF的基本步骤:安装打印机:确保您已经安装了可以打印PDF文件的打印机,并已将其连接到计算机。导入库文件:导入Java打印API库文件。创建打印任务:使用PrinterJob类创建一个打印任务。PrinterJobprinterJob=Print
基鑫阁
·
2023-11-05 22:36
java
pdf
开发语言
spring
mybatis
Java:使用
Java调用
打印机进行打印(JPG、PDF和Word三种文件格式)
目录一、Java的打印简介二、Java打印实现2.1JPG图片文件格式打印实现2.2PDF文件格式打印实现2.3Word文件格式打印实现2.3.1Word文件采用jacob插件进行打印实现。2.3.2先将word转化为pdf文件,然后打印pdf(lz使用)三、总结一、Java的打印简介在我们的实际工作中,经常需要实现打印功能。但由于历史原因,Java提供的打印功能一直都比较弱。实际上最初的jdk根
鉴泉~Richarlie
·
2023-11-05 22:36
利器
打印
word
pde
jpg
Java调用
打印机两种方式(无驱/有驱)
一:无驱(通过ip连接打印机)StringfilePath="D:\\file.pdf";//需要打印的文件Stringip="192.168.2.240";//打印机ipIntegerport=9100;//打印机端口Integertimeout=3000;//连接超时时间Filefile=newFile(filePath);Socketsocket=newSocket();try{socket
随风不说话
·
2023-11-05 21:32
java
开发语言
spring
boot
分布式快照算法: Chandy-Lamport
0.引言上一篇文章最后说到
Spark
的StructuredStreaming的ContinuousProcessingMode的容错处理使用了分布式快照(DistributedSnapshot)算法Chandy-Lamport
weixin_33924220
·
2023-11-05 21:12
大数据
系统架构
分布式快照算法: Chandy-Lamport 算法
0.引言
Spark
的StructuredStreaming的ContinuousProcessingMode的容错处理使用了分布式快照(DistributedSnapshot)算法Chandy-Lamport
王知无(import_bigdata)
·
2023-11-05 21:11
Flink 的checkpoint 基于Chandy-lamport算法
Spark
的StructuredStreaming的ContinuousProcessingMode的容错处理使用了分布式快照(DistributedSnapshot)算法Chandy-Lamport算法
黑头人
·
2023-11-05 21:06
Flink
Flink
checkpoint
Spark
SQL
1、
Spark
简介2、
Spark
-Core核心算子3、
Spark
-Core4、
Spark
SQL文章目录一、概述1、简介2、DataFrame、DataSet3、
Spark
SQL特点二、
Spark
SQL编程
ha_lydms
·
2023-11-05 21:11
大数据
scala
spark
sparksql
大数据
spark
中monotonically_increasing_id的坑
本来以为发现了一个非常好用的函数monotonically_increasing_id,再join回来就行了,直接可以实现为:importorg.apache.
spark
.sql.functions.monotonically_increasing_iduserdf
like_red
·
2023-11-05 19:58
日常记录
Geo
Spark
-[阶段性总结]
一、Geo
spark
安装:我采用的是gradle安装,安装环境是
Spark
3.0.3+Scala.2.12.3plugins{id'java'id'scala'}group'org.example'version
一个懒散的人
·
2023-11-05 19:37
记一次
java调用
kotlin代码编译报错“找不到符号”的问题
项目拉下来编译提示找不到符号,截图如下:错误提示其中LogRecordUtils这个类是用kotlin写的,在java中调用,尝试了各种方法,像CleanProject、RebuildProject、InvalidateCaches这些都试过了,问题依然没解决,包括gradle版本也更换到高版本,问题依旧。最后在检查kotlin配置的时候,发现module下的build.gradle中没有使用ko
笑对浮华
·
2023-11-05 16:40
上一页
75
76
77
78
79
80
81
82
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他