E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
java调用spark
Java辅助程序之键鼠控制(附有代码及运行结果)
首先,承认一点:C系列相对运行效率高,但本人技术有限只会
java调用
Robot、System、Runtime等对象的方法,请大佬勿喷。
GodGump
·
2023-11-19 23:34
java
大数据组件
spark
hadoop hive简单介绍
spark
单机启动
spark
-shell集群启动/usr/local/
spark
-2.4.5-bin-hadoop2.7/sbin/start-all.sh提交任务1.打包python环境:whereispython
转身之后才不会
·
2023-11-19 23:29
大数据
hadoop
大数据
spark
AIGC创作系统ChatGPT源码,AI绘画源码,支持最新GPT-4-Turbo模型,支持DALL-E3文生图
一、AI创作系统
Spark
Ai创作系统是基于OpenAI很火的ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
白云如幻
·
2023-11-19 22:09
AIGC
人工智能
软件源码
chatgpt
AIGC
AI作画
人工智能
2011-2022年高职大数据竞赛-赛题内容
-离线数据抽取第四部分赛题模拟实现-离线数据统计第五部分赛题模拟实现-数据采集与实时计算第六部分赛题模拟实现-数据可视化第一部分竞赛内容赛项以大数据技术与应用为核心内容和工作基础,重点考查参赛选手基于
Spark
xlw2003
·
2023-11-19 21:54
大数据
Spark
hadoop
flink
高职大数据竞赛
2011-2022年高职大数据竞赛-赛题任务剖析
离线数据抽取第四部分赛题模拟实现-离线数据统计第五部分赛题模拟实现-数据采集与实时计算第六部分赛题模拟实现-数据可视化(一)任务一:大数据平台环境搭建具体内容按照大数据分析平台需求,需要完成Hadoop完全分布式、
Spark
xlw2003
·
2023-11-19 21:54
Spark
Flink
hadoop
spark
flume
kafka
flink
电商大数据分析案例(Hadoop+Hive+
Spark
+Azkaban+Spring MVC+ECharts)
项目描述某著名电商平台双十一美妆销售数据分析。由于是真实的商业数据,所以做了脱敏处理,数据集中对店名的引用被处理为产品的品牌名以保护店家隐私。。通过对该平台双十一美妆销售数据的品牌、销量、热度等特征的分析(平台视角和用户视角),尝试探索以下问题:双十一期间,最受消费者青睐的产品或品牌是哪些?双十一期间,美妆行业各品类的销售情况?双十一期间,消费高峰何时出现?双十一期间,客户的评论数对销量的影响?.
xlw2003
·
2023-11-19 21:53
Spark
hive
Hadoop
hive
spark
hadoop
Spark
SQL
spring
Doris Routine Load接入Kafka0.8.0实战
DorisRoutineLoad接入Kafka0.8.0实战想要更全面了解
Spark
内核和应用实战,可以购买我的新书。
wangleigiser
·
2023-11-19 21:48
Doris
kafka
大数据
java
【
Spark
深入学习 02】- 我是一个凶残的
spark
学一门新鲜的技术,其实过程都是相似的,先学基本的原理和概念,再学怎么使用,最后深究这技术是怎么实现的,所以本章节就带你认识认识
spark
长什么样的,帅不帅,时髦不时髦(这货的基本概念和原理),接着了解
spark
weixin_34055910
·
2023-11-19 21:47
大数据
flink原理实战与性能优化 pdf_三万字长文 |
Spark
性能优化实战手册
本文分为四个部分,基本涵盖了所有
Spark
优化的点,面试和实际工作中必备。
weixin_39685697
·
2023-11-19 18:07
flink原理实战与性能优化
pdf
spark算子
spark
性能调优之合理的并行度设置
Spark
性能调优之合理设置并行度1.
Spark
的并行度指的是什么?
spark
作业中,各个stage的task的数量,也就代表了
spark
作业在各个阶段stage的并行度!
浪子城
·
2023-11-19 18:07
大数据
spark优化
大数据
Spark
性能调优之合理设置并行度
1.
Spark
的并行度指的是什么?
spark
作业中,各个stage的task的数量,也就代表了
spark
作业在各个阶段stage的并行度!
跳跃的list
·
2023-11-19 18:06
spark
spark
调优
【
Spark
】|【
Spark
性能调优】|【设置并行度】|【
Spark
多配置优先级】|【总结】
一、【关于
Spark
并行度】1.什么是
Spark
的并行度?
Haven.Liu
·
2023-11-19 18:35
Spark
Spark
性能调优
task并行度
配置读取优先级
spark
性能调优 | 默认并行度
Spark
Sql默认并行度看官网,默认并行度200https://
spark
.apache.org/docs/2.4.5/sql-performance-tuning.html#other-configuration-options
Knight_AL
·
2023-11-19 18:04
Spark优化
spark
大数据
分布式
Spark
性能调优之并行度设置
Spark
性能调优之并行度设置
Spark
作业中的并行度什么是并行度
Spark
在每一个stage中task数量,就称为这个stage上的并行度;为什么要设置并行度如果你按照集群能给的最大资源给当前
Spark
fffalconer
·
2023-11-19 18:04
Spark
spark
大数据
大数据之
Spark
:
Spark
数据倾斜
目录1.预聚合原始数据1.避免shuffle过程2.增大key粒度(减小数据倾斜可能性,增大每个task的数据量)2.预处理导致倾斜的key1.过滤2.使用随机key3.sample采样对倾斜key单独进行join3.提高reduce并行度1.reduce端并行度的设置2.reduce端并行度设置存在的缺陷4.使用mapjoin1.核心思路:2.不适用场景分析:数据倾斜:就是数据分到各个区的数量不
浊酒南街
·
2023-11-19 17:23
大数据系列三
big
data
spark
hive
Spark
数据倾斜解决
Spark
中的数据倾斜问题主要指shuffle过程中出现的数据倾斜问题,是由于不同的key对应的数据量不同导致的不同task所处理的数据量不同的问题。
浪尖聊大数据-浪尖
·
2023-11-19 17:20
spark
java
python
大数据
数据分析
spark
数据倾斜
原本能够正常执行的
Spark
作业,某天突然报出OOM(内存溢出)异常,观察异常栈,是我们写的业务代码造成的。这种情况比较少见。数据倾斜发生的原理数据倾斜的原理很简单:在进行shuffle的时候,必须
什么都要取名累不累
·
2023-11-19 17:49
hive
hadoop
hdfs
spark
数据倾斜优化
目录
spark
数据倾斜优化数据倾斜产生的原因数据倾斜七种解决方案使用HiveETL预处理数据过滤少数导致倾斜的key提高shuffle操作的并行度双重聚合将reducejoin转为mapjoin采样倾斜
赤兔胭脂小吕布
·
2023-11-19 17:15
spark
大数据
hive
hadoop
分布式
Spark
数据倾斜解决方案
倾斜场景1.2解决方案2.大表Join小表倾斜2.1倾斜场景2.2解决方案3.大表Join大表倾斜3.1倾斜场景3.2解决方案4.两表Join时空值过多倾斜4.1倾斜场景4.2解决方案今天我们来详细介绍下
Spark
伯利恒教堂
·
2023-11-19 17:14
spark
大数据
分布式
Spark
数据倾斜解决思路
1.避免数据源倾斜-HDFS
Spark
通过textFile(path,minPartitions)方法读取文件时,使用TextInputFormat。
小小大数据
·
2023-11-19 17:13
Spark
spark
大数据
kafka
Spark
数据倾斜
一、
Spark
数据倾斜介绍1.1数据倾斜介绍
Spark
中的数据倾斜问题主要指shuffle过程中出现的数据倾斜问题,是由于不同的key对应的数据量不同导致的不同task所处理的数据量不同的问题。
火成哥哥
·
2023-11-19 17:10
spark
spark
java
大数据
hive
scala
Spark
数据倾斜
Spark
数据倾斜调优数据倾斜是大数据计算中一个最棘手的问题,出现数据倾斜后,
Spark
作业的性能会比期望值差很多,两大直接后果:
Spark
任务OOM异常退出,数据倾斜拖慢整个任务的执行。
WovJf
·
2023-11-19 17:04
Spark
spark
大数据
分布式
大数据课程结构
1、第一阶段javaSE基础阶段-张一峰2、第二阶段-JavaWeb+数据库阶段-张3、第三阶段-大数据分布式架构-张一峰4、第四阶段-大数据Hadoop实战-张一峰5、第五阶段-大数据
spark
实战-
张一峰
·
2023-11-19 16:31
大数据
大数据
Android开发
java调用
C简单示例
目录下载NDK和CMake新建NDK项目写入C++代码,并运行本文使用的AndroidStudio版本是windows版AndroidStudioBumblebee|2021.1.1Patch2先看下最终效果:下载NDK和CMake检查NDK和CMake是否已经下载了,这一步不难,具体步骤就不细说了。下载好了如下图:新建NDK项目File->New->NewProject…选择NativeC++,
zhangjin1120
·
2023-11-19 15:36
android
java
开发语言
Android Studio 写一个
Java调用
c++ 的demo
前提条件:本地已经配置好了ndk环境,如果没有配置好,建议参考macos配置ndk环境-CSDN博客这篇链接。新建一个EmptyProject比如我这里的Project的名字是HelloJNI,包名是com.example.hellojni然后在src目录下,右键选择AddC++toModule然后展示的目录如下所示:在activity_main.xml里给TextView组件添加一个id,整体代
柯南二号
·
2023-11-19 15:53
android
studio
java
c++
JNI
1.javascript 自动定时刷新网页脚本
一、问题跑一些
spark
任务时要运行很久,每次想看最新进度都要手动刷新一下,手按F5按多了很累,就想为什么不搞个自动刷新脚本呢二、解决1.思路输入时间间隔如果时间间隔大于0那么每次时间超过输入的时间间隔后
终回首
·
2023-11-19 14:17
Other
Language
javascript
数仓开发面试题之Hadoop相关
提纲MapReduce原理,map数、reduce数的参数说一下mapjoin与reducejoinhivesql怎么优
spark
和hive的区别数据倾斜几种解决方式数据如何清洗说一下udf、udtf、
话数Science
·
2023-11-19 13:39
面试
大数据
hadoop
大数据
Java 与 Scala 使用Maven混合编译打包
在SpringBoot上使用
spark
的时候会遇到的混合编译问题,在java代码中打包会找不到scala定义的包,即可参考使用如下配置。
kikiki4
·
2023-11-19 12:16
Spark
自定义分区(Partitioner)
基于优化和数据的有序性等问题考虑,某个设备的日志数据分到指定的计算节点,减少数据的网络传输我们都知道
Spark
内部提供了HashPartitioner和RangePartitioner两种分区策略,这两种分区策略在很多情况下都适合我们的场景
达微
·
2023-11-19 11:36
刻意将每天的生活都和英语学习建立连接——新概念英语联想2
笔者每天下班回来总会看见这样的场景,很生气的然后我就想到了新概念28课Whenhereturnshomeatnight,healwaysfindsthatsomeoneha
spark
edacaroutsidehisgate
生财日历
·
2023-11-19 10:52
浅析图数据库 Nebula Graph 数据导入工具——
Spark
Writer
Spark
Writer从Hadoop说起近年来随着大数据的兴起,分布式计算引擎层出不穷。Hadoop是Apache开源组织的一个分布式计算开源框架,在很多大型网站上都已经得到了应用。
NebulaGraph
·
2023-11-19 09:22
最新AI创作系统ChatGPT系统运营源码+支持GPT-4多模态模型
一、AI创作系统
Spark
Ai创作系统是基于OpenAI很火的ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
只恨天高
·
2023-11-19 08:52
人工智能
系统源码
chatgpt
chatgpt
人工智能
源码软件
AI写作
2023.11.18 Hadoop之 YARN
支持多个数据处理框架(MapReduce
Spark
Storm等)。具有资源利用率高、运行成本底、数据共享等特点资源调度管理的作用MapReduce是基于yarn运行的,没有y
白白的wj
·
2023-11-19 08:41
database
hadoop
hive
sql
big
data
yarn
Spark
算子 - Python
第1关:Transformation-map#-*-coding:UTF-8-*-frompy
spark
import
Spark
Contextif__name__=="__main__":#*******
垫脚摸太阳
·
2023-11-19 07:05
python
spark
python
spark
算子简单案例 - Python
第1关:WordCount-词频统计#-*-coding:UTF-8-*-frompy
spark
import
Spark
Contextif__name__=="__main__":"""需求:对本地文件系统
垫脚摸太阳
·
2023-11-19 07:35
python
spark
python
企业
spark
案例 —— 出租车轨迹分析(Python)
第1关:
Spark
Sql数据清洗#-*-coding:UTF-8-*-frompy
spark
.sqlimport
Spark
Sessionif__name__=='__main__':
spark
=
Spark
Session.builder.appName
垫脚摸太阳
·
2023-11-19 07:35
python
spark
python
javascript
2018年的AI/ML惊喜及预测19年的走势(二)
此外,
Spark
和Kafka将继续呈现引人注目的受欢迎程度。随着云业务模式快速成熟,企业并购交易将继续加速。巨头将对人工智能领先的创业公司进行大规模收购
城市中迷途小书童
·
2023-11-19 05:08
idea Maven仓库出现xxx.lastUpdate文件,并且Failed to read artifact descriptor for xxx依赖导入失败快速解决方案。
问题:以下面为例,在项目pom.xml中引入org.apache.
spark
spark
-core_2.123.0.0依赖后发现标签内容,变红报错,Failedtoreadartifactdescriptorfor
spark
-core
斑鸠同学
·
2023-11-19 03:35
spark
maven
大数据
Spark
如何在Kubernetes运行官方权威资料
spark
on k8s
Spark
如何在Kubernetes运行官方权威资料文章目录
Spark
如何在Kubernetes运行官方权威资料安全性用户身份卷挂载先决条件工作原理
Spark
集群组件提交应用到kubernetesDocker
wang2leee
·
2023-11-19 03:15
云计算
spark
spark
kubernetes
大数据
spark
高频面试题100题源码解答【建议收藏】---持续更新中
spark
高频面试题100题源码解答【建议收藏】—持续更新中文章目录
spark
高频面试题100题源码解答【建议收藏】---持续更新中1.RDD五个主要特性五个特性代码示例**源码**2.
Spark
重分区
wang2leee
·
2023-11-19 03:44
spark
大数据
spark
大数据
分布式
spark
学习笔记(十一)——
spark
Streaming-概述/特点/构架/DStream入门程序wordcount
目录
Spark
Streaming
spark
StreamingDStream
spark
Streaming特点
spark
Streaming构架背压机制DStream入门
Spark
Streaming
spark
Streaming
Spark
Streaming
一个人的牛牛
·
2023-11-19 00:12
spark
学习
spark
scala
大数据
Spark
学习——1.代表性大数据技术
本篇博客是学习子雨大数据之
Spark
入门教程的学习笔记,仅作学习之用。
楓尘林间
·
2023-11-18 23:37
Spark
Spark
大数据学习
使用
Spark
SQL读取阿里云OSS的数据
读OSS数据创建一个table,并关联OSS目录路径CREATETABLEmy_tableUSINGparquetOPTIONS(path'oss://my_bucket/my_data_dir/dt=20230904',--关联OSS路径header'true',--如果Parquet文件包含列名的头部信息,则设置为'true',否则设置为'false'inferSchema'true'--自动
yangxudong
·
2023-11-18 23:00
sql
spark
阿里云
OSS
使用Jupyter Notebook调试Py
Spark
程序错误总结
项目场景:在Ubuntu16.04hadoop2.6.0
spark
2.3.1环境下简单调试一个Py
Spark
程序,中间遇到的错误总结(发现版对应和基础配置很重要)注意:在前提安装配置好hadoophiveanacondajupyternotebook
spark
zookeeper
Keep Doing this
·
2023-11-18 23:52
spark
jupyter
python
spark
Spark
作业串行与并行提交job
在Scala中,您可以以串行和并行的方式提交
Spark
作业。看看如何使用for和par.foreach构造对应的例子。
Mint6
·
2023-11-18 23:48
spark
spark
大数据
分布式
scala
并行
Spark
资源规划-资源上线评估
1、总体原则以单台服务器128G内存,32线程为例。先设定单个Executor核数,根据Yarn配置得出每个节点最多的Executor数量,每个节点的yarn内存/每个节点数量=单个节点的数量总的executor数=单节点数量*节点数。2、具体提交参数1)executor-cores每个executor的最大核数。根据经验实践,设定在3~6之间比较合理。2)num-executors该参数值=每个
Knight_AL
·
2023-11-18 23:16
Spark优化
spark
javascript
大数据
AI创作系统ChatGPT网站源码/支持DALL-E3文生图/支持最新GPT-4-Turbo模型+Prompt应用
一、AI创作系统
Spark
Ai创作系统是基于OpenAI很火的ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
白云如幻
·
2023-11-18 22:35
人工智能
AIGC
程序源码
chatgpt
人工智能
prompt
ai
大文件分片上传、断点续传、秒传
小文件上传后端:SpringBoot+JDK17前端:JavaScript+
spark
+md5.min.js一、依赖org.springframework.bootspring-boot-starter-parent3.1.2com.exampleuploadDemo0.0.1
A尘埃
·
2023-11-18 22:33
文件分片上传
断点续传
秒传
JDK1.8 新特性(二)【Stream 流】
今天再来学习一个新的特性,Stream流,光是看名字就觉得和大数据能扯上关系,我们的
Spark
、Flink当中不就都是这种流的概念嘛。
让线程再跑一会
·
2023-11-18 21:30
JavaSE
java
SaprkStreaming广告日志分析实时数仓
一、系统简介参考尚硅谷的
spark
教程中的需求,参考相关思路,详细化各种代码,以及中间很多逻辑的实现方案采用更加符合项目开发的方案,而不是练习,包括整体的流程也有很大的差别,主要是参考需求描述和部分代码功能实现
是阿威啊
·
2023-11-18 21:50
scala
spark
mysql
kafka
zookeeper
上一页
68
69
70
71
72
73
74
75
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他