E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
spark(scala)
【数据中台】开源项目(5)-Amoro
AmoroisaLakehousemanagementsystembuiltonopendatalakeformats.WorkingwithcomputeenginesincludingFlink,
Spark
码农丁丁
·
2023-12-03 08:05
#
大数据
#
数据中台
开源
数据中台
Amoro
domain参数错误导致讯飞星火大模型:发生错误,错误码为:10404
https://xinghuo.xfyun.cn/
spark
api解决星火1.5,2,3版本分别传general,generalv2,generalv3参考
shy_snow
·
2023-12-03 07:32
大模型
大模型
spark
写入数据报错
报错信息如下:Exceptioninthread"main"org.apache.
spark
.sql.AnalysisException:Cannotoverwritetabledwd.dim_user_infothatisalsobeingreadfromatorg.apache.
spark
.sql.DataFrameWriter.saveAsTable
南城守护
·
2023-12-03 06:47
spark
大数据
分布式
【
Spark
SQL】基础入门(重点:
Spark
SQL和Hive的异同、
Spark
SQL数据抽象)
【大家好,我是爱干饭的猿,本文重点介绍
Spark
SQL的定义、特点、发展历史、与hive的区别、数据抽象、
Spark
Session对象。
爱干饭的猿
·
2023-12-03 06:13
spark
hive
hadoop
数据仓库
spark
解码 SQL:深入探索 Antlr4 语法解析器背后的奥秘
你可能已经使用过诸如MySQL、Hive、ClickHouse、Doris、
Spark
和Flink等工具来编写SQL查询。
Light Gao
·
2023-12-03 06:21
数据仓库
sql
数据库
antlr4
AST
spark
IntelliJ IDEA安装使用教程
一、概述IntelliJIDEA是一款功能强大的集成开发环境(IDE),适用于Java、Kotlin、
Scala
等众多编程语言。
qianli654
·
2023-12-03 04:54
intellij
idea
面向超大规模数据的自适应谱聚类算法
针对超大规模数据聚类过程中人为设定邻域参数及计算量庞大等问题,提出了一种基于近似自然近邻的自适应超大规模谱聚类算法(approximatenaturalnearestneighborbasedself-adaptiveultra-
scala
blespectralclusteringalgorithm
罗伯特之技术屋
·
2023-12-03 03:28
智能科学与技术专栏
算法
聚类
机器学习
Scala
基础教程
简介
Scala
是一种结合了面向对象和函数式编程的、静态类型的高级编程语言。
Scala
代码被编译成.class文件,运行在Java虚拟机(JVM)上,可以调用Java类库。
zzy979
·
2023-12-03 03:46
Scala
scala
Scala
快速入门
Scala
简介
Scala
是一门现代的多范式编程语言,平滑地集成了面向对象和函数式语言的特性。
_小许_
·
2023-12-03 03:16
scala
java
开发语言
Scala
编程快速入门系列(一)
目录一、
Scala
概述二、
Scala
数据类型三、
Scala
函数四、
Scala
集合五、
Scala
伴生对象六、
Scala
trait七、Actor八、隐式转换与隐式参数九、
Scala
JDBC由于整理的篇幅较长
weixin_30856725
·
2023-12-03 03:16
scala
java
python
Scala
入门教程(一)
简介
Scala
(斯嘎啦),
Scala
bleLanguage(可伸缩编程语言),它是基于JVM的多范式编程语言,通俗的讲
Scala
是一种运行在JVM上的函数式面向对象的编程语言。
yida&yueda
·
2023-12-03 03:45
Scala
大数据
scala
Scala
Collection
Scala
Collection
Scala
提供了一套很好的集合实现,提供了一些集合类型的抽象。
Scala
集合分为可变的和不可变的集合。可变集合可以在适当的地方被更新或扩展。
lucasmaluping
·
2023-12-03 03:45
scala
黑猴子的家:
Spark
RDD 操作
所有这些操作主要针对两种类型的RDD:(1)数值RDD(2)键值对RDDRDD的所有转换操作都是懒执行的,只有当行动操作出现的时候
Spark
才会去真的运行,不同的RDD类型之间的转换,通过隐式转换完成,
黑猴子的家
·
2023-12-03 03:06
算法工程师面试八股(搜广推方向)
BatchNormalizationSVM数据不均衡特征选择排序模型树模型进行特征工程的原因GBDTLR和GBDTRF和GBDTXGBoost二阶泰勒展开优势为什么快防止过拟合处理缺失值树停止生长条件处理不平衡数据树剪枝选择最佳分裂点
Scala
贪钱算法还我头发
·
2023-12-03 03:29
Data
Structures
and
Algorithms
算法工程师
面经
搜索广告推荐
机器学习
深度学习
Spark
Streaming 窗口操作
热点搜索词滑动统计,每隔10秒钟,统计最近60秒钟的搜索词的搜索频次,并打印出排名最靠前的3个搜索词以及出现次数普通
Spark
Streaming处理方式,如果将时间间隔设置成60s,无法每隔10s输出一次结果
printf200
·
2023-12-03 02:27
spark
读取GBK文件的方法
spark
读取GBK文件乱码
spark
的textFile方法默认写死了读UTF-8格式的文件,读其他格式的文件则会显示乱码。
NikolasNull
·
2023-12-03 02:31
AI创作ChatGPT源码+AI绘画(Midjourney绘画)+DALL-E3文生图+思维导图生成
一、AI创作系统
Spark
Ai创作系统是基于ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
白云如幻
·
2023-12-03 00:25
chatgpt
人工智能
prompt
AIGC
midjourney
AI作画
Spark
Core源码精读计划#24:StaticMemoryManager——静态内存管理机制
目录前言MemoryManager的初始化静态内存管理器StaticMemoryManager构造方法计算堆内存储/执行内存总量内存申请方法静态内存管理布局图解总结前言在上一篇文章的最后,我们阅读了内存管理器MemoryManager抽象类的源码,并且提到它有两种实现:静态内存管理器StaticMemoryManager、统一内存管理器UnifiedMemoryManager。其中,StaticM
LittleMagic
·
2023-12-03 00:52
spark
操作 hbase 之读取 hbase
1通过scan读取hbase表应用场景:当想读取hbase表数据,做进一步数据处理或数据分析时,需要用scan读取HBASE表。读取方法:file直到读取数据的inputformat是TableInputFormat,filefilekeyin:ImmutableBytesWritablerowkeyvaluein:Result一行(rowkey)的数据file1.1scan全表packageda
海牛大数据_青牛老师
·
2023-12-02 21:13
Hadoop进阶学习---MapReduce分布式计算架构
1.单词统计流程(文字简单描述)已知文件内容:hadoophivehadoop
spark
hiveflinkhivelinuxhivemysql计算每个单词出现的次数2.MR底层计算原理[重点]MAP阶段第一阶段是把输入目录下文件按照一定的标准逐个进行逻辑切片
Yan_bigdata
·
2023-12-02 19:30
hadoop
学习
mapreduce
推荐系统lambda架构学习笔记之Hadoop、HDFS、YARN&MapReduce(三)
名字的由来作者:DougcuttingHadoop项目作者的孩子给一个棕黄色的大象样子的填充玩具的命名Hadoop的概念:Apache™Hadoop®是一个开源的,可靠的(reliable),可扩展的(
scala
ble
吃一口桃酥
·
2023-12-02 19:50
笔记
hadoop
hdfs
mapreduce
Hdoop学习笔记(HDP)-Part.17 安装
Spark
2
目录Part.01关于HDPPart.02核心组件原理Part.03资源规划Part.04基础环境配置Part.05Yum源配置Part.06安装OracleJDKPart.07安装MySQLPart.08部署Ambari集群Part.09安装OpenLDAPPart.10创建集群Part.11安装KerberosPart.12安装HDFSPart.13安装RangerPart.14安装YARN+
这啥命啊
·
2023-12-02 19:45
hadoop
学习
笔记
spark
hadoop
spark
- java 编程实现Word count
本文通过一个demon向读者展示,如何用
spark
实现wordcount功能。
良人与我
·
2023-12-02 11:37
Antlr4 - 自定义
Spark
SQL解析
Antlr4是一个强大的解析器的生成器,可以用来读取、处理、执行或翻译结构化文本,ANTLR可以从语法上来生成一个可以构建和遍历解析树的解析器,最出名的
Spark
计算引擎2.x就是用它来解析SQL的,是一个牛到没朋友的家伙
大猪大猪
·
2023-12-02 11:03
【
Spark
数仓项目】需求八:MySQL的DataX全量导入和增量导入Hive
【
Spark
数仓项目】需求八:MySQL的DataX全量导入和增量导入Hive文章目录一、mysql全量导入hive[分区表]需求介绍:二、mysql增量导入hive1.增量导入的第一种实现方法2.另一种方法是时间字段
程序终结者
·
2023-12-02 10:22
spark
mysql
hive
spark
RDD与DataFrame的相互转换
一、RDD与DataFrame的区别RDD转DataFrame原因及方式可以将RDD转成DataFrame之后,借用
spark
sql和sql以及HQL语句快速方便的使用sql语句统计和查询,比如说分组排名
火树银花之处
·
2023-12-02 10:47
Spark
spark
Spark
---DataFrame存储、
Spark
UDF函数、UDAF函数
四、DataFrame存储+
Spark
UDF函数1、储存DataFrame1)、将DataFrame存储为parquet文件2)、将DataFrame存储到JDBC数据库3)、将DataFrame存储到
30岁老阿姨
·
2023-12-02 10:46
Spark
spark
大数据
分布式
Spark
低版本适配Celeborn
Spark
-3.5版本以下使用Celeborn时,无法使用动态资源,对于低版本的
Spark
,Celeborn提供了patch。
woloqun
·
2023-12-02 10:16
celeborn
spark
patch
编译
动态资源
Spark
SQL 学习笔记----将RDD转换成DataFrame
一、RDD转换成DataFrame1、为什么要将RDD转换成DataFrame转换成DataFrame之后就可以直接针对HDFS等任何可以构建为RDD的数据,进行
Spark
SQL进行SQL查询了。
PZ~浪味仙
·
2023-12-02 10:46
Spark
SQL
2023_
Spark
_实验二十四:Kafka集群环境搭建
Kafka集群环境搭建一、环境说明二、安装步骤一、环境说明目前的Kafka版本还是需要借助zookeeper来存储cluster、brokers、consumer等相关元信息,在当前版本即在本案例中,我们采用了外部的zookeeper,即搭建了三节点的集群zookeeper环境,以其作为Kafka2_12_3.1.0版本的元数据存储库。zookeeper环境配置如下:节点安装路径dataDir路径
pblh123
·
2023-12-02 10:44
Spark实验
spark
kafka
大数据
【详解】
Spark
数据倾斜问题由基础到深入详解-完美理解-费元星
数据倾斜定义:顾名思义,就是大量相似或相同数据聚集在一个块的节点里,导致计算和资源分配不均导致的计算缓慢(长尾)问题。数据倾斜原因:count(distinctfield)groupbyNULL空值Shuffle(概率最高、发生最普遍的数据倾斜问题,本文重点讲述这个)###################################################先说解决方案:1.相同值打散各
未来星_狒狒
·
2023-12-02 10:44
一
大数据技术
spark
大数据
分布式
数据分析
使用
Spark
写入数据到数据库表
项目场景:使用
Spark
写入数据到数据库表问题描述Column"20231201"notfoundinschemaSome(StructType(StructField(sdate,IntegerType
用吉他弹奏摇滚乐
·
2023-12-02 10:14
数据库
spark
mysql
Spark
SQL-MR、RDD、DataFrame三个编程模型演进
转载自:http://hbasefly.com/2017/02/16/
spark
sql-dataframe/
Spark
SQL历史回顾对
Spark
SQL了解的童鞋或多或少听说过Shark,不错,Shark
扎克begod
·
2023-12-02 10:12
Spark
spark
SparkSQL
【
Spark
】RDD转换DataFrame(反射机制)
Spark
支持多种格式文件生成DataFrame,只需在读取文件时调用相应方法即可,本文以txt文件为例。
卜塔
·
2023-12-02 10:42
Spark
spark
大数据
分布式
Spark
---
Spark
on Hive
1、
Spark
OnHive的配置1)、在
Spark
客户端配置HiveOn
Spark
在
Spark
客户端安装包下
spark
-2.3.1/conf中创建文件hive-site.xml:配置hive的metastore
30岁老阿姨
·
2023-12-02 10:40
Spark
spark
hive
大数据
【
Spark
基础】-- RDD 转 Dataframe 的三种方式
目录一、环境说明二、RDD转Dataframe的方法1、通过StructType创建Dataframe(强烈推荐使用这种方法)
high2011
·
2023-12-02 10:39
Spark
大数据综合
spark
大数据
分布式
2023_
Spark
_实验二十四:
Spark
Streaming读取Kafka数据源:使用Direct方式
Spark
Streaming读取Kafka数据源:使用Direct方式一、前提工作安装了zookeeper安装了Kafka实验环境:kafka+zookeeper+
spark
实验流程二、实验内容实验要求
pblh123
·
2023-12-02 09:02
Spark实验
spark
kafka
大数据
spark
3.x 写入hudi报错
报错信息如下:Exceptioninthread"main"org.apache.hudi.exception.HoodieUpsertException:Failedtoupsertforcommittime20231201202516518atorg.apache.hudi.table.action.commit.BaseWriteHelper.write(BaseWriteHelper.ja
南城守护
·
2023-12-02 08:52
大数据
spark
apache
spark
3.x 读取hudi报错
报错信息如下:Exceptioninthread"main"org.apache.hudi.exception.HoodieUpsertException:Failedtoupsertforcommittime20231201203145254atorg.apache.hudi.table.action.commit.BaseWriteHelper.write(BaseWriteHelper.ja
南城守护
·
2023-12-02 08:48
大数据
hadoop
spark
apache
brpc线程模型学习
bthread是brpc使用的M:N线程库,目的是在提高程序的并发度的同时,降低编码难度,并在核数日益增多的CPU上提供更好的
scala
bility和cachelocality。”
okiwilldoit
·
2023-12-02 07:26
brpc学习
驯服大数据的超强利器——Py
Spark
数据处理引擎
现在,
Spark
数据处理引擎正在向你敞开大门。这是一个惊人的分析工厂,输入原始数据,输出洞察。
清图
·
2023-12-02 05:58
大数据
python
spark
算法
数据结构
Scala
如何写一个通用的游戏数据爬虫程序
目录一、引言二、游戏数据爬虫的原理三、
Scala
在游戏数据爬虫中的应用四、游戏数据爬虫的通用实现五、总结一、引言随着网络游戏的发展,游戏数据的获取和分析变得越来越重要。
小小卡拉眯
·
2023-12-02 03:22
爬虫小知识
scala
游戏
爬虫
【已解决】Cannot find project
Scala
library 2.11.8 for module XXX
问题描述在flink示例程序调试过程中,reloadproject报错Cannotfindproject
Scala
library2.11.8formoduleHbasePrint报错如下图所示:问题解决经过搜索
mba1398
·
2023-12-02 02:41
scala
intellij
idea
1.
Spark
介绍
1.什么是
Spark
网址:https://
spark
.apache.org/Unifiedengineforlarge-scaledataanalytics用于大规模数据分析的统一引擎Apache
Spark
想成为数据分析师的开发工程师
·
2023-12-02 00:40
Spark框架
spark
大数据
hadoop
2.
Spark
运行模式
1.
Spark
运行模式概述Local多用于本地测试,如在IDEA、PyCharm、VisualStudioCode中写程序测试等。
想成为数据分析师的开发工程师
·
2023-12-02 00:10
Spark框架
spark
大数据
分布式
程序员零基础,
Scala
系统进行入门和实战的最佳打法
Scala
是一种强大的编程语言,它结合了面向对象和函数式编程的特性。对于零基础的程序员来说,学习
Scala
可能会有些挑战,但只要掌握正确的入门和实战打法,就能够快速上手。
沃威2268731
·
2023-12-02 00:24
实战技术
scala
大数据
开发语言
AIGC创作ChatGPT源码+AI绘画(Midjourney绘画)+支持GPT-4-Turbo模型+DALL-E3文生图
一、AI创作系统
Spark
Ai创作系统是基于ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
白云如幻
·
2023-12-01 23:55
人工智能
ChatGPT
教程
chatgpt
人工智能
midjourney
spark
udf 提示not serializable
20/06/0816:41:06INFOmemory.MemoryStore:Blockbroadcast_0storedasvaluesinmemory(estimatedsize327.2KB,free912.0MB)20/06/0816:41:06INFOmemory.MemoryStore:Blockbroadcast_0_piece0storedasbytesinmemory(estim
南修子
·
2023-12-01 22:06
Exception: Java gateway process exited before sending its port number 解决方案
在阿里云轻量应用服务器上安装
Spark
时遇到了一个异常:Exception:Javagatewayprocessexitedbeforesendingitsportnumber,搜遍谷歌百度无法解决,花费数小时终于解决
谖瓞
·
2023-12-01 19:57
使用编程将图像与标量相乘
使用编程将图像与标量相乘在图像处理中,经常需要对图像进行各种数学操作,例如将图像与标量(
scala
r)相乘。这个操作可以用于调整图像的亮度、对比度或者进行其他的图像增强处理。
后端工程实践
·
2023-12-01 17:27
opencv
计算机视觉
人工智能
编程
上一页
74
75
76
77
78
79
80
81
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他