E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
流式计算
Learning Spark(Ⅰ)
可支持多种开发语言,Java,python,scala,R3.通用性SQL查询:SparkSQL
流式计算
:SparkStreaming机器学习:SparkMLib图算法组件:S
松阁~
·
2023-01-05 02:05
大数据
百度爱番番基于图技术、
流式计算
的实时CDP建设实践
导读:随着营销3.0时代的到来,企业愈发需要依托强大CDP能力解决其严重的数据孤岛问题,帮助企业加温线索、促活客户。但什么是CDP、好的CDP应该具备哪些关键特征?本文在回答此问题的同时,详细讲述了爱番番租户级实时CDP建设实践,既有先进架构目标下的组件选择,也有平台架构、核心模块关键实现的介绍。本文系百度爱番番技术团队撰写,首发于#百度Geek说#公众号一、CDP是什么1.1CDP由来CDP(C
图数据库NebulaGraph
·
2022-12-23 04:39
Nebula
Graph
数据库
重磅!TDengine 3.2.0 正式发布
TDengine3.0带来了几大核心特性,包括云原生架构、
流式计算
,还增强了数据订阅功能;更重要的是,3.0系列版本开始提供了全平台支持,服务器/客户端均已支持Linux、Windows和MacOS。
涛思数据(TDengine)
·
2022-12-21 10:43
TDengine技术解密
tdengine
大数据
时序数据库
时序数据库 TDengine 3.0.2.0 版本正式发布
TDengine3.0带来了几大核心特性,包括云原生架构、
流式计算
,还增强了数据订阅功能;更重要的是,3.0系列版本开始提供了全平台支持,服务器/客户端均已支持Linux、Windows和MacOS。
·
2022-12-20 18:50
Flink窗口及其分类-详细说明
,欢迎访问作者gitee仓库:https://gitee.com/fanggaolei/learning-notes-warehouse/tree/masterFlink窗口的概念 Flink是一种
流式计算
引擎
Fang GL
·
2022-12-19 18:31
#
大数据框架
flink
大数据
Apache Flink 1.14.0
在Flink的世界里一切都是流,纯
流式计算
引擎flink是一个类似spark的“开源技术栈”,因为它也提供了批处理,
流式计算
,图计算,交互式查询,机器学习等。
dzzxjl
·
2022-12-18 16:30
#
Flink
1.13.2
apache
flink
当打造一款极速湖分析产品时,我们在想些什么
作者:王有卓,StarRocksContributor随着开源数据湖技术的快速发展以及湖仓一体全新架构的提出,传统数据湖在事务处理、
流式计算
以及数据科学场景的限制逐渐得以优化解决。
StarRocks_labs
·
2022-12-17 05:49
数据库
数据分析
湖仓融合
当打造一款极速湖分析产品时,我们在想些什么
作者:王有卓,StarRocksContributor随着开源数据湖技术的快速发展以及湖仓一体全新架构的提出,传统数据湖在事务处理、
流式计算
以及数据科学场景的限制逐渐得以优化解决。
·
2022-12-15 18:05
数据库
百度爱番番基于图技术、
流式计算
的实时CDP建设实践
导读:随着营销3.0时代的到来,企业愈发需要依托强大CDP能力解决其严重的数据孤岛问题,帮助企业加温线索、促活客户。但什么是CDP、好的CDP应该具备哪些关键特征?本文在回答此问题的同时,详细讲述了爱番番租户级实时CDP建设实践,既有先进架构目标下的组件选择,也有平台架构、核心模块关键实现的介绍。本文系百度爱番番技术团队撰写,首发于#百度Geek说#公众号一、CDP是什么1.1CDP由来CDP(C
·
2022-12-15 17:01
nebula流计算
百度爱番番基于图技术、
流式计算
的实时CDP建设实践
导读:随着营销3.0时代的到来,企业愈发需要依托强大CDP能力解决其严重的数据孤岛问题,帮助企业加温线索、促活客户。但什么是CDP、好的CDP应该具备哪些关键特征?本文在回答此问题的同时,详细讲述了爱番番租户级实时CDP建设实践,既有先进架构目标下的组件选择,也有平台架构、核心模块关键实现的介绍。本文系百度爱番番技术团队撰写,首发于#百度Geek说#公众号一、CDP是什么1.1CDP由来CDP(C
·
2022-12-14 20:10
nebula流计算
大数据入门:Flink和Spark简单对比
Spark和Flink在处理数据上都能实现
流式计算
、实时分析,那么两者之间有何异同呢?下面我们来做一个简单的Flink和Spark对比。
加米谷大数据张老师
·
2022-12-12 15:32
大数据
大数据
flink
spark
Flink VS Spark:大数据
流式计算
的巅峰对决
在
流式计算
领域,同一套系统需要同时兼具容错和高性能其实非常难,同时它也是衡量和选择一个系统的标准。在这个领域,Flink和Spark无疑是彼此非常强劲的对手。
不稳定记忆
·
2022-12-12 15:28
Flink
Flink
VS
SparkStreaming基础理论
Hadoop的MapReduce及SparkSQL等只能进行离线计算,无法满足实时性要求较高的业务需求,例如实时推荐、实时网站性能分析等,
流式计算
可以解决这些问题。
weixin_33815613
·
2022-12-07 11:41
大数据
数据库
网络
大数据分析技术与实战之Spark Streaming
为此,涌现出了一批如S4、Storm的
流式计算
框架。
chisuijie5678
·
2022-12-07 11:38
开发工具
scala
java
Spark Streaming 学习笔记
它允许用户使用一套和批处理非常接近的API来编写
流式计算
应用,这样就可以大量重用批处理应用的技术甚至代码。SparkStreaming是Spark核心API的一个扩展,可以实现高吞
惹不起的程咬金
·
2022-12-07 11:37
云计算/大数据/并行计算
Spark框架 及 pyspark库
transformationkey-value型transformationactionpersist关闭spark案例SparkSQL(DataFrame)DataFrame简介DataFrame常用算子
流式计算
劫径
·
2022-12-05 11:49
大数据框架
spark
大数据
如何分析及处理 Flink 反压
反压(backpressure)是实时计算应用开发中,特别是
流式计算
中,十分常见的问题。反压意味着数据管道中某个节点成为瓶颈,处理速率跟不上上游发送数据的速率,而需要对上游进行限速。
夜无边CN
·
2022-12-04 19:09
flink
大数据
flink面试相关手册
Flink因为其天然的
流式计算
特性以及强大的处理性能成为炙手可热的大数据处理框架。
暗东方
·
2022-11-29 15:33
大数据
flink
大数据
实时计算
Flink面试大全总结(全文6万字、110个知识点、160张图)
threeknowbigdata,备注Flink,获取文章PDF版本Hello,各位大数据学习爱好者,我是3分钟秒懂大数据公众号的作者土哥,目前在杭州某互联网大厂担任大数据算法工程师,组内专注于Flink
流式计算
组件以及
3分钟秒懂大数据
·
2022-11-29 15:02
Flink
80+互联网大厂大数据开发面经
flink
面试
Flink面试题大全,它是否能登上你的客船?
Flink因为其天然的
流式计算
特性以及强大的处理性能成为炙手可热的大数据处理框架。
90后小伙追梦之路
·
2022-11-29 15:18
架构
java
面试
flink
big
data
scala
网络
linux
大数据分析和大数据开发哪个好就业啊?
大数据开发工程师主要负责公司大数据平台的开发和维护、相关工具平台的架构设计与产品开发、网络日志大数据分析、实时计算和
流式计算
以及数据可视化等技术的研发和网络安全业务主题建模等工作。
我想去吃ya
·
2022-11-23 21:22
大数据
数据分析
数据挖掘
开发语言
hadoop
如何排查Flink生成环境中的反压问题
《2021年最新版大数据面试题全面开启更新》反压问题是
流式计算
系统中经常碰到的一个问题,如果你的任务出现反压节点,那么就意味着任务数据的消费速度小于数据的生成速度,需要对生成速度进行控制。
王知无(import_bigdata)
·
2022-11-12 05:27
大数据成神之路
Flink系统性学习专栏
Apache Flink 1.15 Checkpoint最新架构设计(官网转载)
Flink,作为
流式计算
的标杆,其端到端延迟包括容错的快慢主要取决于检查点机制(Che
Direction_Wind
·
2022-11-03 10:41
flink
大数据
big
data
TDengine3.0
流式计算
引擎语法规则介绍
小T导读:TDengine3.0引入了全新的
流式计算
引擎,既支持时间驱动的
流式计算
,也支持事件驱动的
流式计算
。本文将对新的
流式计算
引擎的语法规则进行详细介绍,方便开发者及企业使用。
涛思数据(TDengine)
·
2022-11-02 18:01
TDengine技术解密
大数据
Apache Hudi技术与架构-1
1前言ApacheHudi是大数据领域中新一代的基于
流式计算
的数据存储平台,又称之为数据湖平台(DataLakePlatform),其综合传统的数据库与数据仓库的核心功能,提供多样化的数据集成、数据处理以及数据存储的平台能力
uesowys
·
2022-10-08 08:27
大数据技术与架构
apache
架构
大数据
数据湖
你的系统有热点缓存问题吗?如何为系统设计缓存架构?
目录(1)为什么要用缓存集群(2)20万用户同时访问一个热点缓存(3)基于
流式计算
的缓存热点自动发现(4)热点缓存自动加载为JVM本地缓存(5)限流熔断保护(6)总结这篇文章,跟大家讲讲站在一个程序员的角度
石杉的架构笔记
·
2022-10-08 07:15
缓存
架构
Java
缓存
架构
java
大数据入门:Flink核心概念详解
在
流式计算
越来越受到主流青睐的市场状况下,
流式计算
框架技术的掌握,正在成为大数据学习当中的重要部分。以Flink框架来说,作为新一代的流计算框架,越来越多地出现在大数据开发者们的技能树当中。
加米谷大数据张老师
·
2022-10-04 14:03
大数据
大数据
java
flink
实时大数据
数据库
大数据学习之Flink——13Window详解
Windows计算是
流式计算
中非常常用的数据计算方式之一,通过按照固定时间或长度将数据流切分成不同的窗口,然后对数据进行相应的聚合运算,从而得到一定时间范围内的统计结果。
Jiang锋时刻
·
2022-10-04 14:00
Flink
大数据
Flink
TDengine 3.0
流式计算
引擎语法规则介绍
小T导读:TDengine3.0引入了全新的
流式计算
引擎,既支持时间驱动的
流式计算
,也支持事件驱动的
流式计算
。本文将对新的
流式计算
引擎的语法规则进行详细介绍,方便开发者及企业使用。
·
2022-09-30 15:16
tdengine数据库
大数据——粗谈Apache Spark(计算引擎)
Spark就是在一个统一的框架下能够进行批处理,
流式计算
和交互式计算。Spark的核心概念就是RDD(弹性分布式数据集)分布在集群中的对象集合,存储在磁盘或内存中。
Xa_L
·
2022-09-28 06:19
大数据
apache
spark
计算引擎
分布式系统面试连环炮
,就是都没怎么搞过分布式系统,现在互联网公司,一般都是做分布式的系统,大家都不是做底层的分布式系统、分布式存储系统HadoopHDFS、分布式计算系统HadoopMapReduce/Spark、分布式
流式计算
系统
@司马懿
·
2022-09-22 19:12
分布式服务
使用 Prometheus 监控 eKuiper 规则运行状态
eKuiper的规则是一个持续运行的
流式计算
任务。规则用于处理无界的数据流,正常情况下,规则启动后会一直运行,不断产生运行状态数据。直到规则被手动停止或出现不可恢复的错误后停止。
·
2022-09-20 20:23
大数据之Flink计算框架
OLTP实时计算(
流式计算
)OLAP离线计算(批量计算)Flink运行环境:StandAlone自己单独运行Hadoop-Yarn
飘然生
·
2022-09-16 13:08
大数据
tcp/ip
python
网络
深度解读!新一代大数据引擎Flink厉害在哪?(附实现原理细节)
本文系统地介绍了
流式计算
的相关知识,并着重介绍了Flink的实现原理细节,便于大家快速地理解和掌握
流式计算
,并基于Flink完成业务开发。一、
流式计算
和批处理批处理在大数据世界有着
架构师小秘圈
·
2022-09-08 10:56
Flink面试题大全(建议收藏)
Flink因为其天然的
流式计算
特性以及强大的处理性能成为炙手可热的大数据处理框架。
无精疯
·
2022-09-08 10:23
分布式
大数据
hadoop
spark
面试
kafka超全学习总结
Kafka快速入门选择Kafka原因:Kafka吞吐量比较高,在我们的系统中,文章是核心数据,每天会发布很多文章数据,产生很多用户行为因为我们的系统中会有一个实时行为计算的逻辑,会使用KAFKA提供的实时
流式计算
功能因为我们团队中之前有小伙伴用过
Code攻城狮
·
2022-08-26 21:06
#
SpringCloud微服务
学习
湖仓一体技术解读|
流式计算
实现秒级数据入湖
数据入湖的时效性直接影响整体数据应用效果,基于湖仓一体架构的巨杉数据库通过对接业界主流的Flink,Spark和Storm等主流的流式框架,实现实时生产数据的高速入湖,原汁原味的将数据保留在巨杉数据库中。SequoiaDB是巨杉数据库通过10年的不断迭代,从多模数据湖架构演进出来的“湖仓一体”架构产品。SequoiaDB的“湖仓一体”结合了数据湖与数据仓库,是一个融合的基础设施环境,支持从原始数据
巨杉数据库SequoiaDB
·
2022-08-25 14:17
大数据
分布式
湖仓一体
Spark Streaming 快速入门系列(一)一文带你了解Spark Streaming
文章目录SparkStreaming介绍SparkStreaming入门SparkStreaming原理SparkStreaming操作SparkStreaming介绍导读1,
流式计算
的场景2,
流式计算
框架
Alienware^
·
2022-08-24 15:49
#
Spark
大数据
spark
Spark Streaming(一)
SparkStreaming(一)导读介绍入门原理操作TableofContents1.SparkStreaming介绍2.SparkStreaming入门2.原理3.操作1.SparkStreaming介绍导读
流式计算
的场景
流式计算
框架
威风少侠
·
2022-08-24 14:57
大数据
大数据
spark
sparkStreaming
Spark Streaming中
流式计算
的困境与解决之道
Sparkstreaming在各种流程处理框架生态中占着举足轻重的位置,但是不可避免地也会面对网络波动带来的数据延迟的问题,所以必须要进行增量数据的累加。在更新Spark应用的时候或者其他不可避免的异常宕机的时候,增量累加会带来重复消费的问题,在一些需要严格保证exactonce的场景下,这个时候我们就需要进行离线修复,从而保证exactonce语义,本文将针对这个问题,提供一些常见的解决方案和处
数大招疯
·
2022-08-21 09:27
Flink编译与安装
一直对
流式计算
心驰神往,flink似乎是一个神器,可惜那些文档写得太玄乎,一些概念性的东西,有一种似懂非懂的感觉所以决定实际操作一下对于flink的状态,窗口,source,task的之类的概念,一直似懂非懂
猪猪_123123123123
·
2022-08-21 08:52
flink
flink
大数据
big
data
使用
流式计算
引擎 eKuiper 处理 Protocol Buffers 数据
ProtocolBuffers(Protobuf)是一种语言中立、平台中立的可扩展机制,用于序列化结构化数据的二进制传输格式。相比常规数据传输格式(如JSON或XML),Protobuf更加高效和快速并节省传输带宽,因此得到了广泛的应用。在云边协同架构中,往往既需要发送数据到云端,同时也需要接收云端发送过来的数据,进行云边协同计算。大规模的云边协同计算传输的数据总量巨大,在公网带宽资源有限而且昂贵
·
2022-08-18 16:53
重磅升级!TDengine3.0 正式发布
我们先来整体看一下3.0的几大亮点:可以支持10亿个设备采集的数据、100个节点支持存储与计算分离,引入计算节点,并重构了整个计算引擎完善并优化了对消息队列、
流式计算
和缓存
·
2022-08-17 16:10
tdengine数据库
flink实战--flinkSQL数据写入hudi
ApacheHudi是目前最流行的数据湖解决方案之一,DataLakeAnalytics集成了Hudi服务高效的数据MERGE(UPDATE/DELETE)场景,ApacheFlink作为目前最流行的流计算框架,在
流式计算
场景有天然的优势
阿华田512
·
2022-07-29 10:25
Flink学习必读系列
flink
大数据
big
data
ClickHouse 之 SummingMergeTree/AggregatingMergeTree 实现准实时看板(qbit)
有点flink
流式计算
的味道。初始化测试数据生成创建库CREATEDAT
·
2022-06-20 21:45
阿里言:出乎意料,“字节跳动”居然是这么做数据迁移的
的特点能够熟悉数据迁移中的数据包装和转换能够完成文章数据的全量和增量迁移能够完成热点文章数据的迁移1为什么需要自动同步因为MySQL保存着我们爬取的以及自建的数据,对于爬取的数据,数据量比较大,使用mysql存储会影响mysql的性能,并且我们需要对数据进行
流式计算
m0_55849656
·
2022-06-16 12:49
面试
编程
java
hbase
mysql
数据库
面试
算法
【技术干货】代码示例:使用 Apache Flink 连接 TDengine
除了核心的时序数据库功能外,TDengine还提供缓存、数据订阅、
流式计算
等大数据平台所需要的系列功能。
·
2022-05-27 20:12
tdengine数据库
Flink 1.15 新功能架构解析:高效稳定的通用增量 Checkpoint
Flink,作为
流式计算
的标杆,其端到端延迟包括容错的快慢主要取决于检查点机制(Checkpointing),所以如何将Checkpoint做得高效稳定是Flink流计算的首要任务。
·
2022-05-27 10:52
Apache APISIX 在雪球双活架构演进中的生产与实践
其中实时行情服务对接了多种上游数据源,通过数据
流式计算
、存储、分发,为投资者提供稳定的数据服务。实时行情一直是雪球业务系统中的资源消耗大户,持续在高水位运行。雪球内部一项重要的工作就是持续进行稳
雪球工程师团队
·
2022-05-24 14:00
apache
apisix
雪球
狂神说 JUC并发编程
进程和线程并发和并行线程状态wait和sleepSynchronized与LockCopyOnWriteArrayListCallable常用辅助类ReadWriteLockBlockingQueue线程池四大函数式接口
流式计算
RainHey
·
2022-05-22 07:27
并发编程
java
经验分享
面试
上一页
3
4
5
6
7
8
9
10
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他