E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
MaxCompute
阿里云
MaxCompute
SQL与Apache Hive区别面面观
目录1.引爆开场:
MaxCompute
和Hive,谁才是大数据SQL的王者?
大模型大数据攻城狮
·
2025-07-28 04:34
阿里云
odps
sql
物化
maxcompute
udf开发
sql语法
MaxCompute
数据迁移至OSS完全指南
目录1.为什么要把
MaxCompute
的数据搬到OSS?
大模型大数据攻城狮
·
2025-07-10 14:12
odps
大数据
阿里云
maxcompute
dataworks
tunnel
sdk
oss
maxcomputer 和 hologres中的EXTERNAL TABLE 和 FOREIGN TABLE
在阿里云的大数据和实时数仓产品中,
MaxCompute
和Hologres都支持类似于EXTERNALTABLE和FOREIGNTABLE的机制,但它们的实现和语义有所不同。
静听山水
·
2025-06-23 06:37
#
Hologres
大数据
【直播回顾】
MaxCompute
技术公开课第二季
MaxCompute
技术公开课第二季已经结束,共进行了5次大数据技术直播,有近6000名用户、大数据专家、技术牛人、大数据爱好者参与其中。我们为大家整理了一下直播的PPT和视频内容,方便大家随时学习。
weixin_33708432
·
2025-06-16 03:25
大数据
MaxCompute
Spark 资源使用优化详解
简介:本文主要讲解MaxComputeSpark资源调优,目的在于在保证Spark任务正常运行的前提下,指导用户更好地对Spark作业资源使用进行优化,极大化利用资源,降低成本。本文作者:吴数傑阿里云智能开发工程师1.概述本文主要讲解MaxComputeSpark资源调优,目的在于在保证Spark任务正常运行的前提下,指导用户更好地对Spark作业资源使用进行优化,极大化利用资源,降低成本。2.S
阿里开发者
·
2025-06-16 03:52
传感器
SQL
分布式计算
监控
DataWorks
数据可视化
安全
Java
MaxCompute
Spark
从
MaxCompute
到Milvus:通过DataWorks进行数据同步,实现海量数据高效相似性检索
在如今大数据和人工智能应用场景中,企业往往需要对存储在云数据仓库(如云原生大数据计算服务
MaxCompute
)中的大规模结构化数据进行向量化处理,以支持高效的向量检索和相似性分析等AI应用。
·
2025-06-12 17:09
阿里云ACP大数据分析师 | 笔记纪要
AlibabaCloudCertifiedProfessional-DataAnalyst重点不完整记录分析报告5大部分目标与背景发现与结论推荐与建议具体数据分析结果与阐述附件数据聚合时如果数据质量无控制将会导致计算时成倍的放大或重复相关的数据使用
MAXCompute
我想养只猫 •͓͡•ʔ
·
2025-05-14 01:34
人工智能
alibaba
大数据
数据分析
机器学习
基于Delta lake、Hudi格式的湖仓一体方案
MaxCompute
在湖仓一体架构中,通过支持DeltaLake和Hudi在数据湖中提供数据仓库性能。本文作者孟硕阿里云智能产品专家一、最佳实践背景整个最佳实践是基于
MaxCompute
的湖仓一体
呆呆咸猪手
·
2025-04-27 02:06
数据仓库
big
data
hadoop
数据库总结
阿里云中的
Maxcompute
(原odps)其实就是hive,扮演数据仓库的角色,适合存储轨迹类历史数据,适合存储的数据量大,适合海量数据的处理,适合对数据进行离线分析,数据
wzz87
·
2025-03-26 20:09
数据库
一文理清:阿里系数据中台-数据治理工具集(傻傻也能分清楚)
以下是对DataWorks、
MaxCompute
、Dataphin、AnalyticDBforMySQL(ADB)、QuickBI、EMR的详细梳理。
Debug_Snail
·
2025-03-11 14:09
Hadoop
Big
Data
技术工具
人工智能
hadoop
数据仓库
doris:阿里云
MaxCompute
MaxCompute
是阿里云上的企业级SaaS(SoftwareasaService)模式云数据仓库。什么是
MaxCompute
连接
MaxCompute
示例--1.创建Catalog。
向阳1218
·
2025-03-11 07:20
大数据
doris
阿里云
MaxCompute
面试题汇总及参考答案
目录简述
MaxCompute
的核心功能及适用场景,与传统数据仓库的区别解释
MaxCompute
分层架构设计原则,与传统数仓分层有何异同
MaxCompute
的存储架构如何实现高可用与扩展性解析伏羲(Fuxi
大模型大数据攻城狮
·
2025-03-06 10:05
阿里云
odps
云计算
机器学习
大数据面试
大数据面经
增量数据
大数据
MaxCompute
教程(阿里云离线数仓项目)学习笔记20231127
1数据仓库概念数据仓库定义(DataWarehouse),是为企业所有决策制定过程,提供所有系统数据支持的战略集合。AI:数据仓库是一个大型、集中、主题导向的数据库系统,用于支持企业决策制定、分析和报告的需要。它统一了来自不同数据源的数据,并将其在一个可查询的数据模型中进行了整合和转换,以便于分析和报告。数据仓库还包括数据清洗、抽取、转换和加载(ETL)的过程,以保证数据的准确性、一致性和完整性。
多刷亿点题⑧
·
2025-02-22 22:54
云原生
数据仓库
阿里云
MaxCompute
MaxQA 开启公测,解锁近实时高效查询体验
为减少查询响应时间,提升数据效率,阿里云云原生大数据计算服务
MaxCompute
推出MaxQA(原MCQA2.0)查询加速功能,在独享的查询加速资源池的基础上,对管控链路、查询优化器、执行引擎、存储引擎以及缓存机制等多个环节进行全面优化
阿里云大数据AI技术
·
2025-02-20 00:23
阿里云
云原生
MaxCompute
大数据
实时数仓
关于阿里云DataWorks的20道面试题
DataWorks的基本概念围绕其作为一个大数据开发和治理的平台,它整合了多种大数据引擎如
MaxCompute
、Hologres、EMR、AnalyticDB、CDP等,旨在为数据仓库、数据湖及湖仓一体化解决方
编织幻境的妖
·
2025-02-11 01:31
阿里云
云计算
大数据(一)
MaxCompute
一、引言作者后面会使用
MaxCompute
,所以在进行学习研究,总会有一些疑问产生,这里讲讲作者的疑问和思路二、介绍
MaxCompute
(原名ODPS-OpenDataProcessingService
胖当当技术
·
2025-02-03 23:39
架构
云计算
odps
学习
大数据
活动火热报名中 | Data+AI 融合趋势下的智能数仓平台建设
MaxCompute
作为阿里云最核心的核心战略级云数仓产品之一,在Data+AI融合趋势下,通过经典数据仓库能力定义与云数据架构的深刻理解,构建出面向下一代智能云数仓,并为用户提供了Data+AI一体化开发体验
·
2025-02-02 11:34
人工智能大数据阿里云数据库数据
【深入
MaxCompute
】人力家:用
MaxCompute
事务表2.0主键模型去重数据持续降本增效
简介:
MaxCompute
新增TransactionTable2.0(下文简称事务表2.0)表类型在2023年6月27日开始邀测,支持基于事务表2.0实现近实时的增全量一体的数据存储、计算解决方案。
阿里云大数据AI技术
·
2024-02-13 20:12
独家解读!阿里首次披露自研飞天大数据平台技术架构
飞天大数据平台始于2009年阿里巴巴的“登月”计划,在此次对外发布之前,它已经在阿里云内部实际运行和服务了十年之久(大家过去更为熟悉的
MaxCompute
是飞天系统的三大件之一,也是如
DP29syM41zyGndVF
·
2024-02-07 11:13
【深入
MaxCompute
】人力家:借助Information Schema合理治理费用
本文将为大家带来
MaxCompute
与人力家客户案例深度解读。
阿里云大数据AI技术
·
2024-02-07 10:14
原来还可以使用 DataX 进行数据同步
DataX实现了包括MySQL、Oracle、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、
MaxCompute
(ODPS)、Hologres
lytao123
·
2024-02-07 06:16
➤
数据库
big
data
hive
java
DataX
Clickhouse
datax 学习记录
是由阿里巴巴研发并开源的一个异构数据源离线同步工具,DataX实现了包括MySQL、Oracle、OceanBase、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、
MaxCompute
咳咳00
·
2024-02-02 17:58
学习
大数据
datax
datax避坑记录
DataX实现了包括MySQL、Oracle、OceanBase、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、
MaxCompute
(ODPS
佛祖保佑永不宕机
·
2024-02-02 17:28
数据库
数据库
mysql 同步 工具 开源_开源数据同步工具——datax
dataxDataX是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括MySQL、Oracle、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、
MaxCompute
weixin_39942572
·
2024-01-28 12:08
mysql
同步
工具
开源
开源数据同步工具DataX
DataX实现了包括MySQL、Oracle、OceanBase、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、
MaxCompute
(ODPS
快乐江小鱼
·
2024-01-28 12:34
java
开源
java
Apache SeaTunnel 数据集成插件开发最新经验总结!
在ApacheSeaTunnel的最新插件开发中,connector-v2
maxcompute
连接器实现了基于CatalogTable+SaveMode的新版本。
SeaTunnel
·
2024-01-26 15:26
大数据
Apache doris Datax DorisWriter扩展使用方法
DataX实现了包括MySQL、Oracle、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、
MaxCompute
(ODPS)、Hologres
张家锋
·
2024-01-22 15:27
Python实现数据库表的监控告警功能
并将告警信息通过钉钉机器人发送到钉钉群实现DataWorks中数据质量的基本功能,当然DW的数据质量的规则类型很多,用起来比较方便,这里只简单实现了其中两个规则类型的功能,仅供参考;初次使用Python,请多指教使用工具:
MaxCompute
1
Taerge0110
·
2024-01-20 21:41
大数据
数仓
算法
数据库
python
开发语言
大数据
阿里云大数据ACA及ACP复习题(1~20)
(多选)
MaxCompute
在每一个项目空间在创建时,会自动创建admin的角色,并且为该角色授予了确定的权限。以下权限中不属于admin的有哪些(ABD)。
周周的奇妙编程
·
2024-01-18 03:08
阿里云云计算ACA笔记
阿里云
大数据
云计算
阿里云大数据ACA及ACP复习题(21~40)
(D)A:HDFSB:DFSC:RDDD:MapReduce解析:MAPREDUCE(分布式运算编程框架)22.以下选项中不属于
MaxCompute
特点的是(D)A:支持多种多种经典的分布式计算模型B:
周周的奇妙编程
·
2024-01-18 03:08
阿里云
大数据
云计算
数仓建设指南
其主要作用是把基础数据引入到
MaxCompute
。CDM:CommonDataModel,公共维度模型层,又细分为DWD和DWS。它的主要作用是完成数据加工与整合、建立一致性的维度、
左美美  ̄
·
2024-01-13 06:04
java
大数据
数据仓库
基于DataWorks+
MaxCompute
的公共电影票房数据预处理实践
实验内容:对
MaxCompute
数仓公共数据进行预处理,主要对
maxcompute
_public_data.dwd_product_movie_basic_info(电影基本信息,包含影片名、导演、编剧
周周的奇妙编程
·
2024-01-08 00:43
odps
数据库
服务器
数据仓库开发教程 (DW) 之数据模型架构&编码规范
其主要作用是把基础数据引入到
MaxCompute
。CDM:CommonDataModel,公共维度模型层,又细分为DWD和DWS。
禅与计算机程序设计艺术
·
2024-01-03 08:38
Maxcompute
数据上云一致性比对
注:这里对数的场景就是指在阿里云平台使用dataworks等大数据开发工具集成业务系统数据库(oracle等)数据上云到
maxcompute
的场景,所以,示例的SQL也是针对
maxcompute
。
阿里云大数据AI技术
·
2023-12-31 19:36
数据仓库基础理论
前端时间,使用阿里云
MaxCompute
做数据仓库,处理大数据的分析处理,整理一下数据仓库的基础理论。
大斜千变
·
2023-12-31 03:12
大数据
数据仓库
odps
大数据
数据挖掘
Datax学习整理
DataX是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括MySQL、Oracle、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、
MaxCompute
耗子背刀PK猫
·
2023-12-18 02:53
学习
Hive、MySQL、Oracle内建函数对照表
例如,日期与时间函数、数学函数、窗口函数、聚合函数、字符串函数、复杂类型函数、加密函数等本文提供
MaxCompute
、Hive、MySQL及Oracle的内建函数对照表,方便我们在使用时进行查阅对照,以免混淆使用
对许
·
2023-12-16 15:06
#
Hive
#
数据库
hive
mysql
oracle
maxcompute
MaxCompute
获取当前季度的第一天日期(odps sql)
工作中遇到获取当前季度的第一天,如下所示SELECTCASEWHENQUARTER(GETDATE())=1THENDATETRUNC(GETDATE(),'yyyy')WHENQUARTER(GETDATE())=2THENDATEADD(DATETRUNC(GETDATE(),'yyyy'),3,'mm')WHENQUARTER(GETDATE())=3THENDATEADD(DATETRUN
Oceanside_yh
·
2023-12-16 13:50
odps
大数据
数据仓库
maxcompute
【云栖 2023】张治国:
MaxCompute
架构升级及开放性解读
云布道师本文根据2023云栖大会演讲实录整理而成,演讲信息如下演讲人:张治国|阿里云智能计算平台研究员、阿里云
MaxCompute
负责人演讲主题:
MaxCompute
架构升级及开放性解读活动:2023云栖大会
云布道师
·
2023-12-04 00:24
阿里云
MMA安装及使用优化
1.背景公司自建的Hadoop集群,后期使用阿里的
Maxcompute
,就需要迁移数据到新环境中,阿里提供众多的迁移方案,在经过我们的实践后,最终选择了MMA,迁移数据Hive到
Maxcompute
。
选手一号位
·
2023-12-03 02:14
阿里云数据中台核心引擎
核心引擎
MaxCompute
阿里离线数据计算平台(离线数仓)原名ODPS,阿里巴巴自主研发的海量数据处理平台
MaxCompute
处理存储在TableStore的数据(不负责收集数据到TableStore
hsabrina
·
2023-11-30 00:30
工程架构
big
data
大数据
Datax的使用说明及入门操作案例演示
DataX实现了包括MySQL、Oracle、OceanBase、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、
MaxCompute
(ODPS
嫣夜来
·
2023-11-23 14:39
知识积累
分布式
数据库
数据库
大数据
hive
DataWorks实践笔记-从入门到精通
DataWorks是阿里出品的一站式大数据开发与治理平台,基于
MaxCompute
/EMR/MC-Hologres等大数据计算引擎,网络上的教程很多,但是一般都比较冗长。
qq_43548990
·
2023-11-22 13:58
云计算
阿里云
MaxCompute
(ODPS)下载数据
基于odpscmd工具中的tunnel命令进行下载阿里云相关文档:https://help.aliyun.com/document_detail/27971.html?spm=a2c4g.11186623.2.14.866f7eafPhFeKl1.下载odpscmd,解压下载地址:https://odps-repo.oss-cn-hangzhou.aliyuncs.com/odpscmd/late
心碎无语
·
2023-11-20 23:55
大数据全攻略:10年老兵带你看尽
MaxCompute
大数据运算挑战与实践(下)
大数据计算服务(
MaxCompute
,原名ODPS)是一种快速、完全托管的TB/PB级数据仓库解决方案。
chuange6363
·
2023-11-19 19:05
大数据
运维
java
Maxcompute
小记1
目录1、关于NULL值排序2、合并小文件手动合并3、排除某个不想要的字段4、bigint和string关联5、sum()over()--级联求和6、lag()over()--(取出前n行数据)7、一次奇葩的数据倾斜调优经历\1、关于NULL值排序①HIVE时间类型:SELECTidFROM(SELECTGETDATE()idUNIONSELECTNULLidUNIONSELECTTO_DATE('
大数据00
·
2023-11-19 13:10
阿里云
数据仓库
sql
mysql
数据库
阿里云云原生一体化数仓 - 数据安全能力解读
MaxCompute
产品简介
MaxCompute
是一款多功能、低成本、高性能、高可靠、易于使用的数据仓库和支持全部数据湖能力的大数据平台,支持超大规模、serverless和完善的多租户能力,内建企业级安全能力和管理功能
阿里云云栖号
·
2023-11-18 21:28
大数据
云计算
阿里云
Hologres揭秘:高性能原生加速
MaxCompute
核心原理
简介:Hologres技术揭秘系列持续更新中,本期我们将带来Hologres高性能原生加速查询
MaxCompute
的技术原理解析。
阿里云云栖号
·
2023-11-17 14:11
云栖号技术分享
Hologres
MaxCompute
首次揭秘云原生Hologres存储引擎
概要:刚刚结束的2020天猫双11中,
MaxCompute
交互式分析(Hologres)+实时计算Flink搭建的云原生实时数仓首次在核心数据场景落地,为大数据平台创下一项新纪录。
阿里云技术
·
2023-11-17 14:09
数据库
大数据
python在ODPS上的深度应用
链接:阿里云官网pyodpsPyODPS提供了DataFrame的接口来处理
MaxCompute
对象,也可以转换成为pandas进行数据操作。
lazyone10
·
2023-11-15 21:54
python
odps
dataframe
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他