随缘清风殇

第一章数据仓库理论专题

1、数据仓库概述

1.1、诞生背景

（1）历史数据积存

历史数据使用频率低，积压在业务库中，导致业务系统的性能下降;
	企业定期将冷数据存储到数据仓库中

（2）企业数据分析需要

各个部门自己建立独立的数据抽取系统，导致数据不一致
	各个部门直接从业务库抽数进行报表生成,资源浪费，权限管理风险;
	数据仓库为各个部门建立了一个统一的数据视图，各个部门的数据统一一致;

1.2、数据仓库概念

1.2.1、数据仓库定义

概念：面向主题的、继承的、非易失的且随时间变化的数据集合

主要用于组织积累的历史数据，并使用分析方法(OLAP、数据分析)进行分析处理,进而辅助决策我，为管理者、企业系统提供数据支持，构建商业智能;

1.2.2、数据仓库特点

Ⅰ、面向主题：为数据分析提供服务，根据**主题将原始数据集合聚合在一起

范例：将业务数据库中的一些零散的表里面的原始数据进行聚合集合成为一张用户行为表，比如从支付流水表,商品表、用户表，订单表抽成一张大宽表 - 用户行为表，然后再用户行为表上做一系列相关分析;

Ⅱ、集成：原始数据来源于不同数据源，要整合成最终数据，需要i经过抽取、清洗、转换的过程

不同数据源采用不同的数据规范
Ⅰ、针对性别的编码：系统A(男，女),系统B(1,0)
Ⅱ、针对计量单位的差异：系统A(cm),系统B(英尺)

Ⅲ、非易失：保存的是一系列历史快照，不允许被修改，只能通过工具进行查询、分析；

数仓保存的数据为一系列的历史快照，每天从业务数据库同步，故数据与业务数据库保持一致;

Ⅳ、数仓定期接收、集成新的数据，从而反映出数据的最新变化；

将最新的数据追加到我们系统中，然后以时间戳标记版本，修改后的数据时间戳是最新的，之前老旧的数据;

1.2.3、数据仓库与数据库的区别

Ⅰ、数据库

1、面向事务设计,属于OLTP(在线事务处理)系统；
2、主要操作是随机读写，为业务系统提供存储服务；
3、在设计时避免冗余，常采用范式规范来设计;

Ⅱ、数据仓库

1、面向分析设计，属于OLAP(在线分析处理)系统
2、主要操作是批量读写，存储各个业务数据库经过清洗后的数据;
3、采用反范式设计，有意引入冗余(避免关联多张表，采用大宽表)，关注数据整合(count,group by等操作)，以及分析、处理性能

数据库VS数据仓库

1.3、数据仓库技术实现

1.3.1、传统数据仓库

（1）由多个单机的关系型数据库组成MMP（大规模并行处理）集群，进行数据存储和计算

（2）数据通过提前调度分配到各个节点进行存储，一般数据采用hash分配，每个节点存储一部分数据；

（3）每个节点的计算/查询任务计算出的结果也是部分结果，这些部分结果会汇总成一个准确的完整的结果进行返回；？？？

传统数仓的缺点

//数据量级一旦达到某个量级，会出现以下问题：

//(1)扩展性有限
	/*在MPP的每个节点本质上还是一个数据库,数据库有很精细的内存管理，在MPP架构独立进行运算，如果需要用到数据交换，需要通过高速网络与其他节点连接进行交换数据，高速网络直接限制了节点上限;
	数据存储的时候采用分库分表，因为架构所限，将一张大表拆分到各个节点进行存储，每张表存储的数据多再将表进行拆分，但分库分表也存在上限，粒度越细性能越差;
	*/

//(2)热点问题
	/*比如：有100w行的数据，存储的时候被拆成了10分，恰好前10w行是热点数据，再访问的频率是其他数据的五倍,则这个节点是承受压力是其他节点的五倍，这个节点容易出现宕机或超时的情况，则这个节点会成为集群的瓶颈;
	*/
	
/*热点问题解决方式
		通过数据加盐方式及来解决，相当于给表中的数据增加前缀，将其打乱随机分布到各个节点中，但是数据加盐本身就是额外操作，会带来额外问题;*/

1.3.2、大数据数仓

Ⅰ、大数据数仓概述

（1）分布式存储，分布式计算，利用大数据天然扩展性，完成海量的数据存放；

（2）将SQL转换为大数据计算引擎任务，完成数据分析；

（3）将SQL转换为大数据计算任务引擎，完成数据分析；

Ⅱ、数据处理方面 - 移动计算（而不是移动数据）

1、使用了移动计算，而非移动数据的架构，为了避免海量数据移动造成IO和网络的开销；
2、数据在哪存储的，就将计算任务分发到那个节点上进行计算；
	一份数据被拆分为并存放到多个节点上，所以每个节点接收到这个计算任务是并发进行的，得到的结果是部分结果，对结果进行汇总得到最终结果

Ⅲ、大数据数仓特点

1、分布式文件系统：将数据库中的结构化数据看作文件进行存储；
2、将数据文件自动拆分，拆分完之后分发到各个节点进行存储；
3、上层数据处理的时候，采用元数据将文件还原为表结构；
	解决了数据热点问题 - 可选降低
4、数据文件被存储到分布式文件系统时，默认备份三分，数据为一致的；
5、计算任务再分发的时候可选，相同的数据被存在三个节点，则可以选择最空闲的数据节点，将任务分发过去;

Ⅳ、大数据数仓的缺点
- 大数据的数据仓库在数据少的时候计算速度比较慢，因为是完全分布式的；
- 任务计算时，会对任务进行拆分，然后调度到各个节点，最后对结果进行合并；
- 在数据量没有达到一定程度时，只是人物的转换、分发、调度、汇总整个过程就会花费大量时间；

1.4、MPP架构

1.4.1、MPP架构概述

（1）传统数仓中常见的技术架构，将单机数据库节点组成集群，提升整体处理性能；

（2）节点间为非共享架构（每个节点独立存在，不关心集群整体状态，不关心其他节点的存储信息），每个节点都有独立的磁盘存储系统和内存系统；

（3）每台数据节点通过专用网络或商业通用网络互相连接，彼此协同计算，为整体提供服务；

计算任务中，如需要使用其他节点的数据，则通过高速网络点对点传输；

（4）设计上优先考虑C（一致性），其次考虑A（可用性），尽量做好P（分区容错性）；

1.4.2、MPP架构优点

（1）运算方式精细，延迟低，吞吐低；

（2）适合中等规模的结构化数据处理；

（3）MPP致力于实现分布式事务

（4）MPP架构没办法单独运行局部应用，只能作为整体进行对外服务；

1.4.3、MPP架构缺点

（1）存储位置不透明，通过hash确定数据所在的物理节点，查询任务在所有节点执行；

非共享架构导致数据存储位置不透明，导致执行查询任务时在所有节点执行；

（2）并行计算时，**单个节点会成为整个系统短板，**容错性差；

解决方式：当这个节点运行缓慢时，将缓慢数据节点的数据通过高速网络分发到其他节点进行处理，但是集群规模越大，单个节点发生故障的几率越大；

（3）分布式事务的实现会导致扩展性降低

集群规模越大，单个节点发生故障的几率越大；

1.5、分布式架构

（1）大数据中常见的技术架构，也成为Hadoop架构/批处理架构；

（2）各个节点实现场地自治（可单独运行局部应用），数据在集群中全局透明共享；

将每个节点存储资源拿出来共同组成一个分布式存储文件系统，各个节点被拿走存储资源后，剩下就是计算资源；
当每个任务分发到单个节点上，节点进行计算时，可访问公共的存储系统，找到数据在那个位置进行计算，所以可以单独进行局部应用

（3）每台节点通过局域网或广域网相连，节点间的通信开销较大，在运算时致力于减少数据移动；

（4）优先考虑的是P（分区容错性），然后是A（可用性），最后是C（一致性）。

对中间结果进行存储，且数据移动开销会比较大

1.6、MPP+分布式架构

数据存储采用分布式架构中的公共存储，提高分区容错性；

相当于把数据透明化

上层架构采用MPP，减少运算延迟

1.7、常见数据仓库产品

//1、传统数据仓库
Oracle 
DB2
Teradata
Greenplum

//2、大数据数据仓库
Hive
Spark SQL
HBase
impala
HAWQ
TIDB

2、数据仓库架构

2.1、数据仓库架构设计

2.1.0、OLTP与大数据仓库的关系

1、数据仓库数据来源
	业务数据:来自OLTP集群，通过Sqoop落HDFS上
	日志数据:来自服务的日志文件 ,通过kafka落HDFS上

2.1.1、ETL - 数据抽取、清洗、转换、加载

结构化数据：sqoop，Kettle
	结构化数据：直接将原系统数据抽取、加载到ODS层
非结构、半结构化数据(日志、文件)：Flume

2.1.2、ODS层 - 数据贴源层

目的：与原始数据保持一致存储业务数据库的数据，不进行数据修改

2.1.3、DW层 - 公共维度模型层

Ⅰ、DWD层：数据明细层 – 满足三范式形式
- 明细层：存的是各种零散表，零散表与业务系统相差不多的，只不过是清洗后的业务系统的表；

DWD层：接受ODS层数据，ODS层拿的业务系统的数据
	将ODS层数据进行清洗、标准化，将异常数据剔除掉，做统一的编码，字段描述，将数据统一规范后存储到数据明细层;

Ⅱ 、DWS层：数据汇总层 – 脱离三范式，维度建模，以宽表形式存在
- 对DWD层的明细表进行汇总，比如将用户行为相关的数据存进一张大表，形成用户行为宽表；

DWS层:将DWD层进行维度建模,建立宽表形式存在

2.1.4、ADS层 - 数据应用层(数据集市层)

ADS层:保存数据分析的结果数据,使用传统数据库搭建

2.2、ETL流程

2.2.1、ETL概述

（1）将数据从来源端经过抽取、交互转换、加载至目的端的过程；

构建数据仓库的重要一环，用户型数据源抽取所需的数据，经过数据清洗,最终按照预算定义好的数据仓库模型,将数据加载到数据仓库中;

（2）ETL规则的设计和实时约占整个数据仓库搭建工作量的60%-80%；

2.2.2、数据抽取(E-JOB)

（1）数据源

抽取的数据源可以分为结构化数据、非结构化数据、半结构化数据;
结构化数据一把采用JDBC、数据库日志方式,非/半结构化数据会监听文件变动

抽取关系型数据库：
JDBC直连：消耗数据库的IO，影响数据库的运转，一般抽取在凌晨业务量较少的；
	对于业务数据库压力很大
直接抽取数据库的日志：直接采集预写日志文件，需要将日志文件解析后获取数据;
	对于业务数据库压力很小

（2）抽取方式

数据抽取方式有全量同步、增量同步两种方式

全量同步:会将全部数据进行抽取,一般用于初始化装载;
增量同步:检测数据的变动,抽取发生变动的数据,一般用于数据更新;

2.2.3、数据清洗

数据清洗要经历数据清洗和转换两个阶段
- 结构化数据抽取与源系统保持一致,数据清洗任务量很小,基本只要去重即可;
- 数据清洗和转换主要集中在非结构化、半结构化数据;

①数据清洗:主要是对出现的重复、二义性、不完整、违反业务或逻辑规则等问题进行统一处理
	数据清洗在结构化数据很少,否则业务数据库就会产生极大的风险;
	数据清洗主要是对非结构化,半结构化数据进行清洗;
②数据转换:主要是对数据进行标准化处理,进行字段、数据类型、数据定义的转换

2.2.4、数据加载

将最后处理完的数据导入到对应的目标源中;

2.2.5、ETL工具

// 1、结构化数据ETL工具
Sqoop
    通过JDBC连接结构化数据库进行数据抽取,使用并发处理方式,批量导入大数据的数据仓库里面;
	生产中使用1.x版本,2.0版本功能完善导致性能下降;
Kettle
Datastage
Information
Kafka
    kafka是一个消息队列,提供ETL功能,支持ETL操作,将数据抽取出来之后存在消息队列里面,等待下游的数据仓库的抽取;

// 2、非/半结构化数据
Flume
    支持对日志文件进行数据监控,一旦有变动将数据抽取出来;
Logstash

2.3、数据积存(ODS层)

（1）数据与源业务数据保持一致，可以增加审计字段用来进行数据管理

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-EsXLs68z-1627957839812)(C:\Users\李海伟\AppData\Roaming\Typora\typora-user-images\image-20210603200830957.png)]$

（2）存储的历史数据是只读的，提供业务系统查询使用

业务系统会将定期将导入数据仓库的业务数据库中的数据删除掉

（3）修改只可追加：业务系统对历史数据完成修改后，将update_type字段更新为UPDATE，追加回ODS层

（4）在离线数仓中业务数据定期通过ETL流程放到如ODS中，导入方式有两种

--全量导入：数据的第一次导入，选择此种方式；
--增量导入：数据非第一次导入，每次只需倒入新增、更改的数据,建议使用外连接&全覆盖方式

case：针对大数据平台不能修改数据的限制

Ⅰ、外连接
Ⅱ、全覆盖

2.4、数据分析(DWD/DWS/ADS)

2.4.1、DWD - 数据明细层

数据仍满足3NF模型，为分析运算做准备；
数据明细层对ODS层的数据进行清洗，标准化、维度退化
- 范例：将维表数据整合到事实表中；
- 范例：各个不同城市子公司的用户表，添加一个城市字段后union

维度退化:
	在大数据的数据仓库里面,大量join操作会涉及到一个海量数据的移动,导致性能会很差

2.4.2、DWS - 数据汇总层

数据汇总层：对数据明细层的数据进行计算汇总，存放便于分析的大宽表；
存储模型：更加注重与数据聚合，复杂查询，处理性能更优的数仓模型；
- 传统数仓：以维度模型为主；
- 大数据数仓：以宽表模型为主

DWS层：将ODS层的零散表聚集成一张面向主题的大宽表

2.4.3、ADS - 数据应用层

数据应用层：数据集市;
主要作用：存储数据分析结果,为不同业务场景提供外部接口，减轻数据仓库的负担

--数据仓库擅长数据分析，直接开放业务查询借口，会增加其负担
	①报表决策的快速查询：kylin
	②前端业务的并发查询：Hbase
	③前端业务的只能检索：ElasticSearch

3、数据仓库建模

3.1、建模基本概念

3.1.1、OLTP传统建模方法

（1）OLTP（在线事务处理）系统中，主要操作是随机读写；

用于业务数据，主要是对业务数据库提供数据存储和数据操作的服务;

（2）使用关系模型建模（ER模型），保证数据一致性，减少冗余；

ER模型原则尽量将表拆分，拆分的越细越好，尽量满足3NF的规则，减少冗余

3.1.2、OLAP在线联机分析

（1）基本概念

OLAP系统：主要操作是复杂分析查询，关注数据整合以及分析，处理性能
OLAP根据存储方式的不同：分为ROLAP、MOLAP、HOLAP;

（2）系统分类

Ⅰ、ROLAP：关系型OLAP

使用关系模型构建，存储系统一般为RDBMS；

Ⅱ、MOLAP：多维型OLAP

预先聚合计算,使用多位数组的形式保存数据结果，加快查询分析时间；

Ⅲ、HOLAP：混合架构的OLAP

1、ROLAP和MOLAP两者的集成；
2、底层是关系性的，高层是多维矩阵的；
3、查询效率高于ROLAP,低于MOLAP;

3.2、ROLAP - DWS层

业务场景：ADS层

3.2.1 维度模型

分为星形模型，雪花模型，星座模型
方便对数据多维分析

事实表维度表

3.2.2、星型模型

标准的星型模型维度只有一层,分析性能最优;

查询的时候,找到维度表对事实表直接聚合;

星型模型与雪花型模型的区别

星型模型和雪花模型的主要区别在于对维度表的拆分，
	雪花模型:维度表的设计更加规范，一般符合3NF；
	星型模型:一般采用降维的操作，利用冗余来避免模型过于复杂，提高易用性和分析效率。

3.2.3、雪花模型

雪花模型具有多层维度,比较接近三范式设计

3.2.4、星座模型

星座模型基于多个事实表,事实表之间会共享一些维度表;

星座模型是大型数据仓库中的常态,是业务增长的结果,与模型设计无关;

3.2.5、宽表模型

大数据数仓里面,join使得大量数据移动导致性能不佳
宽表模型:将维度冗余到事实表中,形成宽表,以此减少join操作;

3.3、MOLAP - ADS层

特点：以空间换时间；灵活性较低，不存储原始数据
业务场景：应用于ADS层

（1）MOLAP将数据进行预结算，并将聚合结果存储到CUBE模型中；

（2）CUBE模型以多维数组的形式，物化到存储系统中，加快后续的查询；

（3）生成cube需要大量的时间，空间，维度预处理可能导致数据膨胀；

常见的MOLAP产品：Kylin，Druid

1、读取Hadoop，hive...各种数据源获取后；
2、由Kylin加工成cube,加工时进行多种维度组合;
3、预计算结果存储到Hbase中;
4、前端业务人员/程序员查询kylin,kylin返回Hbase中的数据;

3.4、OLAP多维分析

OLAP主要操作时复杂查询,可以多表关联,使用count、sum、avg等函数;
OLAP对复杂查询做了直观的定义,包括钻取、切片、切块、旋转;

3.4.1、钻取

钻取：对维度不同层次的分析，通过改变维度的层次来变换分析的粒度;

钻取包括上卷、下钻;
	上卷:向上钻取,指从低层次到高层次的切换;
	下钻:指从高层次到低层次的切换;

3.4.2、切片/切块

切片：选择某个维度进行分割；
切块：按照多维进行切片；

3.4.3、旋转

旋转：对维度方向的互换，类似于坐标轴上卷

1、先查询产品类型,之后每个产品类型按照时间进行筛选;
2、旋转之后,先查询时间,之后按每年的产品类型进行分类;

4、数据仓库最佳实践

4.1、表的分类

4.1.1、事实表

事实表数据：一般指一个现实存在的业务对象；比如用户，商品，商家等；

（1）事务事实表 – 顺序追加

随着业务不断产生的数据，一般产生不会再发生变化，如交易流水，操作日志，出库入库记录；

（2）周期快照事实表 – 顺序追加

随着业务周期型的推进而变化，完成间隔周期内的度量统计，如年、季度累计；
使用周期+状态度量组合，如年累计订单数，年是周期，订单总数是度量；

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-wGyWe6As-1627957839826)(C:\Users\李海伟\AppData\Roaming\Typora\typora-user-images\image-20210604151919082.png)]$

银行/金融行业中:业务随着业务周期的变化,数据重新计算
	比如年累计,月累计,天累计

（3）累计快照事实表 – 随机修改

记录不确定周期的度量统计，完全覆盖一个事实的生命周期，如订单状态表；
通常有多个时间字段，用于记录生命周期中的关键节点；
只有一条记录，针对此记录不断更新；

两种实现方式：
	1、事务事实表;
	2、对之前历史数据的随即修改 --拉链表

累计快照事实表实现方式

1、实现方式一
	使用日期分区表,全量数据记录,每天的分区存储昨天全量数据于当天增量数据的合并结果;
	数据量过大会导致全量表碰撞,存储永远不更新的冷数据,对性能影响较大;
	业务场景:适合于数据量少的情况;

2、实现方式二
	使用日期分区表,存储周期内的数据,周期外的冷数据存储到归档标中;
	需要保留多天的分区数据,存储消耗依然很大;

3、实现方式三
	使用日期分区表,以业务实体的结束时间分区,每天的分区存放当太难结束的数据,设计一个时间非常大的分区如9999-12-31,存放截至当前未结束的数据;
	优点:已结束的数据存放到相应分区,存放未结束数据分区,数据量也不是很大,ETL性能好;
		无存储浪费,数据全局唯一;

4.1.3、维度表

维度表数据：一般是指一些业务状态，代码的解释表（即码表）。
- 通常使用维度对事实表中的数据进行统计、聚合运算

4.1.4、拉链表

拉链表：记录每条信息的生命周期，用于保留数据的所有历史变化状态；
拉链表将表数据的随机修改方式变为顺序追加；

拉链表的实现策略
- 1、拉链表实现方式 – 增量数据与目标表通过主键做全量关联

/*
更新最新数据,以主键是否存在判断是否取增量表中数据,还是T-1的全量表中数据;
	(1)没有关联上的数据:插入insert分区;
					 
	(2)关联上的数据:插入update分区;
	
*** 每次增量数据须和DWI表做关联,会吃很多资源
*/
insert overwrite table dwi_t_9000 partition(date)
select 
	if(tmp.id is null,ods.id,temp.id) as id
from temp full join dwi on temp.id = ods.id

4.2、ETL策略

ETL策略分为两种：全量同步&增量同步；

4.2.1、全量同步

业务场景：数据初始化装载使用全量同步方式；
- 因为业务/技术原因，比如第三方给的数据，使用全亮的方式做周期数据更新，直接覆盖原有的数据即可；
- 利用分区保存每天数据，可保存较短周期；

结构化数据:
	JDBC：直接连接数据库进行数据抽取，会给数据库带来较大的负载和压力，影响数据库的稳定性；
		  一般抽取备库;
	抽取数据库日志方式：开放CDC功能抽取日志，oracle使用OGG工具，mysql或者sqlserver使用CDC工具；

4.2.2、增量同步

业务场景：除了第一次全量同步完后，之后的每次的数据都是增量同步；

（1）结构化数据

抽取方式：
- JDBC抽取：业务数据的时间戳抽取；
- 日志抽取：对数据库日志进行抽取，数据库日志是追加的，对某个时间点之后的数据会更容易追加到；

日志抽取相比于JDBC抽取：抽取速度快，且对数据库影响较小;

（2）非结构/半结构化数据

抽取工具：自带监控功能，可以实时监控变动数据；

（3）增量数据更新方式

Ⅰ、传统数据整合方案：大多数采用merge方式（update+insert）
Ⅱ、主流大数据平台：不支持update操作，可采用全外连接+数据全量覆盖方式

大数据平台担心数据出错,可以采用分区方式,每天保存最新的全量版本,保留较短周期;

insert overwrite table dw_user_inc
select 
--如果ODS表中有数据,以新增数据为准;如果没有则追加;
case when b.uid is not null then b.uid else a.uid end as uid,
case when b.uid is not null then b.ename else a.ename end as uname
...
from dw_user_inc outer join ods_user_inc b
on a.uid = b.uid

4.3、任务调度

4.3.1、任务调度必要性

定时：自动化完成任务的定时执行;
制定节点：解决任务单元间的依赖关系;

4.3.2、调度任务类型

shell：用于启动数据仓库的集群组件，比如ETL的采集组件；
java：数据清洗任务；
mapreduce：Mapreduce执行特定功能，吞吐量更高；
SQL脚本：数据的DDL，数据处理任务等；

4.3.3、常见调度工具

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Yx4C9AFA-1627957839829)(C:\Users\李海伟\AppData\Roaming\Typora\typora-user-images\image-20210604164125162.png)]

5、常见面试题

5.1、范式建模和维度建模的区别

范式模型:从流程上看是自上而下的，自上而下指的是数据的流向，“上”即数据的上游，“下”即数据的下游，即从分散异构的数据源 -> 数据仓库 -> 数据集市。
	   :以数据源头为导向，然后一步步探索获取尽量符合预期的数据，因为数据源往往是异构的，所以会更加强调数据的清洗工作，将数据抽取为实体-关系模型，并不强调事实表和维度表的概念。
特点	
	:1、能够结合业务系统的数据模型，较方便的实现数据仓库的模型；
	:2、同一份数据只存放在一个地方，没有数据冗余，保证了数据一致性；
	:3、数据解耦，方便维护。
	缺点:表的数量多；查询时关联表较多使得查询性能降低。

维度模型:从流程上看是自下而上的，即从数据集市-> 数据仓库 -> 分散异构的数据源。
	  :Kimball 是以最终任务为导向，将数据按照目标拆分出不同的表需求，数据会抽取为事实-维度模型，数据源经ETL转化为事实表和维度表导入数据集市，以星型模型或雪花模型等方式构建维度数据仓库，架构体系中，数据集市与数据仓库是紧密结合的，数据集市是数据仓库中一个逻辑上的主题域。
特点
	:1、维度建模：模型结构简单，面向分析，为了提高查询性能可以增加数据冗余，反规范化的设计，开发周期短，能够快速迭代。
	缺点:就是数据会大量冗余，预处理阶段开销大，后期维护麻烦；还有一个问题就是不能保证数据口径一致性，原因后面有讲解。

范式建模:必须符合准三范式设计规范，如果使用混合建模，则源表也需要符合范式建模的限制，即源数据须为操作型或事务型系统的数据。通过ETL抽取转换和加载到数据仓库的ODS层，ODS层数据与源数据是保持一致的，所以ODS层数据也是符合范式设计规范的，通过ODS的数据，利用范式建模方法，建设原子数据的数据仓库EDW，然后基于EDW，利用维度建模方法建设数据集市。

建模思路

结合两种建模方式的各自规范，混合建模按照“松耦合、层次化”的基本架构原则进行实施。混合数据仓库架构方法主要包含以下关键步骤：业务需求分步构建、分层次保存数据、整合原子级的数据标准、维护一致性维度等。

你可能感兴趣的:(离线数据仓库实战,大数据)

x86-64汇编语言训练程序与实战十除以十等于一
本文还有配套的精品资源，点击获取简介：汇编语言是一种低级语言，与机器代码紧密相关，特别适用于编写系统级代码及性能要求高的应用。nasm编译器是针对x86和x86-64架构的汇编语言编译器，支持多种语法风格和指令集。项目Euler提供数学和计算机科学问题，鼓励编程技巧应用，前100个问题的答案可共享。x86-64架构扩展了寄存器数量并引入新指令，提升了数据处理效率。学习汇编语言能够深入理解计算机底层
Flowable 实战落地核心：选型决策与坑点破解练习时长两年半的程序员小胡 Flowable 流程引擎实战指南低代码 BPMN 流程引擎 flowable 后端 java
在企业级流程引擎的落地过程中，选型的准确性和坑点的预见性直接决定项目成败。本文聚焦Flowable实战中最关键的“选型决策”与“常见坑点”，结合真实项目经验，提供可落地的解决方案。一、流程引擎选型：从业务本质出发1.1选型的三大核心维度企业在选择流程引擎时，需避免陷入“技术崇拜”，应回归业务本质。评估Flowable是否适用，可从三个维度判断：业务复杂度若流程涉及动态审批链（如按金额自动升级审批）
Flowable 高级扩展：自定义元素与性能优化实战练习时长两年半的程序员小胡 Flowable 流程引擎实战指南流程图 flowable BPMN 流程引擎 java
在前五篇文章中，我们从基础概念、流程设计、API实战、SpringBoot集成，到外部系统协同，逐步构建了Flowable的应用体系。但企业级复杂场景中，原生功能往往难以满足定制化需求——比如需要特殊的审批规则网关、与决策引擎联动实现动态路由，或是在高并发场景下优化流程引擎性能。本文将聚焦Flowable的高级扩展能力，详解如何自定义流程元素、集成规则引擎，并掌握大型系统中的性能调优策略。一、自定
图论算法经典题目解析：DFS、BFS与拓扑排序实战周童學数据结构与算法深度优先算法图论
图论算法经典题目解析：DFS、BFS与拓扑排序实战图论问题是算法面试中的高频考点，本博客将通过四道LeetCode经典题目（均来自"Top100Liked"题库），深入讲解图论的核心算法思想和实现技巧。涵盖DFS、BFS、拓扑排序和前缀树等知识点，每道题配有Java实现和易错点分析。1.岛屿数量(DFS遍历)问题描述给定一个由'1'(陆地)和'0'(水)组成的二维网格，计算岛屿的数量。岛屿由水平或
【项目实战】容错机制与故障恢复：保障系统连续性的核心体系本本本添哥 004 -研效与DevOps运维工具链 002 -进阶开发能力分布式
在分布式系统中，硬件故障、网络波动、软件异常等问题难以避免。容错机制与故障恢复的核心目标是：通过主动检测故障、自动隔离风险、快速转移负载、重建数据一致性，最大限度减少故障对业务的影响，保障系统“持续可用”与“数据不丢失”。以下从核心机制、实现方式、典型案例等维度展开说明。一、故障检测：及时发现异常节点故障检测是容错的第一步，需通过多维度手段实时感知系统组件状态，确保故障被快速识别。1.健康检查与心
Java并发核心：线程池使用技巧与最佳实践！ | 多线程篇(五) bug菌¹ Java实战(进阶版)java Java零基础入门 Java并发线程池多线程篇
本文收录于「Java进阶实战」专栏，专业攻坚指数级提升，希望能够助你一臂之力，帮你早日登顶实现财富自由；同时，欢迎大家关注&&收藏&&订阅！持续更新中，up！up！up！！环境说明：Windows10+IntelliJIDEA2021.3.2+Jdk1.8本文目录前言摘要正文何为线程池？为什么需要线程池？线程池的好处线程池使用场景如何创建线程池？线程池的常见配置源码解析案例分享案例代码演示案例运行
JVM 内存分配与回收策略：从对象创建到内存释放的全流程
在JVM的运行机制中，内存分配与回收策略是连接对象生命周期与垃圾收集器的桥梁。它决定了对象在堆内存中的创建位置、存活过程中的区域迁移，以及最终被回收的时机。合理的内存分配策略能减少GC频率、降低停顿时间，是优化Java应用性能的核心环节。本文将系统解析JVM的内存分配规则、对象晋升机制，以及实战中的内存优化技巧。一、对象优先在Eden区分配：新生代的“临时缓冲区”大多数情况下，Java对象在新生代
【Coze搞钱实战】3. 避坑指南：对话流设计中的6个致命错误（真实案例） AI_DL_CODE Coze平台对话流设计客服Bot避坑用户流失封号风险智能客服配置故障修复指南
摘要：对话流设计是智能客服Bot能否落地的核心环节，直接影响用户体验与业务安全。本文基于50+企业Bot部署故障分析，聚焦导致用户流失、投诉甚至封号的6大致命错误：无限循环追问、人工移交超时、敏感词过滤缺失、知识库冲突、未处理否定意图、跨平台适配失败。通过真实案例拆解每个错误的表现形式、技术根因及工业级解决方案，提供可直接复用的Coze配置代码、工作流模板和检测工具。文中包含对话流健康度检测工具使
Deepseek技术深化：驱动大数据时代颠覆性变革的未来引擎荣华富贵8 spring boot 搜索引擎后端缓存 redis
在大数据时代，信息爆炸和数据驱动的决策逐渐重塑各行各业。作为一项前沿技术，Deepseek正在引领新一轮技术革新，颠覆传统数据处理与分析方式。本文将从理论原理、应用场景和前沿代码实践三个层面，深入剖析Deepseek技术如何为大数据时代提供颠覆性变革的解决方案。一、技术背景与核心思想1.1大数据挑战与机遇在数据量呈指数级增长的背景下，传统数据处理方法面临数据存储、计算效率和信息提取精度的诸多挑战。
办公党必备！Excel文件批量加密神器！一键保护你的重要数据阿幸软件杂货间 Excel excel
软件介绍今天推荐的这一款专为Excel文件设计的批量加密工具，能够帮助用户快速、高效地为多个Excel文件设置密码保护，有效防止数据泄露。软件特点本地化离线处理支持批量操作完全免费软件操作选择你需要加密的文件和路径，设置密码进行加密即可软件下载夸克网盘迅雷网盘UC网盘
Qwen3 大模型实战：使用 vLLM 部署与函数调用（Function Call）全攻略曦紫沐大模型大模型部署 Qwen3 vLLM 函数调用
文章摘要本文将带你从零开始，深入掌握如何使用Qwen3-8B大语言模型，结合vLLM进行高性能部署，并通过函数调用（FunctionCall）实现模型与外部工具的智能联动。我们将详细讲解部署命令、调用方式、代码示例及实际应用场景，帮助你快速构建基于Qwen3的智能应用。一、Qwen3简介与部署环境准备Qwen3是通义千问系列的最新一代大语言模型，具备强大的自然语言理解和生成能力，尤其在函数调用、工
你竟然还在用克隆删除？Conda最新版rename命令全攻略！曦紫沐 Python基础知识 conda 虚拟环境管理
文章摘要Conda虚拟环境管理终于迎来革命性升级！本文揭秘Conda4.9+版本新增的rename黑科技，彻底告别传统“克隆+删除”的繁琐操作。从命令解析到实战案例，手把手教你如何安全高效地重命名Python虚拟环境，附带版本检测、环境迁移、故障排查等进阶技巧，助你提升开发效率10倍！一、颠覆认知：Conda居然自带重命名功能？很多开发者仍停留在“Conda无法直接重命名环境”的认知阶段，实际上自
大数据之路：阿里巴巴大数据实践——大数据领域建模综述
为什么需要数据建模核心痛点数据冗余：不同业务重复存储相同数据（如用户基础信息），导致存储成本激增。计算资源浪费：未经聚合的明细数据直接参与计算（如全表扫描），消耗大量CPU/内存资源。数据一致性缺失：同一指标在不同业务线的口径差异（如“活跃用户”定义不同），引发决策冲突。开发效率低下：每次分析需重新编写复杂逻辑，无法复用已有模型。数据建模核心价值性能提升：分层设计（ODS→DWD→DWS→ADS）
《UNIX网络编程卷1：套接字联网API》第8章：基本UDP套接字编程深度解析
《UNIX网络编程卷1：套接字联网API》第8章：基本UDP套接字编程深度解析（8000字图文实战）一、UDP协议核心特性与编程模型1.1UDP协议设计哲学UDP（UserDatagramProtocol）是面向无连接的传输层协议（图1），其核心特征包括：无连接通信：无需三次握手，直接发送数据报尽最大努力交付：不保证可靠性、不维护连接状态报文边界保留：接收方读取的数据与发送方写入完全一致低开销高效
魔搭平台实战：手把手教你训练SDXL模型，解锁AI绘画新纪元 Liudef06小白特殊专栏 AIGC 人工智能 AI作画人工智能 AIGC
魔搭平台实战：手把手教你训练SDXL模型，解锁AI绘画新纪元随着多模态AI技术的爆发式发展，StableDiffusionXL（SDXL）等文生图模型正在彻底重塑创意产业工作流。本文将深入解析如何在魔搭平台高效训练SDXL模型，并探讨AI绘画技术对设计行业的革命性影响。一、SDXL模型架构解析1.1双文本编码器设计SDXL采用双文本编码器架构，显著提升提示词理解能力：#SDXL文本编码器结构示意c
GPT-4 在 AIGC 中的微调技巧：让模型更懂你的需求 AIGC应用创新大全 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 AIGC ai
GPT-4在AIGC中的微调技巧：让模型更懂你的需求关键词：GPT-4、AIGC、模型微调、监督学习、指令优化、过拟合预防、个性化生成摘要：AIGC（人工智能生成内容）正在重塑内容创作行业，但通用的GPT-4模型可能无法精准匹配你的垂直需求——比如写电商爆款文案时总“跑题”，或生成技术文档时专业术语不够。本文将用“教小朋友学画画”的通俗类比，从微调的底层逻辑讲到实战技巧，带你掌握让GPT-4“更懂
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容 AI大模型应用工坊 AI大模型开发实战 AIGC chatgpt ai
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容关键词：AIGC、ChatGPT、DALL·E、内容生成、高转化营销、多模态协同、提示词工程摘要：随着AIGC（人工智能生成内容）技术的爆发式发展，ChatGPT（文本生成）与DALL·E（图像生成）的组合已成为内容创作领域的“黄金搭档”。本文将深度解析二者的协同原理，结合实战案例演示从需求分析到内容落地的全流程，并揭示提升内容
【大模型微调实战】4. P-Tuning爆款文案生成：让模型学会小红书“爽感”写作，转化率提升300% AI_DL_CODE 大模型微调 P-Tuning 小红书文案爆款生成情绪强化自然语言生成提示工程
摘要：在内容营销竞争白热化的当下，普通文案已难以突破流量壁垒。本文聚焦P-Tuning技术在小红书爆款文案生成中的落地应用，通过参数化提示向量优化，将抽象的“爽感”写作转化为可量化、可训练的技术指标。文中提出“六步成文法”，从情绪化数据集构建到爆款元素复刻，完整拆解如何用RTX3060级显卡实现0.1%参数量微调，使文案点击率从2.1%提升至8.7%，爆文率提高5倍，单条文案带货超8万元。核心创新
大数据技术笔记—spring入门卿卿老祖
篇一spring介绍spring.io官网快速开始Aop面向切面编程，可以任何位置，并且可以细致到方法上连接框架与框架Spring就是IOCAOP思想有效的组织中间层对象一般都是切入service层spring组成前后端分离已学方式，前后台未分离：Spring的远程通信：明日更新创建第一个spring项目来源：科多大数据
C++中std::variant的使用详解和实战代码示例点云SLAM C++c++开发语言 variant C++泛型编程联合体 C++类型擦除机制 C++17
std::variant是C++17引入的一个类型安全的联合体（type-safeunion），它可以在多个类型之间存储一个值，并在编译时进行类型检查。它是现代C++类型擦除与泛型编程的核心工具之一，适用于构建可变类型结构、消息传递系统、状态机等。一、基本概念#includestd::variantv;类似于联合体union，但类型安全。std::variant只能存储其中一个类型的值。默认构造时
前端数据库：IndexedDB从基础到高级使用指南
文章目录前端数据库：IndexedDB从基础到高级使用指南引言一、IndexedDB概述1.1什么是IndexedDB1.2与其他存储方案的比较二、基础使用2.1打开/创建数据库2.2基本CRUD操作添加数据读取数据更新数据删除数据三、高级特性3.1复杂查询与游标3.2事务高级用法3.3性能优化技巧四、实战案例：构建离线优先的待办事项应用4.1数据库设计4.2同步策略实现五、常见问题与解决方案5.
Python Gradio：实现交互式图像编辑 PythonAI编程架构实战家 Python编程之道 python 开发语言 ai
PythonGradio：实现交互式图像编辑关键词：Python,Gradio,交互式图像编辑,计算机视觉,深度学习,图像处理,Web应用摘要：本文将深入探讨如何使用Python的Gradio库构建交互式图像编辑应用。我们将从基础概念开始，逐步介绍Gradio的核心功能，并通过实际代码示例展示如何实现各种图像处理功能。文章将涵盖图像滤镜应用、对象检测、风格迁移等高级功能，同时提供完整的项目实战案例
【Java Web实战】从零到一打造企业级网上购书网站系统 | 完整开发实录（三）笙囧同学 java 前端状态模式
核心功能设计用户管理系统用户管理是整个系统的基础，我设计了完整的用户生命周期管理：用户注册流程验证失败验证通过验证失败验证通过用户名已存在用户名可用失败成功用户访问注册页面填写注册信息前端表单验证显示错误提示提交到后端后端数据验证返回错误信息用户名唯一性检查提示用户名重复密码加密处理保存用户信息保存成功?显示系统错误注册成功跳转登录页面登录认证机制深度解析我实现了一套企业级的多层次安全认证机制：认
从零到一：基于差分隐私决策树的客户购买预测系统实战开发笙囧同学决策树算法机器学习
作者简介：笙囧同学，中科院计算机大模型方向硕士，全栈开发爱好者联系方式：[email protected]各大平台账号：笙囧同学座右铭：偷懒是人生进步的阶梯文章导航快速导航前言-项目背景与价值项目概览-系统架构与功能技术深度解析-核心算法原理️系统实现详解-工程实践细节性能评估与分析-实验结果分析Web系统开发-前后端开发部署与运维-DevOps实践完整复现指南-手把手教程️实践案例与故障排除-问
从零到一：打造基于GigaChat AI的艺术创作平台 | 笙囧同学的全栈开发实战
作者简介：笙囧同学，中科院计算机大模型方向硕士，全栈开发爱好者联系方式：[email protected]各大平台账号：笙囧同学座右铭：偷懒是人生进步的阶梯前言在AI技术飞速发展的今天，如何将前沿的大模型技术与实际应用相结合，一直是我们开发者关注的焦点。今天，笙囧同学将带大家从零开始，构建一个基于GigaChatAI的艺术创作平台，实现React前端+Django后端的完整全栈解决方案。这不仅仅是
如何运用深度学习打造高效AI人工智能系统 AI智能探索者 AI Agent 智能体开发实战人工智能深度学习 ai
如何运用深度学习打造高效AI人工智能系统关键词：深度学习、AI系统、神经网络、模型优化、实战开发摘要：本文将从深度学习的核心概念出发，结合生活实例和代码实战，系统讲解如何构建高效AI系统。我们会拆解数据准备、模型设计、训练优化、部署落地的全流程，揭秘“数据-模型-训练-推理”的协同机制，并通过具体案例演示从0到1开发AI系统的关键技巧，帮助开发者掌握打造高效AI系统的底层逻辑。背景介绍目的和范围在
零数学基础理解AI核心概念：梯度下降可视化实战九章云极AladdinEdu 人工智能 gpu算力深度学习 pytorch python 语言模型 opencv
点击“AladdinEdu，同学们用得起的【H卡】算力平台”，H卡级别算力，按量计费，灵活弹性，顶级配置，学生专属优惠。用Python动画演示损失函数优化过程，数学公式具象化读者收获：直观理解模型训练本质，破除"数学恐惧症"当盲人登山者摸索下山路径时，他本能地运用了梯度下降算法。本文将用动态可视化技术，让你像感受重力一样理解AI训练的核心原理——无需任何数学公式推导。一、梯度下降：AI世界的"万有
大数据精准获客并实现高转化的核心思路和实现方法 2401_88470328 大数据精准获客数据分析数据挖掘大数据需求分析 big data
大数据精准获客并实现高转化的核心思路和实现方法大数据精准获客并实现高转化的核心思路和实现方法在当今信息爆炸的时代，企业如何通过海量的数据精准获取潜在客户，并提高转化率，已经成为营销策略中的关键环节。大数据精准获客的核心思路在于数据驱动、多渠道触达以及优化转化路径，从而实现高效的市场推广和客户转化。数据驱动原理和机制数据驱动的核心在于通过分析用户行为数据，挖掘潜在客户的需求和喜好，从而制定更加精准的
一地鸡毛—一个中年男人的日常2021241 随止心语所自欲律
2021年8月31日，星期二，阴有小雨。早起5:30，跑步10公里。空气清新，烟雨朦胧，远山如黛，烟雾缭绕，宛若仙境。空气中湿气很大，朦胧细雨拍打在脸上，甚是舒服，跑步的人明显减少。早上开会，领导说起逐年大幅度下滑的工作业绩，越说越激动，说得脸红脖子粗。开完会又讨论了一下会议精神，心情也有波动，学习热情不高。心里还有一个大事，是今日大数据分析第1次考试，因自己前期没学，而且计算机编程方面没有任何基
【架构实战】AI系统架构设计全攻略：从蓝图到爆款，一步步打造成功！大模型入门教程架构人工智能系统架构产品经理 LLM 大模型学习大模型
某AI公司信心满满推出了一款智能客服，想用它解放客服人力，提升用户体验。可上线没几天，系统就频频崩溃，用户投诉像雪片一样飞来，最后公司不得不紧急下线产品，声誉一落千丈。这事儿听起来是不是有点惨？但它告诉我们一个真相：AI架构设计不是锦上添花，而是决定系统生死存亡的关键。今天我要和大家聊一个既高大上又接地气的话题——AI系统架构设计。别被“架构”这个词吓到，它其实就像盖房子的地基，决定了你的AI系统
springmvc 下 freemarker页面枚举的遍历输出杨白白 enum freemarker
spring mvc freemarker 中遍历枚举 1枚举类型有一个本地方法叫values（），这个方法可以直接返回枚举数组。所以可以利用这个遍历。 enum public enum BooleanEnum { TRUE(Boolean.TRUE, "是"), FALSE(Boolean.FALSE, "否");
实习简要总结 byalias 工作
来白虹不知不觉中已经一个多月了，因为项目还在需求分析及项目架构阶段，自己在这段时间都是在学习相关技术知识，现在对这段时间的工作及学习情况做一个总结：（1）工作技能方面大体分为两个阶段，Java Web 基础阶段和Java EE阶段 1）Java Web阶段在这个阶段，自己主要着重学习了 JSP, Servlet, JDBC, MySQL，这些知识的核心点都过了一遍，也
Quartz——DateIntervalTrigger触发器 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208559 一.概述 simpleTrigger 内部实现机制是通过计算间隔时间来计算下次的执行时间，这就导致他有不适合调度的定时任务。例如我们想每天的 1：00AM 执行任务，如果使用 SimpleTrigger，间隔时间就是一天。注意这里就会有一个问题，即当有 misfired 的任务并且恢复执行时，该执行时间
Unix快捷键 18289753290 unix Unix；快捷键;
复制，删除，粘贴： dd:删除光标所在的行 &nbs
获取Android设备屏幕的相关参数酷的飞上天空 android
包含屏幕的分辨率以及屏幕宽度的最大dp 高度最大dp TextView text = (TextView)findViewById(R.id.text); DisplayMetrics dm = new DisplayMetrics(); text.append("getResources().ge
要做物联网？先保护好你的数据蓝儿唯美数据
根据Beecham Research的说法，那些在行业中希望利用物联网的关键领域需要提供更好的安全性。在Beecham的物联网安全威胁图谱上，展示了那些可能产生内外部攻击并且需要通过快速发展的物联网行业加以解决的关键领域。 Beecham Research的技术主管Jon Howes说：“之所以我们目前还没有看到与物联网相关的严重安全事件，是因为目前还没有在大型客户和企业应用中进行部署，也就
Java取模（求余）运算随便小屋 java
整数之间的取模求余运算很好求，但几乎没有遇到过对负数进行取模求余，直接看下面代码： /** * * @author Logic * */ public class Test { public static void main(String[] args) { // TODO A
SQL注入介绍 aijuans sql注入
二、SQL注入范例这里我们根据用户登录页面 <form action="" > 用户名：<input type="text" name="username"><br/> 密码：<input type="password" name="passwor
优雅代码风格 aoyouzi 代码
总结了几点关于优雅代码风格的描述：代码简单：不隐藏设计者的意图，抽象干净利落，控制语句直截了当。接口清晰：类型接口表现力直白，字面表达含义，API 相互呼应以增强可测试性。依赖项少：依赖关系越少越好，依赖少证明内聚程度高，低耦合利于自动测试，便于重构。没有重复：重复代码意味着某些概念或想法没有在代码中良好的体现，及时重构消除重复。战术分层：代码分层清晰，隔离明确，
布尔数组百合不是茶 java 布尔数组
androi中提到了布尔数组; 布尔数组默认的是false, 并且只会打印false或者是true 布尔数组的例子; 根据字符数组创建布尔数组 char[] c = {'p','u','b','l','i','c'}; //根据字符数组的长度创建布尔数组的个数 boolean[] b = new bool
web.xml之welcome-file-list、error-page bijian1013 java web.xml servlet error-page
welcome-file-list 1.定义： <welcome-file-list> <welcome-file>login.jsp</welcome> </welcome-file-list> 2.作用：用来指定WEB应用首页名称。 error-page1.定义： <error-page&g
richfaces 4 fileUpload组件删除上传的文件 sunjing clear Richfaces 4 fileupload
页面代码 <h:form id="fileForm"> <rich:
技术文章备忘 bit1129 技术文章
Zookeeper http://wenku.baidu.com/view/bab171ffaef8941ea76e05b8.html http://wenku.baidu.com/link?url=8thAIwFTnPh2KL2b0p1V7XSgmF9ZEFgw4V_MkIpA9j8BX2rDQMPgK5l3wcs9oBTxeekOnm5P3BK8c6K2DWynq9nfUCkRlTt9uV
org.hibernate.hql.ast.QuerySyntaxException: unexpected token: on near line 1解决方案白糖_ Hibernate
文章摘自：http://blog.csdn.net/yangwawa19870921/article/details/7553181 在编写HQL时，可能会出现这种代码： select a.name,b.age from TableA a left join TableB b on a.id=b.id 如果这是HQL，那么这段代码就是错误的，因为HQL不支持
sqlserver按照字段内容进行排序 bozch 按照内容排序
在做项目的时候，遇到了这样的一个需求：从数据库中取出的数据集，首先要将某个数据或者多个数据按照地段内容放到前面显示，例如:从学生表中取出姓李的放到数据集的前面； select * fro
编程珠玑-第一章-位图排序 bylijinnan java 编程珠玑
import java.io.BufferedWriter; import java.io.File; import java.io.FileWriter; import java.io.IOException; import java.io.Writer; import java.util.Random; public class BitMapSearch {
Java关于==和equals chenbowen00 java
关于==和equals概念其实很简单，一个是比较内存地址是否相同，一个比较的是值内容是否相同。虽然理解上不难，但是有时存在一些理解误区，如下情况： 1、 String a = "aaa"; a=="aaa"; ==> true 2、 new String("aaa")==new String("aaa
[IT与资本]软件行业需对外界投资热情保持警惕 comsci it
我还是那个看法,软件行业需要增强内生动力,尽量依靠自有资金和营业收入来进行经营,避免在资本市场上经受各种不同类型的风险,为企业自主研发核心技术和产品提供稳定,温和的外部环境... 如果我们在自己尚未掌握核心技术之前,企图依靠上市来筹集资金,然后使劲往某个领域砸钱,然
oracle 数据块结构 daizj oracle 块数据块块结构行目录
oracle 数据块是数据库存储的最小单位，一般为操作系统块的N倍。其结构为：块头－－〉空行－－〉数据，其实际为纵行结构。块的标准大小由初始化参数DB_BLOCK_SIZE指定。具有标准大小的块称为标准块（Standard Block）。块的大小和标准块的大小不同的块叫非标准块（Nonstandard Block）。同一数据库中，Oracle9i及以上版本支持同一数据库中同时使用标
github上一些觉得对自己工作有用的项目收集 dengkane github
github上一些觉得对自己工作有用的项目收集技能类 markdown语法中文说明回到顶部全文检索 elasticsearch bigdesk elasticsearch管理插件回到顶部 nosql mapdb 支持亿级别map, list, 支持事务. 可考虑做为缓存使用 C
初二上学期难记单词二 dcj3sjt126com english word
dangerous 危险的 panda 熊猫 lion 狮子 elephant 象 monkey 猴子 tiger 老虎 deer 鹿 snake 蛇 rabbit 兔子 duck 鸭 horse 马 forest 森林 fall 跌倒；落下 climb 爬；攀登 finish 完成；结束 cinema 电影院；电影 seafood 海鲜；海产食品 bank 银行
8、mysql外键(FOREIGN KEY)的简单使用 dcj3sjt126com mysql
一、基本概念 1、MySQL中“键”和“索引”的定义相同，所以外键和主键一样也是索引的一种。不同的是MySQL会自动为所有表的主键进行索引，但是外键字段必须由用户进行明确的索引。用于外键关系的字段必须在所有的参照表中进行明确地索引，InnoDB不能自动地创建索引。 2、外键可以是一对一的，一个表的记录只能与另一个表的一条记录连接，或者是一对多的，一个表的记录与另一个表的多条记录连接。 3、如
java循环标签 Foreach shuizhaosi888 标签 java循环 foreach
1. 简单的for循环 public static void main(String[] args) { for (int i = 1, y = i + 10; i < 5 && y < 12; i++, y = i * 2) { System.err.println("i=" + i + " y="
Spring Security（05）——异常信息本地化 234390216 exception Spring Security 异常信息本地化
异常信息本地化 Spring Security支持将展现给终端用户看的异常信息本地化，这些信息包括认证失败、访问被拒绝等。而对于展现给开发者看的异常信息和日志信息（如配置错误）则是不能够进行本地化的，它们是以英文硬编码在Spring Security的代码中的。在Spring-Security-core-x
DUBBO架构服务端告警Failed to send message Response javamingtingzhao 架构 DUBBO
废话不多说，警告日志如下，不知道有哪位遇到过，此异常在服务端抛出(服务器启动第一次运行会有这个警告)，后续运行没问题，找了好久真心不知道哪里错了。 WARN 2015-07-18 22:31:15,272 com.alibaba.dubbo.remoting.transport.dispatcher.ChannelEventRunnable.run(84)
JS中Date对象中几个用法 leeqq JavaScript Date 最后一天
近来工作中遇到这样的两个需求 1. 给个Date对象，找出该时间所在月的第一天和最后一天 2. 给个Date对象，找出该时间所在周的第一天和最后一天需求1中的找月第一天很简单，我记得api中有setDate方法可以使用使用setDate方法前，先看看getDate var date = new Date(); console.log(date); // Sat J
MFC中使用ado技术操作数据库你不认识的休道人 sql mfc
1.在stdafx.h中导入ado动态链接库 #import"C:\Program Files\Common Files\System\ado\msado15.dll" no_namespace rename("EOF","end")2.在CTestApp文件的InitInstance()函数中domodal之前写::CoIniti
Android Studio加速 rensanning android studio
Android Studio慢、吃内存！启动时后会立即通过Gradle来sync & build工程。（1）设置Android Studio a) 禁用插件 File -> Settings... Plugins 去掉一些没有用的插件。比如：Git Integration、GitHub、Google Cloud Testing、Google Cloud
各数据库的批量Update操作 tomcat_oracle java oracle sql mysql sqlite
MyBatis的update元素的用法与insert元素基本相同，因此本篇不打算重复了。本篇仅记录批量update操作的 sql语句，懂得SQL语句，那么MyBatis部分的操作就简单了。　　注意：下列批量更新语句都是作为一个事务整体执行，要不全部成功，要不全部回滚。 MSSQL的SQL语句　WITH R AS（　　SELECT 'John' as name, 18 as
html禁止清除input文本输入缓存 xp9802 input
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; eg: <input type="text" autocomplete="off" name

第一章 数据仓库理论专题