卡拉叽里呱啦

维度建模工具箱提纲与总结

这里写自定义目录标题

基本概念
- 事实表和维度表
- BI(Business Intelligence) 产品
事实表
- 事实表的粒度
- 事实表的种类
维度表建模技术
- 基本原则
- - 避免用自然键作为维度表的主键，而要使用类似自增的整数键
  - 避免过度规范化
  - 避免变成形同事实表的维度表
- SCD(Slowly Changed Dimension)建模
其它常见规则
结语

这是一本数据仓库、维度建模领域的经典著作，但是也让我觉得枯燥至极。我好久没看到这么枯燥的书了——尤其是这蹩脚的翻译，为阅读增添了不少难度。这本书枯燥的原因（除了垃圾的翻译之外），可能是它太像一本工具书了，前十章都在用一个“尽量简单”的建模例子，引申出建模所要使用的一些技术。然而一般来说这种例子都非常枯燥，不知所云。其次是作者基本没有介绍书中出现的术语，比如“无事实的事实表”，“自然键”等，因此看到这些术语即觉得拗口，也很难快速吸收文字里的知识。如今已经读完这本书一月有余，希望用脑子里还剩下的东西来写一篇博文，说说这本书带给了我什么知识，必要的时候辅以工作中的实际例子来讲解一些术语。这篇文章先会进行背景介绍和基础术语介绍，然后讲解书中提到的基本建模方法。

基本概念

事实表和维度表

数据仓库中的表分为事实表和维度表。事实表一般存储了一系列事件，通常带有一些用以分析的度量（比如金额等数字），而维度表一般存储着一些相互关联的属性。举个最简单的例子，一个订单表是事实表，每一行存储着一次购物行为。而一个订单通常和以下这些“维度”都有关系，比如用户信息，比如物流信息，比如时间信息。

我们知道大数据领域，一般不太遵循SQL那一套规范化，也就是允许行与行之间有很多重复的字段。那为什么数仓里不直接把各种维度直接展开，全放到事实表里，而是要费劲地整一套维度建模理论？

首先，这里讨论的数仓并不只是数据的仓库，而是通常有一些实时查询的需求，下游可以直接从数仓的数据来构建BI报表。也就是整本书讨论的是可以支持BI下游的数仓，而不是一些基于HDFS之类的数仓。有了这一条件，数仓就有性能要求，因此抽取维度表的好处就有：

降低事实表的列数量，从而大大降低事实表的大小
BI软件通常可以较好地执行一级JOIN，尤其是JOIN KEY为int时。也就是说正常情况下，JOIN维度表的性能较好
提高列值的标准化程度，在列值转化为维度键的时候会先看维度表中是否已有类似的值，从而避免创建相似但类似的维度（比方说大小写不一样等）

通过上面的一大段阐述，就是为了说明维度建模是很重要、很实用的技术。只有技术有其实用性，接下来才有必要讨论如何更好地进行建模。

BI(Business Intelligence) 产品

经典的BI产品有微软的PowerBI等。BI产品可以方便地搭建动态的可视化报表。比如我们都用Excel画过柱状图、饼图等，这些就是可视化的图形。把这些图形放在一个页面里，可以叫它一个报表。比方说某个商店的报表里可以包含：

最近卖出最多的十件商品
卖的最好的十件新品
退货率最高的十件商品

这样，管理者可以一目了然他/她最关心的一些指标，方便他做出决策。

那什么叫动态报表呢？从我使用BI的经验来看，动态主要体现在两个方面

BI可以定时从数据库里获取最新的数据，从而自动更新报表展示的数值和统计图等
BI支持实时聚合计算，比方说一个大公司的产品会在多个区域进行售卖，管理者可能希望分析四川和浙江畅销商品的差别；产品也分为入门级和高端产品，管理者希望分别看到入门级和高端产品中哪些产品卖的比较好。如此繁多的分析需求，人工一个一个做出报表是费时费力的。而BI产品可以自动地根据某些维度过滤或聚合数据，得到用户想要的答案。这样用户分析的自由度也大大提升了，只要是原始数据里有的维度，都可以进行自助的分类分析。那原始数据里没有的维度该怎么办？让上游提供呗:)

事实表

事实表的粒度

介绍过事实表，和数仓在BI侧的应用，接下来可以讲解事实表的粒度设计。粒度在本书中被通篇强调，因为粒度决定了下游可以进行分析的精细程度。

比方说我们有一个原始订单表，记录了用户的每一个订单，那么订单表可以有两种设计方式，这两种设计方式的粒度不同：

以订单作为粒度，好比我们在淘宝购物车里一次性买了好几件商品，那么这一次下单，只会在订单表里产生一行事件
以每个订单的每种商品作为粒度，也就是假如一个订单买了商品1和商品2，那事实表里就会有两条记录

这两种设计的最大区别是什么？从下游应用（下游应用包含BI场景，或者其它分析场景）来看，如果下游希望进行商品维度的分析，那么只有第2种方式能满足。那你可能会说，我把每个订单购买的商品信息存下来不就行了吗？这样会增加分析的复杂程度，毕竟订单和商品是一对多的关系，最终需要一个数组或者更复杂的结构（想想我们不仅关心商品种类，还关心商品购买的数量）来存储。作者虽然不建议在数仓维度建模时进行规范化，但是作者觉得第一范式（也就是每个列不要存储复杂结构如数组、对象等）的底线还是要守住的。

OK，那你可能还会问，如果我要以订单作为分析对象该怎么办？有的分析只能以订单为粒度进行，比方说满减优惠。这时可以给商品订单加上订单维度，用以保存订单的相关信息，比如订单总金额，订单收货地址，订单优惠等。然后订单维度和商品订单事实表以外键关联。

不过一切设计在没有说清楚场景的时候，都很难比较。刚刚的分析是假定需要有很多基于商品的分析，假如情况并非如此，可能结果也不一样。

事实表的种类

事实表有三种基本种类

事务事实表：也就是通常所说的事实表，每次事件发生时会记录一行（或多行）。比如订单表，每个订单会多一行
周期快照事实表：通常是将事务事实表以某一周期汇总后进行分析。比如工作中常见的以日为周期、周为周期或者月为周期。按周期汇总可以去除时间不同带来的影响，比方说周末的商品销售量和工作日的一般有很大不同；还可以减少数据量，提高分析的性能。
累积快照事实表：这一名称非常令人困惑，我觉得叫多步骤事实表可能更直观一些。它通常记录了一系列事件的状态流转过程，比方说一个商品采购事实表，可能需要记录某批次采购的状态，包括合同签订、供应商发货、分发到子仓库等步骤，每个步骤有一些关键维度（比如接收人是谁，接收商品数量、接收金额等）和关键日期。这个表就很适合存储这样的多步骤事实。

那么可能有人会问了，3#看起来就像是把几类不同的事实粘合在一起，能用多个1#类事实表替代吗？
作者提到，SQL的跨行分析能力很差。假如我们希望找出第一阶段和第二阶段之间的时间差大于5天的慢流程，那就需要做一次多事实表JOIN得到临时表，然后再在临时表上做进一步分析。如果某些事实本身就具有3#可应用的模式，那何必强行用1#呢？

事实表还有一些特殊形式，比如

无事实的事实表：我觉得称它为无度量的事实表更好。这样的事实表中可能没有数字，比如一个用户使用数据表，只记录用户某时某刻使用了App的某一功能。这样的表虽然没有数字，但还属于事实表——或者可以将其看成度量为“1”的事实表，即用户某时某刻使用了某一功能，一次。这个“1”也是可加的，比方说可以用于统计用户当天使用了各个功能次数的分布，找到用户最常使用的功能，因此不要觉得没有度量就不是事实表。
聚集事实表：我觉得叫聚合事实表更合适。聚集事实表通常在原始表上选择某些维度进行聚合，以达到提高性能的目的。比方说周期快照事实表相当于是在时间维度聚合的聚集事实表。

维度表建模技术

基本原则

避免用自然键作为维度表的主键，而要使用类似自增的整数键

自然键通常指的是维度信息中具有现实意义的某些列，它们能唯一指定维度表中的一行（或者某些行，在需要保留更改记录的情况下）。自然键非常直观，比方说用产品SKU作为商品表的主键，事实表都通过SKU与商品表关联。那么为什么作者建议不要使用自然键作为维度表主键呢？主要原因大概有：

自然键是从特定的业务背景产生的，使用自然键带来的假设很可能会在未来被违背。比如说商品的SKU可能会被重复利用，当某一商品下架后一段时间，这个SKU就可能代表另一个商品。这样的维度表会给使用者带来很大困惑。
方便从多个数据源中集成数据，不用考虑多个数据源中自然键的定义是否相同，是否会重复等
整数的JOIN操作性能很好

避免过度规范化

我们知道在SQL数据库建模领域有第一范式、第二范式、第三范式等。而在数仓建模领域，通常只遵循第一范式，只要每个列都存储基础类型就可以。换个术语来说，数仓领域通常是星型模型（事实表在中央，与一系列维度表关联，就像从一个点发出多条射线一样），而不是雪花模型（事实表在中央与多个维度表关联，维度表还和一系列维度表关联，就像雪花，每个子结构都相似）。

为什么需要避免过度规范化？主要从性能和简单性出发考虑：

一层JOIN的性能还不错，多层JOIN性能差，不方便进行实时分析
星型模型只有一层，方便使用者理解

如果有的使用者担心非规范化存储了很多重复值，浪费了很多空间，作者的意见是，维度表的容量相对于事实表少了几个数量级，因此无需在意空间的浪费。

作者在本书中还反复提到了支架表。支架表的想法和雪花模型比较类似，大概就是把维度表中一些重复的属性抽成单独的维度表，并与主维度表关联。作者强调支架表可以用，但是尽量不要用，否则可能是走在过度规范化的路上——作者既然叫它“支架”而不是雪花，说明一般来说主维度也就和另一个副维度相关联。如果关联了好几个副维度，那可就不是支架而是真雪花了。

避免变成形同事实表的维度表

什么时候维度表会形同事实表呢？通常是事实表和维度表都使用了同一主键的时候。比方说一个订单表存储了用户的一次购买行为（以订单为粒度），而设计者觉得应该把订单信息（比如订单号、订单日期、订单金额等我就瞎说一通了）单独放到一个订单维度表里，而事实表里存放订单维度键、用户维度键等。这时会发现，事实表和维度表的行数是相同的。

也就是说，当看到维度表和事实表一样大时，就要觉得有点不对劲了。这两个表实际上是同一个表，因此解决方法是把两个表的字段合一（因为它们粒度相同，主键相同，因此合一不会有任何问题），然后再考虑抽取维度。可以参考第11章-电信中的评审例子来理解这一原则

SCD(Slowly Changed Dimension)建模

第五章主要讲解了SCD建模问题。书中称之为缓慢变化维度，但实际上只关注维度变化的问题，而不只是“缓慢”变化维度。从这一章之后，书中会时不时提到“第二类变化维度”这种词，指的就是第五章介绍的这些SCD建模方法

事件表的修改通常是追加新的事件来增加行数，修改一般也是订正错误的事件，所以一般来说，修改历史事件不太需要很多讨论。但维度表通常会被多个事实表、多行关联，因此维度表的修改要考虑的问题更多。比如说

当维度表更新时，所有关联事件的维度都会被更新，这是预期的吗？比方说需要让历史数据的维度保持原样，新修改的维度只影响新数据吗？
维度表更新速度有多快？比方说用户维度表中，包含了一个更新频率很高的字段：“用户积分”，但是其它字段比如用户姓名、城市等几乎不变化。在这种情况下，如果需要记录历史变更记录，那整个维度会因为“用户积分”维度，导致变化很频繁，甚至变化频率都要和事实表不相上下了——这样导致的问题是维度表会记录太多历史数据，过分庞大，而且大部分变化都只针对一个维度，无效存储太多。这时候就要考虑将快速变化的部分从缓慢变化维度中抽离出来

上面大致介绍了变化维度建模需要考虑的事项，接下来介绍具体的建模方法。需要注意从这一章开始

不变化维度：这算是缓慢变化维度的一种特例：只追加新值，但从不变化。比方说日期表
直接修改原来的维度行：最暴力，但是会造成所有与之关联的事件，维度都更新，无法保留变更记录
为每一行加上有效的起止时间，若修改已有的维度行，则会插入新行，并将旧行的截止时间设为新行开始时间(end-time exclusive)。
添加新列，表示最近几次修改记录：比如一个员工信息表，可以用“上个部门”和“当前部门”两个列来记录变化，通常在只关心最近几次变动的场景下比较实用
将快速变化部分从缓慢变化维度中抽取出来，同时使用范围值替代确定值：比如刚刚说的用户积分，可以使用用户消费等级这样的维度替代，比如消费0-5000元的为初级用户，10w+的为忠实用户等，避免维度快速变化给维度表带来太多更新。如果需要计算用户的真实积分数值，可以使用周期快照表等方式实现。
混合以上维度的方法：通常一个维度表中的属性很多，每个属性的特点也不同，因此可以混合以上的处理方法来处理某个维度表。比方说，为了方便起见，有的属性虽然需要保留历史数据，但我们希望还可以快速获取它当前的值，比方说对于员工信息表，我们希望每一行都有当前员工所在部门，和历史时期员工所在部门，我们就可以混合类型1和2建立维度表。每次员工部门变化时，我们既要运用类型2方法插入一行表明当前员工部门变化的数据（并设置旧数据的结束时间），还要把“当前部门”这一列全都刷成最新值。除此之外还有一些混合建模技术，可以通过书来查看。

其它常见规则

这些可以直接看11.2节“设计评审的一般性考虑”和16.9节 “需要避免的常见维度建模错误”，作者做了比较好的总结。

避免使用原始操作代码或者缩写作为维度属性，要使用人类可读的文本。比方说要用Yes/No（或者True/False，是/否等）来代表是否，而不要使用0/1，或者T/F这样摸棱两可的符号来节约空间。这样是为了让维度值有更好的可读性，而且也方便用户在BI应用上自主地分析数据，而不用跑去问数据源团队这个符号到底是什么意思
不论事实表或维度表，它们粒度要一致，比方说不要在日精度的表里塞入周汇总或月汇总数据，这样很容易造成统计错误（比如求和、计数）并且让使用者迷惑

结语

工作之后也没有太多时间看书或者写总结，这篇笔记也写得比较粗糙。如果有什么说得不对的或者希望讨论的也可以直接提出来

x86-64汇编语言训练程序与实战十除以十等于一
本文还有配套的精品资源，点击获取简介：汇编语言是一种低级语言，与机器代码紧密相关，特别适用于编写系统级代码及性能要求高的应用。nasm编译器是针对x86和x86-64架构的汇编语言编译器，支持多种语法风格和指令集。项目Euler提供数学和计算机科学问题，鼓励编程技巧应用，前100个问题的答案可共享。x86-64架构扩展了寄存器数量并引入新指令，提升了数据处理效率。学习汇编语言能够深入理解计算机底层
移动端城市区县二级联动选择功能实现包 good2know
本文还有配套的精品资源，点击获取简介：本项目是一套为移动端设计的jQuery实现方案，用于简化用户在选择城市和区县时的流程。它包括所有必需文件：HTML、JavaScript、CSS及图片资源。通过动态更新下拉菜单选项，实现城市到区县的联动效果，支持数据异步加载。开发者可以轻松集成此功能到移动网站或应用，并可基于需求进行扩展和优化。1.jQuery移动端解决方案概述jQuery技术简介jQuery
日更006 终极训练营day3 懒cici
人生创业课（2）今天的主题：学习方法一：遇到有用的书，反复读，然后结合自身实际，列践行清单，不要再写读书笔记思考这本书与我有什么关系，我在哪些地方能用到，之后我该怎么用方法二：读完书没映像怎么办?训练你的大脑，方法：每读完一遍书，立马合上书，做一场分享，几分钟都行对自己的学习要求太低，要逼自己方法三：学习深度不够怎么办？找到细分领域的榜样，把他们的文章、书籍、产品都体验一遍，成为他们的超级用户，向
（二）SAP Group Reporting (GR) 核心子模块功能及数据流向架构解析
数据如何从子公司流转到合并报表的全过程，即数据采集→合并引擎→报表输出，特别是HANA内存计算如何优化传统ETL瓶颈。SAPGroupReporting(GR)核心模块功能及数据流向的架构解析，涵盖核心组件、数据处理流程和关键集成点，适用于S/4HANA1809+版本：一、核心功能模块概览模块功能关键事务码/FioriApp数据采集(DataCollection)整合子公司财务数据（SAP/非SA
9、汇编语言编程入门：从环境搭建到简单程序实现神经网络酱汇编语言 MEPIS GNU工具链
汇编语言编程入门：从环境搭建到简单程序实现1.数据存储介质问题解决在处理数据存储时，若要使用MEPIS系统，需确保有其可访问的存储介质。目前，MEPIS无法向采用NTFS格式（常用于Windows2000和XP工作站）的硬盘写入数据。不过，若硬盘采用FAT32格式，MEPIS就能进行写入操作。此外，MEPIS还能将文件写入软盘和大多数USB闪存驱动器。若工作站连接到局域网，还可通过FTP协议或挂载
实时数据流计算引擎Flink和Spark剖析程小舰 flink spark 数据库 kafka hadoop
在过去几年，业界的主流流计算引擎大多采用SparkStreaming，随着近两年Flink的快速发展，Flink的使用也越来越广泛。与此同时，Spark针对SparkStreaming的不足，也继而推出了新的流计算组件。本文旨在深入分析不同的流计算引擎的内在机制和功能特点，为流处理场景的选型提供参考。（DLab数据实验室w.x.公众号出品）一.SparkStreamingSparkStreamin
MotionLCM 部署优化踩坑解决bug AI算法网奇 aigc与数字人深度学习宝典文生motion
目录依赖项windowstorchok：渲染黑白图问题解决：humanml3d：sentence-t5-large下载数据：报错：Nomodulenamed'sentence_transformers'继续报错：fromtransformers.integrationsimportCodeCarbonCallback解决方法：推理相关转mesh：module‘matplotlib.cm‘hasno
JVM 内存模型深度解析：原子性、可见性与有序性的实现练习时长两年半的程序员小胡 JVM 深度剖析：从面试考点到生产实践 jvm java 内存模型
在了解了JVM的基础架构和类加载机制后，我们需要进一步探索Java程序在多线程环境下的内存交互规则。JVM内存模型（JavaMemoryModel，JMM）定义了线程和主内存之间的抽象关系，它通过规范共享变量的访问方式，解决了多线程并发时的数据一致性问题。本文将从内存模型的核心目标出发，详解原子性、可见性、有序性的实现机制，以及volatile、synchronized等关键字在其中的作用。一、J
什么是缓存雪崩？缓存击穿？缓存穿透？分别如何解决？什么是缓存预热？ daixin8848 缓存 redis java 开发语言
缓存雪崩：在一个时间段内，有大量的key过期，或者Redis服务宕机，导致大量的请求到达数据库,带来巨大压力-给key设置不同的TTL、利用Redis集群提高服务的高可用性、添加多级缓存、添加降级流策略缓存击穿：给某一个key设置了过期时间，当key过期的时间，恰好这个时间点有大量的并发请求访问这个key，可能会瞬间把数据库压垮-互斥锁：缓存失败时，只允许一个请求去加载数据并更新缓存，其他请求阻塞
车载刷写架构 --- 整车刷写中为何增加了ECU 队列刷写策略？汽车电子实验室电子电器架构——刷写方案车载电子电气架构架构开发语言车载诊断进阶篇汽车中央控制单元HPC软件架构关于网关转发性能引起的思考
我是穿拖鞋的汉子，魔都中坚持长期主义的汽车电子工程师。老规矩，分享一段喜欢的文字，避免自己成为高知识低文化的工程师：周末洗了一个澡，换了一身衣服，出了门却不知道去哪儿，不知道去找谁，漫无目的走着，大概这就是成年人最深的孤独吧!旧人不知我近况，新人不知我过往，近况不该旧人知，过往不与新人讲。纵你阅人何其多，再无一人恰似我。时间不知不觉中，来到新的一年。2025开始新的忙碌。成年人的我也不知道去哪里渡
车载诊断架构 ---面向售后的DTC应该怎么样填写？汽车电子实验室车载电子电气架构漫谈UDS诊断协议系列 EV（电动汽车）常规知识必备架构面向售后的DTC 车载诊断架构 OEM怎么掌握软件开发能力车载通信网络槪述 android ZEVonUDS-J1979
我是穿拖鞋的汉子，魔都中坚持长期主义的汽车电子工程师。老规矩，分享一段喜欢的文字，避免自己成为高知识低文化的工程师：简单，单纯，喜欢独处，独来独往，不易合同频过着接地气的生活，除了生存温饱问题之外，没有什么过多的欲望，表面看起来很高冷，内心热情，如果你身边有这样灵性的人，一定要好好珍惜他们眼中有神有光，干净，给人感觉很舒服，有超强的感知能力有形的无形的感知力很强，能感知人的内心变化喜欢独处，好静，
车载诊断架构 --- 关于诊断时间参数P4的浅析汽车电子实验室车载电子电气架构漫谈UDS诊断协议系列架构开发语言关于网关转发性能引起的思考汽车中央控制单元HPC软件架构车载诊断进阶篇
关于诊断时间参数P4的浅析我是穿拖鞋的汉子，魔都中坚持长期主义的汽车电子工程师。老规矩，分享一段喜欢的文字，避免自己成为高知识低文化的工程师：所谓鸡汤，要么蛊惑你认命，要么怂恿你拼命，但都是回避问题的根源，以现象替代逻辑，以情绪代替思考，把消极接受现实的懦弱，伪装成乐观面对不幸的豁达，往不幸上面喷“香水”来掩盖问题。无人问津也好,技不如人也罢,你都要试着安静下来,去做自己该做的事.而不是让内心的烦
车载刷写架构 --- 刷写思考扩展汽车电子实验室电子电器架构——刷写方案架构开发语言关于网关转发性能引起的思考汽车中央控制单元HPC软件架构车载诊断进阶篇
我是穿拖鞋的汉子，魔都中坚持长期主义的汽车电子工程师。老规矩，分享一段喜欢的文字，避免自己成为高知识低文化的工程师：做到欲望极简，了解自己的真实欲望，不受外在潮流的影响，不盲从，不跟风。把自己的精力全部用在自己。一是去掉多余，凡事找规律，基础是诚信；二是系统思考、大胆设计、小心求证；三是“一张纸制度”，也就是无论多么复杂的工作内容，要在一张纸上描述清楚；四是要坚决反对虎头蛇尾，反对繁文缛节，反对老
2018-09-27 aop相关蒋超_58dc
1.静态织入，需要使用aspectj专用的compilermaven工程可以采用：https://www.mojohaus.org/aspectj-maven-plugin/2.动态织入，配合spring，创建代理来执行3.
JAVA接口机结构解析秃狼 SpringBoot 八股文 Java java 学习
什么是接口机在Java项目中，接口机通常指用于与外部系统进行数据交互的中间层，负责处理请求和响应的转换、协议适配、数据格式转换等任务。接口机的结构我们的接口机的结构分为两个大部分，外部接口机和内部接口机，在业务的调度上也是通过mq来实现的，只要的目的就是为了解耦合和做差异化。在接口机中主要的方法就是定时任务，消息的发送和消费，其他平台调用接口机只能提供外部接口机的方法进行调用，外部接口机可以提供消
Aop +反射实现方法版本动态切换
需求分析在做技术选型的时候一直存在着两个声音，mongo作为数据库比较mysql好，mysql做为该数据比mongo好。当然不同数据库都有有着自己的优势，我们在做技术选型的时候无非就是做到对数据库的扬长避短。mysql最大的优势就是支持事务，事务的五大特性保证的业务可靠性，随之而来的就是事务会产生的问题：脏读、幻读、不可重复度，当然我们也会使用不同的隔离级别来解决。（最典型的业务问题：银行存取钱）
最新阿里四面面试真题46道：面试技巧+核心问题+面试心得风平浪静如码
前言做技术的有一种资历，叫做通过了阿里的面试。这些阿里Java相关问题，都是之前通过不断优秀人才的铺垫总结的，先自己弄懂了再去阿里面试，不然就是去丢脸，被虐。希望对大家帮助，祝面试成功，有个更好的职业规划。一，阿里常见技术面1、微信红包怎么实现。2、海量数据分析。3、测试职位问的线程安全和非线程安全。4、HTTP2.0、thrift。5、面试电话沟通可能先让自我介绍。6、分布式事务一致性。7、ni
上半年居民消费榜出炉！这个城市的人最能花 BBM优选官方
上半年居民消费榜出炉哪个地方的人最能花钱？国家统计局公布的数据显示上海上半年居民人均可支配收入32612元居民人均消费支出21321元均为全国最高成为最能挣钱也最能花钱的城市1上海人均消费支出全国第一国家统计局公布的31省份居民人均消费支出数据显示，上海、北京、天津上半年居民人均消费支出排名前三。其中，上海上半年居民人均消费支出21321元，位居榜首。上海也是上半年全国仅有的居民人均消费支出突破2
【花了N长时间读《过犹不及》，不断练习，可以越通透】君君Love
我已经记不清花了多长时间去读《过犹不及》，读书笔记都写了42页，这算是读得特别精细的了。是一本难得的好书，虽然书中很多内容和圣经吻合，我不是基督徒，却觉得这样的文字值得细细品味，和我们的生活息息相关。我是个界线建立不牢固的人，常常愧疚，常常害怕他人的愤怒，常常不懂拒绝，还有很多时候表达不了自己真实的感受，心里在说不嘴里却在说好……这本书给我很多的启示，让我学会了怎样去建立属于自己的清晰的界限。建立
编程算法：技术创新的引擎与业务增长的核心驱动力
在数字经济时代，算法已成为推动技术创新与业务增长的隐形引擎。从存内计算突破冯·诺依曼瓶颈，到动态规划优化万亿级金融交易，编程算法正在重塑产业竞争格局。一、存内计算：突破冯·诺依曼瓶颈的算法革命1.1存内计算的基本原理传统计算架构中90%的能耗消耗在数据搬运上。存内计算（Processing-in-Memory）通过直接在存储单元执行计算，实现能效10-100倍提升：#传统计算vs存内计算能耗模型i
基于redis的Zset实现作者的轻量级排名周童學 Java redis 数据库缓存
基于redis的Zset实现轻量级作者排名系统在今天的技术架构中，Redis是一种广泛使用的内存数据存储系统，尤其在需要高效检索和排序的场景中表现优异。在本篇博客中，我们将深入探讨如何使用Redis的有序集合（ZSet）构建一个高效的笔记排行榜系统，并提供相关代码示例和详细的解析。1.功能背景与需求假设我们有一个笔记分享平台，用户可以发布各种笔记，系统需要根据用户发布的笔记数量来生成一个实时更新的
【项目实战】容错机制与故障恢复：保障系统连续性的核心体系本本本添哥 004 -研效与DevOps运维工具链 002 -进阶开发能力分布式
在分布式系统中，硬件故障、网络波动、软件异常等问题难以避免。容错机制与故障恢复的核心目标是：通过主动检测故障、自动隔离风险、快速转移负载、重建数据一致性，最大限度减少故障对业务的影响，保障系统“持续可用”与“数据不丢失”。以下从核心机制、实现方式、典型案例等维度展开说明。一、故障检测：及时发现异常节点故障检测是容错的第一步，需通过多维度手段实时感知系统组件状态，确保故障被快速识别。1.健康检查与心
营销活动-大转盘無缺520
写在前面最近，首先营销活动工具这块我是再熟悉不过了。曾经做了不下20个活动工具，然后通过监控活动数据反推活动的好坏。文中主要讲解幸运大转盘营销工具一.大转盘定义大转盘是比较常见的营销活动工具，它是通过消费者用户控制【开始/停止】操作获得奖品物品。用户在不知道自己能获得什么奖品的条件下，然后通过抽奖，大概率的获得未知的奖品。类似最近流行的盲盒玩法。二.为什么做大转盘大转盘是最常用的抽奖类的活动工具之
Java 队列 tryxr java 开发语言队列
队列一般用什么哪种结构实现队列的特性数据入队列时一定是从尾部插入吗数据出队列时一定是从头部删除吗队列的基本运算有什么队列支持随机访问吗队列的英文表示什么是队列队列从哪进、从哪出队列的进出顺序队列是用哪种结构实现的Queue和Deque有什么区别Queue接口的方法Queue中的add与offer的区别offer、poll、peek的模拟实现如何利用链表实现队列如何利用顺序表实现队列什么叫做双端队列
分支和循环（下） tryxr 服务器运维
写⼀个猜数字游戏游戏要求：1.电脑⾃动⽣成1~100的随机数2.玩家猜数字，猜数字的过程中，根据猜测数据的⼤⼩给出⼤了或⼩了的反馈，直到猜对，游戏结束1.随机数生成要想完成猜数字游戏，⾸先得产⽣随机数，那怎么产⽣随机数呢？randC语⾔提供了⼀个函数叫rand，这函数是可以⽣成随机数的，函数原型如下所⽰：intrand(void);rand函数会返回⼀个伪随机数，这个随机数的范围是在0~RAND_
5G-RAN与语义通信RAN 一去不复返的通信er 智简网络&语义通信 5G 人工智能语义通信
1️⃣RAN协议栈与TCP/IP五层协议栈的对应关系a.物理层（TCP/IP）↔PHY（RAN）对应关系：5GNRRAN的物理层直接对应TCP/IP的物理层。功能对比：TCP/IP物理层：负责比特流的物理传输，如通过电缆、光纤或无线介质传输信号。RAN物理层：处理无线信号的调制、编码、信道估计和传输（如OFDM、LDPC编码）。在5GNR中，物理层负责将数据映射到无线信道（如PDSCH、PUSCH
第二十二天（数据结构，无头节点的单项链表）肉夹馍不加青椒 c语言数据结构
线性表：一个线性表里面可以是任意的数据元素，但是同一个线性表里面数据应该是同类型的1存在一个/唯一被称为第一个节点的节点2存在一个/唯一被称为最后一个节点的节点3除了第一个以外，每一个元素都有一个前驱节点4除了最后一个，每一个元素都有一个后继节点满足以上性质，这个表就被称为线性表数组就是一个线性表想实现线性表的保存，我们需要考虑下面的事情1元素要保存2元素与元素之间的序偶关系谁是前面的谁是后面的我
旧系统UI焕新陷阱：保留业务习惯与引入新交互的平衡点把控贝格前端工场 ui 交互
摘要**想给老旧系统换上“高颜值新衣”，却遭遇员工集体吐槽“不会用”？满心期待新交互能提升效率，结果用户操作频频出错，业务进度反而被拖慢？旧系统UI焕新本是优化体验的好机会，可在保留多年养成的业务操作习惯，与引入更先进便捷的新交互方式之间，却横亘着巨大鸿沟。稍有不慎，就会陷入“改了不如不改”的尴尬境地。这场关于“守旧”与“创新”的博弈，究竟该如何破局？一、旧系统UI焕新：一场甜蜜又棘手的改造工程旧
AI模型训练中过拟合和欠拟合的区别是什么？ workflower 人工智能算法人工智能数据分析
在AI模型训练中，过拟合和欠拟合是两种常见的模型性能问题，核心区别在于模型对数据的学习程度和泛化能力：欠拟合（Underfitting）-定义：模型未能充分学习到数据中的规律，对训练数据的拟合程度较差，在训练集和测试集上的表现都不好（如准确率低、损失值高）。-原因：-模型结构过于简单（如用线性模型解决非线性问题）；-训练数据量不足或特征信息不充分；-训练时间太短，模型尚未学到有效模式。-表现：训练
mysql复习立夏的李子 mysql 数据库 database
mysqlselect语法selectfromjoinwheregroupbyhavingorderbylimit联合查询innerjoin（）leftjoin（以左表为基准，匹配右表，不匹配的返回左表，右表以null值填充）rightjoind··(去除列重复的数据)索引类型主键索引(PrimaryKey)唯一索引(Unique)常规索引(Index)全文索引(FullText)索引准则索引不是
apache ftpserver-CentOS config gengzg apache
<server xmlns="http://mina.apache.org/ftpserver/spring/v1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation=" http://mina.apache.o
优化MySQL数据库性能的八种方法 AILIKES sql mysql
1、选取最适用的字段属性　　MySQL可以很好的支持大数据量的存取，但是一般说来，数据库中的表越小，在它上面执行的查询也就会越快。因此，在创建表的时候，为了获得更好的性能，我们可以将表中字段的宽度设得尽可能小。例如，在定义邮政编码这个字段时，如果将其设置为CHAR(255),显然给数据库增加了不必要的空间，甚至使用VARCHAR这种类型也是多余的，因为CHAR(6)就可以很
JeeSite 企业信息化快速开发平台 Kai_Ge JeeSite
JeeSite 企业信息化快速开发平台平台简介 JeeSite是基于多个优秀的开源项目，高度整合封装而成的高效，高性能，强安全性的开源Java EE快速开发平台。 JeeSite本身是以Spring Framework为核心容器，Spring MVC为模型视图控制器，MyBatis为数据访问层， Apache Shiro为权限授权层，Ehcahe对常用数据进行缓存，Activit为工作流
通过Spring Mail Api发送邮件 120153216 邮件 main
原文地址：http://www.open-open.com/lib/view/open1346857871615.html 使用Java Mail API来发送邮件也很容易实现，但是最近公司一个同事封装的邮件API实在让我无法接受，于是便打算改用Spring Mail API来发送邮件，顺便记录下这篇文章。【Spring Mail API】 Spring Mail API都在org.spri
Pysvn 程序员使用指南 2002wmj SVN
源文件:http://ju.outofmemory.cn/entry/35762 这是一篇关于pysvn模块的指南. 完整和详细的API请参考 http://pysvn.tigris.org/docs/pysvn_prog_ref.html. pysvn是操作Subversion版本控制的Python接口模块. 这个API接口可以管理一个工作副本, 查询档案库, 和同步两个. 该
在SQLSERVER中查找被阻塞和正在被阻塞的SQL 357029540 SQL Server
SELECT R.session_id AS BlockedSessionID , S.session_id AS BlockingSessionID , Q1.text AS Block
Intent 常用的用法备忘 7454103 .net android Google Blog F#
Intent 应该算是Android中特有的东西。你可以在Intent中指定程序要执行的动作（比如：view,edit,dial），以及程序执行到该动作时所需要的资料。都指定好后，只要调用startActivity()，Android系统会自动寻找最符合你指定要求的应用程序，并执行该程序。下面列出几种Intent 的用法显示网页:
Spring定时器时间配置 adminjun spring 时间配置定时器
红圈中的值由6个数字组成，中间用空格分隔。第一个数字表示定时任务执行时间的秒，第二个数字表示分钟，第三个数字表示小时，后面三个数字表示日，月，年，< xmlnamespace prefix ="o" ns ="urn:schemas-microsoft-com:office:office" /> 测试的时候，由于是每天定时执行，所以后面三个数
POJ 2421 Constructing Roads 最小生成树 aijuans 最小生成树
来源：http://poj.org/problem?id=2421 题意：还是给你n个点，然后求最小生成树。特殊之处在于有一些点之间已经连上了边。思路：对于已经有边的点，特殊标记一下，加边的时候把这些边的权值赋值为0即可。这样就可以既保证这些边一定存在，又保证了所求的结果正确。代码： #include <iostream> #include <cstdio>
重构笔记——提取方法（Extract Method） ayaoxinchao java 重构提炼函数局部变量提取方法
提取方法（Extract Method）是最常用的重构手法之一。当看到一个方法过长或者方法很难让人理解其意图的时候，这时候就可以用提取方法这种重构手法。下面是我学习这个重构手法的笔记：提取方法看起来好像仅仅是将被提取方法中的一段代码，放到目标方法中。其实，当方法足够复杂的时候，提取方法也会变得复杂。当然，如果提取方法这种重构手法无法进行时，就可能需要选择其他
为UILabel添加点击事件 bewithme UILabel
默认情况下UILabel是不支持点击事件的，网上查了查居然没有一个是完整的答案，现在我提供一个完整的代码。 UILabel *l = [[UILabel alloc] initWithFrame:CGRectMake(60, 0, listV.frame.size.width - 60, listV.frame.size.height)]
NoSQL数据库之Redis数据库管理(PHP-REDIS实例) bijian1013 redis 数据库 NoSQL
一.redis.php <?php //实例化 $redis = new Redis(); //连接服务器 $redis->connect("localhost"); //授权 $redis->auth("lamplijie"); //相关操
SecureCRT使用备注 bingyingao secureCRT 每页行数
SecureCRT日志和卷屏行数设置一、使用securecrt时，设置自动日志记录功能。 1、在C:\Program Files\SecureCRT\下新建一个文件夹(也就是你的CRT可执行文件的路径），命名为Logs； 2、点击Options -> Global Options -> Default Session -> Edite Default Sett
【Scala九】Scala核心三：泛型 bit1129 scala
泛型类 package spark.examples.scala.generics class GenericClass[K, V](val k: K, val v: V) { def print() { println(k + "," + v) } } object GenericClass { def main(args: Arr
素数与音乐 bookjovi 素数数学 haskell
由于一直在看haskell，不可避免的接触到了很多数学知识，其中数论最多，如素数，斐波那契数列等，很多在学生时代无法理解的数学现在似乎也能领悟到那么一点。闲暇之余，从图书馆找了<<The music of primes>>和<<世界数学通史>>读了几遍。其中素数的音乐这本书与软件界熟知的&l
Java-Collections Framework学习与总结-IdentityHashMap BrokenDreams Collections
这篇总结一下java.util.IdentityHashMap。从类名上可以猜到，这个类本质应该还是一个散列表，只是前面有Identity修饰，是一种特殊的HashMap。简单的说，IdentityHashMap和HashM
读《研磨设计模式》-代码笔记-享元模式-Flyweight bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.HashMap; import java.util.List; import java
PS人像润饰&调色教程集锦 cherishLC PS
1、仿制图章沿轮廓润饰——柔化图像，凸显轮廓 http://www.howzhi.com/course/retouching/ 新建一个透明图层，使用仿制图章不断Alt+鼠标左键选点，设置透明度为21%，大小为修饰区域的1/3左右（比如胳膊宽度的1/3），再沿纹理方向（比如胳膊方向）进行修饰。所有修饰完成后，对该润饰图层添加噪声，噪声大小应该和
更新多个字段的UPDATE语句 crabdave update
更新多个字段的UPDATE语句 update tableA a set (a.v1, a.v2, a.v3, a.v4) = --使用括号确定更新的字段范围
hive实例讲解实现in和not in子句 daizj hive not in in
本文转自：http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2842855.html 当前hive不支持 in或not in 中包含查询子句的语法，所以只能通过left join实现。假设有一个登陆表login(当天登陆记录,只有一个uid),和一个用户注册表regusers(当天注册用户，字段只有一个uid)，这两个表都包含
一道24点的10+种非人类解法（2,3,10,10） dsjt 算法
这是人类算24点的方法？！！！事件缘由：今天晚上突然看到一条24点状态，当时惊为天人，这NM叫人啊？以下是那条状态朱明西 : 24点，算2 3 10 10，我LX炮狗等面对四张牌痛不欲生，结果跑跑同学扫了一眼说，算出来了，2的10次方减10的3次方。。我草这是人类的算24点啊。。然后么。。。我就在深夜很得瑟的问室友求室友算刚出完题，文哥的暴走之旅开始了 5秒后
关于YII的菜单插件 CMenu和面包末breadcrumbs路径管理插件的一些使用问题 dcj3sjt126com yii framework
在使用 YIi的路径管理工具时，发现了一个问题。 <?php
对象与关系之间的矛盾：“阻抗失配”效应[转] come_for_dream 对象
概述 “阻抗失配”这一词组通常用来描述面向对象应用向传统的关系数据库（RDBMS）存放数据时所遇到的数据表述不一致问题。C++程序员已经被这个问题困扰了好多年，而现在的Java程序员和其它面向对象开发人员也对这个问题深感头痛。 “阻抗失配”产生的原因是因为对象模型与关系模型之间缺乏固有的亲合力。“阻抗失配”所带来的问题包括：类的层次关系必须绑定为关系模式（将对象
学习编程那点事 gcq511120594 编程互联网
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
Reverse Linked List II hcx2013 list
Reverse a linked list from position m to n. Do it in-place and in one-pass. For example:Given 1->2->3->4->5->NULL, m = 2 and n = 4, return
Spring4.1新特性——页面自动化测试框架Spring MVC Test HtmlUnit简介 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Hadoop集群工具distcp liyonghui160com
1. 环境描述两个集群：rock 和 stone rock无kerberos权限认证，stone有要求认证。 1. 从rock复制到stone，采用hdfs Hadoop distcp -i hdfs://rock-nn:8020/user/cxz/input hdfs://stone-nn:8020/user/cxz/运行在rock端，即源端问题：报版本
一个备份MySQL数据库的简单Shell脚本 pda158 mysql 脚本
　　主脚本（用于备份mysql数据库）：　　该Shell脚本可以自动备份数据库。只要复制粘贴本脚本到文本编辑器中，输入数据库用户名、密码以及数据库名即可。我备份数据库使用的是mysqlump 命令。后面会对每行脚本命令进行说明。　　 1. 分别建立目录“backup”和“oldbackup” 　　#mkdir /backup 　　#mkdir /oldbackup 　
300个涵盖IT各方面的免费资源（中）——设计与编码篇 shoothao IT资源图标库图片库色彩板字体
A. 免费的设计资源 Freebbble:来自于Dribbble的免费的高质量作品。 Dribbble:Dribbble上“免费”的搜索结果——这是巨大的宝藏。 Graphic Burger:每个像素点都做得很细的绝佳的设计资源。 Pixel Buddha:免费和优质资源的专业社区。 Premium Pixels:为那些有创意的人提供免费的素材。
thrift总结 - 跨语言服务开发 uule thrift
官网官网JAVA例子 thrift入门介绍 IBM-Apache Thrift - 可伸缩的跨语言服务开发框架 Thrift入门及Java实例演示 thrift的使用介绍 RPC POM： <dependency> <groupId>org.apache.thrift</groupId>

维度建模工具箱 提纲与总结