数据库管理艺术

数据库领域的秘密武器——物化视图

物化视图：数据库性能优化的理论基石与工程实践

关键词

物化视图、预计算聚合、查询加速、存储换时间、数据库优化、一致性维护、OLAP加速

摘要

物化视图作为数据库领域的“秘密武器”，通过预计算和存储复杂查询结果，在OLAP（联机分析处理）、数据仓库等场景中实现了查询性能的指数级提升。本文从第一性原理出发，系统解析物化视图的理论基础、架构设计、实现机制与工程实践，覆盖从概念定义到未来演化的全生命周期。通过层次化解释框架（专家→中级→入门），结合数学形式化、Mermaid可视化与真实案例，揭示其“存储换时间”的核心权衡逻辑，同时探讨一致性维护、动态扩展等关键挑战，为技术人员提供从理论到实践的完整知识图谱。

一、概念基础

1.1 领域背景化

现代数据库系统面临两类核心负载：OLTP（联机事务处理）与OLAP。OLAP场景中，用户常需执行跨多张表、含复杂聚合（如SUM/COUNT）、多维度过滤（如时间范围、地域分组）的分析查询。这类查询的典型特征是：

高计算复杂度：涉及表连接（JOIN）、排序（ORDER BY）、窗口函数（ROW_NUMBER）等操作
低更新频率：分析对象多为历史数据，写入操作远少于读取
高响应要求：业务决策需要秒级甚至亚秒级结果返回

传统数据库通过索引（Index）优化点查询，但对复杂分析查询的加速效果有限。物化视图（Materialized View）通过预计算并存储查询结果，将“实时计算”转化为“直接读取”，成为OLAP性能优化的核心技术。

1.2 历史轨迹

1970s-1980s：理论萌芽
早期数据库研究（如Codd的关系模型）提出“视图”（View）概念，但仅为逻辑定义，查询时动态计算。1978年，IBM研究人员首次提出“物化视图”概念，主张存储视图结果以加速重复查询。
1990s：工程落地
随着数据量激增（GB→TB级），Oracle 8i（1999）首次实现商用物化视图，支持基于日志的增量刷新。同期，数据仓库系统（如Teradata）将其作为核心优化手段。
2000s-至今：智能化演进
现代数据库（如PostgreSQL 9.3+、Amazon Redshift、ClickHouse）支持自动物化视图选择（Auto-MV）、多版本并发控制（MVCC）下的一致性维护，以及与AI结合的自适应刷新策略。

1.3 问题空间定义

物化视图解决的核心问题是查询性能与存储成本的权衡：

性能维度：如何将O(N²)复杂度的JOIN+AGG查询降至O(1)读取
存储维度：预计算结果需占用额外空间，可能与主数据形成1:1甚至更高的存储比
一致性维度：基表（Base Table）更新时，如何保证物化视图与主数据的一致性（强一致/最终一致）

1.4 术语精确性

需明确区分以下概念：

术语	定义	关键差异
普通视图（View）	逻辑查询定义，无物理存储；查询时动态执行定义的SQL	无存储，无维护成本
物化视图（MV）	物理存储的查询结果集；需定期/实时刷新以保持与基表一致	有存储，需维护
查询缓存（Cache）	临时存储最近查询结果；基于LRU等策略淘汰；无主动刷新机制	临时性，无一致性保证
索引（Index）	按特定列排序的辅助存储结构；加速点查询/范围查询，但无法预计算聚合结果	仅优化访问路径，不存储结果集

二、理论框架

2.1 第一性原理推导

从数据库系统的基本公理出发：
公理1：I/O操作成本远高于CPU计算（磁盘I/O约10⁻³秒/次，CPU计算约10⁻⁹秒/次）
公理2：重复查询相同数据的概率服从Zipf分布（20%查询占80%执行次数）

设某分析查询Q的执行成本为：
$I/O_{scan} \times S + CPU_{exec} \times O$
其中：

( I/O_{scan} )：扫描基表的数据量（MB）
( S )：每MB I/O成本（$/MB）
( CPU_{exec} )：查询执行的操作数（如JOIN次数、聚合次数）
( O )：每个操作的CPU成本（$/op）

若对Q创建物化视图MV，其存储成本为：
$I/O_{store} \times M + T_{refresh} \times R$
其中：

( I/O_{store} )：存储MV的数据量（MB）
( M )：每MB存储成本（$/MB/月）
( T_{refresh} \times R )：刷新成本（每次刷新时间×刷新频率）

当 ( C(Q) \times F > C(MV) )（F为查询频率）时，物化视图具备经济合理性。

2.2 数学形式化

2.2.1 查询代价模型

设基表集合为 ( B = {B_1, B_2, …, B_n} )，查询Q定义为 ( Q(B) = \sigma_{pred}(B_1 \bowtie B_2 \bowtie … \bowtie B_n) )（过滤后的连接结果），其执行时间 ( T(Q) ) 可分解为：
$T(Q) = T_{scan}(B) + T_{join}(B) + T_{agg}(B)$

物化视图MV存储 ( Q(B) ) 的结果，查询时直接读取MV，时间降至 ( T(MV) = T_{scan}(MV) )。由于 ( |MV| \ll |B_1 \bowtie … \bowtie B_n| )（MV仅存储过滤后的结果），( T_{scan}(MV) \ll T_{scan}(B) )。

2.2.2 一致性维护模型

基表更新操作集合为 ( U = {u_1, u_2, …, u_m} )，每个更新 ( u_i ) 影响基表 ( B_j ) 的元组 ( t_k )。物化视图的刷新需将 ( U ) 映射到MV的变更 ( \Delta MV )，满足：
$MV_{new} = MV_{old} \oplus \Delta MV$

增量刷新的关键是找到 ( \Delta MV ) 与 ( U ) 的对应关系。例如，若Q包含COUNT(*)，则每个插入操作 ( u_{insert} ) 对应 ( \Delta MV = +1 )。

2.3 理论局限性

存储爆炸：若对所有可能查询创建MV，存储成本可能指数级增长（如星型模式中，维度表组合数可达 ( 2^d )，d为维度数）。
维护延迟：实时刷新（Refresh on Commit）会增加写操作延迟（写放大），异步刷新（Refresh on Timer）可能导致查询结果不一致。
基表依赖：基表结构变更（如添加/删除列）可能导致MV失效，需手动重建。

2.4 竞争范式分析

技术方案	核心优势	适用场景	局限性
物化视图	显著降低复杂查询延迟	OLAP、数据仓库、高频分析查询	存储成本高，维护复杂
索引	优化点查询/范围查询	OLTP、点查为主的场景	无法加速聚合、多表连接查询
内存数据库	消除磁盘I/O，加速所有查询	实时分析、小数据集场景	内存成本高，数据易丢失
查询缓存	无存储维护成本，通用加速	临时查询、低一致性要求场景	无主动刷新，结果可能过时

三、架构设计

3.1 系统分解

物化视图的核心组件可分解为：

元数据管理器：存储MV的定义（SQL查询、基表依赖、刷新策略）、统计信息（行数、大小、最后刷新时间）。
查询优化器：在查询执行时，识别可匹配的MV，选择直接读取MV而非执行原始查询。
刷新引擎：监听基表变更（通过触发器或日志），生成增量变更集（Delta），更新MV数据。
存储引擎：以与基表相同的存储格式（如B-Tree、LSM-Tree）存储MV数据，支持快速读取。

3.2 组件交互模型

是

否

客户端查询

查询解析器

查询优化器

是否存在匹配的MV?

读取物化视图

执行原始查询

返回结果

基表更新

事务日志

刷新引擎

生成Delta

更新物化视图

更新元数据

3.3 设计模式应用

观察者模式：基表作为被观察者（Subject），物化视图作为观察者（Observer），基表更新时触发MV刷新（类似数据库触发器）。
策略模式：刷新引擎支持多种刷新策略（如完全刷新、增量刷新），通过策略接口动态切换。
模板方法模式：元数据管理器定义MV生命周期的通用流程（创建→刷新→删除），具体数据库（如Oracle/PostgreSQL）实现细节。

四、实现机制

4.1 算法复杂度分析

4.1.1 完全刷新（Refresh Complete）

重新执行原始查询，覆盖MV的所有数据。时间复杂度 ( O(T(Q)) )（与原始查询执行时间相同），空间复杂度 ( O(|MV|) )（需覆盖旧数据）。

4.1.2 增量刷新（Refresh Incremental）

仅更新受基表变更影响的MV数据。假设基表变更量为 ( \Delta B )，则时间复杂度 ( O(T(Q(\Delta B))) )（仅处理变更部分），空间复杂度 ( O(|\Delta MV|) )（仅存储增量）。

关键挑战：如何高效计算 ( \Delta B ) 对MV的影响。例如，若原始查询为 ( SELECT dept, SUM(salary) FROM employees GROUP BY dept )，则插入一条员工记录（dept=5, salary=10000）时，需找到MV中dept=5的记录，将SUM(salary)增加10000。

4.2 优化代码实现（以PostgreSQL为例）

4.2.1 创建物化视图

-- 创建基表
CREATE TABLE employees (
    id SERIAL PRIMARY KEY,
    dept INTEGER,
    salary INTEGER,
    hire_date DATE
);

-- 创建物化视图（按部门统计薪资总和与员工数）
CREATE MATERIALIZED VIEW dept_salary_stats AS
SELECT dept, SUM(salary) AS total_salary, COUNT(*) AS employee_count
FROM employees
GROUP BY dept
WITH DATA; -- WITH DATA表示立即计算并存储结果

4.2.2 增量刷新实现（伪代码）

class MaterializedView:
    def __init__(self, base_tables, query):
        self.base_tables = base_tables  # 基表列表
        self.query = query              # 原始查询
        self.data = None                # 存储的物化结果
        self.last_refresh_lsn = 0       # 最后刷新的日志序列号（LSN）

    def incremental_refresh(self):
        # 1. 获取基表自last_refresh_lsn后的所有变更
        delta = []
        for table in self.base_tables:
            delta += table.get_changes_since(self.last_refresh_lsn)
        
        # 2. 对每个变更应用到物化视图
        for change in delta:
            if change.type == 'INSERT':
                self._apply_insert(change.row)
            elif change.type == 'UPDATE':
                self._apply_update(change.old_row, change.new_row)
            elif change.type == 'DELETE':
                self._apply_delete(change.row)
        
        # 3. 更新最后刷新LSN
        self.last_refresh_lsn = max(change.lsn for change in delta)

    def _apply_insert(self, row):
        # 示例：原始查询是GROUP BY dept的聚合，插入行影响对应dept的统计
        dept = row['dept']
        salary = row['salary']
        self.data[dept]['total_salary'] += salary
        self.data[dept]['employee_count'] += 1

4.3 边缘情况处理

并发更新冲突：当多个事务同时更新基表并触发MV刷新时，需通过行锁或MVCC（多版本并发控制）保证刷新操作的原子性。
基表结构变更：若基表添加新列，需检查MV是否依赖该列（未依赖则无影响；依赖则MV失效，需重建）。
刷新失败回滚：若增量刷新过程中发生错误（如数据不一致），需回滚已应用的变更，避免MV数据损坏。

4.4 性能考量

刷新策略选择：
- 实时刷新（On Commit）：基表事务提交时立即刷新MV，适合强一致性要求场景（如财务报表），但会增加写延迟（写放大因子可达2-5倍）。
- 定时刷新（On Timer）：按固定间隔（如每小时）刷新，适合最终一致性场景（如用户行为分析），平衡读写性能。
- 手动刷新（Manual）：由DBA手动触发，适合数据极少变更的场景（如历史归档数据）。
存储优化：
- 压缩存储：对MV数据应用列压缩（如ZSTD），减少I/O消耗（PostgreSQL支持pg_compress）。
- 分区物化视图：按时间或地域分区，查询时仅扫描相关分区（如ClickHouse的PARTITION BY）。

五、实际应用

5.1 实施策略

5.1.1 选择适用场景

适合创建物化视图的查询需满足：

高频执行：查询频率F足够高（如每日执行100+次），覆盖存储与刷新成本。
计算密集：包含多表JOIN（≥3张表）、复杂聚合（如ROLLUP/CUBE）、窗口函数（如RANK()）。
数据稳定：基表更新频率低（如T+1更新的日志数据），避免频繁刷新导致性能下降。

反例：OLTP中的点查（如SELECT * FROM users WHERE id=123）更适合用索引，而非物化视图。

5.1.2 设计MV结构

最小化存储：仅包含查询需要的列（如避免存储未使用的冗余列）。
对齐查询模式：MV的GROUP BY列、WHERE过滤条件需与实际查询一致（如查询常按dept+region分组，则MV应包含这两个维度）。

5.2 集成方法论

与索引配合：在MV的分组列上创建索引（如对dept_salary_stats(dept)创建B-Tree索引），加速基于维度的过滤查询。
分层物化：对复杂查询链（如Q1→Q2→Q3），可创建中间MV（存储Q1结果），供Q2和Q3复用，避免重复计算。

5.3 部署考虑因素

资源分配：为MV预留20%-50%的存储容量（根据历史查询数据估算）。
刷新任务调度：将定时刷新任务安排在业务低峰期（如凌晨），避免与核心业务争用CPU/内存资源。
监控指标：
- 命中率（Hit Rate）：查询通过MV执行的比例（目标≥80%）。
- 刷新延迟（Refresh Latency）：基表更新到MV可用的时间（实时刷新目标<1秒，定时刷新目标<间隔的10%）。
- 存储占用率（Storage Usage）：MV总大小与基表总大小的比率（目标<300%）。

5.4 运营管理

生命周期管理：定期评估MV的有效性（如通过pg_stat_user_materialized_views视图），淘汰低命中率的MV。
版本控制：对关键MV创建备份（如通过pg_dump），防止误删或数据损坏。
自动化工具：使用数据库内置的自动物化视图工具（如Oracle的Auto Materialized View Advisor），或第三方工具（如AWS Athena的查询结果缓存）。

六、高级考量

6.1 扩展动态

分布式数据库：在分布式系统（如CockroachDB、TiDB）中，物化视图需跨节点存储，面临数据分片（Sharding）、副本同步（Replication）的挑战。例如，基表按region分片，MV需按相同分片键存储，避免跨分片查询。
多租户场景：SaaS数据库需为不同租户隔离物化视图，防止存储资源抢占（如通过命名空间隔离）或数据泄露（如通过行级访问控制）。

6.2 安全影响

敏感数据缓存：物化视图可能存储聚合后的敏感信息（如某部门的平均薪资），需通过列级加密（如AWS KMS）或行级安全策略（如PostgreSQL的RLS）保护。
权限管理：MV的创建与刷新需限制权限（如仅DBA可创建，普通用户仅可读），避免恶意创建大量MV导致存储溢出。

6.3 伦理维度

数据冗余与隐私：物化视图可能导致同一数据在多个MV中重复存储，增加数据泄露风险（如某用户的行为数据被多个分析MV缓存）。需遵循“最小必要”原则，仅存储分析所需的最小数据集。
算法偏见放大：若基表存在数据偏差（如某地区样本不足），物化视图的预计算会固化这种偏差，导致分析结果失真。需定期审计MV的数据分布。

6.4 未来演化向量

AI驱动的自动物化视图：通过机器学习模型预测高频查询（如基于查询日志的RNN模型），自动创建、调整MV（如Google的AutoML for Database Optimization）。
混合存储架构：结合内存数据库（如Redis）与持久化MV，实现“热数据内存加速+冷数据MV存储”的分层优化。
实时物化视图：基于流处理引擎（如Apache Flink）实现“基表变更→实时计算→更新MV”的端到端低延迟（<100ms），支持实时分析场景（如实时销售仪表盘）。

七、综合与拓展

7.1 跨领域应用

数据仓库：如Amazon Redshift通过物化视图加速星型模式查询（事实表+维度表JOIN），性能提升可达10-100倍。
商业智能（BI）工具：Tableau、Power BI依赖物化视图预计算聚合结果，支持前端可视化的快速交互（如拖拽式筛选）。
机器学习特征工程：在训练模型前，通过物化视图预计算特征（如用户近30天的消费总和），减少特征计算的ETL时间。

7.2 研究前沿

自适应刷新策略：基于查询负载动态调整刷新频率（如查询高峰时降低刷新频率，减少资源争用）。
多版本物化视图：存储MV的历史版本（如按小时/天），支持时间旅行查询（Time-Travel Query），无需重建基表快照。
联邦物化视图：在跨数据库场景（如企业数据湖+OLTP数据库）中，物化视图可跨源存储，避免数据拷贝（如Apache Iceberg的Materialized View功能）。

7.3 开放问题

最优MV集合选择：给定一组查询，如何选择最小的MV集合，覆盖最多的查询加速（NP难问题，需启发式算法）。
一致性-性能权衡：如何在强一致性（实时刷新）与高吞吐（异步刷新）之间动态平衡（如基于SLA的自适应策略）。
异构数据源支持：如何对非关系型数据（如JSON、图数据）创建物化视图，扩展其应用边界。

7.4 战略建议

OLAP优先：在数据仓库、BI等OLAP场景中，物化视图是必选优化手段，建议覆盖80%以上的高频分析查询。
分阶段实施：初期选择3-5个最耗时的查询创建MV，验证效果后逐步扩展，避免存储资源浪费。
监控驱动优化：建立MV监控体系（命中率、存储占用、刷新延迟），每月评估并淘汰低效MV，保持系统最优状态。

教学元素附录

概念桥接：物化视图 vs 菜谱预加工

普通视图：相当于菜谱（只写步骤，每次做菜现切菜）。
物化视图：相当于预加工的半成品（提前切好菜、调好酱料，做菜时直接下锅）。
优势：节省时间（查询更快），但需冰箱存储（额外空间）。

思维模型：成本权衡三角

用三角形表示存储成本、查询性能、一致性的关系：

顶点1：存储成本↑ → 查询性能↑（更多MV）
顶点2：一致性↑ → 存储成本↑（实时刷新需更多资源）
顶点3：查询性能↑ → 一致性↓（异步刷新可能结果过时）

可视化：物化视图生命周期

graph LR
    A[创建MV：执行查询并存储结果] --> B[查询时：直接读取MV]
    B --> C{基表更新?}
    C -->|是| D[触发刷新：完全/增量更新MV]
    D --> B
    C -->|否| B
    E[定期评估：淘汰低命中MV] --> A

思想实验：电商大促场景

假设某电商在双十一大促期间需实时统计“各品类实时销售额”，原始查询需JOIN订单表、商品表、品类表，涉及1000万+订单。

无物化视图：每次查询需扫描3张表，耗时10-30秒，无法支持实时仪表盘。
有物化视图：创建MV存储(category, total_sales)，订单提交时增量刷新MV，查询耗时降至50-200ms，满足实时需求。

案例研究：某银行数据仓库优化

某银行数据仓库处理客户资产分析查询（涉及账户表、交易表、产品表），原始查询耗时120秒。通过创建物化视图存储(customer_id, product_type, balance_sum)，查询时间降至1.2秒（提升100倍），同时存储成本增加20%（可接受）。

参考资料

Silberschatz A, Korth H F, Sudarshan S. Database System Concepts[M]. McGraw-Hill Education, 2019.
Oracle Database Materialized Views Documentation.
PostgreSQL 16 Materialized Views Guide.
Stonebraker M, Abadi D J, DeWitt D J, et al. MapReduce and parallel DBMSs: friends or foes?[J]. Communications of the ACM, 2010.
Dean J, Ghemawat S. MapReduce: simplified data processing on large clusters[J]. Communications of the ACM, 2008.

英伟达靠什么支撑起了4万亿？AI泡沫还能撑多久？
英伟达市值突破4万亿美元，既是AI算力需求爆发的直接体现，也暗含市场对未来的狂热预期。其支撑逻辑与潜在风险并存，而AI泡沫的可持续性则取决于技术、商业与地缘政治的复杂博弈。⚙️一、英伟达4万亿市值的核心支撑因素技术垄断与生态壁垒硬件优势：英伟达GPU在AI训练市场占有率超87%，H100芯片的FP16算力达1979TFLOPS，领先竞品3-5倍。CUDA生态：400万开发者构建的软件护城河，成为A
Spring进阶 - SpringMVC实现原理之DispatcherServlet处理请求的过程倾听铃的声后端 spring java mvc 开发语言分布式
前文我们有了IOC的源码基础以及SpringMVC的基础，我们便可以进一步深入理解SpringMVC主要实现原理，包含DispatcherServlet的初始化过程和DispatcherServlet处理请求的过程的源码解析。本文是第二篇：DispatcherServlet处理请求的过程的源码解析。@pdaiSpring进阶-SpringMVC实现原理之DispatcherServlet处理请求的
【C++算法】76.优先级队列_前 K 个高频单词流星白龙优选算法C++c++算法开发语言
文章目录题目链接：题目描述：解法C++算法代码：题目链接：692.前K个高频单词题目描述：解法利用堆来解决TopK问题预处理一下原始的字符串数组，用一个哈希表统计一下每一个单词出现的频次。创建一个大小为k的堆频次：小根堆字典序（频次相同的时候）：大根堆循环让元素依次进堆判断提取结果C++算法代码：classSolution{//定义类型别名，PSI表示对typedefpairPSI;//自定义比较
什么是缓存雪崩？缓存击穿？缓存穿透？分别如何解决？什么是缓存预热？ daixin8848 缓存 redis java 开发语言
缓存雪崩：在一个时间段内，有大量的key过期，或者Redis服务宕机，导致大量的请求到达数据库,带来巨大压力-给key设置不同的TTL、利用Redis集群提高服务的高可用性、添加多级缓存、添加降级流策略缓存击穿：给某一个key设置了过期时间，当key过期的时间，恰好这个时间点有大量的并发请求访问这个key，可能会瞬间把数据库压垮-互斥锁：缓存失败时，只允许一个请求去加载数据并更新缓存，其他请求阻塞
企业级区块链平台Hyperchain核心原理剖析 boyedu 区块链区块链企业级区块链平台 Hyperchain
Hyperchain作为国产自主可控的企业级联盟区块链平台，其核心原理围绕高性能共识、隐私保护、智能合约引擎及可扩展架构展开，通过多模块协同实现企业级区块链网络的高效部署与安全运行。以下从核心架构、关键技术、性能优化、安全机制、应用场景五个维度展开剖析：一、核心架构：分层解耦与模块化设计Hyperchain采用分层架构，将区块链功能解耦为独立模块，支持灵活组合与扩展：P2P网络层由验证节点（VP）
Aop +反射实现方法版本动态切换
需求分析在做技术选型的时候一直存在着两个声音，mongo作为数据库比较mysql好，mysql做为该数据比mongo好。当然不同数据库都有有着自己的优势，我们在做技术选型的时候无非就是做到对数据库的扬长避短。mysql最大的优势就是支持事务，事务的五大特性保证的业务可靠性，随之而来的就是事务会产生的问题：脏读、幻读、不可重复度，当然我们也会使用不同的隔离级别来解决。（最典型的业务问题：银行存取钱）
通义万相2.2：开启高清视频生成新纪元 Liudef06小白特殊专栏 AIGC 人工智能人工智能通义万相2.2 图生视频
通义万相2.2：开启高清视频生成新纪元2025年7月28日，中国AI领域迎来里程碑时刻——通义万相团队正式开源其革命性视频生成模型Wan2.2的核心权重，这标志着开源社区首次获得支持720P高清视频生成的先进模型架构。一、架构革新：混合专家系统1.1MoE视频扩散架构通义万相2.2首次将混合专家（MoE）架构引入视频扩散模型，通过双专家系统实现计算效率与模型容量的平衡：classMoEVideoD
2025年SDK游戏盾终极解析：重新定义手游安全的“隐形护甲” 上海云盾商务经理杨杨游戏安全
副标题：从客户端加密到AI反外挂，拆解全链路防护如何重塑游戏攻防天平引言：当传统高防在手游战场“失效”2025年全球手游市场规模突破$2000亿，黑客单次攻击成本却降至$30——某SLG游戏因协议层CC攻击单日流失37%玩家，某开放世界游戏遭低频DDoS瘫痪6小时损失千万。传统高防IP的致命短板暴露无遗：无法识别伪造客户端流量、难防协议篡改、误杀率超15%。而集成于游戏终端的SDK游戏盾，正以“源
LVS+Keepalived实现高可用和负载均衡 2401_84412895 程序员 lvs 负载均衡运维
2、开启网卡子接口配置VIP[root@a~]#cd/etc/sysconfig/network-scripts/[root@anetwork-scripts]#cp-aifcfg-ens32ifcfg-ens32:0[root@anetwork-scripts]#catifcfg-ens32:0BOOTPROTO=staticDEVICE=ens32:0ONBOOT=yesIPADDR=10.1
CodeFoeces-450B ss5smi
题目原题链接：B.JzzhuandSequences题意根据公式公式计算对应fn的值。参考了其他作者的代码和思路。找循环点。负数取余需要加取余数到>0为止才可取余。代码#includeusingnamespacestd;constintmod=1e9+7;intmain(){longlongf[10],x,y,n;cin>>x>>y>>n;x=(x+mod)%mod;y=(y+mod)%mod;f
【异常】使用 LiteFlow 框架时，提示错误ChainDuplicateException: [chain name duplicate] chainName=categoryChallenge 本本本添哥 002 -进阶开发能力 java
一、报错内容Causedby:com.yomahub.liteflow.exception.ChainDuplicateException:[chainnameduplicate]chainName=categoryChallengeatcom.yomahub.liteflow.parser.helper.ParserHelper.lambda$null$0(ParserHelper.java:1
代码随想录算法训练营第三十五天
01背包问题二维题目链接01背包问题二维题解importjava.util.Scanner;publicclassMain{publicstaticvoidmain(String[]args){Scannersc=newScanner(System.in);intM=sc.nextInt();intN=sc.nextInt();int[]space=newint[M];int[]value=new
为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
AI模型训练中过拟合和欠拟合的区别是什么？ workflower 人工智能算法人工智能数据分析
在AI模型训练中，过拟合和欠拟合是两种常见的模型性能问题，核心区别在于模型对数据的学习程度和泛化能力：欠拟合（Underfitting）-定义：模型未能充分学习到数据中的规律，对训练数据的拟合程度较差，在训练集和测试集上的表现都不好（如准确率低、损失值高）。-原因：-模型结构过于简单（如用线性模型解决非线性问题）；-训练数据量不足或特征信息不充分；-训练时间太短，模型尚未学到有效模式。-表现：训练
Selenium 特殊控件操作与 ActionChains 实践详解小馋喵知识杂货铺 selenium 测试工具
1.下拉框单选操作(a)使用SeleniumSelect类（标准HTML标签）Selenium提供了内置的Select类用于操作标准下拉框，这种方式简单且直观。fromselenium.webdriver.support.uiimportSelect#定位下拉框dropdown=Select(driver.find_element("id","dropdown_id"))#通过以下三种方式选择单个
MySQL复习题
一.填空题1.关系数据库的标准语言是SQL。2.数据库发展的3个阶段中，数据独立性最高的是阶段数据库系统。3.概念模型中的3种基本联系分别是一对一、一对多和多对多。4.MySQL配置文件的文件名是my.ini或my.cnf。5.在MySQL配置文件中，datadir用于指定数据库文件的保存目录。6.添加IFNOTEXISTS可在创建的数据库已存在时防止程序报错。7.MySQL提供的SHOWCREA
Zread.AI：一键将GitHub项目转化为结构化中文手册的AI代码维基工具
Zread.AI：一键将GitHub项目转化为结构化中文手册的AI代码维基工具文章来源：PoixeAI文章目录Zread.AI工具概述核心功能优势亮点典型应用场景上手指南注意事项官网地址Zread.AI由智谱Z.ai推出，是一款面向开发者的AI代码维基工具，可在几秒内把任何公开GitHub仓库转化为结构化中文手册，并通过独家Buzz面板聚合commits、issues与相关新闻，让项目脉搏一目了然
学C++的五大惊人好处
为什么要学c++学c++有什么用学习c++的好处有1.中考可以加分2.高考可能直接录取3.就业广且工资高4.在未来30--50年c++一定是一个很受欢迎的职业5.c++成功的例子deepsick等AI智能C++语言兼备编程效率和编译运行效率的语言C++语言是C语言功能增强版,在c语言的基础上添加了面向对象编程和泛型编程的支持既继承了C语言高效，简洁，快速和可移植的传统,又具备类似Java、Go等其
Android GreenDao介绍和Generator生成表对象代码
目录(?)[-]介绍创建工程转载请注明：http://blog.csdn.net/sinat_30276961/article/details/50052109最近无意中发现了GreenDao，然后查看了一些资料后，发现这个数据库框架很适合用，于是乎，查看了官网的api，并自己写了一个小应用总结一下它的使用方法。介绍按照国际惯例，在开篇，总要先介绍一下什么是GreenDao吧。首先需要说明的是Gr
从振动信号到精准预警：AI 如何重塑工业设备健康管理？缘华工业智维人工智能计算机视觉边缘计算信息与通信
在智能制造浪潮席卷全球的当下，工业生产正经历着从传统模式向智能化、数字化转型的深刻变革。在这场变革中，AI驱动的振动分析技术犹如一颗璀璨新星，成为工业设备可靠运行的“健康卫士”。它通过在设备关键部位部署振动传感器，如同医生为患者听诊般实时采集设备运行时的振动信号，再借助强大的人工智能算法对这些“工业脉搏”进行深度解析，从而实现对工业设备从故障预警到寿命预测的全周期精准守护。一、AI振动分析：设备状
基于DeepSeek的下一代大型游戏开发革命：架构、核心技术与项目管理实践 Liudef06小白特殊专栏人工智能 AIGC 架构人工智能 deepseek
基于DeepSeek的下一代大型游戏开发革命：架构、核心技术与项目管理实践DeepSeek大模型正重塑游戏开发范式，本文将深入解析如何利用这一革命性技术构建下一代大型游戏，涵盖从架构设计到项目管理的全流程实践。目录DeepSeek游戏引擎核心架构1.1神经符号系统融合架构1.2动态世界生成引擎智能NPC与剧情系统2.1角色人格建模技术2.2动态叙事生成算法大型项目管理体系3.1敏捷-AI混合开发流
魔搭平台实战：手把手教你训练SDXL模型，解锁AI绘画新纪元 Liudef06小白特殊专栏 AIGC 人工智能 AI作画人工智能 AIGC
魔搭平台实战：手把手教你训练SDXL模型，解锁AI绘画新纪元随着多模态AI技术的爆发式发展，StableDiffusionXL（SDXL）等文生图模型正在彻底重塑创意产业工作流。本文将深入解析如何在魔搭平台高效训练SDXL模型，并探讨AI绘画技术对设计行业的革命性影响。一、SDXL模型架构解析1.1双文本编码器设计SDXL采用双文本编码器架构，显著提升提示词理解能力：#SDXL文本编码器结构示意c
AI 生成虚拟宠物：24 小时陪你聊天解闷大力出奇迹985 人工智能宠物
本文围绕AI生成虚拟宠物展开，介绍这类依托人工智能技术诞生的虚拟伙伴，能实现24小时不间断陪伴聊天，为人们解闷。文中详细阐述其技术基础，包括自然语言处理、机器学习等；分析多样功能，如个性化互动、情绪回应等；探讨在独居人群、压力大者等不同群体中的应用场景，最后总结其为人们生活带来的积极影响及未来发展潜力，展现AI虚拟宠物在陪伴领域的独特价值。一、AI生成虚拟宠物的诞生背景与技术基石在快节奏的现代社会
基于Python的AI健康助手：开发与部署全攻略 AI算力网络与通信 AI算力网络与通信原理 AI人工智能大数据架构 python 人工智能开发语言 ai
基于Python的AI健康助手：开发与部署全攻略关键词：Python、AI健康助手、机器学习、自然语言处理、Flask、部署、健康管理摘要：本文将详细介绍如何使用Python开发一个AI健康助手，从需求分析、技术选型到核心功能实现，再到最终部署上线的完整过程。我们将使用自然语言处理技术理解用户健康咨询，通过机器学习模型提供个性化建议，并展示如何用Flask框架构建Web应用接口。文章包含大量实际代
GPT-4 在 AIGC 中的微调技巧：让模型更懂你的需求 AIGC应用创新大全 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 AIGC ai
GPT-4在AIGC中的微调技巧：让模型更懂你的需求关键词：GPT-4、AIGC、模型微调、监督学习、指令优化、过拟合预防、个性化生成摘要：AIGC（人工智能生成内容）正在重塑内容创作行业，但通用的GPT-4模型可能无法精准匹配你的垂直需求——比如写电商爆款文案时总“跑题”，或生成技术文档时专业术语不够。本文将用“教小朋友学画画”的通俗类比，从微调的底层逻辑讲到实战技巧，带你掌握让GPT-4“更懂
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容 AI大模型应用工坊 AI大模型开发实战 AIGC chatgpt ai
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容关键词：AIGC、ChatGPT、DALL·E、内容生成、高转化营销、多模态协同、提示词工程摘要：随着AIGC（人工智能生成内容）技术的爆发式发展，ChatGPT（文本生成）与DALL·E（图像生成）的组合已成为内容创作领域的“黄金搭档”。本文将深度解析二者的协同原理，结合实战案例演示从需求分析到内容落地的全流程，并揭示提升内容
数据分析领域中AI人工智能的发展前景展望 AI大模型应用工坊 AI大模型开发实战数据分析人工智能数据挖掘 ai
数据分析领域中AI人工智能的发展前景展望关键词：数据分析、人工智能、机器学习、深度学习、数据挖掘、预测分析、自动化摘要：本文深入探讨了人工智能在数据分析领域的发展现状和未来趋势。我们将从核心技术原理出发，分析AI如何改变传统数据分析范式，详细讲解机器学习算法在数据分析中的应用，并通过实际案例展示AI驱动的数据分析解决方案。文章还将探讨行业应用场景、工具生态以及未来发展面临的挑战和机遇，为数据分析师
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
Mac OSX 下的mysql数据库文件存放位置 Bruuuces mysql mac osx 位置存放
之前我的mysql的系统数据库里的表被我玩坏了，万般无奈之下只得删除所有mysql的东西重新构建数据库。按照网上搜到的内容删除后重装发现数据库没有什么变化。于是自己在每个可能存放数据库文件的目录查找，最终确认目录位置如下:使用HomeBrew安装为/usr/local/var/mysql使用官方下载的dmg镜像安装为/usr/local/mysql删除这个目录再重新安装mysql就会重新生成系统数
2018年中南大学中英翻译某翁
参考：20180827235856533.jpg【1】机器学习理论表明，机器学习算法能从有限个训练集样本上得到较好的泛化【1】Machinelearningtheoryshowsthatmachinelearningalgorithmcangeneralizewellfromfinitetrainingsetsampleslimited有限的infinite无限的【2】这似乎违背了一些基本的逻辑准
java短路运算符和逻辑运算符的区别 3213213333332132 java基础
/* * 逻辑运算符——不论是什么条件都要执行左右两边代码 * 短路运算符——我认为在底层就是利用物理电路的“并联”和“串联”实现的 * 原理很简单，并联电路代表短路或（||），串联电路代表短路与（&&）。 * * 并联电路两个开关只要有一个开关闭合，电路就会通。 * 类似于短路或（||），只要有其中一个为true（开关闭合）是
Java异常那些不得不说的事白糖_ java exception
一、在finally块中做数据回收操作比如数据库连接都是很宝贵的，所以最好在finally中关闭连接。 JDBCAgent jdbc = new JDBCAgent(); try{ jdbc.excute("select * from ctp_log"); }catch(SQLException e){ ... }finally{ jdbc.close();
utf-8与utf-8(无BOM)的区别 dcj3sjt126com PHP
BOM——Byte Order Mark，就是字节序标记在UCS 编码中有一个叫做"ZERO WIDTH NO-BREAK SPACE"的字符，它的编码是FEFF。而FFFE在UCS中是不存在的字符，所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前，先传输字符"ZERO WIDTH NO-BREAK SPACE"。这样如
JAVA Annotation之定义篇周凡杨 java 注解 annotation 入门注释
Annotation: 译为注释或注解 An annotation, in the Java computer programming language, is a form of syntactic metadata that can be added to Java source code. Classes, methods, variables, pa
tomcat的多域名、虚拟主机配置 g21121 tomcat
众所周知apache可以配置多域名和虚拟主机，而且配置起来比较简单，但是项目用到的是tomcat，配来配去总是不成功。查了些资料才总算可以，下面就跟大家分享下经验。很多朋友搜索的内容基本是告诉我们这么配置：在Engine标签下增面积Host标签，如下： <Host name="www.site1.com" appBase="webapps"
Linux SSH 错误解析（Capistrano 的cap 访问错误 Permission ） 510888780 linux capistrano
1.ssh -v [email protected] 出现 Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password). 错误运行状况如下： OpenSSH_5.3p1, OpenSSL 1.0.1e-fips 11 Feb 2013 debug1: Reading configuratio
log4j的用法 Harry642 java log4j
一、前言： log4j 是一个开放源码项目，是广泛使用的以Java编写的日志记录包。由于log4j出色的表现，当时在log4j完成时，log4j开发组织曾建议sun在jdk1.4中用log4j取代jdk1.4 的日志工具类，但当时jdk1.4已接近完成，所以sun拒绝使用log4j，当在java开发中
mysql、sqlserver、oracle分页，java分页统一接口实现 aijuans oracle jave
定义：pageStart 起始页，pageEnd 终止页,pageSize页面容量 oracle分页：　　　　select * from ( select mytable.*,rownum num from (实际传的SQL) where rownum<=pageEnd) where num>=pageStart sqlServer分页：
Hessian 简单例子 antlove java Web service hessian
hello.hessian.MyCar.java package hessian.pojo; import java.io.Serializable; public class MyCar implements Serializable { private static final long serialVersionUID = 473690540190845543
数据库对象的同义词和序列百合不是茶 sql 序列同义词 ORACLE权限
回顾简单的数据库权限等命令; 解锁用户和锁定用户 alter user scott account lock/unlock; //system下查看系统中的用户 select * dba_users; //创建用户名和密码 create user wj identified by wj; identified by //授予连接权和建表权 grant connect to
使用Powermock和mockito测试静态方法 bijian1013 持续集成单元测试 mockito Powermock
实例： package com.bijian.study; import static org.junit.Assert.assertEquals; import java.io.IOException; import org.junit.Before; import org.junit.Test; import or
精通Oracle10编程SQL(6)访问ORACLE bijian1013 oracle 数据库 plsql
/* *访问ORACLE */ --检索单行数据 --使用标量变量接收数据 DECLARE v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; BEGIN select ename,sal into v_ename,v_sal from emp where empno=&no; dbms_output.pu
【Nginx四】Nginx作为HTTP负载均衡服务器 bit1129 nginx
Nginx的另一个常用的功能是作为负载均衡服务器。一个典型的web应用系统，通过负载均衡服务器，可以使得应用有多台后端服务器来响应客户端的请求。一个应用配置多台后端服务器，可以带来很多好处：负载均衡的好处增加可用资源增加吞吐量加快响应速度，降低延时出错的重试验机制 Nginx主要支持三种均衡算法： round-robin l
jquery-validation备忘白糖_ jquery css F#Firebug
留点学习jquery validation总结的代码： function checkForm(){ validator = $("#commentForm").validate({// #formId为需要进行验证的表单ID errorElement :"span",// 使用"div"标签标记错误，默认:&
solr限制admin界面访问（端口限制和http授权限制） ronin47 限定Ip访问
solr的管理界面可以帮助我们做很多事情，但是把solr程序放到公网之后就要限制对admin的访问了。可以通过tomcat的http基本授权来做限制，也可以通过iptables防火墙来限制。我们先看如何通过tomcat配置http授权限制。第一步：在tomcat的conf/tomcat-users.xml文件中添加管理用户，比如： <userusername="ad
多线程-用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 bylijinnan java 多线程
public class IncDecThread { private int j=10; /* * 题目:用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 * 两个问题： * 1、线程同步--synchronized * 2、线程之间如何共享同一个j变量--内部类 */ public static
买房历程 cfyme
2015-06-21: 万科未来城，看房子 2015-06-26: 办理贷款手续，贷款73万，贷款利率5.65=5.3675 2015-06-27: 房子首付,签完合同 2015-06-28，央行宣布降息 0.25，就2天的时间差啊，没赶上。首付，老婆找他的小姐妹接了5万，另外几个朋友借了1-
[军事与科技]制造大型太空战舰的前奏 comsci 制造
天气热了........空调和电扇要准备好.......... 最近,世界形势日趋复杂化,战争的阴影开始覆盖全世界.......... 所以,我们不得不关
dateformat dai_lm DateFormat
"Symbol Meaning Presentation Ex." "------ ------- ------------ ----" "G era designator (Text) AD" "y year
Hadoop如何实现关联计算 datamachine mapreduce hadoop 关联计算
选择Hadoop，低成本和高扩展性是主要原因，但但它的开发效率实在无法让人满意。以关联计算为例。假设：HDFS上有2个文件，分别是客户信息和订单信息，customerID是它们之间的关联字段。如何进行关联计算，以便将客户名称添加到订单列表中？ &nbs
用户模型中修改用户信息时，密码是如何处理的 dcj3sjt126com yii
当我添加或修改用户记录的时候对于处理确认密码我遇到了一些麻烦，所有我想分享一下我是怎么处理的。场景是使用的基本的那些(系统自带)，你需要有一个数据表(user)并且表中有一个密码字段(password),它使用 sha1、md5或其他加密方式加密用户密码。面是它的工作流程: 当创建用户的时候密码需要加密并且保存，但当修改用户记录时如果使用同样的场景我们最终就会把用户加密过的密码再次加密，这
中文 iOS/Mac 开发博客列表 dcj3sjt126com Blog
本博客列表会不断更新维护，如果有推荐的博客，请到此处提交博客信息。本博客列表涉及的文章内容支持定制化Google搜索，特别感谢 JeOam 提供并帮助更新。本博客列表也提供同步更新的OPML文件（下载OPML文件），可供导入到例如feedly等第三方定阅工具中，特别感谢 lcepy 提供自动转换脚本。这里有导入教程。
js去除空格，去除左右两端的空格蕃薯耀去除左右两端的空格 js去掉所有空格 js去除空格
js去除空格，去除左右两端的空格 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>&g
SpringMVC4零配置--web.xml hanqunfeng springmvc4
servlet3.0+规范后，允许servlet，filter，listener不必声明在web.xml中，而是以硬编码的方式存在，实现容器的零配置。 ServletContainerInitializer：启动容器时负责加载相关配置 package javax.servlet; import java.util.Set; public interface ServletContainer
《开源框架那些事儿21》：巧借力与借巧力 j2eetop 框架 UI
同样做前端UI，为什么有人花了一点力气，就可以做好？而有的人费尽全力，仍然错误百出？我们可以先看看几个故事。故事1：巧借力，乌鸦也可以吃核桃有一个盛产核桃的村子，每年秋末冬初，成群的乌鸦总会来到这里，到果园里捡拾那些被果农们遗落的核桃。核桃仁虽然美味，但是外壳那么坚硬，乌鸦怎么才能吃到呢？原来乌鸦先把核桃叼起，然后飞到高高的树枝上，再将核桃摔下去，核桃落到坚硬的地面上，被撞破了，于是，
JQuery EasyUI 验证扩展可怜的猫 jquery easyui 验证
最近项目中用到了前端框架-- EasyUI，在做校验的时候会涉及到很多需要自定义的内容，现把常用的验证方式总结出来，留待后用。以下内容只需要在公用js中添加即可。使用类似于如下： <input class="easyui-textbox" name="mobile" id="mobile&
架构师之httpurlconnection----------读取和发送(流读取效率通用类) nannan408
1.前言. 如题. 2.代码. /* * Copyright (c) 2015, S.F. Express Inc. All rights reserved. */ package com.test.test.test.send; import java.io.IOException; import java.io.InputStream
Jquery性能优化 r361251 JavaScript jquery
一、注意定义jQuery变量的时候添加var关键字这个不仅仅是jQuery，所有javascript开发过程中，都需要注意，请一定不要定义成如下： $loading = $('#loading'); //这个是全局定义，不知道哪里位置倒霉引用了相同的变量名，就会郁闷至死的二、请使用一个var来定义变量如果你使用多个变量的话，请如下方式定义： . 代码如下: var page
在eclipse项目中使用maven管理依赖 tjj006 eclipse maven
概览: 如何导入maven项目至eclipse中建立自有Maven Java类库服务器建立符合maven代码库标准的自定义类库 Maven在管理Java类库方面有巨大的优势，像白衣所说就是非常“环保”。我们平时用IDE开发都是把所需要的类库一股脑的全丢到项目目录下，然后全部添加到ide的构建路径中，如果用了SVN/CVS，这样会很容易就把
中国天气网省市级联页面 x125858805 级联
1、页面及级联js <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> &l