anda0109

GPU编程实战指南04：CUDA编程示例，使用共享内存优化性能

在CUDA编程中，共享内存（Shared Memory） 比 全局内存（Global Memory） 效率高的原因主要与CUDA的硬件架构和内存访问特性密切相关。以下是详细分析：

1. CUDA内存层次结构

CUDA设备（GPU）具有多层次的内存架构，主要包括以下几种：

寄存器（Registers）：每个线程私有的高速存储单元，速度最快但容量有限。
共享内存（Shared Memory）：由同一个线程块（Block）中的所有线程共享，位于片上（On-Chip），速度接近寄存器。
全局内存（Global Memory）：位于片外（Off-Chip），供所有线程块访问，容量大但访问延迟高。
常量内存（Constant Memory） 和 纹理内存（Texture Memory）：特殊用途的只读内存。

共享内存是CUDA中一种非常重要的资源，其高效性主要体现在以下几个方面。

2. 共享内存比全局内存效率高的原理

（1）更低的访问延迟

共享内存：位于GPU芯片内部，属于片上存储器（On-Chip Memory）。它的访问延迟通常为几十个时钟周期。
全局内存：位于GPU芯片外部，属于片外存储器（Off-Chip Memory）。它的访问延迟通常为几百个甚至上千个时钟周期。

因此，共享内存的访问速度远高于全局内存。

（2）更高的带宽

共享内存的带宽通常是全局内存的数十倍。例如，在现代GPU中，共享内存的带宽可以达到数百GB/s，而全局内存的带宽可能只有几十GB/s。
高带宽意味着单位时间内可以从共享内存加载或存储更多的数据，从而提高程序的整体性能。

（3）可编程性与数据重用

共享内存是由程序员显式管理的，允许程序员控制数据的加载和存储。通过将频繁使用的数据加载到共享内存中，可以在同一线程块内的多个线程之间实现数据重用，避免重复从全局内存加载相同的数据。
这种数据重用特性特别适合需要多次访问相同数据的计算任务，例如矩阵乘法、卷积操作等。

（4）提升内存访问的局部性

CUDA的全局内存访问性能高度依赖于合并访问（Coalesced Access），即相邻线程访问连续的内存地址。如果访问模式不连续，会导致缓存未命中率增加，进一步降低性能。
而共享内存允许程序员手动组织数据布局，使得数据访问更加连续，从而优化局部性并减少冲突。

（5）支持高效的并行访问

在CUDA中，共享内存允许多个线程同时访问，且不会产生冲突（前提是访问模式合理）。这种并行访问能力进一步提高了效率。
例如，在矩阵乘法中，多个线程可以同时从共享内存中读取数据进行计算，而无需等待其他线程完成。

3. 实际应用场景中的优化

在CUDA编程中，使用共享内存的主要目的是优化数据访问模式，减少对全局内存的依赖。以下是一些典型的应用场景及其优化原理：

（1）矩阵乘法

矩阵乘法是典型的计算密集型任务，涉及大量的数据重用。
通过将矩阵分块加载到共享内存中，可以减少对全局内存的访问次数。例如：
- 将矩阵A的一个子块和矩阵B的一个子块加载到共享内存中。
- 同一线程块内的所有线程共同计算这些子块的乘积。
- 重复此过程，直到完成整个矩阵的乘法。

（2）图像卷积

图像卷积操作需要对每个像素点周围的邻域进行计算。
可以将图像的一部分加载到共享内存中，供多个线程共享使用，从而避免重复从全局内存加载邻域数据。

（3）排序算法

在并行排序算法（如快速排序、归并排序）中，可以使用共享内存作为中间存储，减少全局内存的交互。

4. 代码示例：矩阵乘法中的共享内存优化

以下是一个简单的矩阵乘法示例，展示如何利用共享内存优化性能：

__global__ void matrixMulSharedMemory(float* A, float* B, float* C, int N) {
    // 定义共享内存
    __shared__ float sharedA[TILE_SIZE][TILE_SIZE];
    __shared__ float sharedB[TILE_SIZE][TILE_SIZE];

    int row = blockIdx.y * blockDim.y + threadIdx.y;
    int col = blockIdx.x * blockDim.x + threadIdx.x;

    float result = 0.0f;

    // 分块计算
    for (int tile = 0; tile < (N + TILE_SIZE - 1) / TILE_SIZE; tile++) {
        // 将数据加载到共享内存中
        if (row < N && tile * TILE_SIZE + threadIdx.x < N)
            sharedA[threadIdx.y][threadIdx.x] = A[row * N + tile * TILE_SIZE + threadIdx.x];
        else
            sharedA[threadIdx.y][threadIdx.x] = 0.0f;

        if (col < N && tile * TILE_SIZE + threadIdx.y < N)
            sharedB[threadIdx.y][threadIdx.x] = B[(tile * TILE_SIZE + threadIdx.y) * N + col];
        else
            sharedB[threadIdx.y][threadIdx.x] = 0.0f;

        __syncthreads();  // 确保所有线程完成加载

        // 计算当前分块的结果
        for (int k = 0; k < TILE_SIZE; k++) {
            result += sharedA[threadIdx.y][k] * sharedB[k][threadIdx.x];
        }

        __syncthreads();  // 确保所有线程完成计算
    }

    // 写回结果到全局内存
    if (row < N && col < N)
        C[row * N + col] = result;
}

关键点分析：

数据加载到共享内存：
- 将矩阵A和矩阵B的部分数据加载到共享内存sharedA和sharedB中。
- 减少了对全局内存的访问次数。
数据重用：
- 同一线程块内的所有线程共享sharedA和sharedB中的数据，避免了重复加载。
同步机制：
- 使用__syncthreads()确保所有线程完成共享内存的加载和计算后再继续下一步。

5. 注意事项

虽然共享内存能显著提高性能，但在使用时需要注意以下几点：

容量限制：
- 共享内存的容量有限（通常为几十KB到几百KB）。如果数据量过大，可能会导致溢出。
银行冲突（Bank Conflict）：
- 共享内存被划分为多个存储体（Banks）。如果多个线程同时访问同一个存储体，会导致冲突，降低性能。
- 解决方法：调整数据布局，使访问模式均匀分布。
编程复杂度：
- 使用共享内存需要手动管理数据加载和存储，增加了编程复杂度。

6. 总结

在CUDA编程中，共享内存比全局内存效率高的核心原因在于其低访问延迟、高带宽、数据重用以及更好的局部性。通过合理利用共享内存，可以显著减少对全局内存的访问次数，优化内存访问模式，从而提高程序的整体性能。

下面是一个矩阵乘法的示例，比较了使用共享内存和使用全局内存两种方式的性能差异：

/*
 * 矩阵乘法性能对比示例
 * 
 * 本程序实现了两种矩阵乘法的方法：
 * 1. 使用全局内存的朴素实现
 *    - 每个线程直接从全局内存读取数据
 *    - 重复访问全局内存，性能较低
 * 
 * 2. 使用共享内存的优化实现
 *    - 将矩阵分块加载到共享内存
 *    - 减少全局内存访问次数
 *    - 提高内存访问效率
 *    - 显著提升计算性能
 */

#include 
#include 
#include 

// 矩阵大小（为简化示例，使用方阵）
#define MATRIX_SIZE 1024
// 每个线程块的大小（二维）
#define BLOCK_SIZE 64

// 检查CUDA错误
void checkCudaError(cudaError_t error, const char* message) {
    if (error != cudaSuccess) {
        fprintf(stderr, "CUDA错误: %s - %s\n", message, cudaGetErrorString(error));
        exit(-1);
    }
}

// 使用全局内存的矩阵乘法核函数
__global__ void matrixMulGlobal(
    const float* A,
    const float* B,
    float* C,
    int size
) {
    // 计算当前线程负责的矩阵C中的元素位置
    int row = blockIdx.y * blockDim.y + threadIdx.y;
    int col = blockIdx.x * blockDim.x + threadIdx.x;

    if (row < size && col < size) {
        float sum = 0.0f;
        // 计算一个元素需要遍历一整行和一整列
        for (int k = 0; k < size; k++) {
            sum += A[row * size + k] * B[k * size + col];
        }
        C[row * size + col] = sum;
    }
}

// 使用共享内存的矩阵乘法核函数
__global__ void matrixMulShared(
    const float* A,
    const float* B,
    float* C,
    int size
) {
    // 声明共享内存，用于存储A和B的子矩阵
    __shared__ float sharedA[BLOCK_SIZE][BLOCK_SIZE];
    __shared__ float sharedB[BLOCK_SIZE][BLOCK_SIZE];

    // 计算线程在全局和块内的位置
    int row = blockIdx.y * blockDim.y + threadIdx.y;
    int col = blockIdx.x * blockDim.x + threadIdx.x;
    int tx = threadIdx.x;
    int ty = threadIdx.y;

    float sum = 0.0f;

    // 分块计算，每次处理BLOCK_SIZE大小的子矩阵
    for (int i = 0; i < (size + BLOCK_SIZE - 1) / BLOCK_SIZE; i++) {
        // 协作加载数据到共享内存
        if (row < size && (i * BLOCK_SIZE + tx) < size) {
            sharedA[ty][tx] = A[row * size + i * BLOCK_SIZE + tx];
        } else {
            sharedA[ty][tx] = 0.0f;
        }
        if (col < size && (i * BLOCK_SIZE + ty) < size) {
            sharedB[ty][tx] = B[(i * BLOCK_SIZE + ty) * size + col];
        } else {
            sharedB[ty][tx] = 0.0f;
        }

        // 确保所有线程都完成数据加载,以确保共享内存加载完成
        __syncthreads();

        // 计算当前子矩阵的点积
        if (row < size && col < size) {
            for (int k = 0; k < BLOCK_SIZE; k++) {
                sum += sharedA[ty][k] * sharedB[k][tx];
            }
        }

        // 同步以确保计算完成后再加载下一块数据
        __syncthreads();
    }

    // 将结果写回全局内存
    if (row < size && col < size) {
        C[row * size + col] = sum;
    }
}

// 初始化矩阵数据
void initMatrix(float* matrix, int size) {
    for (int i = 0; i < size * size; i++) {
        matrix[i] = rand() / (float)RAND_MAX;
    }
}

int main() {
    int size = MATRIX_SIZE;
    size_t matrixBytes = size * size * sizeof(float);

    // 分配主机内存
    float *h_A, *h_B, *h_C1, *h_C2;
    h_A = (float*)malloc(matrixBytes);
    h_B = (float*)malloc(matrixBytes);
    h_C1 = (float*)malloc(matrixBytes);
    h_C2 = (float*)malloc(matrixBytes);

    // 初始化输入矩阵
    printf("正在初始化矩阵数据...\n");
    initMatrix(h_A, size);
    initMatrix(h_B, size);

    // 分配设备内存
    float *d_A, *d_B, *d_C;
    checkCudaError(cudaMalloc((void**)&d_A, matrixBytes), "分配设备内存d_A失败");
    checkCudaError(cudaMalloc((void**)&d_B, matrixBytes), "分配设备内存d_B失败");
    checkCudaError(cudaMalloc((void**)&d_C, matrixBytes), "分配设备内存d_C失败");

    // 将数据复制到设备
    checkCudaError(cudaMemcpy(d_A, h_A, matrixBytes, cudaMemcpyHostToDevice), "复制数据到设备d_A失败");
    checkCudaError(cudaMemcpy(d_B, h_B, matrixBytes, cudaMemcpyHostToDevice), "复制数据到设备d_B失败");

    // 设置网格和块的维度
    dim3 blockDim(BLOCK_SIZE, BLOCK_SIZE);
    dim3 gridDim((size + BLOCK_SIZE - 1) / BLOCK_SIZE, (size + BLOCK_SIZE - 1) / BLOCK_SIZE);

    // 创建CUDA事件用于计时
    cudaEvent_t start, stop;
    cudaEventCreate(&start);
    cudaEventCreate(&stop);
    float elapsedTime;

    // 运行使用全局内存的版本
    printf("\n运行使用全局内存的矩阵乘法...\n");
    cudaEventRecord(start);
    matrixMulGlobal<<>>(d_A, d_B, d_C, size);
    cudaEventRecord(stop);
    cudaEventSynchronize(stop);
    cudaEventElapsedTime(&elapsedTime, start, stop);
    printf("使用全局内存的版本耗时: %.2f ms\n", elapsedTime);

    // 复制结果到主机
    checkCudaError(cudaMemcpy(h_C1, d_C, matrixBytes, cudaMemcpyDeviceToHost), "从设备复制结果失败");

    // 运行使用共享内存的版本
    float elapsedTime1;
    printf("\n运行使用共享内存的矩阵乘法...\n");
    cudaEventRecord(start);
    matrixMulShared<<>>(d_A, d_B, d_C, size);
    cudaEventRecord(stop);
    cudaEventSynchronize(stop);
    cudaEventElapsedTime(&elapsedTime1, start, stop);
    printf("使用共享内存的版本耗时: %.2f ms\n", elapsedTime1);
    printf("加速比: %.2f\n", elapsedTime / elapsedTime1);

    // 复制结果到主机
    checkCudaError(cudaMemcpy(h_C2, d_C, matrixBytes, cudaMemcpyDeviceToHost), "从设备复制结果失败");

    // 验证两种方法的结果是否一致
    bool resultsMatch = true;
    for (int i = 0; i < size * size && resultsMatch; i++) {
        if (fabs(h_C1[i] - h_C2[i]) > 1e-5) {
            resultsMatch = false;
            break;
        }
    }
    printf("\n两种实现的结果%s\n", resultsMatch ? "一致" : "不一致");

    // 清理资源
    cudaFree(d_A);
    cudaFree(d_B);
    cudaFree(d_C);
    cudaEventDestroy(start);
    cudaEventDestroy(stop);
    free(h_A);
    free(h_B);
    free(h_C1);
    free(h_C2);

    return 0;
}

运行结果如下，使用共享内存相较于使用全局内存效率提高了3.69倍：

x86-64汇编语言训练程序与实战十除以十等于一
本文还有配套的精品资源，点击获取简介：汇编语言是一种低级语言，与机器代码紧密相关，特别适用于编写系统级代码及性能要求高的应用。nasm编译器是针对x86和x86-64架构的汇编语言编译器，支持多种语法风格和指令集。项目Euler提供数学和计算机科学问题，鼓励编程技巧应用，前100个问题的答案可共享。x86-64架构扩展了寄存器数量并引入新指令，提升了数据处理效率。学习汇编语言能够深入理解计算机底层
三菱PLC全套学习资料及应用手册 good2know
本文还有配套的精品资源，点击获取简介：三菱PLC作为工业自动化领域的核心设备，其系列产品的学习和应用需要全面深入的知识。本次资料包为学习者提供从基础到进阶的全方位学习资源，包括各种型号PLC的操作手册、编程指南、软件操作教程以及实际案例分析，旨在帮助用户系统掌握PLC的编程语言、指令系统及在各类工业应用中的实施。1.三菱PLC基础知识入门1.1PLC的基本概念可编程逻辑控制器（PLC）是工业自动化
9、汇编语言编程入门：从环境搭建到简单程序实现神经网络酱汇编语言 MEPIS GNU工具链
汇编语言编程入门：从环境搭建到简单程序实现1.数据存储介质问题解决在处理数据存储时，若要使用MEPIS系统，需确保有其可访问的存储介质。目前，MEPIS无法向采用NTFS格式（常用于Windows2000和XP工作站）的硬盘写入数据。不过，若硬盘采用FAT32格式，MEPIS就能进行写入操作。此外，MEPIS还能将文件写入软盘和大多数USB闪存驱动器。若工作站连接到局域网，还可通过FTP协议或挂载
英伟达靠什么支撑起了4万亿？AI泡沫还能撑多久？
英伟达市值突破4万亿美元，既是AI算力需求爆发的直接体现，也暗含市场对未来的狂热预期。其支撑逻辑与潜在风险并存，而AI泡沫的可持续性则取决于技术、商业与地缘政治的复杂博弈。⚙️一、英伟达4万亿市值的核心支撑因素技术垄断与生态壁垒硬件优势：英伟达GPU在AI训练市场占有率超87%，H100芯片的FP16算力达1979TFLOPS，领先竞品3-5倍。CUDA生态：400万开发者构建的软件护城河，成为A
Spring进阶 - SpringMVC实现原理之DispatcherServlet处理请求的过程倾听铃的声后端 spring java mvc 开发语言分布式
前文我们有了IOC的源码基础以及SpringMVC的基础，我们便可以进一步深入理解SpringMVC主要实现原理，包含DispatcherServlet的初始化过程和DispatcherServlet处理请求的过程的源码解析。本文是第二篇：DispatcherServlet处理请求的过程的源码解析。@pdaiSpring进阶-SpringMVC实现原理之DispatcherServlet处理请求的
【C++算法】76.优先级队列_前 K 个高频单词流星白龙优选算法C++c++算法开发语言
文章目录题目链接：题目描述：解法C++算法代码：题目链接：692.前K个高频单词题目描述：解法利用堆来解决TopK问题预处理一下原始的字符串数组，用一个哈希表统计一下每一个单词出现的频次。创建一个大小为k的堆频次：小根堆字典序（频次相同的时候）：大根堆循环让元素依次进堆判断提取结果C++算法代码：classSolution{//定义类型别名，PSI表示对typedefpairPSI;//自定义比较
企业级区块链平台Hyperchain核心原理剖析 boyedu 区块链区块链企业级区块链平台 Hyperchain
Hyperchain作为国产自主可控的企业级联盟区块链平台，其核心原理围绕高性能共识、隐私保护、智能合约引擎及可扩展架构展开，通过多模块协同实现企业级区块链网络的高效部署与安全运行。以下从核心架构、关键技术、性能优化、安全机制、应用场景五个维度展开剖析：一、核心架构：分层解耦与模块化设计Hyperchain采用分层架构，将区块链功能解耦为独立模块，支持灵活组合与扩展：P2P网络层由验证节点（VP）
车载诊断架构 ---面向售后的DTC应该怎么样填写？汽车电子实验室车载电子电气架构漫谈UDS诊断协议系列 EV（电动汽车）常规知识必备架构面向售后的DTC 车载诊断架构 OEM怎么掌握软件开发能力车载通信网络槪述 android ZEVonUDS-J1979
我是穿拖鞋的汉子，魔都中坚持长期主义的汽车电子工程师。老规矩，分享一段喜欢的文字，避免自己成为高知识低文化的工程师：简单，单纯，喜欢独处，独来独往，不易合同频过着接地气的生活，除了生存温饱问题之外，没有什么过多的欲望，表面看起来很高冷，内心热情，如果你身边有这样灵性的人，一定要好好珍惜他们眼中有神有光，干净，给人感觉很舒服，有超强的感知能力有形的无形的感知力很强，能感知人的内心变化喜欢独处，好静，
通义万相2.2：开启高清视频生成新纪元 Liudef06小白特殊专栏 AIGC 人工智能人工智能通义万相2.2 图生视频
通义万相2.2：开启高清视频生成新纪元2025年7月28日，中国AI领域迎来里程碑时刻——通义万相团队正式开源其革命性视频生成模型Wan2.2的核心权重，这标志着开源社区首次获得支持720P高清视频生成的先进模型架构。一、架构革新：混合专家系统1.1MoE视频扩散架构通义万相2.2首次将混合专家（MoE）架构引入视频扩散模型，通过双专家系统实现计算效率与模型容量的平衡：classMoEVideoD
2025年SDK游戏盾终极解析：重新定义手游安全的“隐形护甲” 上海云盾商务经理杨杨游戏安全
副标题：从客户端加密到AI反外挂，拆解全链路防护如何重塑游戏攻防天平引言：当传统高防在手游战场“失效”2025年全球手游市场规模突破$2000亿，黑客单次攻击成本却降至$30——某SLG游戏因协议层CC攻击单日流失37%玩家，某开放世界游戏遭低频DDoS瘫痪6小时损失千万。传统高防IP的致命短板暴露无遗：无法识别伪造客户端流量、难防协议篡改、误杀率超15%。而集成于游戏终端的SDK游戏盾，正以“源
LVS+Keepalived实现高可用和负载均衡 2401_84412895 程序员 lvs 负载均衡运维
2、开启网卡子接口配置VIP[root@a~]#cd/etc/sysconfig/network-scripts/[root@anetwork-scripts]#cp-aifcfg-ens32ifcfg-ens32:0[root@anetwork-scripts]#catifcfg-ens32:0BOOTPROTO=staticDEVICE=ens32:0ONBOOT=yesIPADDR=10.1
CodeFoeces-450B ss5smi
题目原题链接：B.JzzhuandSequences题意根据公式公式计算对应fn的值。参考了其他作者的代码和思路。找循环点。负数取余需要加取余数到>0为止才可取余。代码#includeusingnamespacestd;constintmod=1e9+7;intmain(){longlongf[10],x,y,n;cin>>x>>y>>n;x=(x+mod)%mod;y=(y+mod)%mod;f
编程算法：技术创新的引擎与业务增长的核心驱动力
在数字经济时代，算法已成为推动技术创新与业务增长的隐形引擎。从存内计算突破冯·诺依曼瓶颈，到动态规划优化万亿级金融交易，编程算法正在重塑产业竞争格局。一、存内计算：突破冯·诺依曼瓶颈的算法革命1.1存内计算的基本原理传统计算架构中90%的能耗消耗在数据搬运上。存内计算（Processing-in-Memory）通过直接在存储单元执行计算，实现能效10-100倍提升：#传统计算vs存内计算能耗模型i
【异常】使用 LiteFlow 框架时，提示错误ChainDuplicateException: [chain name duplicate] chainName=categoryChallenge 本本本添哥 002 -进阶开发能力 java
一、报错内容Causedby:com.yomahub.liteflow.exception.ChainDuplicateException:[chainnameduplicate]chainName=categoryChallengeatcom.yomahub.liteflow.parser.helper.ParserHelper.lambda$null$0(ParserHelper.java:1
四百八十九章. 春晓客栈鲁易寒巨木擎天
邓林他们在打量别人的时候，而别人，自然也是在打量他们了。邓林就看见在这大堂里，散散啦啦的有四个人在，其中两个，只是僵直站立，眼眶中燃烧着橙色骨火的骷髅，而另外两个坐着的，才是眼眶中点燃黄色魂火的骨族人。这两个骨族人中的一个，在邓林他们刚一进来的时候，就把注意力都放在了伊莲娜娜的身上，似乎在确认着什么，当看到伊莲娜娜冲着自己点了点头以后，他有些激动的走过来几步，口中说道：“真的是伊莲娜娜公主殿下？您
善吃五色五味，女人更妖娆，想漂亮享受健康美味吃起来余老师讲健康
善吃五色五味，女人更妖娆我们所说的五色五味是指具有赤、青、黄、白、黑五种颜色以及酸、辛、甘、苦、咸五种味道的食物。其实五味和五色与人体的五脏对应，养生必养五脏，通过五味、五色的食物可以调养人的容颜。一、赤色、苦味入心——养颜，面色红润有句话这么说，“会吃的女人更漂亮，贪吃的女人变糟粕。”经过科学、合理搭配的五色五味饮食，就是最天然、最安全的美容药方。赤色——抗衰老，增强免疫力，改善血液循环。赤色即
代码随想录算法训练营第三十五天
01背包问题二维题目链接01背包问题二维题解importjava.util.Scanner;publicclassMain{publicstaticvoidmain(String[]args){Scannersc=newScanner(System.in);intM=sc.nextInt();intN=sc.nextInt();int[]space=newint[M];int[]value=new
为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
《自控力》P158 迷糊笑
作者：凯利•麦格尼格尔图片发自App金句：众多研究显示，自我批评会降低积极性和自控力，而且也是最容易导致抑郁的因素。它不仅耗尽了“我要做”的力量，还耗尽了“我想要”的力量。相反，自我同情则会提升积极性和自控力，比如，在压力和挫折面前支持自己、对自己好一些。感想：我当年抑郁是不是也是因为这样？图片发自App
D124:如何训练独立思考力？大栗子_
当我们要判断一个理论或者思想是否正确，需要有三个层次，分别是体验、解释和分析。首先看体验。很多时候，我们会相信“听上去、感觉是对的”的事情。我们之前讲的太空笔的故事之所以大多数人都认为是对的，就是有一些看似真实的关键词，比如美国，NASA，设计等，这些词看起来非常权威，但是离我们又遥远，这时候我们的大脑就会放松警惕了。于是，我们毫不犹豫就接受了。说到这里，你有没有发现之前的电视广告中的各种高让我们
心脏猝死姜地主
什么是猝死？猝死就是平时身体健康、或貌似健康的患者，在出乎意料的短时间内，因自然疾病而突然死亡。猝死基本上都在1小时之内死亡。因为实在太快了，80%的死亡都发生在医院之外，连抢救的机会都没有。猝死是一件非常令人震惊的、对日常生活有极大冲击力的事。一个人昨天还好端端的，还热情洋溢地发朋友圈，今天可能突然就没了。2018年，吉祥三宝里的父亲，蒙古族歌手布仁巴雅尔就是突发心脏病去世，享年58岁。麻醉界有
人不能两次踏进同一条河流就是源
这是古希腊学家赫拉克利特的名言，在我原先看来就是万事万物都在不断的变化，强调事物的运动性。可后来了解到他还有个徒弟更深的进行了解读，人哪怕一次也不能踏进同一条河流，因为当你踏进的时候，已经不是你最初想的那天河流了。这确实也说明了事物无时无刻不在运动，可感觉毫无意义，如果一切都这样去算，那么每一秒甚至每一个更加微小的时间上都会有一个不同的结论，这根本无法指明生活的方向和解决困顿，只会让人更加困顿。这
AI模型训练中过拟合和欠拟合的区别是什么？ workflower 人工智能算法人工智能数据分析
在AI模型训练中，过拟合和欠拟合是两种常见的模型性能问题，核心区别在于模型对数据的学习程度和泛化能力：欠拟合（Underfitting）-定义：模型未能充分学习到数据中的规律，对训练数据的拟合程度较差，在训练集和测试集上的表现都不好（如准确率低、损失值高）。-原因：-模型结构过于简单（如用线性模型解决非线性问题）；-训练数据量不足或特征信息不充分；-训练时间太短，模型尚未学到有效模式。-表现：训练
Selenium 特殊控件操作与 ActionChains 实践详解小馋喵知识杂货铺 selenium 测试工具
1.下拉框单选操作(a)使用SeleniumSelect类（标准HTML标签）Selenium提供了内置的Select类用于操作标准下拉框，这种方式简单且直观。fromselenium.webdriver.support.uiimportSelect#定位下拉框dropdown=Select(driver.find_element("id","dropdown_id"))#通过以下三种方式选择单个
斗罗大陆：没有魂环的唐三紫极魔瞳加鬼影迷踪战力有多强嘚瑟_a3a5
自从唐三穿越到斗罗大陆以后，由于修炼体系和前世的不同，虽然玄天功也是勤修不辍可是无论怎样修炼都毫无进展，总是难以突破瓶颈，而紫极魔瞳和鬼影迷踪也因为内力的限制发挥不出其真正的威力。后来通过在素云涛那里了解了一些斗罗大陆修炼的方法和体系之后，唐三才知道魂力也就是他前世的内力需要突破的话需要附加魂环以后才可以进入下一阶段的修炼。而在小刚老师详细介绍和针对唐三的具体情况分析指导以后，唐三也不再迷茫决定重
【生活小悟】换牙记薛春霞Cathy
这段时间，不知道在忙什么，总感觉时光匆匆。每天浑浑噩噩起床，忙忙碌碌吃饭上班接送娃，不知不觉一日又没了。每天不是在感慨岁月匆匆，就是在埋怨自己又蹉跎了岁月。总感觉这样的日子似乎哪里不对劲，却又无能为力，茫然无措。于是又继续着这样的无奈。昨儿下午，妈妈回来了，接孩子们，然后送回家，自己一个人来学校上自习。这个自习我上的踏实，不用担忧自己在校园玩耍的孩子会磕碰到哪，也不用考虑会不会又玩儿到忘记上厕所，
C++编程基础与面向对象概念解析侯昂面向对象编程 C++语法函数类与对象继承与多态性
C++编程基础与面向对象概念解析背景简介C++是一种广泛使用的面向对象编程语言，它允许开发者创建高效、灵活且功能强大的程序。本文基于《C++Primer》一书的章节内容，深入解析C++的核心概念和面向对象编程原则，旨在帮助读者构建扎实的C++编程基础。面向对象编程的原则软件危机与进化介绍了软件危机的产生和软件进化的必要性，强调了面向对象编程（OOP）在应对这些问题中的优势。面向对象编程范式讨论了面
中原焦点团队坚持原创分享第 1172天金JJ
信阳案例督导：在学生出现危机时，学校启动心理应急程序，一位心理老师安抚个案的同时，其他心理老师给班级同学进行团体心理辅导，学校方面马上通知家长前来学校。学校危机干预应急流程的成熟，能有效降低个案的自杀风险。个案不愿谈及家庭及自己自杀行为等问题时，用沙盘、玩具等分散注意力，谈论他感兴趣的话题，老师温和的态度，关切的言语，个案的情绪逐渐平复。从个案自己说的，流露的非言语，家长、老师、同学、以往的记录，
[spring6: Mvc-网关]-源码解析
推荐阅读：[spring6:Mvc-函数式编程]-源码解析GatewayServerMvcAutoConfiguration@AutoConfiguration(after={HttpClientAutoConfiguration.class,RestTemplateAutoConfiguration.class,RestClientAutoConfiguration.class,FilterAu
Zread.AI：一键将GitHub项目转化为结构化中文手册的AI代码维基工具
Zread.AI：一键将GitHub项目转化为结构化中文手册的AI代码维基工具文章来源：PoixeAI文章目录Zread.AI工具概述核心功能优势亮点典型应用场景上手指南注意事项官网地址Zread.AI由智谱Z.ai推出，是一款面向开发者的AI代码维基工具，可在几秒内把任何公开GitHub仓库转化为结构化中文手册，并通过独家Buzz面板聚合commits、issues与相关新闻，让项目脉搏一目了然
java线程Thread和Runnable区别和联系 zx_code java jvm thread 多线程 Runnable
我们都晓得java实现线程2种方式，一个是继承Thread，另一个是实现Runnable。模拟窗口买票，第一例子继承thread，代码如下 package thread; public class ThreadTest { public static void main(String[] args) { Thread1 t1 = new Thread1(
【转】JSON与XML的区别比较丁_新 json xml
1.定义介绍 (1).XML定义扩展标记语言 (Extensible Markup Language, XML) ，用于标记电子文件使其具有结构性的标记语言，可以用来标记数据、定义数据类型，是一种允许用户对自己的标记语言进行定义的源语言。 XML使用DTD(document type definition)文档类型定义来组织数据;格式统一，跨平台和语言，早已成为业界公认的标准。 XML是标
c++ 实现五种基础的排序算法 CrazyMizzz C++c 算法
#include<iostream> using namespace std; //辅助函数，交换两数之值 template<class T> void mySwap(T &x, T &y){ T temp = x; x = y; y = temp; } const int size = 10; //一、用直接插入排
我的软件麦田的设计者我的软件音乐类娱乐放松
这是我写的一款app软件，耗时三个月，是一个根据央视节目开门大吉改变的，提供音调，猜歌曲名。1、手机拥有者在android手机市场下载本APP，同意权限，安装到手机上。2、游客初次进入时会有引导页面提醒用户注册。（同时软件自动播放背景音乐）。3、用户登录到主页后，会有五个模块。a、点击不胫而走，用户得到开门大吉首页部分新闻，点击进入有新闻详情。b、
linux awk命令详解被触发 linux awk
awk是行处理器: 相比较屏幕处理的优点，在处理庞大文件时不会出现内存溢出或是处理缓慢的问题，通常用来格式化文本信息 awk处理过程: 依次对每一行进行处理，然后输出 awk命令形式: awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END{}’ file [-F|-f|-v]大参数，-F指定分隔符，-f调用脚本，-v定义变量 var=val
各种语言比较 _wy_ 编程语言
Java Ruby PHP 擅长领域
oracle 中数据类型为clob的编辑知了ing oracle clob
public void updateKpiStatus(String kpiStatus,String taskId){ Connection dbc=null; Statement stmt=null; PreparedStatement ps=null; try { dbc = new DBConn().getNewConnection(); //stmt = db
分布式服务框架 Zookeeper -- 管理分布式环境中的数据矮蛋蛋 zookeeper
原文地址： http://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/ 安装和配置详解本文介绍的 Zookeeper 是以 3.2.2 这个稳定版本为基础，最新的版本可以通过官网 http://hadoop.apache.org/zookeeper/来获取，Zookeeper 的安装非常简单，下面将从单机模式和集群模式两
tomcat数据源 alafqq tomcat
数据库 JNDI(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。没有使用JNDI时我用要这样连接数据库： 03. Class.forName("com.mysql.jdbc.Driver"); 04. conn
遍历的方法百合不是茶遍历
遍历在java的泛
linux查看硬件信息的命令 bijian1013 linux
linux查看硬件信息的命令一.查看CPU： cat /proc/cpuinfo 二.查看内存： free 三.查看硬盘： df linux下查看硬件信息 1、lspci 列出所有PCI 设备； lspci - list all PCI devices:列出机器中的PCI设备（声卡、显卡、Modem、网卡、USB、主板集成设备也能
java常见的ClassNotFoundException bijian1013 java
1.java.lang.ClassNotFoundException: org.apache.commons.logging.LogFactory 添加包common-logging.jar2.java.lang.ClassNotFoundException: javax.transaction.Synchronization
【Gson五】日期对象的序列化和反序列化 bit1129 反序列化
对日期类型的数据进行序列化和反序列化时，需要考虑如下问题： 1. 序列化时，Date对象序列化的字符串日期格式如何 2. 反序列化时，把日期字符串序列化为Date对象，也需要考虑日期格式问题 3. Date A -> str -> Date B,A和B对象是否equals 默认序列化和反序列化 import com
【Spark八十六】Spark Streaming之DStream vs. InputDStream bit1129 Stream
1. DStream的类说明文档： /** * A Discretized Stream (DStream), the basic abstraction in Spark Streaming, is a continuous * sequence of RDDs (of the same type) representing a continuous st
通过nginx获取header信息 ronin47 nginx header
1. 提取整个的Cookies内容到一个变量，然后可以在需要时引用，比如记录到日志里面， if ( $http_cookie ~* "(.*)$") { set $all_cookie $1; } 变量$all_cookie就获得了cookie的值，可以用于运算了
java-65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 bylijinnan java
参考了网上的http://blog.csdn.net/peasking_dd/article/details/6342984 写了个java版的： public class Print_1_To_NDigit { /** * Q65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 * 1.使用字符串
Netty源码学习-ReplayingDecoder bylijinnan java netty
ReplayingDecoder是FrameDecoder的子类，不熟悉FrameDecoder的，可以先看看 http://bylijinnan.iteye.com/blog/1982618 API说，ReplayingDecoder简化了操作，比如： FrameDecoder在decode时，需要判断数据是否接收完全： public class IntegerH
js特殊字符过滤 cngolon js特殊字符 js特殊字符过滤
1.js中用正则表达式过滤特殊字符, 校验所有输入域是否含有特殊符号function stripscript(s) { var pattern = new RegExp("[`~!@#$^&*()=|{}':;',\\[\\].<>/?~！@#￥……&*（）——|{}【】‘；：”“'。，、？]"
hibernate使用sql查询 ctrain Hibernate
import java.util.Iterator; import java.util.List; import java.util.Map; import org.hibernate.Hibernate; import org.hibernate.SQLQuery; import org.hibernate.Session; import org.hibernate.Transa
linux shell脚本中切换用户执行命令方法 daizj linux shell 命令切换用户
经常在写shell脚本时，会碰到要以另外一个用户来执行相关命令，其方法简单记下： 1、执行单个命令：su - user -c "command" 如：下面命令是以test用户在/data目录下创建test123目录 [root@slave19 /data]# su - test -c "mkdir /data/test123"
好的代码里只要一个 return 语句 dcj3sjt126com return
别再这样写了：public boolean foo() { if (true) { return true; } else { return false;
Android动画效果学习 dcj3sjt126com android
1、透明动画效果方法一：代码实现 public View onCreateView(LayoutInflater inflater, ViewGroup container, Bundle savedInstanceState) { View rootView = inflater.inflate(R.layout.fragment_main, container, fals
linux复习笔记之bash shell (4)管道命令 eksliang linux管道命令汇总 linux管道命令 linux常用管道命令
转载请出自出处： http://eksliang.iteye.com/blog/2105461 bash命令执行的完毕以后，通常这个命令都会有返回结果，怎么对这个返回的结果做一些操作呢？那就得用管道命令‘|’。上面那段话，简单说了下管道命令的作用，那什么事管道命令呢？答：非常的经典的一句话，记住了，何为管
Android系统中自定义按键的短按、双击、长按事件 gqdy365 android
在项目中碰到这样的问题：由于系统中的按键在底层做了重新定义或者新增了按键，此时需要在APP层对按键事件（keyevent）做分解处理，模拟Android系统做法，把keyevent分解成： 1、单击事件：就是普通key的单击； 2、双击事件：500ms内同一按键单击两次； 3、长按事件：同一按键长按超过1000ms（系统中长按事件为500ms）； 4、组合按键：两个以上按键同时按住；
asp.net获取站点根目录下子目录的名称 hvt .net C#asp.net hovertree Web Forms
使用Visual Studio建立一个.aspx文件(Web Forms)，例如hovertree.aspx,在页面上加入一个ListBox代码如下： <asp:ListBox runat="server" ID="lbKeleyiFolder" /> 那么在页面上显示根目录子文件夹的代码如下： string[] m_sub
Eclipse程序员要掌握的常用快捷键 justjavac java eclipse 快捷键 ide
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。写道程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可
c++编程随记 lx.asymmetric C++笔记
为了字体更好看，改变了格式…… &&运算符： #include<iostream> using namespace std; int main(){ int a=-1,b=4,k; k=(++a<0)&&!(b--
linux标准IO缓冲机制研究音频数据 linux
一、什么是缓存I/O(Buffered I/O)缓存I/O又被称作标准I/O,大多数文件系统默认I/O操作都是缓存I/O。在Linux的缓存I/O机制中，操作系统会将I/O的数据缓存在文件系统的页缓存(page cache)中，也就是说，数据会先被拷贝到操作系统内核的缓冲区中，然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。1.缓存I/O有以下优点:A.缓存I/O使用了操作系统内核缓冲区，
随想生活暗黑小菠萝生活
其实账户之前就申请了，但是决定要自己更新一些东西看也是最近。从毕业到现在已经一年了。没有进步是假的，但是有多大的进步可能只有我自己知道。毕业的时候班里12个女生，真正最后做到软件开发的只要两个包括我，PS：我不是说测试不好。当时因为考研完全放弃找工作，考研失败，我想这只是我的借口。那个时候才想到为什么大学的时候不能好好的学习技术，增强自己的实战能力，以至于后来找工作比较费劲。我
我认为POJO是一个错误的概念 windshome java POJO 编程 J2EE 设计
这篇内容其实没有经过太多的深思熟虑，只是个人一时的感觉。从个人风格上来讲，我倾向简单质朴的设计开发理念；从方法论上，我更加倾向自顶向下的设计；从做事情的目标上来看，我追求质量优先，更愿意使用较为保守和稳妥的理念和方法。 &