UCAS_HMM

CUDA——内存

内存形式

静态全局内存

#include 
#include

__device__ float devData;   //- GPU静态变量（所有设备代码均可见，主机代码不允许直接访问）

__global__ void checkGlobalVariable()
{
    printf("threadIdx.x=%d devData = %0.2f\n", threadIdx.x, devData);
    devData += 2.0f;
}

int main(int argc, char **argv)
{
    float init_value = 3.14f;
    //- 注意传递参数是devData，而不是地址，不需要指定拷贝方向，因为函数名已经明确了
    cudaMemcpyToSymbol(devData, &init_value, sizeof(float));
    dim3 block(3);
    dim3 grid(2);
    checkGlobalVariable<<>>();
    cudaDeviceSynchronize();
    //- 注意传递参数是devData，而不是地址，不需要指定拷贝方向，因为函数名已经明确了
    cudaMemcpyFromSymbol(&init_value, devData, sizeof(float));
    printf("devData=%0.2f\n", init_value);

    return 0;
}

[mmhe@k231 chapter4]$ ./test 
threadIdx.x=0 devData = 3.14
threadIdx.x=1 devData = 3.14
threadIdx.x=2 devData = 3.14
threadIdx.x=0 devData = 3.14
threadIdx.x=1 devData = 3.14
threadIdx.x=2 devData = 3.14
devData=5.14

可以看到每个线程输出的结果都是3.14，而最终主机输出的结果是5.14，显示只加和了1次。这是因为访问冲突导致的，所有的thread首先加载到静态变量的值（均为3.14），然后执行加2操作之后（结果为5.14），将结果存储到静态变量中，因此最终结果为5.14.如果想要解决这个问题，需要调用原子操作atomicAdd。
另外需要注意的是，devData在主机代码中是被当做一个符号进行处理的，而非一个变量，因此在调用cudaMemcpyToSymbol和cudaMemcpyFromSymbol函数时，传递的是符号名字，而非地址。
书里面也介绍了一个获取全局变量地址的API——cudaGetSymbolAddress，这样就能使用cudaMemcpy来进行拷贝赋值了。

固定内存

在CUDA框架下，主机内存分为两种：（1）可分页内存——由malloc开辟，有free释放；（2）固定内存——由cudaMallocHost开辟，由cudaFreeHost释放，占用的内存更多，但是主机设备间的数据传递更快。

#include
#include

int main(int argc, char **argv)
{
    int *pin_arr, *page_arr;
    int nElem = 1<<30;
    cudaMallocHost((void **)&pin_arr, nElem * sizeof(int));
    page_arr = (int *)malloc(nElem * sizeof(int));

    int *d_arr;
    cudaMalloc((void **)&d_arr, nElem * sizeof(int));

    cudaMemcpy(d_arr, page_arr, nElem * sizeof(int), cudaMemcpyHostToDevice);
    cudaMemcpy(page_arr, d_arr, nElem * sizeof(int), cudaMemcpyDeviceToHost);
    // cudaMemcpy(d_arr, pin_arr, nElem * sizeof(int), cudaMemcpyHostToDevice);
    // cudaMemcpy(pin_arr, d_arr, nElem * sizeof(int), cudaMemcpyDeviceToHost);

    free(page_arr);
    cudaFreeHost(pin_arr);
    cudaDeviceReset();
    return 0;
}

==45339== Profiling result:
            Type  Time(%)      Time     Calls       Avg       Min       Max  Name
 GPU activities:   84.54%  3.21079s         1  3.21079s  3.21079s  3.21079s  [CUDA memcpy DtoH]
                   15.46%  587.34ms         1  587.34ms  587.34ms  587.34ms  [CUDA memcpy HtoD]

==48677== Profiling result:
            Type  Time(%)      Time     Calls       Avg       Min       Max  Name
 GPU activities:   50.19%  574.67ms         1  574.67ms  574.67ms  574.67ms  [CUDA memcpy DtoH]
                   49.81%  570.23ms         1  570.23ms  570.23ms  570.23ms  [CUDA memcpy HtoD]

上半部分是使用可分页的内存，下半部分使用的是固定内存。可以发现，对于设备到主机的传输，固定内存要远快于可分页内存，但是对于主机到设备的传输，则性能差不多。

零拷贝内存

零拷贝内存是主机和设备都能直接访问的一片内存，主要用于显存不够时的一个补充。但是由于数据需要经过PCIe总线，因此如果频繁对这片区域的数据进行读写，那么会显著降低性能。
以矢量相加为例子，比较一下当A和B都位于GMEM和位于零拷贝内存上，核函数执行效率的区别。

#include
#include

__host__ void init(int *arr, int nElem)
{
    for (int i = 0; i < nElem; i++)
    {
        arr[i] = i;
    }
}

__global__ void sumArr(int *arrA, int *arrB, int *arrC, int nElem)
{
    int index = blockIdx.x * blockDim.x + threadIdx.x;
    if (index < nElem)
    {
        arrC[index] = arrA[index] + arrB[index];
    }
}

__host__ void check(int *arrA, int *arrB, int *arrC, int nElem)
{
    for (int i = 0; i < nElem; i++)
    {
        if (arrC[i] != (arrA[i] + arrB[i]))
        {
            printf("error at i = %d\n", i);
            return;
        }
    }
    printf("result is correct\n");
}

int main(int argc, char **argv)
{
    int nElem = 1<<24;
    int *h_arrA, *h_arrB, *h_arrC, *d_arrA_G, *d_arrB_G, *d_arrC_G, *d_arrA_U, *d_arrB_U, *d_arrC_U;
    h_arrA = (int *)malloc(nElem * sizeof(int));
    h_arrB = (int *)malloc(nElem * sizeof(int));
    h_arrC = (int *)malloc(nElem * sizeof(int));
    cudaMalloc((void **)&d_arrA_G, nElem * sizeof(int));
    cudaMalloc((void **)&d_arrB_G, nElem * sizeof(int));
    cudaMalloc((void **)&d_arrC_G, nElem * sizeof(int));
    cudaHostAlloc((void **)&d_arrA_U, nElem * sizeof(int), cudaHostAllocMapped);
    cudaHostAlloc((void **)&d_arrB_U, nElem * sizeof(int), cudaHostAllocMapped);
    cudaHostAlloc((void **)&d_arrC_U, nElem * sizeof(int), cudaHostAllocMapped);

    init(h_arrA, nElem);
    init(h_arrB, nElem);
    init(d_arrA_U, nElem);
    init(d_arrB_U, nElem);
    cudaMemcpy(d_arrA_G, h_arrA, nElem * sizeof(int), cudaMemcpyHostToDevice);
    cudaMemcpy(d_arrB_G, h_arrB, nElem * sizeof(int), cudaMemcpyHostToDevice);

    dim3 block(512);
    dim3 grid((nElem + block.x - 1) / block.x);
    //- A和B都是全局内存，C是全局内存
    sumArr<<>>(d_arrA_G, d_arrB_G, d_arrC_G, nElem);
    cudaMemcpy(h_arrC, d_arrC_G, nElem * sizeof(int), cudaMemcpyDeviceToHost);
    check(h_arrA, h_arrB, h_arrC, nElem);
    // //- A和B都是零拷贝内存，C是全局内存
    // sumArr<<>>(d_arrA_U, d_arrB_U, d_arrC_G, nElem);
    // cudaMemcpy(h_arrC, d_arrC_G, nElem * sizeof(int), cudaMemcpyDeviceToHost);
    // check(h_arrA, h_arrB, h_arrC, nElem);
    // //- A和B都是零拷贝内存，C也是零拷贝内存
    // sumArr<<>>(d_arrA_U, d_arrB_U, d_arrC_U, nElem);
    // cudaDeviceSynchronize();    //- 这个地方一定要注意，鉴于d_arrC_U主机可以访问，就没有用调用cudaMemcpy来拷贝，因此一定要显式同步。
    // check(d_arrA_U, d_arrB_U, d_arrC_U, nElem);

    free(h_arrA);
    free(h_arrB);
    free(h_arrC);
    cudaFree(d_arrA_G);
    cudaFree(d_arrB_G);
    cudaFree(d_arrC_G);
    cudaFreeHost(d_arrA_U);
    cudaFreeHost(d_arrB_U);
    cudaFreeHost(d_arrC_U);
    cudaDeviceReset();

    return 0;
}

#-  A和B都是全局内存，C是全局内存
            Type  Time(%)      Time     Calls       Avg       Min       Max  Name
 GPU activities:   60.39%  42.203ms         1  42.203ms  42.203ms  42.203ms  [CUDA memcpy DtoH]
                   27.05%  18.908ms         2  9.4539ms  9.3450ms  9.5628ms  [CUDA memcpy HtoD]
                   12.56%  8.7768ms         1  8.7768ms  8.7768ms  8.7768ms  sumArr(int*, int*, int*, int)
#- A和B都是零拷贝内存，C是全局内存
 GPU activities:   54.52%  39.520ms         1  39.520ms  39.520ms  39.520ms  [CUDA memcpy DtoH]
                   29.03%  21.047ms         2  10.523ms  10.407ms  10.639ms  [CUDA memcpy HtoD]
                   16.45%  11.926ms         1  11.926ms  11.926ms  11.926ms  sumArr(int*, int*, int*, int)
#- A和B都是零拷贝内存，C也是零拷贝内存
 GPU activities:   66.12%  49.425ms         2  24.713ms  21.864ms  27.561ms  [CUDA memcpy HtoD]
                   33.88%  25.330ms         1  25.330ms  25.330ms  25.330ms  sumArr(int*, int*, int*, int)

可以看到，对性能的影响还是挺大的。零拷贝内存不适合大数据集，书上提到，随着处理的数据变大，减速越明显。

统一虚拟寻址

上面的零拷贝例子中，我们直接将零拷贝内存的指针传递给了核函数，让它在设备代码上被解析。其实这里隐藏了一个称为虚拟统一寻址（UVA）的机制。对于不支持这一特性的老版本cuda来说，我们不能这样用同一个指针来在设备和主机代码中进行解析，而是需要先通过API获取零拷贝内存的地址，然后传递给核函数，才能进行解析，如：

int *d_arrA_U_ref, *d_arrB_U_ref, *d_arrC_U_ref;
cudaHostGetDevicePointer((void **)&d_arrA_U_ref, d_arrA_U, 0);
cudaHostGetDevicePointer((void **)&d_arrB_U_ref, d_arrB_U, 0);
cudaHostGetDevicePointer((void **)&d_arrC_U_ref, d_arrC_U, 0);
sumArr<<>>(d_arrA_U_ref, d_arrB_U_ref, d_arrC_U_ref, nElem);

这两种做法性能是相同的，只是代码可读性和维护性更强。

内存访问模式

对齐访问

这里有一个推论概念：以L1缓存内存加载事务为例，粒度为128字节。首先会以数组的首地址为起始点，每间隔128字节为一个区间，如果一个warp中的32个thread请求的数据内存刚好都落在这一个区间内，那么只需要一个128字节内存加载事务就能满足需求；否则，如果散落在两个区间内，就需要两个加载事务。这里的关键要明确，划分区间的起始点是数组的首地址。

#include
#include

__global__ void sumArrOffSet(int *arrA, int *arrB, int *arrC, int nElem, int offset)
{
    int index = blockIdx.x * blockDim.x + threadIdx.x;
    int k = index + offset;
    if (index < nElem)
    {
        arrC[index] = arrA[k] + arrB[k];
    }
}

int main(int argc, char **argv)
{
    int nElem = 1<<14;
    int *d_arrA, *d_arrB, *d_arrC;
    cudaMalloc((void **)&d_arrA, nElem * sizeof(int));
    cudaMalloc((void **)&d_arrB, nElem * sizeof(int));
    cudaMalloc((void **)&d_arrC, nElem * sizeof(int));

    dim3 block(512);
    dim3 grid((nElem + block.x - 1) / block.x);
    sumArrOffSet<<>>(d_arrA, d_arrB, d_arrC, nElem, atoi(argv[1]));
    cudaDeviceSynchronize();
    
    cudaFree(d_arrA);
    cudaFree(d_arrB);
    cudaFree(d_arrC);
    cudaDeviceReset();

    return 0;
}

[mmhe@k231 chapter4]$ nvprof --metrics gld_transactions,gst_transactions ./test 0
Invocations                               Metric Name                        Metric Description         Min         Max         Avg
Device "Tesla K80 (0)"
    Kernel: sumArrOffSet(int*, int*, int*, int, int)
          1                          gld_transactions                  Global Load Transactions        1024        1024        1024
          1                          gst_transactions                 Global Store Transactions         512         512         512

[mmhe@k231 chapter4]$ nvprof --metrics gld_transactions,gst_transactions ./test 1
Invocations                               Metric Name                        Metric Description         Min         Max         Avg
Device "Tesla K80 (0)"
    Kernel: sumArrOffSet(int*, int*, int*, int, int)
          1                          gld_transactions                  Global Load Transactions        2048        2048        2048
          1                          gst_transactions                 Global Store Transactions         512         512         512

[mmhe@k231 chapter4]$ nvprof --metrics gld_transactions,gst_transactions ./test 16
Invocations                               Metric Name                        Metric Description         Min         Max         Avg
Device "Tesla K80 (0)"
    Kernel: sumArrOffSet(int*, int*, int*, int, int)
          1                          gld_transactions                  Global Load Transactions        2048        2048        2048
          1                          gst_transactions                 Global Store Transactions         512         512         512

[mmhe@k231 chapter4]$ nvprof --metrics gld_transactions,gst_transactions ./test 32
Invocations                               Metric Name                        Metric Description         Min         Max         Avg
Device "Tesla K80 (0)"
    Kernel: sumArrOffSet(int*, int*, int*, int, int)
          1                          gld_transactions                  Global Load Transactions        1024        1024        1024
          1                          gst_transactions                 Global Store Transactions         512         512         512

本次处理的矢量长度为16384，blockDim.x=512，共有32个block，每个block有16个warp。

当偏移量=0时，第一个warp中请求的A和B元素各需要一个128字节的内存加载事务，因此共计1024个内存加载事务。
当偏移量=1时，第一个warp中32个thread加载A和B均落在字节索引4-131这128个字节内，但是由于前面推论中提到的分区是以数组的首地址开始的，因此0-127属于第一个区间，128-255属于第二个区间，因此4-131跨越了两个区间。对于其他的warp也是如此，因此一个warp需要4个内存事务来进行，共计2048个加载事务。
当偏移量=16时，第一个warp加载的字节索引落在64-191这128个字节内，同样跨越了两个区间，因此也上述情况一样；
当偏移量=32时，第一个warp加载的字节索引落在128-255字节区间内，刚好属于第二个区间，因此一个事务就能满足，因此又回到了1024这个结果。
注意，这里的程序只是为了验证对其访问，因此并不注重程序的正确性，程序中存在跨区域索引。

合并访问

全局内存写入

写入的粒度有多种，因此它能提供更高的利用率。

结构体数组和数组结构体

#include
#include

struct point
{
    int x;
    int y;
};

__global__ void kernel(point *arr, int nElem)
{
    int index = blockIdx.x * blockDim.x + threadIdx.x;
    if (index < nElem)
    {
        arr[index].x = arr[index].x + 2;
        arr[index].y = arr[index].y + 2;
    }
}

int main(int argc, char **argv)
{
    int nElem = 1<<14;
    struct point *d_arr;
    cudaMalloc((void **)&d_arr, nElem * sizeof(point));
    dim3 block(512);
    dim3 grid((nElem + block.x - 1)/block.x);
    kernel<<>>(d_arr, nElem);
    cudaDeviceSynchronize();
    cudaDeviceReset();
    return 0;
}

数组尺寸16384，block尺寸512，共有32个block，每个block有16个warp。
当结构体对象是数组的基本单元时，在这个数组的内存中，对象成员x和y是紧挨在一起的，即[x,y,x,y…x,y]。那么对于一个warp中对x的索引，会分散在以数组首地址为起始的两个128字节区间内，也就是说，加载x需要2个事务，那么总的核函数加载x和y共需要2048个内存加载事务，并且利用率只有50%。

#include
#include

struct point
{
    int *x;
    int *y;
};

__global__ void init(point *A, int nElem)
{
    int index = blockIdx.x * blockDim.x + threadIdx.x;
    if (index < nElem)
    {
        A->x[index] = index;
        A->y[index] = index;
    }
}

__global__ void kernel(point *A, int nElem)
{
    int index = blockIdx.x * blockDim.x + threadIdx.x;
    if (index < nElem)
    {
        A->x[index] += 2;
        A->y[index] += 2;
    }
}

int main(int argc, char **argv)
{
    int nElem = 32;
    point *h_arr;
    point *d_arr;
    h_arr = (point *)malloc(sizeof(point));
    cudaMalloc((void **)&(h_arr->x), nElem * sizeof(int));
    cudaMalloc((void **)&(h_arr->y), nElem * sizeof(int));
    cudaMalloc((void **)&d_arr, sizeof(point));
    cudaMemcpy(d_arr, h_arr, sizeof(point), cudaMemcpyHostToDevice);

    dim3 block(32);
    dim3 grid((nElem + block.x - 1)/block.x);
    init<<>>(d_arr, nElem);
    cudaDeviceSynchronize();
    kernel<<>>(d_arr, nElem);
    cudaDeviceSynchronize();
    cudaDeviceReset();
    return 0;
}

Invocations                               Metric Name                        Metric Description         Min         Max         Avg
Device "Tesla K80 (0)"
    Kernel: init(point*, int)
          1                          gld_transactions                  Global Load Transactions           2           2           2
          1                          gst_transactions                 Global Store Transactions           2           2           2
          1                            gld_efficiency             Global Memory Load Efficiency      25.00%      25.00%      25.00%
          1                            gst_efficiency            Global Memory Store Efficiency     100.00%     100.00%     100.00%
    Kernel: kernel(point*, int)
          1                          gld_transactions                  Global Load Transactions           4           4           4
          1                          gst_transactions                 Global Store Transactions           2           2           2
          1                            gld_efficiency             Global Memory Load Efficiency      85.00%      85.00%      85.00%
          1                            gst_efficiency            Global Memory Store Efficiency     100.00%     100.00%     100.00%

这个结果比较有意思，一步一步来分析：（32个数据，整体只有一个warp，便于分析）

init核函数：出现了2个加载事务，这是因为A->x也是需要从GMEM中进行加载的，一个int*类型有8个字节，需要一个内存加载事务。整体需要两个内存加载事务。这里需要注意的是，nvcc会根据加载量自动优化缓存路径，这里它采用了非L1缓存的方式来加载，导致加载粒度为32，因此利用率为25%。
kernel核函数：同样，对于数组地址的加载共计需要消耗2个32粒度的事务，其余元素的加载共需要消耗2个128粒度的事务，因此总的利用率为 $\frac{8\times2+32\times4\times2}{32\times2+128\times2} = 85\%$ .

最大内存带宽

基本概念

峰值带宽

K80一块板上集成了2个GPU，内存总线宽度是384bit，内存时钟频率为2505Mhz，双通道，8bit为一个字节，则内存带宽峰值为：
$\frac{2\times 384bit\times2.505GHz\times2}{8bits/byte} = 480.96GB/s$

有效带宽

$\text{effective bandwidth (GB/s)} = \frac{\left(\text{byte read + byte written}\right)}{\text{time}\times1024\times1024\times1024}$

矩阵转置

有效带宽上下限

上限：当读取和写入都是行主导的时候，内存可以被合并对其加载，此时的内存性能是最好的，因此这种情况作为有效带宽的上限
下限：当读取和写入都是列主导的时候，这是最坏的情况，因此作为下限。

L1缓存是否加载

L1缓存是否加载会导致加载粒度不同。

#include
#include
#include"../../CodeSamples/common/common.h"

__global__ void copyRow(int *arrA, int *arrB, int row, int col)
{
    int x = blockIdx.x * blockDim.x + threadIdx.x;
    int y = blockIdx.y * blockDim.y + threadIdx.y;
    if (x < col && y < row)
    {
        arrB[y * col + x] = arrA[y * col + x];
    }
}

__global__ void copyCol(int *arrA, int *arrB, int row, int col)
{
    int x = blockIdx.x * blockDim.x + threadIdx.x;
    int y = blockIdx.y * blockDim.y + threadIdx.y;
    if (x < col && y < row)
    {
        arrB[x * col + y] = arrA[x * col + y];
    }
}

__global__ void NaiveRow(int *arrA, int *arrB, int row, int col)
{
    int x = blockIdx.x * blockDim.x + threadIdx.x;
    int y = blockIdx.y * blockDim.y + threadIdx.y;
    if (x < col && y < row)
    {
        arrB[x * col + y] = arrA[y * col + x];
    }
}

__global__ void NaiveCol(int *arrA, int *arrB, int row, int col)
{
    int x = blockIdx.x * blockDim.x + threadIdx.x;
    int y = blockIdx.y * blockDim.y + threadIdx.y;
    if (x < col && y < row)
    {
        arrB[y * col + x] = arrA[x * col + y];
    }
}

int main(int argc, char **argv)
{
    cudaSetDevice(5);
    int row = 1<<14;
    int col = 1<<14;
    int nElem = row * col;
    int *d_arrA, *d_arrB;
    cudaMalloc((void **)&d_arrA, nElem * sizeof(int));
    cudaMalloc((void **)&d_arrB, nElem * sizeof(int));

    dim3 block(atoi(argv[1]), atoi(argv[2]));
    dim3 grid((row + block.y - 1) / block.y, (col + block.x - 1) / block.x);
    printf("gridDim:(%d,%d,%d) blockDim:(%d,%d,%d)\n", grid.x, grid.y, grid.z, block.x, block.y, block.z);

    double iStart = seconds();
    copyRow<<>>(d_arrA, d_arrB, row, col);
    cudaDeviceSynchronize();
    double iElaps = seconds() - iStart;
    printf("copyRow time=%fs, brandwidth = %fGB/s\n", iElaps, 2.0*row*col*sizeof(int)/iElaps/1024/1024/1024);

    iStart = seconds();
    copyCol<<>>(d_arrA, d_arrB, row, col);
    cudaDeviceSynchronize();
    iElaps = seconds() - iStart;
    printf("copyCol time=%fs, brandwidth = %fGB/s\n", iElaps, 2.0*row*col*sizeof(int)/iElaps/1024/1024/1024);

    iStart = seconds();
    NaiveRow<<>>(d_arrA, d_arrB, row, col);
    cudaDeviceSynchronize();
    iElaps = seconds() - iStart;
    printf("NaiveRow time=%fs, brandwidth = %fGB/s\n", iElaps, 2.0*row*col*sizeof(int)/iElaps/1024/1024/1024);

    iStart = seconds();
    NaiveCol<<>>(d_arrA, d_arrB, row, col);
    cudaDeviceSynchronize();
    iElaps = seconds() - iStart;
    printf("NaiveCol time=%fs, brandwidth = %fGB/s\n", iElaps, 2.0*row*col*sizeof(int)/iElaps/1024/1024/1024);

    cudaFree(d_arrA);
    cudaFree(d_arrB);
    return 0;
}

L1缓存开启						
Kernel		BandWidth		Notes		加载吞吐量	存储吞吐量	加载效率	存储效率
copyRow		41.340298GB/s	Upper bound	23.154GB/s	23.154GB/s	100.00%		100.00%
copyCol		21.524815GB/s	Lower bound	308.22GB/s	77.056GB/s	3.12%		12.50%
NaiveRow	30.102732GB/s	合并读/间隔写	15.946GB/s	127.57GB/s	100.00%		12.50%
NaiveCol	22.602213GB/s	间隔写/合并读	379.29GB/s	11.853GB/s	3.12%		100.00%
						
L1缓存关闭						
Kernel		BandWidth		Notes		加载吞吐量	存储吞吐量	加载效率	存储效率
copyRow		41.362517GB/s	Upper bound	23.460GB/s	23.460GB/s	100.00%		100.00%
copyCol		13.826092GB/s	Lower bound	53.674GB/s	53.674GB/s	12.50%		12.50%
NaiveRow	29.522903GB/s	合并读/间隔写	15.419GB/s	123.35GB/s	100.00%		12.50%
NaiveCol	17.568648GB/s	间隔写/合并读	72.086GB/s	9.0108GB/s	12.50%		100.00%

吞吐量的计算

C++ 计数排序、归并排序、快速排序每天搬一点点砖 c++数据结构算法
计数排序：是一种基于哈希的排序算法。他的基本思想是通过统计每个元素的出现次数，然后根据统计结果将元素依次放入排序后的序列中。这种排序算法适用于范围较小的情况，例如整数范围在0到k之间计数排序步骤：1初始化一个长度为最大元素值加1的计数数组，所有元素初始化为02遍历原始数组，将每个元素值作为索引，在计数数组中对应位置加13将数组清空4遍历计数器数组，按照数组中的元素个数放回到元数组中计数排序的优点和
英伟达靠什么支撑起了4万亿？AI泡沫还能撑多久？
英伟达市值突破4万亿美元，既是AI算力需求爆发的直接体现，也暗含市场对未来的狂热预期。其支撑逻辑与潜在风险并存，而AI泡沫的可持续性则取决于技术、商业与地缘政治的复杂博弈。⚙️一、英伟达4万亿市值的核心支撑因素技术垄断与生态壁垒硬件优势：英伟达GPU在AI训练市场占有率超87%，H100芯片的FP16算力达1979TFLOPS，领先竞品3-5倍。CUDA生态：400万开发者构建的软件护城河，成为A
【C++算法】76.优先级队列_前 K 个高频单词流星白龙优选算法C++c++算法开发语言
文章目录题目链接：题目描述：解法C++算法代码：题目链接：692.前K个高频单词题目描述：解法利用堆来解决TopK问题预处理一下原始的字符串数组，用一个哈希表统计一下每一个单词出现的频次。创建一个大小为k的堆频次：小根堆字典序（频次相同的时候）：大根堆循环让元素依次进堆判断提取结果C++算法代码：classSolution{//定义类型别名，PSI表示对typedefpairPSI;//自定义比较
Flowable 高级扩展：自定义元素与性能优化实战练习时长两年半的程序员小胡 Flowable 流程引擎实战指南流程图 flowable BPMN 流程引擎 java
在前五篇文章中，我们从基础概念、流程设计、API实战、SpringBoot集成，到外部系统协同，逐步构建了Flowable的应用体系。但企业级复杂场景中，原生功能往往难以满足定制化需求——比如需要特殊的审批规则网关、与决策引擎联动实现动态路由，或是在高并发场景下优化流程引擎性能。本文将聚焦Flowable的高级扩展能力，详解如何自定义流程元素、集成规则引擎，并掌握大型系统中的性能调优策略。一、自定
企业级区块链平台Hyperchain核心原理剖析 boyedu 区块链区块链企业级区块链平台 Hyperchain
Hyperchain作为国产自主可控的企业级联盟区块链平台，其核心原理围绕高性能共识、隐私保护、智能合约引擎及可扩展架构展开，通过多模块协同实现企业级区块链网络的高效部署与安全运行。以下从核心架构、关键技术、性能优化、安全机制、应用场景五个维度展开剖析：一、核心架构：分层解耦与模块化设计Hyperchain采用分层架构，将区块链功能解耦为独立模块，支持灵活组合与扩展：P2P网络层由验证节点（VP）
Effective C++ 条款10：令operator=返回一个reference to *this 君鼎 C++c++
EffectiveC++条款10：令operator=返回一个referenceto*this核心思想：赋值操作符（operator=）应始终返回当前对象的引用（*this），以实现连锁赋值并保持与内置类型一致的语义。⚠️1.问题场景：违反连锁赋值语义classWidget{public:voidoperator=(constWidget&rhs){//错误：返回voidvalue=rhs.val
C++ ：vector的模拟诚自然成 c++开发语言
目录一、vector的迭代器二、vector的构造函数默认构造函数参数构造函数迭代器范围构造函数拷贝构造函数swap:交换vector重载赋值符析构函数reserve:扩容vectorresize:调整大小push_back:添加元素empty:判空pop_back:后删获取大小与容量：size(),capacity()重载operator[]：元素访问insert：插入元素erase:删除一个元
C++编程基础与面向对象概念解析侯昂面向对象编程 C++语法函数类与对象继承与多态性
C++编程基础与面向对象概念解析背景简介C++是一种广泛使用的面向对象编程语言，它允许开发者创建高效、灵活且功能强大的程序。本文基于《C++Primer》一书的章节内容，深入解析C++的核心概念和面向对象编程原则，旨在帮助读者构建扎实的C++编程基础。面向对象编程的原则软件危机与进化介绍了软件危机的产生和软件进化的必要性，强调了面向对象编程（OOP）在应对这些问题中的优势。面向对象编程范式讨论了面
手把手教你用C语言实现顺序表
hello，大家好，本篇文章旨在为大家讲解如何使用C语言实现顺序表，还有就是小编自己复习一下相关知识，OK，那我们现在开始。在通讯录中，有增删查改等功能，那么顺序表我们也会对以上功能进行实现。一、创建并初始化顺序表1.创建typedefintSLDataType;#defineINIT_CAPACITY4//动态顺序表--按需申请typedefstructSeqList{SLDataType*a;
分布式链路追踪系统架构设计：从理论到企业级实践 ma451152002 java 分布式系统架构
分布式链路追踪系统架构设计：从理论到企业级实践本文深入探讨分布式链路追踪系统的架构设计原理、关键技术实现和企业级应用实践，为P7架构师提供完整的技术方案参考。目录引言：分布式链路追踪的重要性核心概念与技术原理系统架构设计数据模型与协议标准核心组件架构设计性能优化与扩展性设计企业级实施策略技术选型与对比分析监控与运维体系未来发展趋势P7架构师面试要点引言：分布式链路追踪的重要性微服务架构下的挑战在现
学C++的五大惊人好处
为什么要学c++学c++有什么用学习c++的好处有1.中考可以加分2.高考可能直接录取3.就业广且工资高4.在未来30--50年c++一定是一个很受欢迎的职业5.c++成功的例子deepsick等AI智能C++语言兼备编程效率和编译运行效率的语言C++语言是C语言功能增强版,在c语言的基础上添加了面向对象编程和泛型编程的支持既继承了C语言高效，简洁，快速和可移植的传统,又具备类似Java、Go等其
程序员必备：10 个提升代码质量的工具大力出奇迹985 宠物
在软件开发过程中，代码质量对项目的成功起着决定性作用。高质量的代码不仅易于维护和扩展，还能有效降低成本并提升可靠性。本文精心挑选了10个程序员必备工具，助力提升代码质量。这些工具涵盖代码格式化、静态分析、代码审查、测试、性能优化、安全扫描、版本控制、依赖管理、代码生成以及文档生成等多个关键领域。通过使用它们，开发者能够高效地发现并解决代码中的潜在问题，遵循最佳实践，提升代码的可读性、可维护性与安全
C++中std::variant的使用详解和实战代码示例点云SLAM C++c++开发语言 variant C++泛型编程联合体 C++类型擦除机制 C++17
std::variant是C++17引入的一个类型安全的联合体（type-safeunion），它可以在多个类型之间存储一个值，并在编译时进行类型检查。它是现代C++类型擦除与泛型编程的核心工具之一，适用于构建可变类型结构、消息传递系统、状态机等。一、基本概念#includestd::variantv;类似于联合体union，但类型安全。std::variant只能存储其中一个类型的值。默认构造时
今年校招竞争真激烈 12_05
程序员满大街，都要找不到工作了。即使人工智能满大街，我也后悔当初没学机器学习，后悔当初没学Java。C++真难找工作。难道毕了业就失业吗？好担心！
前端数据库：IndexedDB从基础到高级使用指南
文章目录前端数据库：IndexedDB从基础到高级使用指南引言一、IndexedDB概述1.1什么是IndexedDB1.2与其他存储方案的比较二、基础使用2.1打开/创建数据库2.2基本CRUD操作添加数据读取数据更新数据删除数据三、高级特性3.1复杂查询与游标3.2事务高级用法3.3性能优化技巧四、实战案例：构建离线优先的待办事项应用4.1数据库设计4.2同步策略实现五、常见问题与解决方案5.
深入剖析 boost::unique_lock＜boost::mutex＞程序员乐逍遥 C++Boost库 C/C++多线程编程专题 C++boost 线程锁
在高并发的C++程序中，线程安全是永恒的主题。而boost::unique_lock作为Boost.Thread库中的核心组件，为开发者提供了强大、灵活且异常安全的互斥量管理机制。它不仅是RAII（ResourceAcquisitionIsInitialization）设计模式的典范，更是实现复杂线程同步逻辑的基石。一、从lock_guard的说起在介绍unique_lock之前，我们先回顾其“简
C语言结构体详解初学者，亦行者 C语言学习算法数据结构 c语言
目录C语言结构体1、声明结构体类型2、定义结构体变量3、成员的赋值与引用4、结构体数组5、结构体指针6、总结C语言结构体1、声明结构体类型前面学习了数组是一组相同类型数据的集合。但在实际应用中，我们往往会遇到不同类型的数据。而结构体就是用来存放不同数据的。#includeintmain(){structStu{intnum;//学号为整型charname[20];//姓名为字符串charsex;/
PaddleOCR 快速开始张欣-男 PaddlePaddle PaddleOCR OCR
1.安装1.1安装PaddlePaddle#GPUcudapipinstallpaddlepaddle-gpu#CPUpipinstallpaddlepaddle1.2安装PaddleOCRwhl包pipinstallpaddleocr2.便捷使用2.1命令行使用2.1.1中英文模型检测+方向分类器+识别全流程：–use_angle_clstrue设置使用方向分类器识别180度旋转文字，–use_
Serverless架构下Spring Function的创新实践 tmjpz04412 serverless 架构 spring
引言：Serverless与Spring生态的交汇背景介绍：云计算与Serverless架构的兴起Spring生态的演进与云原生适配性核心问题：传统Spring应用如何融入Serverless范式Serverless架构的核心特征与挑战事件驱动、弹性伸缩与按需计费冷启动问题与性能优化需求Spring应用在Serverless环境中的典型瓶颈（如依赖注入、上下文初始化）SpringFunction的
嵌入式学习 c语言构造数据类型结构体
1.结构体基础语法在C语言中，结构体（struct）用于将不同类型的数据组合成一个自定义数据类型。struct结构体名{数据类型成员1;数据类型成员2;//更多成员...};结构体示例代码#include//定义结构体structStudent{intid;charname[50];floatscore;};intmain(){//声明结构体变量structStudentstu1;//初始化结构体
2025.07 Java入门笔记01 殷浩焕笔记
一、熟悉IDEA和Java语法（一）LiuCourseJavaOOP1.一直在用C++开发，python也用了些，Java是真的不熟，用什么IDE还是问的同事；2.一开始安装了jdk-23，拿VSCode当编辑器，在cmd窗口编译运行，也能玩；但是想正儿八经搞项目开发，还是需要IDE；3.安装了IDEA社区版：（1）IDE通常自带对应编程语言的安装包，例如IDEA自带jbr-21（和jdk是不同的
C语言基础-数组和指针的区别阿部春光 C语言数据结构算法
在C语言中，数组和指针是两个密切相关但又有显著区别的概念。下面我会详细解释它们之间的区别和联系。区别数组和指针在C语言中虽然经常一起使用，但它们是两个不同的概念，具有一些关键的区别：本质不同：数组：数组是一种数据结构，用于存储固定数量的同类型元素的连续内存块。数组名在某些上下文中（如取地址操作或sizeof操作符）代表整个数组，但在其他上下文中（如作为函数参数或用于指针算术）通常退化为指向数组第一
OpenCloudOS 城市行·成都站圆满落幕，共探操作系统技术新未来！ CSDN资讯业界资讯资讯数据库人工智能
7月26日，由OpenCloudOS社区主办，海光信息战略合作的OpenCloudOS城市行・成都站活动在成都欧洲中心圆满举办，线上观看人次超3万。当前，数字化浪潮席卷全球各行各业，在国产化进程加速的背景下，操作系统的技术突破与生态构建不仅是保障信息安全的关键，更是推动产业升级、实现高质量发展的必由之路。然而，国产操作系统在性能优化、安全防护、多场景适配等方面仍面临诸多挑战，亟需产业链上下游协同创
涵盖轻量级锁（SpinLock）与操作系统同步原语（如 CRITICAL_SECTION）的性能优化、Monitor 的原子性和数据竞争防护、Monitor.Wait 和 Pulse 在生产者-消费者 zhxup606 C#实战教程李工篇 wpf 开发语言 C#
涵盖轻量级锁（SpinLock）与操作系统同步原语（如CRITICAL_SECTION）的性能优化、Monitor的原子性和数据竞争防护、Monitor.Wait和Pulse在生产者-消费者中的作用、控制线程执行顺序、Thread.Join的含义、避免嵌套锁的锁顺序策略，以及防止伪唤醒的条件检查。每个问题包括核心概念、实现细节、与之前讨论的关联（如线程池、进程间同步、分布式同步）、代码示例、测试用
c语言辅音字符怎么表示,C 语言实例 - 判断元音/辅音吴世宁 c语言辅音字符怎么表示
C语言实例-判断元音/辅音C语言实例C语言实例判断输入的字母是元音，还是辅音。英语有26个字母，元音只包括a、e、i、o、u这五个字母，其余的都为辅音。y是半元音、半辅音字母，但在英语中都把他当作辅音。实例#includeintmain(){charc;intisLowercaseVowel,isUppercaseVowel;printf("输入一个字母:");scanf("%c",&c);//小
判断回文数怪我冷i #c语言 c++回文数 c语言
文章目录题目palindrome-number代码c语言java语言只判断一半的方法参考资料题目palindrome-number判断一个数是否为回文数。设n是一任意自然数。若将n的各位数字反向排列所得自然数n1与n相等，则称n为一回文数。例如，若n=1234321，则称n为一回文数；但若n=1234567，则n不是回文数代码c语言#includeintmain(){intn,reversedIn
从零到大厂：硬件程序员的硬核修炼手册——2025版面试笔试全攻略 small_wh1te_coder c 面试嵌入式面试职场和发展 c 算法嵌入式硬件汇编 linux
从零到大厂：嵌入式程序员的硬核修炼手册——2025版面试笔试全攻略第一章：C语言的内功心法——从“会用”到“精通”的蜕变引子：C语言，嵌入式江湖的“独孤九剑”兄弟，你是不是觉得C语言都学烂了？指针、数组、结构体，这些东西张口就来。但为啥一到大厂面试，或者遇到稍微复杂点的嵌入式项目，就感觉力不从心，甚至有点懵圈？原因很简单：你可能只是“会用”C语言，离“精通”C语言，特别是“精通”嵌入式领域所需的C
大厂95%面试人不懂的易错点：strlen和sizeof 的底层博弈，大部分人踩过的内存陷阱一文吃透 strlen/sizeof 的本质区别（附 30 + 代码演示从崩溃到精通！
1揭开c语言内存底裤：strlensizeof区别（上）是否曾被C语言中strlen和sizeof这两个“磨人精”搞得一头雾水？它们一个号称能测“长度”，一个号称能测“大小”，可当你把它们用在字符串和字符数组上时，结果却常常让你大跌眼镜，甚至引发诡异的程序崩溃！就像你和豆包AI的对话中，那两个看似无辜的字符数组：chara8[]="hello";chara9[]={'h','e','l','l',
C语言实例_20之回文数计算 FreeLikeTheWind. C语言实例 c语言开发语言 c++算法
1.题目判断一个5位数是否为回文数。回文数的特点是个位与万位相同，十位与千位相同，例如13531是回文数。2.分析要判断一个5位数是否为回文数，关键在于比较其个位与万位、十位与千位上的数字是否分别相等。可以通过数学运算提取出该5位数各个数位上的数字，然后进行相应的比较操作来得出结论。3.实例代码实现方式一：直接提取数位比较#includeintmain(){intnum=0;printf("请输入
大厂都在用的前端缓存策略，你掌握了吗？ AI架构全栈开发实战笔记前端缓存 ai
大厂都在用的前端缓存策略，你掌握了吗？关键词：前端缓存、HTTP缓存、ServiceWorker、CDN缓存、缓存策略、性能优化、浏览器缓存摘要：本文将深入探讨前端开发中常用的缓存策略，从浏览器缓存到ServiceWorker，从HTTP缓存头到CDN缓存，全面解析大厂都在使用的高效缓存技术。通过生动的比喻和实际代码示例，帮助开发者理解并掌握这些提升Web应用性能的关键技术。背景介绍目的和范围本文
Algorithm 香水浓 java Algorithm
冒泡排序 public static void sort(Integer[] param) { for (int i = param.length - 1; i > 0; i--) { for (int j = 0; j < i; j++) { int current = param[j]; int next = param[j + 1];
mongoDB 复杂查询表达式开窍的石头 mongodb
1:count Pg: db.user.find().count(); 统计多少条数据 2:不等于$ne Pg: db.user.find({_id:{$ne:3}},{name:1,sex:1,_id:0}); 查询id不等于3的数据。 3：大于$gt $gte(大于等于) &n
Jboss Java heap space异常解决方法, jboss OutOfMemoryError : PermGen space 0624chenhong jvm jboss
转自 http://blog.csdn.net/zou274/article/details/5552630 解决办法： window->preferences->java->installed jres->edit jre 把default vm arguments 的参数设为-Xms64m -Xmx512m ----------------
文件上传下载解析相对路径不懂事的小屁孩文件上传
有点坑吧，弄这么一个简单的东西弄了一天多，身边还有大神指导着，网上各种百度着。下面总结一下遇到的问题：文件上传，在页面上传的时候，不要想着去操作绝对路径，浏览器会对客户端的信息进行保护，避免用户信息收到攻击。在上传图片，或者文件时，使用form表单来操作。前台通过form表单传输一个流到后台，而不是ajax传递参数到后台，代码如下: <form action=&
怎么实现qq空间批量点赞换个号韩国红果果 qq
纯粹为了好玩！！逻辑很简单 1 打开浏览器console；输入以下代码。先上添加赞的代码 var tools={}; //添加所有赞 function init(){ document.body.scrollTop=10000; setTimeout(function(){document.body.scrollTop=0;},2000);//加
判断是否为中文灵静志远中文
方法一： public class Zhidao { public static void main(String args[]) { String s = "sdf灭礌 kjl d{';\fdsjlk是"; int n=0; for(int i=0; i<s.length(); i++) { n = (int)s.charAt(i); if((
一个电话面试后总结 a-john 面试
今天，接了一个电话面试，对于还是初学者的我来说，紧张了半天。面试的问题分了层次，对于一类问题，由简到难。自己觉得回答不好的地方作了一下总结：在谈到集合类的时候，举几个常用的集合类，想都没想，直接说了list,map。然后对list和map分别举几个类型： list方面：ArrayList,LinkedList。在谈到他们的区别时，愣住了
MSSQL中Escape转义的使用 aijuans MSSQL
IF OBJECT_ID('tempdb..#ABC') is not null drop table tempdb..#ABC create table #ABC ( PATHNAME NVARCHAR(50) ) insert into #ABC SELECT N'/ABCDEFGHI' UNION ALL SELECT N'/ABCDGAFGASASSDFA' UNION ALL
一个简单的存储过程 asialee mysql 存储过程构造数据批量插入
今天要批量的生成一批测试数据，其中中间有部分数据是变化的，本来想写个程序来生成的，后来想到存储过程就可以搞定，所以随手写了一个，记录在此： DELIMITER $$ DROP PROCEDURE IF EXISTS inse
annot convert from HomeFragment_1 to Fragment 百合不是茶 android 导包错误
创建了几个类继承Fragment, 需要将创建的类存储在ArrayList<Fragment>中; 出现不能将new 出来的对象放到队列中,原因很简单; 创建类时引入包是:import android.app.Fragment; 创建队列和对象时使用的包是:import android.support.v4.ap
Weblogic10两种修改端口的方法 bijian1013 weblogic 端口号配置管理 config.xml
一.进入控制台进行修改 1.进入控制台: http://127.0.0.1:7001/console 2.展开左边树菜单域结构->环境->服务器-->点击AdminServer(管理) &
mysql 操作指令征客丶 mysql
一、连接mysql 进入 mysql 的安装目录； $ bin/mysql -p [host IP 如果是登录本地的mysql 可以不写 -p 直接 -u] -u [userName] -p 输入密码，回车，接连；二、权限操作［如果你很了解mysql数据库后，你可以直接去修改系统表，然后用 mysql> flush privileges; 指令让权限生效］ 1、赋权 mys
【Hive一】Hive入门 bit1129 hive
Hive安装与配置 Hive的运行需要依赖于Hadoop，因此需要首先安装Hadoop2.5.2，并且Hive的启动前需要首先启动Hadoop。 Hive安装和配置的步骤 1. 从如下地址下载Hive0.14.0 http://mirror.bit.edu.cn/apache/hive/ 2.解压hive，在系统变
ajax 三种提交请求的方法 BlueSkator Ajax jqery
1、ajax 提交请求 $.ajax({ type:"post", url : "${ctx}/front/Hotel/getAllHotelByAjax.do", dataType : "json", success : function(result) { try { for(v
mongodb开发环境下的搭建入门 braveCS 运维
linux下安装mongodb 1）官网下载mongodb-linux-x86_64-rhel62-3.0.4.gz 2）linux 解压 gzip -d mongodb-linux-x86_64-rhel62-3.0.4.gz; mv mongodb-linux-x86_64-rhel62-3.0.4 mongodb-linux-x86_64-rhel62-
编程之美-最短摘要的生成 bylijinnan java 数据结构算法编程之美
import java.util.HashMap; import java.util.Map; import java.util.Map.Entry; public class ShortestAbstract { /** * 编程之美最短摘要的生成 * 扫描过程始终保持一个[pBegin,pEnd]的range,初始化确保[pBegin,pEnd]的ran
json数据解析及typeof chengxuyuancsdn js typeof json解析
// json格式 var people='{"authors": [{"firstName": "AAA","lastName": "BBB"},' +' {"firstName": "CCC&
流程系统设计的层次和目标 comsci 设计模式数据结构 sql 框架脚本
流程系统设计的层次和目标
RMAN List和report 命令 daizj oracle list report rman
LIST 命令使用RMAN LIST 命令显示有关资料档案库中记录的备份集、代理副本和映像副本的信息。使用此命令可列出： • RMAN 资料档案库中状态不是AVAILABLE 的备份和副本 • 可用的且可以用于还原操作的数据文件备份和副本 • 备份集和副本，其中包含指定数据文件列表或指定表空间的备份 • 包含指定名称或范围的所有归档日志备份的备份集和副本 • 由标记、完成时间、可
二叉树:红黑树 dieslrae 二叉树
红黑树是一种自平衡的二叉树,它的查找,插入,删除操作时间复杂度皆为O(logN),不会出现普通二叉搜索树在最差情况时时间复杂度会变为O(N)的问题. 红黑树必须遵循红黑规则,规则如下 1、每个节点不是红就是黑。 2、根总是黑的 &
C语言homework3，7个小题目的代码 dcj3sjt126com c
1、打印100以内的所有奇数。 # include <stdio.h> int main(void) { int i; for (i=1; i<=100; i++) { if (i%2 != 0) printf("%d ", i); } return 0; } 2、从键盘上输入10个整数，
自定义按钮, 图片在上, 文字在下, 居中显示 dcj3sjt126com 自定义
#import <UIKit/UIKit.h> @interface MyButton : UIButton -(void)setFrame:(CGRect)frame ImageName:(NSString*)imageName Target:(id)target Action:(SEL)action Title:(NSString*)title Font:(CGFloa
MySQL查询语句练习题，测试足够用了 flyvszhb sql mysql
http://blog.sina.com.cn/s/blog_767d65530101861c.html 1.创建student和score表 CREATE TABLE student ( id INT(10) NOT NULL UNIQUE PRIMARY KEY , name VARCHAR
转：MyBatis Generator 详解 happyqing mybatis
MyBatis Generator 详解 http://blog.csdn.net/isea533/article/details/42102297 MyBatis Generator详解 http://git.oschina.net/free/Mybatis_Utils/blob/master/MybatisGeneator/MybatisGeneator.
让程序员少走弯路的14个忠告 jingjing0907 工作计划学习
无论是谁，在刚进入某个领域之时，有再大的雄心壮志也敌不过眼前的迷茫：不知道应该怎么做，不知道应该做什么。下面是一名软件开发人员所学到的经验，希望能对大家有所帮助 1.不要害怕在工作中学习。只要有电脑，就可以通过电子阅读器阅读报纸和大多数书籍。如果你只是做好自己的本职工作以及分配的任务，那是学不到很多东西的。如果你盲目地要求更多的工作，也是不可能提升自己的。放
nginx和NetScaler区别流浪鱼 nginx
NetScaler是一个完整的包含操作系统和应用交付功能的产品，Nginx并不包含操作系统，在处理连接方面，需要依赖于操作系统，所以在并发连接数方面和防DoS攻击方面，Nginx不具备优势。 2.易用性方面差别也比较大。Nginx对管理员的水平要求比较高，参数比较多，不确定性给运营带来隐患。在NetScaler常见的配置如健康检查，HA等，在Nginx上的配置的实现相对复杂。 3.策略灵活度方
第11章动画效果（下） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
FAQ - SAP BW BO roadmap blueoxygen BO BW
http://www.sdn.sap.com/irj/boc/business-objects-for-sap-faq Besides, I care that how to integrate tightly. By the way, for BW consultants, please just focus on Query Designer which i
关于java堆内存溢出的几种情况 tomcat_oracle java jvm jdk thread
【情况一】：　　 java.lang.OutOfMemoryError: Java heap space：这种是java堆内存不够，一个原因是真不够，另一个原因是程序中有死循环；　　如果是java堆内存不够的话，可以通过调整JVM下面的配置来解决：　　<jvm-arg>-Xms3062m</jvm-arg> 　　<jvm-arg>-Xmx
Manifest.permission_group权限组阿尔萨斯 Permission
结构继承关系 public static final class Manifest.permission_group extends Object java.lang.Object android. Manifest.permission_group 常量 ACCOUNTS 直接通过统计管理器访问管理的统计 COST_MONEY可以用来让用户花钱但不需要通过与他们直接牵涉的权限 D