关于CUFFT

我们知道,程序在首次执行调用GPU函数时,会有一个初始化的过程。该初始化过程有很大的开销,不应被计入实际执行时间。然而我们发现,在调用CUFFT库的时候,第一次生成plan handle 也会有很大的开销:


void main()
{
	int n = 100;
	float2 *data_h = new float2[n];
	for (int i=0; i

运行结果:

Create plan1: 228.562ms
Execute plan1: 0.27255ms
Create plan2: 0.328378ms
Execute plan2: 0.275842ms

可以看到,第一次调用 cufftPlan1d 函数时,耗时高达228毫秒,远远超过执行第二次调用 cufftPlan1d 函数以及执行FFT的时间。因此,大家在测试 CUFFT 运行时间时,应该注意吧首次生成 Plan 的函数排除在外,或者在此之前执行一个额外的 Plan 调用。

你可能感兴趣的:(GPU编程学之初)