[C#] 对24位图像进行水平翻转(FlipX)的跨平台SIMD硬件加速向量算法-第2部分:使用YShuffleX2Kernel优化程序
文章目录一、算法思路1.1瓶颈分析1.2优化思路1.3计算索引二、算法实现2.1程序里计算索引2.2思路A的实现2.3思路B的实现三、基准测试结果3.1X86架构3.1.1X86架构上`.NET6.0`程序的测试结果3.1.2X86架构上`.NET7.0`程序的测试结果3.1.3X86架构上`.NET8.0`程序的测试结果3.2Arm架构3.2.1Arm架构上`.NET6.0`程序的测试结果3.2