E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
simd
SIMD
和多核心编程时的一些总结。
1在计算过程中不涉及输出内存的数据时,应使用_mm*_stream_*(直接写入内存)代替_mm*_store_*,例如:for(i=0;i<256;i+=4){ymm0=_mm256_load_pd(a+i);ymm1=_mm256_load_pd(b+i);ymm2=_mm256_add_pd(ymm0,ymm1);_mm256_stream_pd(c+i,ymm2);}若计算过程中还要使用输
cyrosly
·
2012-09-25 16:06
[C] zintrin.h : 智能引入intrinsic函数。支持VC、GCC,兼容Windows、Linux、Mac OS X
现在很多编译器支持intrinsic函数,这给编写SSE等
SIMD
代码带来了方便。但是各个编译器略有差异,于是我编写了zintrin.h,智能引入intrinsic函数。
zyl910
·
2012-09-23 23:00
SSE
SSE是指令集的简称,它包括70条指令,其中包含单指令多数据浮点计算、以及额外的
SIMD
整数和高速缓存控制指令。
pizi0475
·
2012-09-02 04:00
优化
解密
video
扩展
英特尔
64bit
RISC、CISC、
SIMD
、FPU、MMX、SSE、SSEX、AVX、3D Now以及DSP、ARM的Neon简介
CPU的指令集从主流的体系结构上分为精简指令集和复杂指令集,而在普通的计算机处理器基本上是使用的复杂指令集。在计算机早期的发展过程中,CPU中的指令集是没有划分类型的,而是都将各种程序需要相配合的指令集成到CPU中,但是随着科技的进步,计算机的功能也越来越强大,计算机内部的元件也越来越多,而且越来越复杂,CPU的指令也相应的变得十分复杂,而在使用过程中,并不是每一条指令都要完全被执行,在技术人员的
飞翔2017
·
2012-08-30 15:28
ARM
DSP
SSE
MMX
SIMD
汇编
X86
IA-32
/
IA-64
assembly
language
扩展
电话
存储
图像处理
优化
x86
RISC、CISC、
SIMD
、FPU、MMX、SSE、SSEX、AVX、3D Now以及DSP、ARM的Neon简介
CPU的指令集从主流的体系结构上分为精简指令集和复杂指令集,而在普通的计算机处理器基本上是使用的复杂指令集。在计算机早期的发展过程中,CPU中的指令集是没有划分类型的,而是都将各种程序需要相配合的指令集成到CPU中,但是随着科技的进步,计算机的功能也越来越强大,计算机内部的元件也越来越多,而且越来越复杂,CPU的指令也相应的变得十分复杂,而在使用过程中,并不是每一条指令都要完全被执行,在
feixiang_john
·
2012-08-30 15:00
优化
存储
扩展
电话
图像处理
X86
mmx开发文档
该技术使用了单指令多数据技术(
simd
)技术,以并行方式处理多个数据元素,从而提高了多媒体和通讯软件的运行速度。mmx™指令集增加了57条新的操作码和一个新的64位四字数据类型。mmx™技术提高了很多
arau_sh
·
2012-06-04 14:00
编程
汇编
扩展
byte
图形
视频会议
SIMD
、MMX、SSE、AVX、3D Now!、neon
http://blog.csdn.net/conowen/article/details/7255920SIMDSIMD单指令流多数据流(SingleInstructionMultipleData,
SIMD
arau_sh
·
2012-06-02 22:00
优化
扩展
英特尔
图形
图像处理
X86
Intel SSE / MMX2 / KNI documentation
转自 http://intel80386.com/
simd
/mmx2-doc.htmlPleasenote,thisisawork-in-progress(ieBETA).
arau_sh
·
2012-06-01 12:00
Integer
less
documentation
float
parallel
pair
SSE 介紹
如同其名稱所表示的,SSE是一種
SIMD
指令集。所謂的
SIMD
是指singleinstruction,multipledata,也
arau_sh
·
2012-05-19 22:00
exception
cache
input
float
compiler
output
A practical guide to using SSE
SIMD
with C++ (printable)
转自 http://sci.tuomastonteri.fi/programming/sse/printableApracticalguidetousingSSESIMDwithC++(printable)1.0Introduction2.0WhatisSIMD?3.0EffectiveuseofSSE4.0DatastructureswithSSE5.0Maskoperations6.0C++S
arau_sh
·
2012-05-18 09:00
C++
float
compiler
optimization
distance
vectorization
C6000的线性汇编--格式,用法以及优化策略
本文主要介绍TIC6000系列DSP的线性汇编格式,用法以及
SIMD
、循环、软件流水线、指令打包和寄存器、功能单元分配平衡等优化策略。优化过程:?
yuyin86
·
2012-05-08 08:00
c
优化
算法
汇编
function
存储
基于DSP平台的音视频编解码C代码优化方法
本文主要介绍了基于DSP平台的音视频编解码算法的C语言优化方法,如常用的内联函数,数据打包
SIMD
,函数组合,数据的reuse重用,循环loop的优化,针对结构体和宏定义的优化,对条件控制语句的优化,并以
yuyin86
·
2012-05-07 13:00
SIMD
函数整理:01 《PC平台新技术MMX(上册):开发编程指南》第8章 MMX编码技术
一、来源来源:《PC平台新技术MMX(上册):开发编程指南》第8章MMX编码技术书籍信息——http://e.360buy.com/30027396.htmlPC平台新技术MMX(上册):开发编程指南作者:吴乐南编出版社:东南大学出版社ISBN:9787810502528出版时间:1997-10-01页数:149字数:237000所属分类:电子书>计算机与互联网>编程语言与程序设计电子书>计算机与
zyl910
·
2012-04-26 22:00
[置顶]
SIMD
函数整理:00 索引贴(2012-07-31更新)
作者:zyl910关于
SIMD
(MMX、SSE、AVX)编程的资料一直很零散,于是我试图进行收集整理,便于随时翻阅学习。
zyl910
·
2012-04-26 22:00
编程
算法
vector
汇编
测试
平台
SIMD
函数整理:00 索引贴(2012-07-31更新)
作者:zyl910关于
SIMD
(MMX、SSE、AVX)编程的资料一直很零散,于是我试图进行收集整理,便于随时翻阅学习。
zyl910
·
2012-04-26 21:00
SIMD
(MMX/SSE/AVX)变量命名规范心得
当使用Intrinsics函数来操作
SIMD
指令集(MMX/SSE/AVX等)时,会面对不同长度的
SIMD
数据类型,其中又分为多种紧缩格式。
zyl910
·
2012-04-23 17:00
c
null
byte
2010
libjpeg-turbo的neon功能
libjpeg-turbo是对libjpeg的扩展,支持
SIMD
指令,如X86架构的MMX、SSE、SSE2、3DNOW,ARM架构的NEON,在对jpeg进行编码和解码的过程中能提高速度。
alien75
·
2012-04-13 15:00
测试
扩展
平台
图形
WinCE
X86
深入探讨用位掩码代替分支(7):MMX指令集速度测试
其实,对于这样的大批量数据处理,使用
SIMD
(SingleInstructionMultipleData,单指令多数据流)技术能极大的提高性能。
zyl910
·
2012-04-09 23:00
编程
exception
汇编
测试
存储
reference
高级语言内的单指令多数据流计算(
SIMD
)
http://blog.csdn.net/housisong/article/details/6324467
swimmingfish2004
·
2012-03-09 18:00
Visual Studio 11开发指南(18)C++11更新-自动矢量器使用
自动矢量器使用在MSDN文档中,现在编译器自动性能方面的原因是有能力的"概述"循环和支持
SIMD
指令,这是大多数情况下调用自动性能的话,对于所有X86处理器/X64现代的处理器中运行的速度要快8倍。
junwong
·
2012-03-09 16:00
SIMD
to SSE5
SIMD
:http://baike.baidu.com/view/188706.htmSSE指令集:http://baike.baidu.com/view/65687.htm 细节了解对于我来讲还不是那么必要
彭博
·
2012-03-09 14:00
Designing Fast Cross-Platform
SIMD
Vector Libraries
是对这篇文章的笔记:http://www.gamasutra.com/view/feature/4248/designing_fast_crossplatform_
simd
_.php?
彭博
·
2012-03-09 14:00
Intrinsics头文件与
SIMD
指令集、Visual Studio版本对应表
File:Intrinsics头文件描述:指令集描述VS:VisualStudio版本号VisualStudio:VisualStudio版本名File描述VSVisualStudiointrin.hAllArchitectures8.02005mmintrin.hMMXintrinsics6.06.0SP5+PP5xmmintrin.hStreamingSIMDExtensionsintrin
zyl910
·
2012-02-28 22:00
File
2010
[x86]
SIMD
指令集发展历程表(MMX、SSE、AVX等)
自1996年的MMX指令集以来,Intel和AMD不断为x86体系添加新的
SIMD
指令集。时至2012年,Intel的IvyBridge即将发布,这16年来
SIMD
指令集有了哪些发展呢?
zyl910
·
2012-02-26 19:00
Date
vector
XP
encryption
2010
X86
1D.7 张兆庆教授编译组为英特尔开发出开放源码编译器
90年后开发了共享内存、分布式内存并行机上的自动并行识别器,
SIMD
芯片和VLIW芯片上的并行优化C编译器,可视化并行编程环境。这些工作获:国家科
zhaoyang17
·
2012-02-15 17:54
编译春秋
Prolog新长征
1D.7 张兆庆教授编译组为英特尔开发出开放源码编译器
90年后开发了共享内存、分布式内存并行机上的自动并行识别器,
SIMD
芯片和VLIW芯片上的并行优化C编译器,可视化并行编程环境。这些工
zhaoyang17
·
2012-02-15 17:00
数据结构
优化
工具
英特尔
编译器
代码分析
【整理】SISD、MIMD、
SIMD
、MISD计算机的体系结构的Flynn分类法
1. 计算平台介绍Flynn于1972年提出了计算平台的Flynn分类法,主要根据指令流和数据流来分类,共分为四种类型的计算平台,如下图所示:单指令流单数据流机器(SISD)SISD机器是一种传统的串行计算机,它的硬件不支持任何形式的并行计算,所有的指令都是串行执行。并且在某个时钟周期内,CPU只能处理一个数据流。因此这种机器被称作单指令流单数据流机器。早期的计算机都是SISD机器,如冯诺.依曼架
conowen
·
2012-02-13 21:00
多线程
编程
cache
存储
平台
图像处理
【整理】
SIMD
、MMX、SSE、AVX、3D Now!、neon
SIMDSIMD单指令流多数据流(SingleInstructionMultipleData,
SIMD
)是一种采用一个控制器来控制多个处理器,同时对一组数据(又称“数据向量”)中的每一个分别执行相同的操作从而实现空间上的并行性的技术
conowen
·
2012-02-13 19:28
【整理】
SIMD
、MMX、SSE、AVX、3D Now!、neon
SIMDSIMD单指令流多数据流(SingleInstructionMultipleData,
SIMD
)是一种采用一个控制器来控制多个处理器,同时对一组数据(又称“数据向量”)中的每一个分别执行相同的操作从而实现空间上的并行性的技术
conowen
·
2012-02-13 19:00
优化
扩展
英特尔
图形
X86
图像处理
GCC中
SIMD
指令的应用方法
X86架构上的多媒体应用开发,如果能够使用
SIMD
指令进行优化,性能将大大提高。目前,IA-32的
SIMD
指令包括MMX,SSE,SSE2等几级。
szu030606
·
2012-02-01 09:00
vector
汇编
gcc
compiler
reference
编译器
读书笔记:深入理解计算机系统 第一章
SIMD
(单指令,多数据)并行.向量数据类型.5. CP
liujb861213
·
2012-01-31 17:00
基于
SIMD
的AVS整数反变换算法设计与优化
基于
SIMD
的AVS整数反变换算法设计与优化王玲娟,张刚**作者简介:王玲娟,(1987-),女,在读硕士,主要研究方向:视频解码算法通信联系人:张刚,(1953-),男,教授,主要研究方向:语音编码、
szu030606
·
2012-01-27 11:00
算法
优化
测试
Matrix
transformation
多媒体处理
AVS软件解码器的优化
AVS软件解码器的优化董斌,姜昱明(西安电子科技大学计算机学院,陕西西安,710071))摘要:主要研究了AVS标准的视频压缩部分,指出了影响解码速度的瓶颈并提出了一种优化方案.使用从程序结构入手结合使用
SIMD
szu030606
·
2012-01-27 11:00
优化
cache
测试
video
optimization
h.264
ARM CORTEX-M4处理器 面向高性能数字信号控制领域
Cortex-M4处理器具有一个单时钟周期乘法累加(MAC)单元、优化的单指令多数据(
SIMD
)指令、饱和运算指令和一个可选的单精度浮点运算
xiaolei05
·
2011-11-13 21:01
cortex-m4
嵌入式
数学计算
产品
扩展
开发工具
matlab
ARM CORTEX-M4处理器 面向高性能数字信号控制领域
Cortex-M4处理器具有一个单时钟周期乘法累加(MAC)单元、优化的单指令多数据(
SIMD
)指令、饱和运算指令和一个可选的单精度浮点运
xiaolei05
·
2011-11-13 21:00
matlab
嵌入式
扩展
开发工具
产品
数学计算
NEON
ARM®NEON™ 通用
SIMD
引擎可有效处理当前和将来的多媒体格式,从而改善用户体验。
·
2011-11-07 22:00
internet
图形
编译器
mozilla
图像处理
h.264
6.087 Practical Programming in C, lec12
•Instructionlevel(pipelining)•Dataparallelism(
SIMD
)•Taskparallelism(embarrassinglypara
jubincn
·
2011-11-03 23:00
programming
6.087 Practical Programming in C, lec12
•Instructionlevel(pipelining)•Dataparallelism(
SIMD
)•Taskparallelism(embarrassinglypara
jubincn
·
2011-11-03 23:00
Neon 是什么?
Neon是ARM核心附带的浮点
SIMD
引擎,可以把它当一个DSP用,可以把它理解为桌面CPU上的SSE,SSE2。合理的利用可以增强处理器在游戏,多媒体中的表现,当然需要软件的支持。
·
2011-10-10 20:00
on
《大话处理器》连载——微架构(20) 处理器并行设计——Flynn分类
SIMD
(singleinstructionmultipleda
muxiqingyang
·
2011-08-26 21:00
使用递归高斯滤波器实现快速高斯模糊
但是随着高斯半径的增加,时间消耗会逐级增加如高斯半径为N时,计算每个输出采样点需要计算的乘法次数为(2N+1)*模糊方向数,加法次数为2N*模糊方向数,这种情况下,当N=100时,甚至更大时,计算量是非常大的,即使进行
SIMD
·
2011-08-26 09:00
递归
使用递归高斯滤波器实现快速高斯模糊
但是随着高斯半径的增加,时间消耗会逐级增加如高斯半径为N时,计算每个输出采样点需要计算的乘法次数为(2N+1)*模糊方向数,加法次数为2N*模糊方向数,这种情况下,当N=100时,甚至更大时,计算量是非常大的,即使进行
SIMD
lifesider
·
2011-08-25 16:00
优化
vector
filter
性能优化
processing
图像处理
网络工程师考试2005年下半年上午试题解析
(1)A.SISD B.
SIMD
C.MISD D.MIMD试题解析:SISD(SingleInstructionSingleDatastream,单指令流单数据流):单处理器计算机,对保存在单一存储器中的数据进行操作
www417000
·
2011-06-28 22:59
软考
职场
休闲
2010
网络规划设计师
自动矢量化编译优化技术(Automatic Vectorization)
自动矢量化技术,是编译器代码优化技术的一种,即在不改变C/C++源代码的情况下,自动编译产生使用单指令多数据(SingleInstructionMultipleData,
SIMD
)指令集的二进制码,包括
lifesider
·
2011-06-27 21:00
优化
汇编
Microsoft
compiler
编译器
vectorization
连载:编写高效代码(5)——选用合适的指令
处理器除了一些常用的加法、移位、乘法等指令外,还有一些完成复杂功能的指令,例如:DSP中的乘累加指令、求绝对值指令,x86中的
SIMD
指令等等。
muxiqingyang
·
2011-06-21 22:00
编程
优化
汇编
function
语言
编译器
使用PMULHW或PMADDWD指令对RGB颜色转换至YCbCr颜色的汇编优化
在视频处理中,常会遇到颜色空间的转换(高清和标清下的转换公式不同),下面是使用
SIMD
指令对RGBA颜色转换至YUYV颜色的汇编优化 假设转换公式如下:Y=Yr*R+Yg* G+Yb*BU=Ur*R+Ug
lifesider
·
2011-05-27 21:00
优化
汇编
存储
vb
《SSE...》一文的相关说明
其中使用到的技术如下: (1)Intel的
SIMD
技术SSE,这样可以用一条指令实现4个浮点数的乘法,加法; (2)多线程调用了pthread,结合其中提供的锁机制可以自动为多个线程平均分配任务;
eyeyin
·
2011-04-18 21:00
eclipse
多线程
c
cache
ubuntu
高级语言内的单指令多数据流计算(
SIMD
)
高级语言内的单指令多数据流计算(
SIMD
)
[email protected]
2011.04.14tag:单指令多数据流计算,
SIMD
摘要: 很多年来
housisong
·
2011-04-14 23:00
c
算法
扩展
语言
DST
X86
高级语言内的单指令多数据流计算(
SIMD
)
高级语言内的单指令多数据流计算(
SIMD
)
[email protected]
:单指令多数据流计算,
SIMD
摘要:很多年来,x86体系的CPU增加的新指令集大多都是
SIMD
指令
housisong
·
2011-04-14 23:00
语言
算法
dst
c
x86
扩展
代码优化
学习显卡编程,提高程序员的理论基础
熟悉
SIMD
和矢量运算的指令体系。这个对提高自己设计大规模数据处理程序的能力提供了最底层的理论基础。 同时通过学习CPU和GPU的协调工作的机制,也能拓宽自己对于计算的视野。
theorytree
·
2011-04-13 11:00
上一页
11
12
13
14
15
16
17
18
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他