http://blog.csdn.net/pkrobbie/archive/2007/01/18/1486331.aspx
COM是一种跨编程语言的平台,需要提供语言无关的数据类型。多数编程语言有自己的字符串表示。
需要定义一种通用的字符串类型,可以很容易的匹配到不同编程语言。在C++中,就是BSTR。
2.1 BSTR 简介
"Basic STRing"的简称,微软在COM/OLE中定义的标准字符串数据类型。对于C++,Windows头文件wtypes.h中定义如下:
2.2 BSTR实现
在COM中,字符用16-bit OLECHAR表示,这样使COM可以支持各种code pages,包括Unicode。对于windows系统,可以简单理解为OLECHAR使用的就是Unicode 。OLECHAR串与单字节字符串很类似,是一个以null结尾的buffer。唯一的区别是每个字符占两个字节,而不是一个
0 1 2 3 4 5 6 7 8 9 0 1
| H | E | L | L | O | \0|
^
OLCHAR
Figure 1. Format of an OLECHAR string.
使用以Null结尾的简单字符串在COM component间传递不太方便。因此,标准BSTR是一个有长度前缀和null结束符的OLECHAR数组。BSTR的前4字节是一个表示字符串长度的前缀。BSTR长度域的值是字符串的字节数,并且不包括0结束符。由于是Unicode串,所以字符数是字节数的一半。这种方式的优点是允许程序员在BSTR串中间嵌入NULL字符。但是,BSTR的前四个字节表示长度,而OLECHAR数组的前四字节表示前两个字符。这种情况下,对于C++程序,如何实现BSTR和OLECHAR的交换?答案是COM提供了两个BSTR分配用的API:SysAllocString / SysReallocString。函数返回的指针指向BSTR的第一个字符,而不是BSTR在内存的第一个字节。
0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5
0a000000 | H | E | L | L | O | \0|
^
BSTR
Figure 2. Format of a BSTR.
下面是SysAllocString和SysFreeString的伪代码。
只有在你不得不用的时候。
使用BSTR一般有以下几种情况:
不使用的情况:
字符串相关类型的推荐选择顺序
优先级
类型
说明
最高
stl::string/wstring
· 功能最完善,可移植性最好。
CString
· 如果编码规范限制使用STL的时候,推荐CString。
· VC 6的版本很不完善。.Net有明显改进,需要进一步研究。
C/C++ basic type(TCHAR* / char* / LPTSTR / LPCTSTR / TCHAR[])
· 在结构体中,优先使用指定最大长度的字符数组。
· 效率最好
CComBSTR/ _bstr_t
· 在必须使用BSTR时的优先选择。
· 在ATL(COM component)工程或者工程中必须使用ATL中,优先选择CComBSTR。一般Exe/dll如果_bstr_t能满足要求,优先使用_bstr_t。
· 对于VC6,使用_bstr_t一定要慎重,最好只用作简单临时变量保存调被调用函数的传入参数。因为_bstrt_t不能支持一些关键性操作,比如Detach。
· 对于VC++ .Net推荐使用_bstr_t,它是C++扩展,不需要额外包含ATL的文件。
最低
BSTR
· COM接口