CharLength - C++ Builder

C++ Builder 参考手册 ➙ System::Sysutils ➙ CharLength


字符串里面从某个编码单元开始的字符的字节数

头文件:#include
命名空间:System::Sysutils
函数原型:

int __fastcall CharLength(const System::UnicodeString S, int Index);

参数:

  • S:字符串;
  • Index:编码单元序号,从 1 到 n,n 为字符串长度;由于 UnicodeString 是 UTF-16 编码的,编码单元为 char16_t (或 wchar_t),由于一个字符可能由 1 个或 2 个 char16_t 组成的,一个字符是 2 或 4 个字节;

返回值:

  • 2: 在 Index 位置的字符是单个编码的字符 (2 个字节的字符),或者半个字符位置 (这是单个编码单元的字符,或者与前面的编码单元组成一个字符);
  • 4: 在 Index 位置的字符是两个编码单元的字符 (4 个字节的字符);
  • 字符串 L"Hello玄坴" 长度为 7,即包含 7 个编码单元,14 个字节,包含的字符个数是 7 个字符;
  • 字符串 L"土圭垚㙓" 长度为 8,即包含 8 个编码单元,16 个字节,包含的字符个数是 6 个字符,其中 "土"、"圭"、"垚" 和 "㙓" 都是单个编码单元的字符 (2个字节),"" 和 "" 是两个编码单元的字符 (4个字节)。

例子:输出字符串 L"土圭垚㙓" 里面每个 char16_t 位置开始的字符是几个字节;

void __fastcall TForm1::Button1Click(TObject *Sender)
{
    UnicodeString s = L"土圭垚㙓";

    int n = s.Length();
    for(int i=1; i<=n; i++)
    {
        Memo1->Lines->Add(String().sprintf(L"%d:%d",i,Sysutils::CharLength(s,i)));
    }
}

运行结果:
通过运行结果可以看到:

  • "土"、"圭"、"垚" 和 "㙓" 都是单个编码单元的字符 (2个字节),"" 和 "" 是两个编码单元的字符 (4个字节);
  • 序号 Index 在半个字符位置返回结果为 2,否则返回 2 (单个编码单元的字符) 或 4 (两个编码单元的字符)。
运行结果

相关:

  • System::Sysutils::ByteToCharIndex
  • System::Sysutils::BytesOf
  • System::Sysutils::WideBytesOf
  • System::Sysutils::PlatformBytesOf
  • System::Sysutils::StringOf
  • System::Sysutils::WideStringOf
  • System::Sysutils::PlatformStringOf
  • System::Sysutils::ByteLength
  • System::Sysutils::CharLength
  • System::Sysutils::StrCharLength
  • System::Sysutils::AnsiLastChar
  • System::Sysutils::AnsiStrLastChar
  • System::Sysutils::AnsiPos
  • System::Sysutils::AnsiStrPos
  • System::Sysutils::AnsiStrScan
  • System::Sysutils::AnsiStrRScan
  • System::Sysutils::CharToElementIndex
  • System::Sysutils::CharToElementLen
  • System::Sysutils::ElementToCharIndex
  • System::Sysutils::ElementToCharLen
  • System::Sysutils
  • std::mblen
  • std::_mbstrlen
  • std::strlen, std::_fstrlen, std::_tcslen, std::wcslen

C++ Builder 参考手册 ➙ System::Sysutils ➙ CharLength

你可能感兴趣的:(CharLength - C++ Builder)