Unicode里的表意文字描述符

「表意文字描述符(Ideographic Description Characters)」区块位于U+2FF0-U+2FFF范围内,共占据十六个编码空间,但由于实际上只有十二个符号,所以U+2FFC-U+2FFF的四个位置并没有编排任何符号。
由于汉字的数量庞大,而且不断增加,旧的罕见文字未必能在Unicode统一码中找到,新造的就更不用说了,所以这时可以用已经存在的字符作为部件,加上结构的说明,两者结合来描述,以便用来合成这些未编码的文字。
根据Unicode统一码文件说明,使用汉字表意文字描述符,加上组成部件的字,计算机可以把合成后的文字显示出来。或者把表意文字描述符和组成部件的字符都按顺序显示出来,让用户自己在脑中想象需要构成的文字的长相。
下面是表意文字描述符的字符编码:
表意文字描述符是可显示字符,如上图中的虚线图形。
但大部分情况下,文本成形引擎(text shaping engine)无法显示出我们想构造的文字,仅直接显示出一个个字符:
⿴囗⿰⿱鹵凼阝
上面每个字符对应的Unicode值:2FF4 56D7 2FF0 2FF1 9E75 51FC 961D
有没有办法显示出构造的字呢?
发现了一个网站,可以帮忙造字:
: zi.tools
打开后网页后,上方菜单选择“组字Compose”,然后按顺序选择表示文字描述符,并填入作为部件的字符,点击生成,显示出要构造的字:
(或者将准备好的字符串直接拷贝进去)
  Unicode里的表意文字描述符_第1张图片
参考:
漢字結構描述字符(Ideographic Description Characters,U+2FF0-U+2FFF)
https://www.unicode.org/charts/PDF/U2FF0.pdf
Unicode 15.1 Character Code Charts

你可能感兴趣的:(汉语,笔记)