如前所述,要研究文字处理的标点符号问题。经过一番搜索,还真没有一个统一标准说法,甚至连国标都缺失很多。因为吾开发OFFICE,不得不进行彻底研究。首先要进行分类。吾将其分为以下几类:
-
数学算符。此处所说的算符,不包括图形,都是有编码的字符。
-
半角。键盘上能看到的那些。
-
全角。在收集过程中发现,很多符号看着象是全角,编码其实并不一样。要把半角转移为全角,可以参考:
https://quantum6.blog.csdn.net/article/details/109626937
- 数字序号。不包括汉字的甲乙丙丁、一二三四等。
- 特殊符号。如温度、货币等。
-
横排标点(着重号、专名号是格式,不是字符)。这个是真正意义上的标点。
-
竖排标点。没想到吧?从编码来说,句号、逗号都是不同的
具体有哪些,还在收集中。