汉字属性查询
汉字属性查询是使用计算机对文字信息进行自动处理的一种方式。它通过分析文字信息的结构,提取其中具有特定意义的元素,从而获得该汉字的各种信息。
汉字属性的分类:
1.按字形分类:如左右结构的" ? 、 ? ",上下结构的" ? 、 ? ",半包围结构的"口、日、月、田、木、水、火"。
2. 按偏旁部首分类:如左右偏旁的:"车、石",上下偏旁的:"山、土、人、金、口、日、月、田、木"。
3. 按笔画数分类:如一横的写法有5种,两竖各有4种,一撇有3种,三撇有1种。
4. 按笔顺规则分类的字体,其笔画书写顺序与一般印刷体不同(即先写后写或从左到右),例如:"二"(先横再折,最后点)。
5. 根据字意来分类的字体,其笔画书写顺序与一般印刷体相同,例如:"义、心、思"。
6.根据字形和含义来分类的字体,其笔画书写顺序与其字面意义一致。例如,"爱"、"安"、"福"、"祥","国"、"民、"家、"富"、"强","新"等。
在计算机系统中,汉字属性主要包含如下内容。
(1)汉字的编码;
(2)汉字的区位信息;
(3)文字的输入输出控制命令;
(4)文字识别结果显示。
1. 编码
编码是对一个给定的中文字符集进行唯一性标记的过程。由于每个汉字都有固定的读音和形体结构,所以只要将它们按照一定的方法进行编码,就能够使计算机能够正确地识别这些汉字。目前,常用的方法有以下两种。
(1)基于拼音的输入法。这种方法是利用事先定义好的一套音素代码表,把每一个要识别的中文字符转换成相应的音素代码。当用户键入这个字符时,电脑就能根据这套发音方案产生出与之相对应的音素,然后由语音合成器将其转化为声音信号。这样,用户就可以听到所输入的字了。
(2)基于五笔字型键盘的输入法。这是我国一种比较成熟的形码。它的原理是将每个基本单码字根用五种以上的笔形描述,组成字根助记词,并赋予一定的区位号,以便于记忆和使用。只要记住这五套不同的码字根及其位置组合关系,就可以打出一个符合要求的任何汉语的文字。
2. 方位信息
所谓方位信息是指某个特定的符号代表哪个特定的位置。对于某些特殊符号来说,只有知道了它的具体位置才能够对它作出正确的解释。比如我们说一个人坐在沙发上,如果不知道他的确切地点,那么就无法知道他是坐在沙发上的。同样道理,如果我们不知道某一个英文单词的具体意思的话,那么也就无法了解这个词的含义。
标签: 属性