1.7万余个生僻汉字编码字符上线 专家表示:不同平台文字不兼容的情况将成为历史

2022年07月29日 15:40:46 | 来源:我苏网

字号变大| 字号变小

  7月28日,国家标准化管理委员会、工业和信息化部、国家语言文字工作委员会联合发布新版《信息技术 中文编码字符集》强制性国家标准(GB 18030-2022)。与上一版标准相比,新国标增加录入1.7万余个生僻汉字,为传承中华文化、增强中文信息处理能力、满足姓名生僻字人群用字需求提供强有力的标准保障。

  国家标准委介绍,《信息技术 中文编码字符集》是中文信息技术领域最重要的基础性标准,对汉字和我国多种少数民族文字进行统一编码,需要进行中文处理的信息系统均需应用此类编码标准。因此,该标准实施场景丰富、应用范围广泛。标准首次发布于2000年,2005年第一次修订,支撑了我国中文信息处理和交换需要。

  新版《信息技术 中文编码字符集》强制性国家标准将于2023年8月1日正式实施,共收录汉字87887个,比上一版增加录入了1.7万余个生僻汉字。不仅收录国务院发布的《通用规范汉字表》全部汉字,还可覆盖我国绝大部分人名、地名用生僻字以及文献、科技等专业领域的用字,能够满足各类使用需求。

  今天(7月29日),记者独家采访了语言学专家,南京大学文学院教授、博士生导师程少轩,他举例表示,比如曹操《短歌行》“契阔谈讌,心念旧恩”的讌,以前用一些输入法无法录入,以后就可以正常录入了。

  程少轩表示,可能会有一种误解,以为生僻字只是在古籍整理、汉字研究等领域才会用到。“其实增录了一万多个汉字的新版强制国家标准,与生产生活密切相关。因为使用生僻字的情况并不罕见,特别是在人名之中使用生僻字的情况广泛存在。而在当今这个信息时代,只要用到电脑,用到数据库,未被国家标准覆盖的生僻字就会给人们带来困扰。在管理层面,生僻字问题涉及税务、电信、社保、金融、公安、工信等诸多部门;在技术层面,生僻字问题涉及操作系统、数据库、对外接口、中间件、源文件等诸多环节。”

  有些生僻字系统使用自己造的字符来补充,有的系统根本无法正常显示。“无法录入,在办理银行卡、转账汇款、办理手机卡、医保、纳税等场合就会有诸多不便。有些名字里带生僻字的人,甚至连买火车票、坐飞机都成问题。这还只是对个人的影响,对管理的影响就更多了。比如公安部门、社保部门进行户籍登记和身份登记,有很多人名和地名的生僻字无法以统一标准录入,在查找时就会有很多不便,非常不利于统一管理。在技术层面也有影响,比如有些文件使用了生僻字,由于不同系统、不同软件对这些文字编码的处理缺乏统一标准,传输和使用时会出现各种故障。相信不少朋友遇到过通过FTP、email接收到的文件出现乱码或者无法打开等情况,有时候就是由于出现了2005版标准之外的字形造成的。”

  这次新颁布的标准,其实就是在充分吸收社会诉求的前提下,对2005版国家标准的修订和补充。彻底解决了“一字多码”等旧标准的技术失误;覆盖了绝大多数人名地名的生僻字,尽可能满足了社会用字的需求。在字集和编码上,兼容GBK和GB2312等旧标准。全面覆盖了国务院于2013年公布的《通用规范汉字表》,补录了见于《通用规范汉字表》但2005版标准未收的196个汉字。“这次颁布的是全文强制国家标准,也就是必须强制施行的。这样以后各种平台,系统、软件、硬件设备,必须使用这套规范,不同平台文字不兼容的情况将成为历史。”专家表示。

  (来源:江苏广电融媒体新闻中心/方晨 编辑/赵梦琰)

layer
快乐分享