缅文两大字符编码争夺全球最大社交媒体!U跟Z你们选哪一个?
近日,缅甸电脑协会秘书长吴吞杜耶德对媒体表示,由于目前最受缅甸网民青睐的社交网站Facebook(脸书)支持了缅文字符编码为Zawgyi-one的字体(以下简称为Zawgyi),从而导致了另一种缅文字符编码为Unicode字体的发展和推广都受到了冲击。
尽管早先Facebook曾经尝试支持Unicode字符,但由于缅甸使用Unicode的网民数量相对较少,Facebook不得不在2016年6月的第二个星期重新装载了Zawgyi字体以支持更多的网络用户。目前,Facebook同时支持Zawgyi和Unicode这两种不同的字符。
此外,由于多数缅甸民众已经熟知并习惯使用Zawgyi进行输入,因此Unicode缅文字符的推广始终处于一个很尴尬的境地。据统计,在当前各类缅文网页中,依然有超过60%的网页在使用ZawGyi作为缅语的主要字符编码,有30%的网页选择制作了同时支持Zawgyi和Unicode的两种不同模式,只有10%左右的网页支持Unicode字符。
吴吞杜耶德指出,其实缅甸民众清楚Unicode缅文字符编码的重要性。有IT业内人士向记者解释,尽管Zawgyi字体输入法看起来更加简单便捷,但是Unicode缅文字符编码的优势在于国际通用性和规范性(例如Unicode字符编码可以让缅文搜索变得更加快捷准确),这也有利于缅文的国际化推广。
除了一部分人对Unicode缅文字体的推广表示担忧以外,也有不少IT行业人士对Unicode在缅推广保持乐观的态度。缅甸计算机发展组织(MIDO)负责人表示,国内缅文字符编码规范的标准制定与其适用情况有着紧密的联系,最终选择“U”还是“Z”,要取决于民众的态度,但依照全球字符“Unicode化”的趋势而言,Unicode的推广进程将不会受到Facebook支持Zawgyi字体的影响。
小知识我来答
什么是字符编码?
说到字符编码,我们首先需要了解,目前我们所使用的计算机,也就是电脑只能进行二进制存储、运算数据。也就是说,你输入一个数字“9”,就会被计算机转化成计算机能看懂的“1001”这样一串二进制数字。
但是,在你使用计算机的时候,不能总是输入诸如“10001010101101”这样一连串二进制数字吧,于是这个时候,人们就发明了ASCII编码系统。这个系统可以将我们输入的符号转换为一个8位的二进制数(如“10010100”),由于英文字母只有26种变化,算上大小写也只有52种变化,再加上老外用的英文标点符号、特殊字符也没多少种变化。用8位二进制数就可以表达256种字符,这就足以胜任处理英文字符的工作了。
但是,这里又出现了一个新的问题了,那就是不是所有的计算机用户都是英文用户,大家大部分时间里都要输入非英文字符。
以汉字为例,汉字保守估计有6万多个,常用的有三五千个。ASCII编码肯定是无法满足我们这样需求的,于是就有诸如BIG5、GBK这类字符编码,用16位二进制数可以表达65535个汉字,对日常用字来说是够用了。
目前,比较常见的一些字符编码方式有:Unicode(UTF-8)、ASCII、GBK等等。
Unicode又是什么?
以上面一汉字的编码为例,简单讲了一下什么是字符代码。但是,世界上除了汉字之外,还有各种各样不同的语言,这个时候又要怎么办呢?于是,Unicode(UTF-8)编码就这样出现了。
Unicode(UTF-8),或者称作UTF,是通用转换格式的缩写,又被称为万国码,理论上来说可以表达各种文字的编码格式。
其实,Unicode的诞生时间并不长,它于1990年开始研发,1994年才正式公布。研发Unicode是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。
简单地说,Unicode编码的出现解决了不同国家间不同字符编码格式出现的不兼容情况,让不同语言不同国家的人们的距离更近了。
为什么Unicode用户看Zawgyi网页是乱码?
刚才小编已经说了,由于Unicode和Zawgyi是两种截然不同的字符编码,假设你用Unicode字符编码的操作系统,打开一个Zawgyi字符编码的网页,系统将默认使用Unicode编码还读取Zawgyi编码的文字,那结果是显而易见的啦。
请问有现成的转化两种字体编码的程序吗?求求求。。。
从技术角度来讲,是可以相互转换的。但目前,缅甸人大多仍在使用Z码。
那两种编码可以互相转换吗