我们很快就可以光明正大的复制biangbiang面的biang了

源码蚁

发表文章数:254

­作为一个网络从业者,每天的日常少不了接触电脑、键盘、输入法( 和咖啡 )。 ­

 

写了这么久文章,自然也发现了一些问题是打字快解决不了的:比如敲一个在电脑里找不到的字。
我们很快就可以光明正大的复制biangbiang面的biang了

上面这个字有网友可能会觉得眼熟,也可能有网友根本不认识,这个字念 biáng ——「 就系biáng biáng面里边的那个biang啊 」

­

 

饿了吗,想吃吗▼
我们很快就可以光明正大的复制biangbiang面的biang了 ­ 

但是 biáng 字只是用来表示这道著名的陕西面食,用途太过生僻,导致电脑的字符编码一直都没有收录,所以我们的电脑里一直都打不出来这个字。 ­ 

你要是不信的话可以试下,我保证评论区里打不出这个字 (咦,我们还没有评论区。可以店阅读原文)~~ ­ 

然而最近突然有个消息说, Unicode 组织把 biáng 字收录进了「 CJK 统一表意汉字 」的扩展 G 区中,从今天开始就生效了。 ­ 

 
我们很快就可以光明正大的复制biangbiang面的biang了 

 

所以现在能在电脑里打出 biáng 字了吗?陕西那嘎达的小伙伴们可以在微信里教别人怎么写 biángbiáng 面了咩?

 

大家先冷静一下,实际上事情没有这么简单,因为我们电脑里的文字编码和输入法还不是一回事。

 

其实,电脑里能看到的字,在输入法中也不一定能打出来

 

要想搞明白这件事儿,就得先和大家聊聊我们电脑里的文字编码是啥玩意。

 

咱们都知道,现代的计算机是美国人儿造出来的,他们为了处理文字方便,于是给 26 个字母在电脑里设置了一套编码标准。

 

 

我们很快就可以光明正大的复制biangbiang面的biang了 ­ 

就是说,这就相当于规定电脑里的1字符是「 A 」,2字符是「 B 」。 ­ ­ 

 

 

但是这个一号二号是二进制的「 0010 0001 」。 ­ 

 

 

这就是传说中大名鼎鼎的阿斯克( ASCII )码 —— 又被叫做美国信息交换标准代码。ASCII 码表在当时的地位不亚于现在的九九乘法表,是现代计算机处理文字的基础(…)。

 

 

我们很快就可以光明正大的复制biangbiang面的biang了 ­ ­ 

然而 ASCII 码有个严重的问题:因为当时的硬盘比较小,能有 1 MB (1GB=1024MB)的内存就算挺好的了,所以整个 ASCII 表最多也只能定义 256 个字符… ­ ­ 

 

 

所以等到电脑飘洋过海进入了其他国家之后,那些不说英语的国家的小伙伴们就愤怒了 —— ASCII 表根本就没给其他语言预留地盘(这可咋整)。 ­ ­ 

 

 

­

所以我们现在如果还在用 ASCII 表的话,可◻用◻电◻脑◻中◻文◻字◻就◻这样◻的◻。( 会缺少很多字符,就像PS的字体缺失一阿姨那个 )

 
于是,各个国家一时间都开始制定自己国家的文字标准,比较著名的有西欧的 ISO-8859 系列标准、微软的 Windows-12xx 系列标准。
当然还有咱们中国的 GB 2312 文字编码标准。 ­ 

 ­

 

我们很快就可以光明正大的复制biangbiang面的biang了 ­ 

 ­

 

然而即使大家自己制定的一些文字编码标准解决了不同语言文字在计算机里存储的问题,但是经常是在一个牌子的计算机里能正常显示的文档,拿到别的电脑上就成了乱码(就好像office和WPS)。
如同没有 USB 充电口之前,功能机(如诺基亚)和山寨机(如…)们各自用着五花八门的充电头(…)一样,谁也不兼容谁(打一架就好了)。
我们很快就可以光明正大的复制biangbiang面的biang了 ­ ­ 

所以就像一些共享充电宝上附带了好多种插头的万能充电线一样,计算机上的排版软件也得加进去尽可能多的文字编码规范(好苦哦…),才可以做到自动识别出来文字编码,让文字(字符)正确显示出来。
 ­ 

不过一直用万能线也不是个办法(浪费资源),如果大家都用一样的 USB 线该多好呢。 ­ ­ 

就在上世纪 80 年代的时候,万国码( Unicode )组织就在苹果、 Adobe 、微软、惠普、 IBM (被lenove收了)等几个科技巨头们的牵头之下意外成立了。 ­ ­ 

­

我们很快就可以光明正大的复制biangbiang面的biang了 ­ ­ 

以前 ASCII 码吃亏在了序列位数不足上,搞得只能存 256 个字符。于是这次的万国码直接把序列位数拉到了 16 位

 ­ 

­

把「 0000 0000 0000 0000 」开始,到「 1111 1111 1111 1111 」结束全都塞满字符的话,存上 65,536 个字。 ­ ­ 

 ­ 

­

后来 Unicode 又把字符编码扩展到了 32 位,于是储存空间更大了,40 多亿个字的存储地盘,别说地球上的文字了,即使发现了外星文明的时候依旧够用。 ­ ­ 

 ­ 

­

我们很快就可以光明正大的复制biangbiang面的biang了 ­ 

 ­ 

­

地盘大了之后,那么就可以挥霍了:在过去的二十年中, Unicode 陆续收录了地球上所有主要的文字,还把古代汉字和埃及象形字之类的东西全给收了。 ­ ­

《 康熙字典 》和《 四库全书 》在列▼
我们很快就可以光明正大的复制biangbiang面的biang了 ­ ­ 

就连我们平常用的 Emoji 表情,其实也是 Unicode 文字编码的一部分:
在 Unicode 还有一个专门的小组,负责和表情设计师一起讨论下次应该再加点儿什么表情进来。

 ­

 

我们很快就可以光明正大的复制biangbiang面的biang了 ­ 

 ­

 

收录的东西又好又多,操作系统和文字排版工具们就不用再需要跟文字编码打架了,直接选 Unicode 编码就好了。 ­ ­ 

而这次收录了 biáng 字的 Unicode 13 ,也就是 Unicode 标准的第 13 版更新 —— 除了 biáng 字之外还收录了 4,939 个生僻的汉字
反正没一个认识的 ▼
我们很快就可以光明正大的复制biangbiang面的biang了 ­ 

( 注意这里) ­ 

其实我们在这段的左上角给大家复制(copy)了一个 biáng 字,不过可能大家现在只能看到一个 “ 口 ” ,或者一个黑底的大大的问号。
嗯,因为虽然从现在开始 Unicode 13 标准已经正式发布了,但是我们还没法马上用到。 ­ 

这是由于文字编码是存储在内置于操作系统当中的,今天只是意味着厂商们可以开始着手集成系统了,距离我们能正式体验到还需要系统更新之后。 ­ ­ 

­ ­

我们很快就可以光明正大的复制biangbiang面的biang了 ­ ­ 

等什么时候大家系统更新完之后,突然发现上面的那个 biáng 字可以正常显示了,就代表着操作系统已经更新到最新的 13.0 版 Unicode 文字编码了。
即使是这样,这个 biáng 字依旧是「 只可远观,但打不出来 」。 ­ 
这是因为在我们的拼音规范里没有 biáng 的拼音…,字典里也还没有收录这个字。
我们很快就可以光明正大的复制biangbiang面的biang了 ­ ­ 

实际上, biáng 由 bi ( 读 bai )和 áng 两个音节组合而成的合音字,是关中地区的方言发音,不单独作为一个拼音来用,所以没法被拼音输入法打出来。
而 biáng 字的性质也和「 招财进宝 」类似,属于民间为了这个发音生造出来的一种臆造字( 野字 )。 ­ 

 ­

 

我们很快就可以光明正大的复制biangbiang面的biang了 ­ ­ 

­而且 biáng 字本身更是在陕西的不同地区也还存在差异较大的不一样的写法,把谁收录进字典估计其他地区的朋友都不会同意(又要打架),所以不费这劲,让它继续野着去了算了吧。 ­ ­ 

孔乙己,你知道 biáng 有几种写法吗?▼
我们很快就可以光明正大的复制biangbiang面的biang了 ­ ­ 

所以虽然以后电脑里正常显示 biáng 字了,我们也还是依旧没法通过拼音输入法正常把它敲出来,只能跑到百科一类的地方复制粘贴(copy)。
在今年,也有陕西民俗学家在推动 biáng 字进字典的事情了,有 Unicode 的示例在前,没准等再过几年这件事也许还真能迎来个大反转。
估计到时候我们就能正常的用 biáng 打出「  」字了。 ­ ­ 
 ­
 ­
图片、资料来源:
Wikipedia,Biángbiáng 面
Wikipedia,通用字符集
西安晚报,biang”字入字典 你觉得可吗?
Unicode® 13.0 Versioned Charts Index
知乎,《 Biang 字是如何躲过建国时的汉字简化的?》
感谢方元教授( 北京信息科技大学外国语学院 ),马嘉晨、朱钰同学( 首都师范大学 )为本文提供的支持
部分图片来自互联网
改编于微信公众号:差评君

未经允许不得转载:作者:源码蚁, 转载或复制请以 超链接形式 并注明出处 源码蚁
原文地址:《我们很快就可以光明正大的复制biangbiang面的biang了》 发布于2020-03-11

分享到:
赞(4) 打赏 生成海报

评论 抢沙发

评论前必须登录!

  注册



长按图片转发给朋友

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

Vieu4.5主题
专业打造轻量级个人企业风格博客主题!专注于前端开发,全站响应式布局自适应模板。
切换注册

登录

忘记密码 ?

您也可以使用第三方帐号快捷登录

Q Q 登 录
微 博 登 录
切换登录

注册