日文假名和韩国谚文 回忆上次内容
-
上次回顾了非ascii的拉丁字符编码的进化过程
-
0-127 是 ascii 的领域
-
世界各地编码分布
-
拉丁字符扩展 ascii 共 16 种
-
由iso组织制定
-
从iso-8859-1
-
到iso-8859-16
-
无法同时显示俄文和法文
-
此时中日韩的文字也需要进入计算机
-
象形文字的字符集超级巨大
-
日本、韩国也用汉字
-
数量2万起步
-
真能把 如此巨大的字符集
-
编码进入计算机吗?🤔
文字
-
日本汉字我们可以直接看懂
-
地铁里的 标记
-
日文中 为什么
-
这么多汉字呢?
遣唐使
-
皇子公卿僧侣
-
都要 专门
-
来中国 朝圣
-
学文化
-
日文 很多词
-
都 能看懂
-
管 老师 叫做 先生
-
管 火车 叫做 机车
-
管 学习 叫做 勉强
-
管 辣 叫 辛
-
特别辣
-
叫 激辛
-
这些汉字怎么来的呢?
空海和尚
-
从日本来的 留学僧
-
不但学习 汉语佛法
-
也学习 汉字书法
-
并把这些文化带回日本
-
汉字 成为 书写符号
-
口头系统的 日语
-
可以 记录下来了
-
正如同
-
使用圣书体的一些字型
-
将腓尼基的口语记录下来
万叶集
-
“叶” 是 “世”
-
即时代
-
希望能流传到万世
-
各种各样的歌
-
敬畏自然山神、河神 的歌
-
男女恋爱 的歌
-
挽歌
-
汉字
-
数量很多
-
记起来、写起来也比较复杂
-
只有 最有文化的人
-
才能 都写下来
-
自己 写东西 的时候
-
有些字 忘了 怎么写
-
就拿一个 同音字
-
来 假借
日语假名
-
假借的 次数 多了
-
就 固定了下来
-
形成了
-
专门的 日语拼音 字符
-
假名
-
存在着多个体系
-
不同的时代
-
不同的地域
平假名
-
直到明治33年
-
发行公文才得以统一
-
万葉仮名(假名)
-
草书风格的符号
-
有女性的柔美
-
抄文众多
-
《枕草子》
-
《源氏物语》
-
把写法也固定了下来
-
成为铅字
-
万葉仮名(假名)
-
形成了
-
现代假名系统 中的 平假名
-
除了平假名之外
-
还有片假名
片假名
-
片假名来自 汉字 的 一片
-
也是一种 假名系统
-
有 硬朗的 楷书 转化而来
-
明治维新时期
-
大量欧美外来语涌入日本
-
日语只取其读音
-
用片假名将其表示出来
-
假名系统
-
是 拼音文字 系统
-
字符数量 不多
最初的日文编码
-
在ascii的基础上
-
把片假名加了上去
-
字型什么样呢?
假名字形码
-
可以把这些片假名输出出来吗?
输出假名
-
下面的代码是将a1到e0
-
封包进入一个字节
-
然后再将字节解码
-
可以动手试试
-
以后我们会详细讲解封包解包
-
范围[0xa1, 0xe0)
勇者斗恶龙
-
当时的日文
-
能显示出ascii和假名的字型
-
就已经很厉害
-
想显示出中文字型
-
是不可能的
日本汉字
-
是中文的拼音文字
-
只是假名都加在一起就至少 100+
-
128 根本不够用
-
更何况日文里面用日本汉字
-
虽然只有2000个不到
-
但是是文化的象征
-
不过假名毕竟是假的
-
日文中最厉害的还是汉字
汉字文化
-
日语中混有各种汉字
-
感觉根本不用翻译
-
也会造一些日本汉字
评选年度汉字
-
所以日文中的字符直接超过2000+
-
1 个字节 是不够了
-
至少需要 2 个字节
-
日本规格协会制定标准
-
JIS X 0212
-
点阵字库 产生了
-
日本汉字的黑体模式
无衬线黑体风格
-
无衬线
-
黑体
-
注重实效
-
注重清晰度
-
任何字帖一般都有两种风格
-
板正规范的生硬风格
-
圆润灵动的手写风格
手写风格
-
不像大写字母
-
那么生硬
-
就像小写字母
-
那么圆滑
-
韩文字符又是如何编码的呢?
韩文
-
韩文也是一种拼音文字
-
基础字母有二十四个
-
符号是朝鲜王朝世宗大王时创作的
-
从此韩文有了谚文
-
但是韩国士大夫会写汉字
-
不愿意推广谚文
拼音
-
不过拼音文字
-
更容易一些
-
谚文书写 普及速度 比汉字书写 快得多
-
拼音 是有结构的
谚文结构
-
谚文是由表音符号组合而成的
-
有各种间架结构
-
这些声旁都发什么音呢?
声音
-
韩文名字
-
宋仲基(송중기)
-
金喜善(김희선)
-
李英爱(이영애)
-
阿一古(아이구)
-
圆圈不发音
-
从此就连哎呦喂(阿一古)
-
都有了标准发音方法
-
用拼音文字把读音固化下来
-
谚文有多少字符呢?
谚文字符
-
声母韵母拼写在一起算一个
-
共 554 个
-
而且这还不算朝鲜汉字
-
这554个基础字符导致
-
1 个字节不够
-
2 个字节才够
-
韩文的字符集为
-
KS X 1001
总结
-
日韩各有 编码格式
-
日本
-
有假名
-
五十音
-
一字节 可以勉强放下
-
有日本汉字
-
字符数量超过20000+
-
韩国
-
有谚文
-
数量超过500
-
一个字节 放不下
-
有朝鲜汉字
-
字符数量超过20000+
-
作为 汉字源头的中国
-
究竟应该 如何对汉字 进行编码 呢?🤔
-
我们下次再说!👋