各种符号 回忆上次内容
  • 中文字符可以有各种分类方法
  • 声母
  • 拼音检字法
 
  • 韵母
  • 合辙押韵的分类
 
  • 偏旁部首
  • 实际上unicode的排序方法
 
 
 
添加图片注释,不超过 140 字(可选)
 
  • 我们以前勇闯地下城时候获得了一把屠龙宝刀
  • 给他镶上了❤️宝石
  • 这宝石应该如何理解?
 
  • 今天我们就来彻底解密红色爱心的原理
闭环
  • 首先是文字
  • 我们的汉字可以构成一个闭环
 
添加图片注释,不超过 140 字(可选)
 
  • 这♥也可以构成一个闭环吗?
构成闭环
 
添加图片注释,不超过 140 字(可选)
 
  • 这种编解码方式是unicode-escape
  • 也可以构成闭环
 
添加图片注释,不超过 140 字(可选)
 
  • 这符号最初怎么来的呢?
插入符号
  • 搜索出来的
 
添加图片注释,不超过 140 字(可选)
 
  • ♠ ♣ ♥ ♦
  • 把字符复制下来
  • 然后粘到系统里面观察
  • 类似的有很多好玩的东西
  • ꧁༺新闻༒计算༻꧂
  • ༺动院༒编程༻
 
  • 加到名字里感觉萌萌哒
  • ლ(′◉❥◉`ლ)
 
输出符号
  • 这些其实都是uncode字符
 
添加图片注释,不超过 140 字(可选)
 
  • 这个东西是可以作为字符串里的字符输出的
  • 但是他的 ordinal (序号) 是多少呢?
得到序号
 
添加图片注释,不超过 140 字(可选)
 
  • 通过字符得到序号 ord
  • 反过来通过序号得到字符 chr
  • 输出红心试试
 
添加图片注释,不超过 140 字(可选)
 
  • 真的可以
  • 这个红桃符号在存储和传输的时候传的都是二进制形式
  • 可以看看红桃的序号的 16进制 或者 2进制 形式么 ?
16 进制
 
添加图片注释,不超过 140 字(可选)
 
  • 字符可以拼合
  • 前面一个 \u
  • 后面加上 4位 16进制 数
  • 就可以进行输出字符
 
  • 好像是又在\转义(escape)了
  • 这次的转义序列是\u2660
  • 黑红梅方都可以有对应序号么?
  • 不要翻篇
  • 上下找找
  • 自己试试
 
遍历花色
  • 从0x2660到0x2670
  • 将这16个数字对应的字符进行输出
 
 
添加图片注释,不超过 140 字(可选)
 
  • 他们分别都是多少呢?
遍历扑克
 
添加图片注释,不超过 140 字(可选)
 
  • 选出实心的黑红梅方
转义
 
添加图片注释,不超过 140 字(可选)
 
  • 我想要的不是默认红
  • 我想要纯红色的大红心
  • 怎么办?
回忆颜色
  • 高亮基础色
 
添加图片注释,不超过 140 字(可选)
 
  • 然后我们了解了\33[38;5;XXXm 索引颜色
  • 每个颜色 0-5 总共 6 级
 
 
添加图片注释,不超过 140 字(可选)
 
  • 甚至可以用RGB得到各种颜色
  • \33[38;2;R;G;Bmoeasy\33[0m
  • 颜色真不少了
 
  • 我想用大红色画个桃心 ♥️
  • 有可能吗??🤔
大红心
 
添加图片注释,不超过 140 字(可选)
 
  • \33[38;5;196
  • 使用索引色
 
  • 196 = 16 + 625 + 610 + 60*0
  • 红色打满
 
 
添加图片注释,不超过 140 字(可选)
 
  • rgb形式 也没有问题
  • 那么 红色方板 应该怎么做呢?
 
添加图片注释,不超过 140 字(可选)
 
  • 这个\u 又是什么意思呢?
  • 好像是也是一种通过数字找到对应字符的方法
  • 以前都有什么通过数字找字符的方法呢?
ascii
  • 最基础的肯定是ascii
sudo apt install ascii ascii
 
添加图片注释,不超过 140 字(可选)
输出字符
  • 可以用\输出字符
  • \xhh
  • x意味着hexdecimal
  • h 是十六进制数子
 
  • \ooo
  • o 是八进制数字
 
 
 
添加图片注释,不超过 140 字(可选)
 
  • 不要翻页
  • 再复习 如何用chr函数
  • 通过 数字直接输出oeasy字符串
 
输出
 
添加图片注释,不超过 140 字(可选)
 
  • 尝试用16进制和8进制输出
数字化输出
 
添加图片注释,不超过 140 字(可选)
 
  • 可是这个\u 究竟是什么呢?
 
添加图片注释,不超过 140 字(可选)
 
  • 不会了就去搜帮助
查看帮助
 
添加图片注释,不超过 140 字(可选)
 
  • 查找关于字符串的帮助
  • 具体转义序列语法如下
 
添加图片注释,不超过 140 字(可选)
 
  • \nnn 8 进制
  • \xhh 16 进制
  • \uhhhh 4 位的 Unicode 编码
  • \Uhhhhhhhh 8 位的 Unicode 编码
  • 那我们胡乱来试试吧
具体试试
  • \u后面
  • 4 位 16 进制数
  • 对应一个字符
 
 
添加图片注释,不超过 140 字(可选)
 
  • 这种对应关系就像ascii
  • ascii
  • 7 位 2进制数 对应一个字符
 
  • unicode
  • 范围更广
  • 字符更多
 
 
  • 其中中文标点
  • 我们要特别注意
 
调出中文标点
  • 点击桌面的sogou输入法
  • 开启中文输入法模式
 
 
添加图片注释,不超过 140 字(可选)
 
  • 可以切换
  • 中英文输入法
  • 全角半角
 
编程注意
  • 编程的时候
  • 只能使用英文标点
  • 不能使用中文标点
 
 
  • 这是为什么呢?
 
添加图片注释,不超过 140 字(可选)
 
  • 注意下图的括号不是半角的
原理
  • 中文括号和英文括号对应的根本不是一个序号
  • python解释器解释不下去
  • 就会报错了
 
 
 
添加图片注释,不超过 140 字(可选)
 
  • 引号,逗号等符号都要使用英文半角的
  • 在哪里切换标点的全角半角呢?
切换全角半角标点
  • 下图红框位置就是切换全角半角标点的位置
 
添加图片注释,不超过 140 字(可选)
 
  • 可以切换中英文标点
  • 那旁边的月亮怎么理解呢?
全角半角英文字符
  • 圆月是全角英文
  • 半月是半角英文
 
添加图片注释,不超过 140 字(可选)
 
  • 为什么会有全角英文字符呢?
全角英文
 
添加图片注释,不超过 140 字(可选)
 
  • 序号位置在中文之后
 
添加图片注释,不超过 140 字(可选)
 
  • 最初目的是和中文字符等宽
  • 其实也可以生成一系列特殊词元token
  • 因为这些词元看起来是英文单词
  • 但实际上并不是
 
  • 这应该是一块有趣的区域!
  • 另外汉语拼音字符
  • 应该如何理解呢?
 
汉语拼音
  • 汉语拼音符号:ā á ǎ à ō ó ǒ ò ē é ě è ī í ǐ ì ū ú ǔ ù ǖ ǘ ǚ ǜ ü ê ɑ  ń ň ǹ ɡ
 
添加图片注释,不超过 140 字(可选)
 
  • 这些序号
  • 好像并不是连续的
  • 可以将他们一起解码吗?
 
观察unicode编码
  • unicode中并没有汉语拼音block
 
添加图片注释,不超过 140 字(可选)
 
  • 我们把各个地方散乱的字符
  • 当做汉语拼音来用...
 
 
添加图片注释,不超过 140 字(可选)
 
  • ǖ ǘ ǚ ǜ ü 也是来自于拉丁语扩展
更多拼音
 
 
添加图片注释,不超过 140 字(可选)
 
  • 也有相应的拼音字符
1.[á]/[â] 2.[ǎ] 3.[ā] 4.[a̖]/[ȁ] 5.[a̗] 6.[à] 总结
  • 这次再次输出了大红心<span style="color:red">♥</span>
  • 找到了红心对应的编码
  • 黑红梅方都对应有编码
 


posted on 2023-04-09 18:13  overmind1980  阅读(15)  评论(0编辑  收藏  举报