摘要:
7.7.1 Unicode Property 每个 Unicode 字符都只能属于一个 Unicode Property。所有的 Unicode Property 共分为7大类,30小类。大类的名字只有1个字母,小类的名字则不知1个字母,开头字母与所在大类的名字相同,小 阅读全文
摘要:
每一个 Unicode 字符,除了有 Code Point 与之对应外,还具体其他属性,在正则表达式中常用到三种 Unicode 属性: Unicode Property、Unicode Script,分别对应字符符的功能、所属代码区段、书写系统;它们的表现形式都类似 。 7 阅读全文
摘要:
Unicode 字符多种多样,除去 ASCII 中的字母、数字、标点和中文字符,还包括其他多种语言和多种符号,有些符号甚至很难打出来(比如表示商标注册的™️),这时候该如何表示呢?再说远一点,如果我们想用一个字符组匹配所有的中文字符,能不能像 那样呢? &ems 阅读全文
摘要:
单词边界的准确解释是:一端必须出现 能匹配的字符,另一端不出现 能匹配的字符。在JavaScript、PHP、Python 2、Ruby中, 只能匹配 。所以在这些语言中, 能用来匹配几乎所有的英文单词。 | 字符串 | 正则表达式 | 能否匹配 | 说明 | |: |: 阅读全文
摘要:
一般来说,数字字符解释 ,单词字符就是 ,空白字符则包括空格、回车等字符,但这是 ASCII 编码中的情况,在 Unicode 编码中并非如此。 因为包括了多种语言和字符,所以在 Unicode 编码中,全角数字0、1、2之类也算作“ 数字字符 ”, 阅读全文
摘要:
常见的正则表达式的文档都是关于英文(ASCII字符)的,英文开发者通常也只需要处理ASCII字符,不需要处理中文这类多字符的字符。不过,依照李处ASCII字符的方式处理中文字符,就有可能出错。 举个例子,许多文档说点号 可以匹配“除换行符\n之外 阅读全文
摘要:
第 7 章 Unicode 7.1 关于编码 通常,英文编码较为统一,都采用ASCII编码或可以兼容ASCII编码(即编码表的前127位与ASCII编码一直,常见的各种编码,包括Unicode编码都是如此)。也就是说,稳赢字母、阿拉伯数字、稳赢的各种符号,在不同编码下的码 阅读全文
摘要:
环境是windows 10 版本1809,docker 版本18.09.0 首先是下载docker、git, 具体可以参考 要求 Docker = 17.12 启动docker git clone https://github.com/Laradock/laradock.git 进入laradock 阅读全文
摘要:
正则表达式千变万化,都是由之前介绍的字符组、括号、量词等等基本结构组合而成的,只要掌握了组合的规则,面对再复杂的表达式,都能把结构梳理清楚。 仔细观察会发现,正则表达式的元素之间的组合关系只有4种。 | 普通拼接 | abc | |: :|: 阅读全文
摘要:
![](https://img2018.cnblogs.com/blog/962172/201812/962172-20181211175025696-1003187061.png)
![](https://img2018.cnblogs.com/blog/962172/201812/962172-20181211175045843-1109408711.png)
![](https://img2... 阅读全文