Linux - Shell - 字符串截取
-
概述
- 简述 字符串 截取
- 写的有点复杂了, 抽空 重构 一下
-
背景
- 之前因为要给文件 批量重命名, 做过字符串截取
- 当时做好了, 也说了要写点东西
- 结果忘了
- 现在又要尝试批量 重命名
- 才发现之前的东西已经忘了好多
- 要是当时把博客写下来, 该多好
-
准备
- os
- win10
- git
- 2.20.1
- os
-
约定
- 例子里有的例子会失败
- 当然这个是 预料到的
- 没有结论总结
- 太懒
- 从头看到尾, 也不需要太多时间
- 对了
- 所有的操作, 都不会改变源字符串内容
- 例子里有的例子会失败
1. 需求
-
概述
- 简单描述 需求
- 简单分类, 后面细说
- 简单描述 需求
-
截取字符串
- 按下标截取
- 按模式匹配
2. 按下标截取
-
概述
- 按下标截取
-
目的
- 尝试使用 下标, 来对 字符串进行操作
例子1: 尝试直接用 [] 方式获取
-
概述
- 尝试用 数组下标 的方式, 获取字符串内容
-
脚本
#!/bin/bash str="123456" echo ${str} echo ${str[0]}
-
结果
$ ./script01.sh 123456 123456
-
结论
- 无法通过 [] 来 正确获取 字符串 字串
- 这不是废话
- 无法通过 [] 来 正确获取 字符串 字串
例子2: 开始下标
-
概述
- 正式开始尝试
-
脚本
#!/bin/bash str="123456" echo ${str:0} echo ${str:1}
-
结果
$ ./script02.sh 123456 23456
-
结论
- 字符串的下标, 从 0 开始
- $
- 从 offset 开始
- 一直截取到字符串结束
-
疑问
-
字符串如果有问题, 会是什么情况呢
- 变量为空
- 返回空串, 也没有异常
- 变量为 空串
- 返回空串, 也没有异常
- 变量为空
-
下标异常
- 负数下标
- 常规负数
- -1, -2
- 结果
- 好像并不能 识别出来
- 感觉是 语法的问题
- 但是 书上 却没有写出来, 我感觉算是书上的错误
- 另一种表达
- 0-1, 0-2
- 结果
- 从 右边开始算下标
- 0-1 表示最后一位
- 0-2 表示倒数第二位
- $
- 截取字符串最后两位
- 从 右边开始算下标
- 常规负数
- 下标大于长度
- 返回空串, 也没有异常
- 负数下标
-
建议
- 变量
- 避免使用 空变量, 空串
- 下标
- 避免使用 异常下标
- 变量
-
我不想截取到结束, 怎么有办法吗?
- 当然有啦
-
例子3: 开始下标 和 指定长度
-
概述
- 尝试指定 开始下标 和 指定长度
-
脚本
#!/bin/bash echo group1 str="012345" echo ${str:0:1} echo ${str:1:1} echo ${str:1:2} echo ${str:0:6} echo ''
-
结果
group1 0 1 12 012345
-
结论
- $
- offset
- 开始下标
- length
- 字串长度
- 结果
- 从开始下标开始, 截取长度为 length 的字串
- offset
- $
-
疑问
- 我有办法知道字串多长呢?
- 定长的好说
- 变长的怎么办呢?
- 当然有啦
- 我有办法知道字串多长呢?
例子4: 字符串长度
-
概述
- 求 字符串长度 的方法
-
脚本
#!/bin/bash echo group2 echo ${#str} echo ${str:0:${#str}} echo ''
-
结果
group2 6 012345
-
结论
- $
- 可以求出 str 的长度
- 可以嵌套在 ${str:offset:length} 中
- $
其他: 问题
-
概述
- 其他的问题
-
问题
-
offset
- 负数
- 常规负数
- -1, -2
- 没有效果, 感觉是 语法不支持
- 0-1, 0-2
- 常规负数
- 大于长度
- 返回空串
- 负数
-
length
- 负数
- 结果不太正常, 不建议
- 大于长度
- 直接到字符串结尾
- 负数
-
空变量/空串
- 没有异常, 没有返回
-
-
疑问
- 我想要根据特定字符, 来做 截取, 有办法吗?
- 当然有啦
- 我想要根据特定字符, 来做 截取, 有办法吗?
3. 模式匹配与截取
-
概述
- 截取的另一种思路
-
目的
- 从根据 特定关键字截取
- 给定特定模式
- 删除符合模式的内容, 返回余下内容
- 从根据 特定关键字截取
-
问题
- 匹配方向
- 左边开始
- 右边开始
- 匹配策略
- 不贪婪
- 贪婪
- 匹配内容
- 模式, 通配符
- 匹配方向
例子1: 从头匹配
-
概述
- 从头开始匹配
-
脚本
#!/bin/bash str="abcdabcdabcd" echo group1 echo ${str} echo ${str#*bc} echo ${str##*bc}
-
结果
group1 abcdabcdabcd dabcdabcd d
-
结论
-
$
- 格式
- str 是需要截取的源字符串
- pattern 是 模式串
- 格式
-
关注点
- 匹配方向
#
是 从左往右
- 匹配策略
#
不贪婪- 最短模式串
##
贪婪- 最长模式串
- 模式
- 类似通配符
- ? 表示单个字符
*
表示多个字符- [] 可以有 字符集合
- 不是正则
- 不是正则
- 不是正则
- 类似通配符
- 匹配方向
-
-
疑问
- 是否可以从后往前匹配呢?
- 当然可以啦
- 是否可以从后往前匹配呢?
例子2: 从尾匹配
-
概述
- 从尾开始匹配
-
脚本
#!/bin/bash str="abcdabcdabcd" echo group1 echo ${str} echo ${str%bcd*} echo ${str%%bcd*}
-
结果
group1 abcdabcdabcd abcdabcda a
-
结论
-
$
- 格式
- str 是需要截取的源字符串
- pattern 是 模式串
- 格式
-
关注点
- 匹配方向
- % 是 从右往左
- 匹配策略
- % 不贪婪
- 最短模式串
- %% 贪婪
- 最长模式串
- % 不贪婪
- 模式
- 同 从左往右
- 匹配方向
-
其他
- 其他注意事项
-
如果没匹配到
- 那就没有结果
-
理解
- 可以借用 括号
-
假设我有 这么个串 "1 + ( 2 + ( 3 + 3 ) + 2 ) + 1"
- 删除左边, 通常用 *(
- 删除右边, 通常用 )*
-
边界
- 边界也会被删除
- 如果需要边界, 记得自己补上
-
- 可以借用 括号
-
ps
-
ref
- 学习 bash
-
疑问: 是否有从 shell 中获取特定字符的下标
-
需求
- 给定字符串 str
- 给定特定字符 s
- 获取获取 s 在 str 中的位置
-
寻找结果
- 貌似没有找到
-
其他
- 可以确定 str 里是否包含 s
- 可以根据 s 做截取
- 可以根据 s 做替换
- 这个后面讲
-
疑问
- 获取 s 在 str 里的下标, 目的到底是什么
- 截取
- 替换
- 根据下标位置, 精准划分, 从而确定行为?
- 获取 s 在 str 里的下标, 目的到底是什么
-
-
其他
- 这么点破事, 感觉写的 有点长 啊
尽量尝试解释清楚; 自己校对能力有限, 如果有错误欢迎指出