Python 字符串

Python 字符串

字符串基本特点#

很多人初学编程时,总是担心自己数学不行,潜意识里认为数学好才能编程。实际上,大多数程序员打交道最多的是“字符串”而不是“数字”。因为,编程是用来解决现实问题的,因此逻辑思维的重要性远远超过数学能力。

字符串的本质是:字符序列。Python 的字符串是不可变的,我们无法对原字符串做任何修改。但,可以将字符串的一部分复制到新创建的字符串,达到“看起来修改”的效果。

Python 不支持单字符类型,单字符也是作为一个字符串使用的。

字符串的编码#

Python3 直接支持 Unicode,可以表示世界上任何书面语言的字符Python3 的字符默认就是 16 位 Unicode 编码,ASCII 码是 Unicode 编码的子集。

使用内置函数 ord()可以把字符转换成对应的 Unicode 码;

使用内置函数 chr()可以把十进制数字转换成对应的字符

>>> ord('A')
65
>>> ord('高')
39640
>>> chr(66)
'B' >>> ord('淇')
28103

引号创建字符串#

我们可以通过单引号或双引号创建字符串。例如:a=’abc’; b=”sxt”

使用两种引号的好处是可以创建本身就包含引号的字符串,而不用使用转义字符。例如:

>>> a = "I'm a teacher!" 
>>> print(a)
I'm a teacher!
>>> b = 'my_name is "TOM"' 
>>> print(b)

my_name is "TOM" 连续三个单引号或三个双引号,可以帮助我们创建多行字符串。例如:

>>> resume = ''' name="gaoqi" company="sxt" age=18
lover="Tom"''' 
>>> print(resume)
name="gaoqi" company="sxt" age=18
lover="Tom"

空字符串和 len()函数#

Python 允许空字符串的存在,不包含任何字符且长度为 0。例如:

>>> c = '' >>> len(c)
0

len()用于计算字符串含有多少字符。例如:

>>> d = 'abc 尚学堂' >>> len(d)
6

转义字符#

我们可以使用“\+特殊字符”,实现某些难以用字符表示的效果。比如:换行等。常见的转义字符有这些:

转义字符 描述
\(在行尾时) 续行符
\\ 反斜杠符号
' 单引号
" 双引号
\b 退格(Backspace)
\n 换行
\t 横向制表符
\r 回车

字符串拼接#

  1. 可以使用+将多个字符串拼接起来。例如:’aa’+ ’bb’ ==>’aabb’。

    (1) 如果+两边都是字符串,则拼接。

    (2) 如果+两边都是数字,则加法运算。

    (3) 如果+两边类型不同,则抛出异常。

  2. 可以将多个字面字符串直接放到一起实现拼接。例如’aa’’bb’==>’aabb

不换行打印#

我们前面调用 print 时,会自动打印一个换行符。有时,我们不想换行,不想自动添加换行符。我们可以自己通过参数 end = “任意字符串”。实现末尾添加任何内容:

print("sxt",end=' ')
print("sxt",end='##')
print("sxt")
结果 sxt sxt##sxt

input#

我们可以使用 input()从控制台读取键盘输入的内容。

>>> myname = input("请输入名字:")
请输入名字:高淇
>>> myname
'高淇'

str()实现数字转型字符串#

str()可以帮助我们将其他数据类型转换为字符串。例如:

str(5.20) > ‘5.20’ str(3.14e2)>’314.0’ str(True) ==> ‘True’

当我们调用 print()函数时,解释器自动调用了 str()将非字符串的对象转成了字符串。

使用[]提取字符#

字符串的本质就是字符序列,我们可以通过在字符串后面添加[],在[]里面指定偏移量,可以提取该位置的单个字符。

正向搜索:

最左侧第一个字符,偏移量是 0,第二个偏移量是 1,以此类推。直到 len(str)-1为止。
反向搜索:
最右侧第一个字符,偏移量是-1,倒数第二个偏移量是-2,以此类推,直到-len(str)为止。
【操作】使用[]提取字符串中的字符

>>> a = 'abcdefghijklmnopqrstuvwxyz' 
>>> a
'abcdefghijklmnopqrstuvwxyz' 
>>> a[0]
'a' 
>>> a[3]
'd' 
>>> a[26-1]
'z' 
>>> a[-1]
'z' 
>>> a[-26]
'a' 
>>> a[-30]
Traceback (most recent call last):
  File "<pyshell#91>", line 1, in <module>
    a[-30]
IndexError: string index out of range

replace()实现字符串替换#

字符串是“不可改变”的,我们通过[]可以获取字符串指定位置的字符,但是我们不能改变字符串。我们尝试改变字符串中某个字符,发现报错了:

>>> a = 'abcdefghijklmnopqrstuvwxyz' 
>>> a
'abcdefghijklmnopqrstuvwxyz' 
>>> a[3]='高'
Traceback (most recent call last):
  File "<pyshell#94>", line 1, in <module>
    a[3]='高' 
TypeError: 'str' object does not support item assignment

字符串不可改变。但是,我们确实有时候需要替换某些字符。这时,只能通过创建新的字符串来实现。

>>> a = 'abcdefghijklmnopqrstuvwxyz' 
>>> a
'abcdefghijklmnopqrstuvwxyz' 
>>> a = a.replace('c','高')
'ab 高 defghijklmnopqrstuvwxyz' 

整个过程中,实际上我们是创建了新的字符串对象,并指向了变量 a,而不是修改了以前的字符串。 内存图如下:

字符串切片 slice 操作#

切片 slice 操作可以让我们快速的提取子字符串。标准格式为:
[起始偏移量 start:终止偏移量 end:步长 step]

典型操作(三个量为正数的情况)如下:

操作和说明 示例 结果
[:] 提取整个字符串 “abcdef”[:] “abcdef”
[start:]从 start 索引开始到结尾 “abcdef”[2:] “cdef”
[:end]从头开始知道 end-1 “abcdef”[:2] “ab”
[start:end]从 start 到 end-1 “abcdef”[2:4] “cd”
[start🔚step]从 start 提取到
end-1,步长是 step
“abcdef”[1:5:2] “bd”

其他操作(三个量为负数)的情况:

示例 说明 结果
"abcdefghijklmnopqrstuvwxyz"[-3:] 倒数三个 “xyz”
"abcdefghijklmnopqrstuvwxyz"[-8:-3] 倒数第八个到倒数第三个(包头不包尾) 'stuvw'
"abcdefghijklmnopqrstuvwxyz"[::-1] 步长为负,从右到左反向提取 'zyxwvutsrqponmlkjihgfedcba'

split()分割和 join()合并#

split()可以基于指定分隔符将字符串分隔成多个子字符串(存储到列表中)。如果不指定分隔符,则默认使用空白字符(换行符/空格/制表符)。示例代码如下:

>>> a = "to be or not to be" 
>>> a.split()
['to', 'be', 'or', 'not', 'to', 'be']
>>> a.split('be')
['to ', ' or not to ', '']

join()的作用和 split()作用刚好相反,用于将一系列子字符串连接起来。示例代码如下:

>>> a = ['sxt','sxt100','sxt200']
>>> '*'.join(a)
'sxt*sxt100*sxt200

字符串比较和同一性#

我们可以直接使用==,!=对字符串进行比较,是否含有相同的字符。

我们使用 is / not is,判断两个对象是否同一个对象。比较的是对象的地址,即 id(obj1)是否和 id(obj2)相等。

成员操作符#

in /not in 关键字,判断某个字符(子字符串)是否存在于字符串中。

字符串常用方法汇总#

字符串有很多常用的方法,我们需要熟悉。我们通过表格将这些方法汇总起来,方便大家查
阅。希望大家针对每个方法都做一次测试。

常用查找方法#

我们以一段文本作为测试:

a='''我是高淇,今年 18 岁了,我在北京尚学堂科技上班。我的儿子叫高洛希,他 6 岁了。我是一个编程教育的普及者,希望影响 6000 万学习编程的中国人。我儿子现在也开始学习编程,希望他 18 岁的时候可以超过我'''

方法和使用示例 说明 结果
len(a) 字符串长度 96
a.startswith('我是高淇') 以指定字符串开头 True
a.endswith('过我') 以指定字符串结尾 True
a.find('高') 第一次出现指定字符串的位置 2
a.rfind('高') 最后一次出现指定字符串的位置 29
a.count("编程") 指定字符串出现了几次 3
a.isalnum() 所有字符全是字母或数字 Fals

去除首尾信息#

我们可以通过 strip()去除字符串首尾指定信息。通过 lstrip()去除字符串左边指定信息,rstrip()去除字符串右边指定信息。

【操作】去除字符串首尾信息

>>> "*s*x*t*".strip("*")
's*x*t' >>> "*s*x*t*".lstrip("*")
's*x*t*' >>> "*s*x*t*".rstrip("*")
'*s*x*t' >>> " sxt ".strip()
'sxt'

大小写转换#

a = "gaoqi love programming, love SXT"

示例 说明 结果
a.capitalize() 产生新的字符串,首字母大写 'Gaoqi love programming, love sxt'
a.title() 产生新的字符串,每个单词都首字母大写 'Gaoqi Love Programming, Love Sxt'
a.upper() 产生新的字符串,所有字符全转成大写 'GAOQI LOVE PROGRAMMING, LOVE SXT'
a.lower() 产生新的字符串,所有字符全转成小写 'gaoqi love programming, love sxt'
a.swapcase() 产生新的,所有字母大小写转换 'GAOQI LOVE PROGRAMMING, LOVEsxt'

格式排版#

center()、ljust()、rjust()这三个函数用于对字符串实现排版。示例如下:

>>> a="SXT" 
>>> a.center(10,"*")
'***SXT****' 
>>> a.center(10)
' SXT ' 
>>> a.ljust(10,"*")
'SXT*******'

其他方法#

  1. isalnum() 是否为字母或数字
  2. isalpha() 检测字符串是否只由字母组成(含汉字)。
  3. isdigit() 检测字符串是否只由数字组成。
  4. isspace() 检测是否为空白符
  5. isupper() 是否为大写字母
  6. islower() 是否为小写字母

字符串的格式化#

format()基本用法#

Python2.6 开始,新增了一种格式化字符串的函数 str.format(),它增强了字符串格式化的功能。

基本语法是通过 {} 和 : 来代替以前的 % 。

format 函数可以接受不限个参数,位置可以不按顺序。

>>> a = "名字是:{0},年龄是:{1}" 
>>> a.format("高淇",18)
'名字是:高淇,年龄是:18' 
>>> a.format("高希希",6)
'名字是:高希希,年龄是:6' 
>>> b = "名字是:{0},年龄是{1}。{0}是个好小伙" 
>>> b.format("高淇",18)
'名字是:高淇,年龄是 18。高淇是个好小伙' 
>>> c = "名字是{name},年龄是{age}" 
>>> c.format(age=19,name='高淇')
'名字是高淇,年龄是 19'

我们可以通过{索引}/{参数名},直接映射参数值,实现对字符串的格式化,非常方便。

填充与对齐#

填充常跟对齐一起使用

^、<、>分别是居中、左对齐、右对齐,后面带宽度

:号后面带填充的字符,只能是一个字符,不指定的话默认是用空格填充

>>> "{:*>8}".format("245")
'*****245' 
>>> "我是{0},我喜欢数字{1:*^8}".format("高淇","666")
'我是高淇,我喜欢数字**666***'

数字格式化#

浮点数通过 f,整数通过 d 进行需要的格式化。案例如下:

>>> a = "我是{0},我的存款有{1:.2f}" 
>>> a.format("高淇",3888.234342)
'我是高淇,我的存款有 3888.23'
数字 格式 输出 描述
3.1415926 3.14 保留小数点后两位
3.1415926 3.14 带符号保留小数点后两位
2.71828 3 不带小数
5 05 数字补零 (填充左边, 宽度为 2)
5 5xxx 数字补 x (填充右边, 宽度为 4)
10 10xx 数字补 x (填充右边, 宽度为 4)
1000000 1,000,000 以逗号分隔的数字格式
0.25 25.00% 百分比格式
1000000000 1.00E+09 指数记法
13 13 右对齐 (默认, 宽度为 10)
13 13 左对齐 (宽度为 10)
13 13 中间对齐 (宽度为 10)

可变字符串#

在 Python 中,字符串属于不可变对象,不支持原地修改,如果需要修改其中的值,智能创建新的字符串对象。但是,经常我们确实需要原地修改字符串,可以使用 io.StringIO对象或 array 模块

>>> import io
>>> s = "hello, sxt" 
>>> sio = io.StringIO(s)
>>> sio
<_io.StringIO object at 0x02F462B0>
>>> sio.getvalue()
'hello, sxt' 
>>> sio.seek(7)
7
>>> sio.write("g")
1
>>> sio.getvalue()
'hello, gxt'

作者:Hovey

出处:https://www.cnblogs.com/thankcat/p/16997416.html

版权:本作品采用「署名-非商业性使用-相同方式共享 4.0 国际」许可协议进行许可。

posted @   ThankCAT  阅读(43)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· AI与.NET技术实操系列(二):开始使用ML.NET
· 单线程的Redis速度为什么快?
more_horiz
keyboard_arrow_up dark_mode palette
选择主题
menu
点击右上角即可分享
微信分享提示