目录
Python字符串类型str
Python字符串类型str的理解
什么是字符?
单个符号元素。英文字母是字符(单个字母),汉字是字符(单个汉字),数字是字符(单个数字),符号是字符(单个)。
什么是字符串?
由0个或1个或多个字符拼接起来的一串内容,并且由引号包围起来的就是字符串。
在 Python 中处理文本数据是使用str 对象,也称为字符串。 字符串是由 Unicode 码位构成的不可变序列。 字符串字面值有多种不同的写法:
- 单引号:
'允许包含有 "双" 引号'
- 双引号:
"允许包含有 '单' 引号"
。 - 三重引号:
'''三重单引号'''
,"""三重双引号"""
使用三重引号的字符串可以跨越多行 —— 其中所有的空白字符都将包含在该字符串字面值中。
Python中字符串相当于字符数组(字符元组),变长度,不可变类型(不可修改)。
Python中没有字符类型,只有字符串类型,字符串长度为1时的内容相当于一个字符。
str1="" # 空字符串
str2="1" # 由单个数字构成的字符串
str3="123" # 由多个数字构成的字符串
str4="a" # 由单个字母构成的字符串
str5="ab c" # 由多个字母和空格构成的字符串
str6="abc123" # 由多个字母和数字构成的字符串
str7="[1,2,3]" # 这个字符串里的内容与列表list格式相同
print(type(str1),str1)
print(type(str2),str2)
print(type(str3),str3)
print(type(str4),str4)
print(type(str5),str5)
print(type(str6),str6)
print(type(str7),str7)
运行结果
C:UsershccmaAnaconda3python.exe E:/wkp01/p00/test01/py001/t09.py
<class 'str'>
<class 'str'> 1
<class 'str'> 123
<class 'str'> a
<class 'str'> ab c
<class 'str'> abc123
<class 'str'> [1,2,3]
Process finished with exit code 0
字符串切片
因为Python中字符串相当于字符数组(字符元组),所以可以使用索引切片操作。
mystr="hello world"
print(len(mystr)) # 11
print(mystr[0:3]) # hel
print(mystr[3:]) # lo world
字符串str的拼接
Python字符串的拼接主要用加号"+"。当然,用字符串格式化(后面讲)方法也可以。join函数也可以拼接(在后面数据类型转换篇讲)。
str1="hello"
str2="world"
age=18
# 字符串与字符串拼接
str_join1=str1+str2
print(str_join1)
# 字符串与数字串拼接,需要把数字转换成字符串再拼接
str_join2=str1+str(age)
print(str_join2)
运行结果。
C:UsershccmaAnaconda3python.exe E:/wkp01/p00/test01/py001/t09.py
helloworld
hello18
Process finished with exit code 0
Python字符串格式化
Python字符串的格式化方法分为两种,分别为占位符(%)和format方式。
python字符串格式化符号:
符 号 | 描述 |
---|---|
%c | 格式化字符及其ASCII码 |
%s | 格式化字符串 |
%d | 格式化整数 |
%u | 格式化无符号整型 |
%o | 格式化无符号八进制数 |
%x | 格式化无符号十六进制数 |
%X | 格式化无符号十六进制数(大写) |
%f | 格式化浮点数字,可指定小数点后的精度 |
%e | 用科学计数法格式化浮点数 |
%E | 作用同%e,用科学计数法格式化浮点数 |
%g | %f和%e的简写 |
%G | %f 和 %E 的简写 |
%p | 用十六进制数格式化变量的地址 |
格式化操作符辅助指令:
符号 | 功能 |
---|---|
* | 定义宽度或者小数点精度 |
- | 用做左对齐 |
+ | 在正数前面显示加号( + ) |
在正数前面显示空格 | |
# | 在八进制数前面显示零('0'),在十六进制前面显示'0x'或者'0X'(取决于用的是'x'还是'X') |
0 | 显示的数字前面填充'0'而不是默认的空格 |
% | '%%'输出一个单一的'%' |
(var) | 映射变量(字典参数) |
m.n. | m 是显示的最小总宽度,n 是小数点后的位数(如果可用的话) |
占位符(%)示例
age=18
name="张三"
print("my name is %s 年龄是%d" %(name,age))
运行结果
C:UsershccmaAnaconda3python.exe E:/wkp01/p00/test01/py001/t09.py
my name is 张三 年龄是18
Process finished with exit code 0
Python2.6 开始,新增了一种格式化字符串的函数 str.format(),它增强了字符串格式化的功能。
基本语法是通过 {} 和 : 来代替以前的 % 。
format 函数可以接受不限个参数,位置可以不按顺序。
mylist=["张三",18]
person={
"name":"张三",
"age":18
}
str1="{} {}".format("hello", mylist[0]) # 不设置指定位置,按默认顺序
str2="{0} {1}".format("hello", person["age"]) # 设置指定位置
str3="{1} {0} {1}".format("hello", "world") # 设置指定位置
str4="姓名:{name}, 年龄 {age}".format(name="张三", age=18) # 设置参数
str5="姓名:{name}, 年龄 {age}".format(**person) # 通过字典设置参数
str6="姓名:{0[0]}, 年龄 {0[1]}".format(mylist) # 通过列表设置参数
print(str1)
print(str2)
print(str3)
print(str4)
print(str5)
print(str6)
运行结果
C:UsershccmaAnaconda3python.exe E:/wkp01/p00/test01/py001/t09.py
hello 张三
hello 18
world hello world
姓名:张三, 年龄 18
姓名:张三, 年龄 18
姓名:张三, 年龄 18
Process finished with exit code 0
数字格式化有多种控制参数。
数字 | 格式 | 输出 | 描述 |
---|---|---|---|
3.1415926 | {:.2f} | 3.14 | 保留小数点后两位 |
3.1415926 | {:+.2f} | +3.14 | 带符号保留小数点后两位 |
-1 | {:+.2f} | -1.00 | 带符号保留小数点后两位 |
2.71828 | {:.0f} | 3 | 不带小数 |
5 | {:0>2d} | 05 | 数字补零 (填充左边, 宽度为2) |
5 | {:x<4d} | 5xxx | 数字补x (填充右边, 宽度为4) |
10 | {:x<4d} | 10xx | 数字补x (填充右边, 宽度为4) |
1000000 | {:,} | 1,000,000 | 以逗号分隔的数字格式 |
0.25 | {:.2%} | 25.00% | 百分比格式 |
1000000000 | {:.2e} | 1.00e+09 | 指数记法 |
13 | {:>10d} | 13 | 右对齐 (默认, 宽度为10) |
13 | {:<10d} | 13 | 左对齐 (宽度为10) |
13 | {:^10d} | 13 | 中间对齐 (宽度为10) |
^, <, > 分别是居中、左对齐、右对齐,后面带宽度, : 号后面带填充的字符,只能是一个字符,不指定则默认是用空格填充。
+ 表示在正数前显示 +,负数前显示 -; (空格)表示在正数前加空格
另外,b、d、o、x 分别是二进制、十进制、八进制、十六进制。
格式 | 结果 |
---|---|
'{:b}'.format(11) | 1011 |
'{:d}'.format(11) | 11 |
'{:o}'.format(11) | 13 |
'{:x}'.format(11) | b |
'{:#x}'.format(11) | 0xb |
'{:#X}'.format(11) | 0XB |
转义字符
在需要在字符中使用特殊字符时,python 用反斜杠 转义字符。如下表:
转义字符 | 描述 |
---|---|
(在行尾时) | 续行符 |
反斜杠符号 | |
' | 单引号 |
" | 双引号 |
a | 响铃 |
b | 退格(Backspace) |
00 | 空 |
n | 换行 |
v | 纵向制表符 |
t | 横向制表符 |
r | 回车,将 r 后面的内容移到字符串开头,并逐一替换开头部分的字符,直至将 r 后面的内容完全替换完成。 |
f | 换页 |
yyy | 八进制数,y 代表 0~7 的字符,例如:12 代表换行。 |
xyy | 十六进制数,以 x 开头,y 代表的字符,例如:x0a 代表换行 |
other | 其它的字符以普通格式输出 |
字符串str的编码
字符串str的编码表就是数字转文字的翻译表。
机器中只有二进制,没有文字(字符),也没有十进制、十六进制。
二进制与十进制和十六进制之间可以相互转换。也就是说知道了二进制就明确了十进制和十六进制。
但是,二进制与字符之间没有固定转换关系。它们之间可以人为规定一种转换关系(翻译表,编码)。常见的编码有ascii、utf-8、unicode和gbk。
官网帮助文档中有全面介绍。
https://docs.python.org/zh-cn/3/library/codecs.html
关于字符串的编码转换可以参考后面字节串bytes中内容。
字符串str的方法
参考菜鸟Python网(https://www.runoob.com/python3/python3-string.html)。
序号 | 方法及描述 |
---|---|
1 | capitalize() 将字符串的第一个字符转换为大写 |
2 | center(width, fillchar) 返回一个指定的宽度 width 居中的字符串,fillchar 为填充的字符,默认为空格。 |
3 | count(str, beg= 0,end=len(string)) 返回 str 在 string 里面出现的次数,如果 beg 或者 end 指定则返回指定范围内 str 出现的次数 |
4 | bytes.decode(encoding="utf-8", errors="strict") Python3 中没有 decode 方法,但我们可以使用 bytes 对象的 decode() 方法来解码给定的 bytes 对象,这个 bytes 对象可以由 str.encode() 来编码返回。 |
5 | encode(encoding='UTF-8',errors='strict') 以 encoding 指定的编码格式编码字符串,如果出错默认报一个ValueError 的异常,除非 errors 指定的是'ignore'或者'replace' |
6 | endswith(suffix, beg=0, end=len(string)) 检查字符串是否以 obj 结束,如果beg 或者 end 指定则检查指定的范围内是否以 obj 结束,如果是,返回 True,否则返回 False. |
7 | expandtabs(tabsize=8) 把字符串 string 中的 tab 符号转为空格,tab 符号默认的空格数是 8 。 |
8 | find(str, beg=0, end=len(string)) 检测 str 是否包含在字符串中,如果指定范围 beg 和 end ,则检查是否包含在指定范围内,如果包含返回开始的索引值,否则返回-1 |
9 | index(str, beg=0, end=len(string)) 跟find()方法一样,只不过如果str不在字符串中会报一个异常。 |
10 | isalnum() 如果字符串至少有一个字符并且所有字符都是字母或数字则返 回 True,否则返回 False |
11 | isalpha() 如果字符串至少有一个字符并且所有字符都是字母或中文字则返回 True, 否则返回 False |
12 | isdigit() 如果字符串只包含数字则返回 True 否则返回 False.. |
13 | islower() 如果字符串中包含至少一个区分大小写的字符,并且所有这些(区分大小写的)字符都是小写,则返回 True,否则返回 False |
14 | isnumeric() 如果字符串中只包含数字字符,则返回 True,否则返回 False |
15 | isspace() 如果字符串中只包含空白,则返回 True,否则返回 False. |
16 | istitle() 如果字符串是标题化的(见 title())则返回 True,否则返回 False |
17 | isupper() 如果字符串中包含至少一个区分大小写的字符,并且所有这些(区分大小写的)字符都是大写,则返回 True,否则返回 False |
18 | join(seq) 以指定字符串作为分隔符,将 seq 中所有的元素(的字符串表示)合并为一个新的字符串 |
19 | len(string) 返回字符串长度 |
20 | ljust(width[, fillchar]) 返回一个原字符串左对齐,并使用 fillchar 填充至长度 width 的新字符串,fillchar 默认为空格。 |
21 | lower() 转换字符串中所有大写字符为小写. |
22 | lstrip() 截掉字符串左边的空格或指定字符。 |
23 | maketrans() 创建字符映射的转换表,对于接受两个参数的最简单的调用方式,第一个参数是字符串,表示需要转换的字符,第二个参数也是字符串表示转换的目标。 |
24 | max(str) 返回字符串 str 中最大的字母。 |
25 | min(str) 返回字符串 str 中最小的字母。 |
26 | replace(old, new [, max]) 把 将字符串中的 old 替换成 new,如果 max 指定,则替换不超过 max 次。 |
27 | rfind(str, beg=0,end=len(string)) 类似于 find()函数,不过是从右边开始查找. |
28 | rindex( str, beg=0, end=len(string)) 类似于 index(),不过是从右边开始. |
29 | rjust(width,[, fillchar]) 返回一个原字符串右对齐,并使用fillchar(默认空格)填充至长度 width 的新字符串 |
30 | rstrip() 删除字符串字符串末尾的空格. |
31 | split(str="", num=string.count(str)) 以 str 为分隔符截取字符串,如果 num 有指定值,则仅截取 num+1 个子字符串 |
32 | splitlines([keepends]) 按照行('r', 'rn', n')分隔,返回一个包含各行作为元素的列表,如果参数 keepends 为 False,不包含换行符,如果为 True,则保留换行符。 |
33 | startswith(substr, beg=0,end=len(string)) 检查字符串是否是以指定子字符串 substr 开头,是则返回 True,否则返回 False。如果beg 和 end 指定值,则在指定范围内检查。 |
34 | strip([chars]) 在字符串上执行 lstrip()和 rstrip() |
35 | swapcase() 将字符串中大写转换为小写,小写转换为大写 |
36 | title() 返回"标题化"的字符串,就是说所有单词都是以大写开始,其余字母均为小写(见 istitle()) |
37 | translate(table, deletechars="") 根据 str 给出的表(包含 256 个字符)转换 string 的字符, 要过滤掉的字符放到 deletechars 参数中 |
38 | upper() 转换字符串中的小写字母为大写 |
39 | zfill (width) 返回长度为 width 的字符串,原字符串右对齐,前面填充0 |
40 | isdecimal() 检查字符串是否只包含十进制字符,如果是返回 true,否则返回 false。 |