Python字符串
in 知识 on Python
Python转义字符
转义字符 | 描述 |
---|---|
\(在行尾时) | 续行符 |
\\ | 反斜杠符号 |
\' | 单引号 |
\" | 双引号 |
\a | 响铃 |
\b | 退格(Backspace) |
\e | 转义 |
\000 | 空 |
\n | 换行 |
\v | 纵向制表符 |
\t | 横向制表符 |
\r | 回车 |
\f | 换页 |
\oyy | 八进制数,yy代表的字符,例如:\o12代表换行 |
\xyy | 十六进制数,yy代表的字符,例如:\x0a代表换行 |
\other | 其它的字符以普通格式输出 |
var1 = 'Hello Wrld!'
print '更新字符串', var1[:6] + 'Runoob!'
var2 = '''\续行符 \\ 反斜杠符号 \' 当引号 \" 双引号 \a 响铃 \b 退格(Backspace)
\e 转义 \000 空 、\n 换行 \v 纵向制表符 \t 横向制表符 \r 回车 \f 换页 \012 八进制数
\x12 16进制数 \other 其他字符以普通形式输出
'''
print var2
Python 字符串运算符
操作符 | 描述 | 实例 |
---|---|---|
+ | 字符串连接 | a + b 输出结果: HelloPython |
* | 重复输出字符串 | a*2 输出结果:HelloHello |
[] | 通过索引获取字符串中字符 | a[1] 输出结果 e |
[ : ] | 截取字符串中的一部分 | a[1:4] 输出结果 ell |
in | 成员运算符 - 如果字符串中包含给定的字符返回 True | H in a 输出结果 1 |
not in | 成员运算符 - 如果字符串中不包含给定的字符返回 True | M not in a 输出结果 1 |
r/R | 原始字符串 - 原始字符串:所有的字符串都是直接按照字面的意思来使用,没有转义特殊或不能打印的字符。 原始字符串除在字符串的第一个引号前加上字母”r”(可以大小写)以外,与普通字符串有着几乎完全相同的语法。 | print r’\n’ 输出 \n 和 print R’\n’ 输出 \n |
% | 格式字符串 | 请看下一章节 |
a = 'hello'
b = 'Python'
print a + b # 字符串连接
print a*2 # 重复输出字符串
print a[2] # 通过索引获取字符串中字符
print a[1:4] # 截取字符串中的一部分
if 'o' in a: print 'a中存在字符o' # 成员运算符
if 'i' not in a: print 'a中不存在i' # 成员运算符
print r'\n' # 原始字符串 屏蔽所有特殊字符 输出\n
print 'a = %s b = %s' % (a, b) # 字符串格式化
Python字符串格式化
符 号 | 描述 |
---|---|
%c | 格式化字符及其ASCII码 |
%s | 格式化字符串 |
%d | 格式化整数 |
%u | 格式化无符号整型 |
%o | 格式化无符号八进制数 |
%x | 格式化无符号十六进制数 |
%X | 格式化无符号十六进制数(大写) |
%f | 格式化浮点数字,可指定小数点后的精度 |
%e | 用科学计数法格式化浮点数 |
%E | 作用同%e,用科学计数法格式化浮点数 |
%g | %f和%e的简写 |
%G | %f 和 %E 的简写 |
%p | 用十六进制数格式化变量的地址 |
符号 | 功能 |
---|---|
* | 定义宽度或者小数点精度 |
- | 用做左对齐 |
+ | 在正数前面显示加号( + ) |
<sp> | 在正数前面显示空格 |
# | 在八进制数前面显示零(‘0’),在十六进制前面显示’0x’或者’0X’(取决于用的是’x’还是’X’) |
0 | 显示的数字前面填充’0’而不是默认的空格 |
% | ’%%’输出一个单一的’%’ |
(var) | 映射变量(字典参数) |
m.n. | m 是显示的最小总宽度,n 是小数点后的位数(如果可用的话) |
Unicode字符串
Python中定义一个Unicode字符串和定义一个普通字符串一样简单
# Unicode字符串
a = u'Hello\u0020world' # \u0020为Unicode字符 表示空格
print a # 输出结果 Hello world1
字符串内建函数
方法 | 描述 |
---|---|
string.capitalize() | 把字符串的第一个字符大写 |
string.center(width) | 返回一个原字符串居中,并使用空格填充至长度 width 的新字符串 |
string.count(str, beg=0, end=len(string)) | 返回 str 在 string 里面出现的次数,如果 beg 或者 end 指定则返回指定范围内 str 出现的次数 |
string.decode(encoding=’UTF-8’, errors=’strict’) | 以 encoding 指定的编码格式解码 string,如果出错默认报一个 ValueError 的 异 常 , 除 非 errors 指 定 的 是 ‘ignore’ 或 者’replace’ |
string.encode(encoding=’UTF-8’, errors=’strict’) | 以 encoding 指定的编码格式编码 string,如果出错默认报一个ValueError 的异常,除非 errors 指定的是’ignore’或者’replace’ |
string.endswith(obj, beg=0, end=len(string)) | 检查字符串是否以 obj 结束,如果beg 或者 end 指定则检查指定的范围内是否以 obj 结束,如果是,返回 True,否则返回 False. |
string.expandtabs(tabsize=8) | 把字符串 string 中的 tab 符号转为空格,tab 符号默认的空格数是 8。 |
string.find(str, beg=0, end=len(string)) | 检测 str 是否包含在 string 中,如果 beg 和 end 指定范围,则检查是否包含在指定范围内,如果是返回开始的索引值,否则返回-1 |
string.index(str, beg=0, end=len(string)) | 跟find()方法一样,只不过如果str不在 string中会报一个异常. |
string.isalnum() | 如果 string 至少有一个字符并且所有字符都是字母或数字则返回 True,否则返回 False |
string.isalpha() | 如果 string 至少有一个字符并且所有字符都是字母则返回 True,否则返回 False |
string.isdecimal() | 如果 string 只包含十进制数字则返回 True 否则返回 False. |
string.isdigit() | 如果 string 只包含数字则返回 True 否则返回 False. |
string.islower() | 如果 string 中包含至少一个区分大小写的字符,并且所有这些(区分大小写的)字符都是小写,则返回 True,否则返回 False |
string.isnumeric() | 如果 string 中只包含数字字符,则返回 True,否则返回 False |
string.isspace() | 如果 string 中只包含空格,则返回 True,否则返回 False. |
string.istitle() | 如果 string 是标题化的(见 title())则返回 True,否则返回 False |
string.isupper() | 如果 string 中包含至少一个区分大小写的字符,并且所有这些(区分大小写的)字符都是大写,则返回 True,否则返回 False |
string.join(seq) | 以 string 作为分隔符,将 seq 中所有的元素(的字符串表示)合并为一个新的字符串 |
string.ljust(width) | 返回一个原字符串左对齐,并使用空格填充至长度 width 的新字符串 |
string.lower() | 转换 string 中所有大写字符为小写. |
string.lstrip() | 截掉 string 左边的空格 |
string.maketrans(intab, outtab]) | maketrans() 方法用于创建字符映射的转换表,对于接受两个参数的最简单的调用方式,第一个参数是字符串,表示需要转换的字符,第二个参数也是字符串表示转换的目标。 |
max(str) | 返回字符串 str 中最大的字母。 |
min(str) | 返回字符串 str 中最小的字母。 |
string.partition(str) | 有点像 find()和 split()的结合体,从 str 出现的第一个位置起,把 字 符 串 string 分 成 一 个 3 元 素 的 元 组 (string_pre_str,str,string_post_str),如果 string 中不包含str 则 string_pre_str == string. |
string.replace(str1, str2, num=string.count(str1)) | 把 string 中的 str1 替换成 str2,如果 num 指定,则替换不超过 num 次. |
string.rfind(str, beg=0,end=len(string) ) | 类似于 find()函数,不过是从右边开始查找. |
string.rindex( str, beg=0,end=len(string)) | 类似于 index(),不过是从右边开始. |
string.rjust(width) | 返回一个原字符串右对齐,并使用空格填充至长度 width 的新字符串 |
string.rpartition(str) | 类似于 partition()函数,不过是从右边开始查找. |
string.rstrip() | 删除 string 字符串末尾的空格. |
string.split(str=””, num=string.count(str)) | 以 str 为分隔符切片 string,如果 num有指定值,则仅分隔 num 个子字符串 |
string.splitlines(num=string.count(‘\n’)) | 按照行分隔,返回一个包含各行作为元素的列表,如果 num 指定则仅切片 num 个行. |
string.startswith(obj, beg=0,end=len(string)) | 检查字符串是否是以 obj 开头,是则返回 True,否则返回 False。如果beg 和 end 指定值,则在指定范围内检查. |
string.strip([obj]) | 在 string 上执行 lstrip()和 rstrip() |
string.swapcase() | 翻转 string 中的大小写 |
string.title() | 返回”标题化”的 string,就是说所有单词都是以大写开始,其余字母均为小写(见 istitle()) |
string.translate(str, del=””) | 根据 str 给出的表(包含 256 个字符)转换 string 的字符,要过滤掉的字符放到 del 参数中 |
string.upper() | 转换 string 中的小写字母为大写 |
string.zfill(width) | 返回长度为 width 的字符串,原字符串 string 右对齐,前面填充0 |
string.isdecimal() | isdecimal()方法检查字符串是否只包含十进制字符。这种方法只存在于unicode对象。 |
#!/usr/bin/python
# -*- coding: UTF-8 -*-
from string import maketrans # 必须调用 maketrans 函数
a = u' afad fa'
print a.capitalize() # 把字符串的第一个字符大写
print a.center(20) # 将字符串扩充到字符数为20,并且字符串居中,没有字符的地方直接用空格填充
print a.count('a', 0, len(a)) # 返回'a'在a中出现的次数,如果后面指定了范围则返回指定范围内'a'出现的次数
print a.decode(encoding='UTF-8', errors='strict') # 以encoding指定的编码格式解码string,如果出现错误默认报一个ValueError的异常,除非errors指定的是'ignore'或'replace'
print a.encode(encoding='UTF-8', errors='strict') # 以encoding指定的编码方式编码string,如果出现错误默认报一个ValueError的异常,除非errors指定的是'ignore'或者'replace'
print a.endswith('f', 0, len(a)) # 异常 检查字符串是否已f结束,如果beg或者end指定则检查指定的范围内是否已f结束,如果是,返回True,否则返回False.
print a.expandtabs(8) # 异常 把字符串a中的tab符号转为空格,tab符号默认的空格数是8
print '%d' % a.find('f', 0, len(a)) # 检测a是否包含在string中,如果beg和end指定范围,则检查是否包含在指定范围内,如果是返回索引值,否则返回-1
print a.index('a', 0, len(a)) # 和find()一样,只不过如果'a'不在a中会报一个异常
print a.isalnum() # 如果a至少有一个字符并且所有字符都是字母或数字则返回True,否则返回False
print a.isalpha() # 如果a至少有一个字符并且所有字符都是字母则返回True,否则返回False
print a.isdecimal() # 如果a只包含十进制数字则返回True否则返回False 针对unicode字符串
print a.isdigit() # 如果string只包含数字则返回True否则返回False
print a.islower() # 如果string中包含至少一个区分大小写的字符,并且所有这些(区分大小写的)字符都是小写,则返回true,否则返回False
print a.isnumeric() # 如果string中只包含数字字符,则返回True,否则返回False
print a.isspace() # 如果string中只包含空格,则返回True,否则返回False
print a.istitle() # 如果string是标题化的返回true,否则返回False
print a.isupper() # 如果string中包含至少一个区分大小写的的字符,并且所有这些(区分大小写)字符都是大写,则返回True,否则返回False
b = ''
seq = ['a', 'b', 'c', 'd']
print b.join(seq) # 以b作为分隔符,将seq中所有的元素(的字符串表示)合并为一个新的字符串
print a.ljust(20) # 返回一个元字符串左对齐,并使用空格填充至长度width的新字符串
print a.lower() # 转换a中所以的大写字符为小写
c = ' 98999asfafafafadf'
print c.lstrip() # 截掉string左边的空格
print c.lstrip('9') # 截掉左边连续的9
'''
maketrans()方法用于创建字符映射的转换表,对于接受两个参数的最简单的调用方式,第一个参数是字符串
表示需要转换的字符,第二个参数也是字符串表示转换的目标
'''
# maketrans
intab = 'aeiou'
outtab = '12345'
trantab = maketrans(intab, outtab) # 将intab中的字符与outtab中的字符调换位置 a换成1 e换成2 i换成3 o换成4 u换成5
str = 'this is string example.....wow!!'
print str.translate(trantab)
# 输出结果 th3s 3s str3ng 2x1mpl2.....w4w!!
print max(a) # 返回字符串a中最大的字母
print min(a) # 返回字符串a中最小的字母
# partition() 分隔方法
'''
partition()方法用来根据指定的分隔符将字符串进行分隔
如果字符串包含指定的分隔符,则返回一个3元的元组,第一个为分隔符左边的子串,第二个为分隔符本身,
第三个为分隔符右边的字串。
'''
strOne = 'http://www.baidu.com/'
print strOne.partition('://') # 返回的是一个元组
# replace方法
'''
str.replace(old, new, max)
old 将会被代替的字符串
new 新字符串,用于替换old子字符串
max 可选字符串,替换不超过max次
'''
strTwo = 'this is string example'
print strTwo.replace('is', 'was') # 将is替换成was
print strTwo.replace('is', 'was', 3) # 将is替换成was,最多不能替换3次
# rfind() 从右边开始查找
print len(a)
print a
print a.rfind('a', 0, len(a)) # 返回9,从右向左数,最后一个的位置为9
# str.rindex(str, beg=0, end=len(string)) 从右边开始排查 返回字符串str在字符串中最后出现的位置,如果没有匹配的字符串,则返回异常
str1 = 'this is string example'
str2 = 'is'
print str1.rindex(str2, 0, len(str1))
print a.rjust(20) # 返回一个愿字符串右对齐,并使用空格填充至长度width长度的字符串
print a.rstrip() # 删除a字符串末尾的空格
# str.split(str='', num=string.count(str)) str分隔符默认为空格 num分隔次数 返回分隔后的字符串列表
str3 = 'a b c d e f g h i j'
print str3.split() # 返回结果 ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j']
print str3.split(' ', 1) # 返回结果 ['a', 'b c d e f g h i j']
# str.splitlines(num=string.count('\n')) 根据\n来返回各个行组成的列表
str4 = 'line1\nline2\nline3\nline4'
print str4.splitlines() # ['line1', 'line2', 'line3', 'line4']
print str4.splitlines(0) # ['line1', 'line2', 'line3', 'line4']
print str4.splitlines(2) # ['line1\n', 'line2\n', 'line3\n', 'line4']
print str4.splitlines(3) # ['line1\n', 'line2\n', 'line3\n', 'line4']
'''
str.startswith(str, beg=0, end=len(string)) 用于检测字符串是否以指定字符串开头,
如果是则返回True,否则返回False,如果beg和end指定值,则在指定范围内检测
'''
str5 = 'this is string exmple!!'
print str5.startswith('this')
print str5.startswith('is', 2, 4)
print str5.startswith('this', 2, 4)
# .strip() 移除字符串头尾部的指定的字符串
str6 = ' afafa '
print str6.strip() # 移除两边的空格
print str6.swapcase() # 翻转string中字母大小写
# .title() 返回以大写字母开头的'标题话'的字符串
print str5.title() # 返回 This Is String Exmple!!
# .translate() 不仅有替换的功能,还有过滤字符的功能
intab = 'aeiou'
outtab = '12345'
trantab = maketrans(intab, outtab)
str7 = 'this is string example...wow!!!'
print str7.translate(trantab) # 返回 th3s 3s str3ng 2x1mpl2...w4w!!!
print str7.translate(trantab, 'xm') # 返回 th3s 3s str3ng 21pl2...w4w!!! 过滤掉了xm字符
# .upper() 转换string中的小写字母为大写
print str7.upper() # 返回 THIS IS STRING EXAMPLE...WOW!!!
# .zfill(width) 返回长度为width的字符串,原字符串string右对齐,前面填充0
print str7.zfill(40) # 返回 000000000this is string example...wow!!!
# .isdecimal() 检查字符串是否只包含十进制字符。这种方法值存在于unicode中 如果只包含十进制字符返回True,否则返回False
a = u'12345'
print a.isdecimal() # True
a = u'this12345'
print a.isdecimal() # False