字符串(4)

最后更新于:2022-04-01 11:34:19

字符串的内容的确不少,甚至都有点啰嗦了。但是,本节依然还要继续,就是因为在编程实践中,经常会遇到有关字符串的问题,而且也是很多初学者容易迷茫的。 ## [](https://github.com/qiwsir/StarterLearningPython/blob/master/109.md#字符串格式化输出)字符串格式化输出 什么是格式化?在维基百科中有专门的词条,这么说的: > 格式化是指对磁盘或磁盘中的分区(partition)进行初始化的一种操作,这种操作通常会导致现有的磁盘或分区中所有的文件被清除。 不知道你是否知道这种“格式化”。显然,此格式化非我们这里所说的,我们说的是字符串的格式化,或者说成“格式化字符串”,都可以,表示的意思就是: > 格式化字符串,是C、C++等程序设计语言printf类函数中用于指定输出参数的格式与相对位置的字符串参数。其中的转换说明(conversion specification)用于把随后对应的0个或多个函数参数转换为相应的格式输出;格式化字符串中转换说明以外的其它字符原样输出。 这也是来自维基百科的定义。在这个定义中,是用C语言作为例子,并且用了其输出函数来说明。在python中,也有同样的操作和类似的函数`print`,此前我们已经了解一二了。 如果将那个定义说的通俗一些,字符串格式化化,就是要先制定一个模板,在这个模板中某个或者某几个地方留出空位来,然后在那些空位填上字符串。那么,那些空位,需要用一个符号来表示,这个符号通常被叫做占位符(仅仅是占据着那个位置,并不是输出的内容)。 ~~~ >>> "I like %s" 'I like %s' ~~~ 在这个字符串中,有一个符号:`%s`,就是一个占位符,这个占位符可以被其它的字符串代替。比如: ~~~ >>> "I like %s" % "python" 'I like python' >>> "I like %s" % "Pascal" 'I like Pascal' ~~~ 这是较为常用的一种字符串输出方式。 另外,不同的占位符,会表示那个位置应该被不同类型的对象填充。下面列出许多,供参考。不过,不用记忆,常用的只有`%s`和`%d`,或者再加上`%f`,其它的如果需要了,到这里来查即可。 | 占位符 | 说明 | | --- | --- | | %s | 字符串(采用str()的显示) | | %r | 字符串(采用repr()的显示) | | %c | 单个字符 | | %b | 二进制整数 | | %d | 十进制整数 | | %i | 十进制整数 | | %o | 八进制整数 | | %x | 十六进制整数 | | %e | 指数 (基底写为e) | | %E | 指数 (基底写为E) | | %f | 浮点数 | | %F | 浮点数,与上相同 | | %g | 指数(e)�或浮点数 (根据显示长度) | | %G | 指数(E)或浮点数 (根据显示长度) | 看例子: ~~~ >>> a = "%d years" % 15 >>> print a 15 years ~~~ 当然,还可以在一个字符串中设置多个占位符,就像下面一样 ~~~ >>> print "Suzhou is more than %d years. %s lives in here." % (2500, "qiwsir") Suzhou is more than 2500 years. qiwsir lives in here. ~~~ 对于浮点数字的打印输出,还可以限定输出的小数位数和其它样式。 ~~~ >>> print "Today's temperature is %.2f" % 12.235 Today's temperature is 12.23 >>> print "Today's temperature is %+.2f" % 12.235 Today's temperature is +12.23 ~~~ 注意,上面的例子中,没有实现四舍五入的操作。只是截取。 关于类似的操作,还有很多变化,比如输出格式要宽度是多少等等。如果看官在编程中遇到了,可以到网上查找。我这里给一个参考图示,也是从网上抄来的。 [![](https://docs.gechiui.com/gc-content/uploads/sites/kancloud/2015-09-07_55ed2e4fd9ce7.png)](https://github.com/qiwsir/StarterLearningPython/blob/master/1images/10901.png) 其实,上面这种格式化方法,常常被认为是太“古老”了。因为在python中还有新的格式化方法。 ~~~ >>> s1 = "I like {}".format("python") >>> s1 'I like python' >>> s2 = "Suzhou is more than {} years. {} lives in here.".format(2500, "qiwsir") >>> s2 'Suzhou is more than 2500 years. qiwsir lives in here.' ~~~ 这就是python非常提倡的`string.format()`的格式化方法,其中`{}`作为占位符。 这种方法真的是非常好,而且非常简单,只需要将对应的东西,按照顺序在format后面的括号中排列好,分别对应占位符`{}`即可。我喜欢的方法。 如果你觉得还不明确,还可以这样来做。 ~~~ >>> print "Suzhou is more than {year} years. {name} lives in here.".format(year=2500, name="qiwsir") Suzhou is more than 2500 years. qiwsir lives in here. ~~~ 真的很简洁,看成优雅。 其实,还有一种格式化的方法,被称为“字典格式化”,这里仅仅列一个例子,如果看官要了解字典的含义,本教程后续会有的。 ~~~ >>> lang = "python" >>> print "I love %(program)s"%{"program":lang} I love python ~~~ 列举了三种基本格式化的方法,你喜欢那种?我推荐:`string.format()` ## [](https://github.com/qiwsir/StarterLearningPython/blob/master/109.md#常用的字符串方法)常用的字符串方法 字符串的方法很多。可以通过dir来查看: ~~~ >>> dir(str) ['__add__', '__class__', '__contains__', '__delattr__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__getnewargs__', '__getslice__', '__gt__', '__hash__', '__init__', '__le__', '__len__', '__lt__', '__mod__', '__mul__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__rmod__', '__rmul__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', '_formatter_field_name_split', '_formatter_parser', 'capitalize', 'center', 'count', 'decode', 'encode', 'endswith', 'expandtabs', 'find', 'format', 'index', 'isalnum', 'isalpha', 'isdigit', 'islower', 'isspace', 'istitle', 'isupper', 'join', 'ljust', 'lower', 'lstrip', 'partition', 'replace', 'rfind', 'rindex', 'rjust', 'rpartition', 'rsplit', 'rstrip', 'split', 'splitlines', 'startswith', 'strip', 'swapcase', 'title', 'translate', 'upper', 'zfill'] ~~~ 这么多,不会一一介绍,要了解某个具体的含义和使用方法,最好是使用help查看。举例: ~~~ >>> help(str.isalpha) Help on method_descriptor: isalpha(...) S.isalpha() -> bool Return True if all characters in S are alphabetic and there is at least one character in S, False otherwise. ~~~ 按照这里的说明,就可以在交互模式下进行实验。 ~~~ >>> "python".isalpha() #字符串全是字母,应该返回True True >>> "2python".isalpha() #字符串含非字母,返回False False ~~~ ### [](https://github.com/qiwsir/StarterLearningPython/blob/master/109.md#split)split 这个函数的作用是将字符串根据某个分割符进行分割。 ~~~ >>> a = "I LOVE PYTHON" >>> a.split(" ") ['I', 'LOVE', 'PYTHON'] ~~~ 这是用空格作为分割,得到了一个名字叫做列表(list)的返回值,关于列表的内容,后续会介绍。还能用别的分隔吗? ~~~ >>> b = "www.itdiffer.com" >>> b.split(".") ['www', 'itdiffer', 'com'] ~~~ ### [](https://github.com/qiwsir/StarterLearningPython/blob/master/109.md#去掉字符串两头的空格)去掉字符串两头的空格 这个功能,在让用户输入一些信息的时候非常有用。有的朋友喜欢输入结束的时候敲击空格,比如让他输入自己的名字,输完了,他来个空格。有的则喜欢先加一个空格,总做的输入的第一个字前面应该空两个格。 这些空格是没用的。python考虑到有不少人可能有这个习惯,因此就帮助程序员把这些空格去掉。 方法是: * S.strip() 去掉字符串的左右空格 * S.lstrip() 去掉字符串的左边空格 * S.rstrip() 去掉字符串的右边空格 例如: ~~~ >>> b=" hello " #两边有空格 >>> b.strip() 'hello' >>> b ' hello ' ~~~ 特别注意,原来的值没有变化,而是新返回了一个结果。 ~~~ >>> b.lstrip() #去掉左边的空格 'hello ' >>> b.rstrip() #去掉右边的空格 ' hello' ~~~ ### [](https://github.com/qiwsir/StarterLearningPython/blob/master/109.md#字符大小写的转换)字符大小写的转换 对于英文,有时候要用到大小写转换。最有名驼峰命名,里面就有一些大写和小写的参合。如果有兴趣,可以来这里看[自动将字符串转化为驼峰命名形式的方法](https://github.com/qiwsir/algorithm/blob/master/string_to_hump.md)。 在python中有下面一堆内建函数,用来实现各种类型的大小写转化 * S.upper() #S中的字母大写 * S.lower() #S中的字母小写 * S.capitalize() #首字母大写 * S.isupper() #S中的字母是否全是大写 * S.islower() #S中的字母是否全是小写 * S.istitle() 看例子: ~~~ >>> a = "qiwsir,python" >>> a.upper() #将小写字母完全变成大写字母 'QIWSIR,PYTHON' >>> a #原数据对象并没有改变 'qiwsir,python' >>> b = a.upper() >>> b 'QIWSIR,PYTHON' >>> c = b.lower() #将所有的小写字母变成大写字母 >>> c 'qiwsir,python' >>> a 'qiwsir,python' >>> a.capitalize() #把字符串的第一个字母变成大写 'Qiwsir,python' >>> a #原数据对象没有改变 'qiwsir,python' >>> b = a.capitalize() #新建立了一个 >>> b 'Qiwsir,python' >>> a = "qiwsir,github" #这里的问题就是网友白羽毛指出的,非常感谢他。 >>> a.istitle() False >>> a = "QIWSIR" #当全是大写的时候,返回False >>> a.istitle() False >>> a = "qIWSIR" >>> a.istitle() False >>> a = "Qiwsir,github" #如果这样,也返回False >>> a.istitle() False >>> a = "Qiwsir" #这样是True >>> a.istitle() True >>> a = 'Qiwsir,Github' #这样也是True >>> a.istitle() True >>> a = "Qiwsir" >>> a.isupper() False >>> a.upper().isupper() True >>> a.islower() False >>> a.lower().islower() True ~~~ 顺着白羽毛网友指出的,再探究一下,可以这么做: ~~~ >>> a = "This is a Book" >>> a.istitle() False >>> b = a.title() #这样就把所有单词的第一个字母转化为大写 >>> b 'This Is A Book' >>> b.istitle() #判断每个单词的第一个字母是否为大写 True ~~~ ### [](https://github.com/qiwsir/StarterLearningPython/blob/master/109.md#join拼接字符串)join拼接字符串 用“+”能够拼接字符串,但不是什么情况下都能够如愿的。比如,将列表(关于列表,后续详细说,它是另外一种类型)中的每个字符(串)元素拼接成一个字符串,并且用某个符号连接,如果用“+”,就比较麻烦了(是能够实现的,麻烦)。 用字符串的join就比较容易实现。 ~~~ >>> b 'www.itdiffer.com' >>> c = b.split(".") >>> c ['www', 'itdiffer', 'com'] >>> ".".join(c) 'www.itdiffer.com' >>> "*".join(c) 'www*itdiffer*com' ~~~ 这种拼接,是不是简单呢?
';