史上最全Python字符串操作指南-伙伴云

史上最全 Python 字符串操作指南

网友投稿 637 2022-05-30

惨不忍睹

拿出了看家的老中医野广告，都没能拯救惨淡的selenium剧集。上周五和朋友聊天，说希望看到一些python基础的知识。本来还担心更新基础的东西没人看，但现在看来，最差不过selenium系列了...哈哈。

虽然说更新基础知识，但基础的东西不代表不重要或者说你们都会，不信走着...

记得有句话说到，当一件事请遇到了正则，那它将变为两件事。看到这句话，你们以为我要讲python正则？NO...

日常编码中，大家会发现，太多时候我们需要对数据进行处理，而这数据不管是数组、列表、字典，最终都逃不开字符串的处理。

所以今天要来跟大家发散的聊聊字符串！

字符串的定义

完了，估计很多人看到这个标题就要关网页了，稍等不妨在往下看看？

python定义字符、字符串没有java那样的严格，不管是单引号、双引号、甚至是三个单引号和双引号都可以用来定义字符(串)，只要成对出现即可。比如：

# 单个字符 a='a' # 使用单引号定义字符串 name='Uranus' # 使用双引号定义字符串 code = "Hello World ..." # 既然说到了string，怎么能不点开源码看看呢？ class str(object): """ str(object='') -> str str(bytes_or_buffer[, encoding[, errors]]) -> str Create a new string object from the given object. If encoding or errors is specified, then the object must expose a data buffer that will be decoded using the given encoding and error handler. Otherwise, returns the result of object.__str__() (if defined) or repr(object). encoding defaults to sys.getdefaultencoding(). errors defaults to 'strict'. """

虽然这些不是主要说的，但还是简单提下，三个单引号或者双引号，主要是用来作为文档注释的，请不要拿来定义字符串(虽然这样并不会出现语法错误)。

今天主要说下关于打段的字符串应该如何定义，PEP8有规定，一行代码的长度请勿超过120个字符。那么如果遇到这种情况，该怎么办？

# 不推荐的使用方式：

line = """ Create a new string object from the given object. If encoding or errors is specified, then the object must expose a data buffer that will be decoded using the given encoding and error handler. """ # 或者这样 line = "Create a new string object from the given object. " \ "If encoding or errors is specified," \ "then the object must expose a data buffer that will be" \ " decoded using the given encoding and error handler." # 更好的实现方式： line = ("Create a new string object from the given object." "If encoding or errors is specified," "then the object must expose a data buffer that will be " "decoded using the given encoding and error handler." )

字符串中简单的.is()与.()的用法

.is()*, 既然是is，那么它返回的结果只有两种，True or False

先来对比一下数字：

isdigit() True: Unicode数字，byte数字（单字节），全角数字（双字节），罗马数字 False: 汉字数字 Error: 无

isdecimal() True: Unicode数字，全角数字（双字节） False: 罗马数字，汉字数字 Error: byte数字（单字节）

isnumeric() True: Unicode数字，全角数字（双字节），罗马数字，汉字数字 False: 无 Error: byte数字（单字节)

总结几个偏门知识点：

a='①②③④⑤' isdigit()、isnumeric() 为True isdecimal()为False b='一壹' isnumeric()会认为是True的哦！

再来看一个等式：

isalnum() = isdigit() + isalpha() + isspace() isdigit()表示字符串内全部为数字 isalpha()表示字符串内全部为字符 isspace()表示字符串有一个或多个空格组成 isalnum()表示字符串内全部为数字和字符

a='12345' b='①②③④⑤' c='abc123' print(a.isdigit()) # True print(b.isalpha()) # True print(c.isalnum()) # True

针对字符串大小写的方法：

.isupper() 字符串全部由大写组成 .islower() 字符串全部由小写组成 .istitle() 字符串形式为驼峰命名，eg:"Hello World"

以上这些用法去掉is，则变为了对应的字符串转发方法。学一套会两套，买一送一....

最后说一个不带.的is* --- isinstance(obj,type)

判断一个object是什么类型... type可选类型为：int，float，bool，complex，str，bytes，unicode，list，dict，set，tuple 并且type可以为一个原组：isinstance(obj, (str, int))

判断字符串中的内容

.*with() starts ends 不仅支持开头结尾的匹配，还支持start和end两个参数来动态定义字符串的index位置

long_string = "To live is to learn，to learn is to better live" long_string.startswith('To') long_string.startswith('li', 3, 5) long_string.endswith('live') long_string.endswith('live', 0, 7)

同样支持start、end来判断字符串的还有 .find()、.rfind()和 .index()、.rindex()

这两类字符串寻址方法均支持从左到右、从右至左两种寻址方式，不同的是：

find在未找到时，返回-1，而index在未找到时，会抛出ValueError的异常...

long_string.index('live') # 3 long_string.rindex('live') # 42

字符串的内容变更

狭义来说使用，字符串的替换使用.replace()即可，那为什么还要单独说呢？因为它有一个可选你参数count

long_string = "To live is to learn，to learn is to better live" long_string.count('live') # 2 long_string.replace('live','Live',1) output: 'To Live is to learn，to learn is to better live' # 可以看到，第二个live并未进行替换

刚才说了狭义，那么广义呢？

(l/r)strip()

将字符串左、右、两端的特定字符过滤掉，默认为空格...

strip()要注意的地方是，strip('TolLive') 中的字符并非完整匹配，而是针对每一个字符进行匹配，说起来混，直接上例子：

long_string = "To live is to learn，to learn is to better live" long_string.strip('TolLive') 's to learn，to learn is to better'

字符串切片

字符串的切片分为long_string[start:end;step] start、end区间为左闭右开...这个网上说的太多了，再拉出来详细讲就要挨打了...

(l/r)just(width,[fillchar])、center(width, [fillchar])、zfill(width)

这些均为填充固定长度的字符，默认使用空格(zfill为左补0，z是zero的意思...),看意思就明白了，不用多讲了....

字符串格式化输出

本来fill和center等可以放在这里，但是他们使用频率和重量级不够格，就丢在上面了。

Python格式化输出分为两类，那是在pyton2的时代，即 % 和 format。这两种网上的资料太多了，说的太多显得没逼格...

但，还是要简单说说其中特殊的地方

% 格式化输出：

如何在%的格式输出中，输出用来看做标记为的%符号呢？使用两个百分号（%%）

史上最全Python字符串操作指南

%(-)(width) width为设置长度，默认左填充空格，添加-号为右填充

.width代表字符串截断，保留多少长度的字符串

type %s字符串 %d十进制整数 %f小数 ...

多个参数是，后面的参数需要使用括号包裹起来

'姓名：%-5s 年龄：%4d 爱好： %.8s' % ('王大锤',30,'python、Java') output： '姓名：王大锤年龄： 30 爱好： python、J'

format格式输出：

format在python3开始官方就表示为替换%的输出方式，之所以还保留着%，主要是为了兼容性考虑...

对比%，format使用花括号{}表示变量

< > ^ 代表了format的对齐方式

'{:-^40s}'.format('华丽的分割线') output: '-----------------华丽的分割线-----------------'

f-string

Python3.6的版本更新时，新增了f-string，英文好的可以去看官方解释PEP 498 -- Literal String Interpolation 。

f-string是字符串引号前以f/F开头，并使用{}标注替换位置的使用形式。

之所以官方推出f-string，主要是因为它的更高的性能、更强的功能。例子走起：

name = 'Uranus' f'Hello,{name}' f'Hello,{name.lower()}' f'Hello,{name:^10s}' f'Hello,{(lambda x: x*2) (name)}' output: 'Hello,Uranus' 'Hello,uranus' 'Hello, Uranus ' 'Hello,UranusUranus'

怎么说，是高端了一些，但我这人有点念旧啊...

The End

字符串操作还有什么？能沾上边的东西还有太多，但再写下去天就亮了，明天还怎么上班，收摊了收摊了...

今天的内容就到这里，如果觉得有帮助，欢迎将文章或我的微信公众号【清风Python】分享给更多喜欢python的人，谢谢。

编程语言新手入门 python

excel中mid函数的功能是什么？（Excel中mid函数）

637 2022-05-30

史上最全 Python 字符串操作指南

Excel中如何计算字符串的长度（excel求字符串长度）

Excel 中可以通过什么符号将两个字符串连接起来？（excel函数公式大全）

excel中mid函数的功能是什么？（Excel中mid函数）

推荐文章

企业生产管理是什么，企业生产管理软件

进盘点进销存软件排行榜前十名

进销存系统哪个简单好用？进销存系统优点

工厂生产管理（工厂生产管理流程及制度）

生产管理软件，机械制造业生产管理，制造业生产过程管理软件

进销存软件和ERP有什么区别？进销存与erp软件理解

进销存如何进行库存管理

如何利用excel制作销售订单管理系统？

数据库订单管理系统有哪些功能？数据库订单管理系统怎么设计？

什么是数据库管理系统？

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜

智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐

WPS2016怎么绘制简单的价格表?

连锁餐饮管理系统的功能有哪些？餐饮服务系统的构成及工

定制订单管理系统（为特定需求定制的订单管理系统）

友情链接

史上最全Python字符串操作指南

微信扫一扫：分享

推荐文章

最近发表

热评文章

友情链接

史上最全 Python 字符串操作指南