Python中的plisttext和HTTP的Content-Type

网友投稿 631 2022-05-29

这段时间本人在学习Android Service相关的内容,临时需要一个可以提供文件上传和下载功能的服务器,于是上网查找了一个简单服务器的python实现代码,本着温顾一下HTTP协议的想法,于是深入研究了一下其中的代码,发现大家对SimpleHTTPRequestsHandler中的self.headers.plisttext.split("=")[1]语句的含义不是很理解,于是自己查阅了一下python源码定义和相关HTTP协议文档,理解了这段代码的含义。

源码定义

我们先来看一下关于plisttext的源码定义。

#https://svn.python.org/projects/python/branches/alpha100/Lib/mimetools.py class Message(rfc822.Message): def __init__(self, fp): .... self.typeheader = \ self.getheader('content-type') .... def parsetype(self): str = self.typeheader if str == None: str = 'text/plain' if ';' in str: i = string.index(str, ';') self.plisttext = str[i:] str = str[:i] else: self.plisttext = '' ....

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

从源码中可以得出,plisttext与HTTP头部content-type有关,这里我们就要回想一下content-type的有关定义了。

在w3c的文档给出了content-type的格式定义,我们可以发现,content-type对的值有可选的内容,使用;隔开,所以plisttext的值就是parameter的内容。

Content-Type := type "/" subtype *[";" parameter] type := "application" / "audio" / "image" / "message" / "multipart" / "text" / "video" / x-token x-token := subtype := token parameter := attribute "=" value attribute := token value := token / quoted-string token := 1* tspecials := "(" / ")" / "<" / ">" / "@" ; Must be in / "," / ";" / ":" / "\" / <"> ; quoted-string, / "/" / "[" / "]" / "?" / "." ; to use within / "=" ; parameter values

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

使用原理

知道了plisttext代表的含义,我们再来看一下它在文件上传过程中的作用吧。我们先来看一下它在处理文件上传的post请求时的作用吧。

boundary = self.headers.plisttext.split("=")[1] remainbytes = int(self.headers['content-length']) line = self.rfile.readline() remainbytes -= len(line) if not boundary in line: return (False,"Content NOT begin with boundary") line = self.rfile.readline() remainbytes -= len(line) filename = re.findall(r'Content-Disposition.*name="file"; filename="(.*)"',line) if not fn: return (False,"Can't find out file name")

1

2

3

4

5

6

7

8

9

10

11

我们都知道当通过html的form来进行文件提交时,浏览器会发送POST请求,并且content-type为multipart/form-data; boundary=----WebKitFormBoundaryqdHXHkzdBEGWWZka,所以,plisttext的值为boundary=----WebKitFormBoundaryqdHXHkzdBEGWWZka。boundary在HTTP的body中会使用到,因为post请求提交了很多类型的数据,所以必须使用boundary进行间隔,也就是所谓的Multipart Content-Type时的body格式。详细的body的格式在w3c的文档中有详细的介绍。

这里贴一张wireShark截获的tcp包的信息,来帮助大家理解一下这段python代码的原理。通过form提交一份文件和一个名为other的字符串。

POST / HTTP/1.1 Host: localhost:8080 Connection: keep-alive Content-Length: 269353 Cache-Control: max-age=0 Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8 Origin: http://localhost:8080 User-Agent: Mozilla/5.0 (X11; Linux i686) AppleWebKit/537.36 (KHTML, like Gecko) Ubuntu Chromium/43.0.2357.81 Chrome/43.0.2357.81 Safari/537.36 Content-Type: multipart/form-data; boundary=----WebKitFormBoundaryqdHXHkzdBEGWWZka Referer: http://localhost:8080/ Accept-Encoding: gzip, deflate Accept-Language: en-US,en;q=0.8,zh-CN;q=0.6,zh;q=0.4 ------WebKitFormBoundaryqdHXHkzdBEGWWZka Content-Disposition: form-data; name="file"; filename="AndroidStudy.png" Content-Type: image/png ..... //图片内容 ------WebKitFormBoundaryqdHXHkzdBEGWWZka Content-Disposition: form-data; name="other" ddd ------WebKitFormBoundaryqdHXHkzdBEGWWZka--

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

Python中的plisttext和HTTP的Content-Type

17

18

19

20

21

22

HTTP Python

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:《敏捷软件开发:用户故事实战》—为什么要改变?
下一篇:【小白学习kears教程】四、Keras基于数字数据集建立基础的CNN模型
相关文章