数据的远程传输,使得文件信息交流变得更为方便。我们经常会听说,用远程的方式传递一些文件,想必大家还没有使用python来进行过这方面的传输。本篇要带来的是urlretrieve的方法,其中的返回格式里涉及到了远程文本的信息。下面我们就这个函数进行简单的说明,然后带来获取远程文件的方法。
1、函数说明
这个函数不返回一个类似于文件的对象,而返回一个格式为 (filename, headers) 的元组,其中 filename 是本地文件的名称(由 urllib 自动创建),而 headers 包含一些有关远程文件的信息(这里不会介绍 headers,如果想要更深入的了解它,请在有关 urllib 的标准库文档中查找 urlretrieve)。如果要给下载的副本指定文件名,可通过第二个参数来提供。
2、获取步骤
(1)获取 python 官网的主页,并将其存储到文件 C:\python_webpage.html 中。
urlretrieve('http://www.python.org', 'C:\\python_webpage.html')
(2)使用完毕后,你可能想将其删除,以免占用磁盘空间。要清空这样的临时文件,可调用函数 urlcleanup 且不提供任何参数,它将负责替你完成清空工作。
拓展:
urllib 提供了一些用于操作URL的函数:
(1)quote(string[, safe]):返回一个字符串,其中所有的特殊字符(在 URL 中有特殊意义的字符)都已替换为对 URL 友好的版本(如将 ~ 替换为 %7E)。如果要将包含特殊字符的字符串用作 URL,这很有用。参数 safe 是一个字符串(默认为 '/'),包含不应该像这样对其进行编码的字符。
(2)quote_plus(string[, safe]):类似于 quote,但也将空格替换为加号。
(3)unquote(string):与 quote 相反。
(4)unquote_plus(string):与 quote_plus 相反。
以上就是python中urlretrieve获取远程文件的方法,大家在对这个函数有所了解后,也可以对结尾其他操作 URL的函数进行学习。更多Python高级指路:python高级