urllib abre objetos de archivo de la Web mediante el acceso a ellos a través de su URL. La función urlopen obtendrá un objeto de red desde un recurso de red , por lo general en forma de una página Web , y almacenarlo como un objeto de archivo Python. Este objeto puede ser manipulado en gran parte del mismo modo que un objeto fichero Python , a través de funciones como la lectura o readline .
Copia Objetos de red
urllib puede también recoger objetos como páginas web de Internet y almacenarlos en el disco duro local. Esto permite que el programa de Python para acceder al archivo desde el disco duro y no siempre se solicita la página cada vez que se requiere que el objeto. La función urlretrieve obtiene un objeto de red y devuelve una tupla , o conjunto de valores , lo que representa el nombre del archivo guardado y los encabezados especiales en el archivo .
Codificación URL
urllib también puede tomar una serie de tuplas de dos de entrada y convertirlos en URLs. La función urlencode convierte una serie de tuplas en pares clave-valor que se convierten en parte de una URL cuando la solicitud URL envía información. Esto permite que el programa para solicitar información a los usuarios , guárdelo con un valor clave que define la información necesaria del servidor y la construcción de una URL para enviar una solicitud de URL.
Manejar códigos de respuesta HTTP especiales
cuando solicite una copia de los objetos de una red, específicamente las peticiones HTTP ( como cuando se hace una petición de una página web) , el servidor puede devolver ciertos códigos de respuesta . Estos códigos significan algo sobre el estado de la página, tales como haber sido movidos. Otros códigos representan el hecho de que la página no ha sido modificada desde su última visita y no necesita ser renovada . La función FancyURLopener maneja las solicitudes en las que estos códigos pueden ser devueltos y ofrece un manejo por defecto para su ocurrencia.