19-noviembre-2015
admin

Web Scraping en Python con Requests y lxml

El módulo Requests simplifica el manejo HTTP, mientras que lxml se utiliza para procesar los documentos HTML.

– Documentación oficial lxml
– Documentación oficial requests

Instalación de las librerias.

python -m pip install -U pip
cd C:\Python27\Scripts
pip install lxml
pip install requests

Ejemplo de uso:

page = requests.get("http://url.com")
tree = html.fromstring(page.text)
table = tree.xpath('//table[@id=”prueba”]')
print 'Total de tablas con id=prueba ', len(table) 

Comentarios cerrados.

Categorias

Linkedin