scraping - obtener el nombre del sitio de una URL en python

web scraping python español (3)

¿Con qué versión de Python estás aprendiendo? Tenga en cuenta que la respuesta de SilentGhost es para Python 3.0, mientras que Alabaster Codify funcionará con la serie 2.x.

Soy nuevo en Python y parece tener muchas funciones agradables que no conozco. ¿Qué función puedo usar para obtener el nombre del sitio raíz? Por ejemplo, ¿cómo obtendría faqs.org si le diera a la función la URL " http://www.faqs.org/docs/diveintopython/kgp_commandline.html "?

El módulo urlparse pasado por alto :

from urlparse import urlparse scheme, netloc, path, params, query, fragment = urlparse("http://www.faqs.org/docs/diveintopython/kgp_commandline.html") print netloc

>>> from urllib.parse import urlparse >>> urlparse(''http://www.cwi.nl:80/%7Eguido/Python.html'').hostname ''www.cwi.nl''