Saltar al contenido

Extraiga el nombre de dominio de la URL en Python

El paso a paso o código que verás en este artículo es la resolución más sencilla y efectiva que hallamos a tus dudas o problema.

Solución:

Usar tldextract que es la versión más eficiente de urlparse, tldextract separa con precisión el gTLD o ccTLD (dominio de nivel superior genérico o de código de país) del registrado domain y subdomains de una URL.

>>> import tldextract
>>> ext = tldextract.extract('http://forums.news.cnn.com/')
ExtractResult(subdomain='forums.news', domain='cnn', suffix='com')
>>> ext.domain
'cnn'

Parece que puede usar urlparse https://docs.python.org/3/library/urllib.parse.html para esa url y luego extraer netloc.

Y desde netloc puede extraer fácilmente el nombre de dominio usando split

Nos puedes ayudar nuestra faena dejando un comentario y dejando una valoración te damos la bienvenida.

¡Haz clic para puntuar esta entrada!
(Votos: 0 Promedio: 0)



Utiliza Nuestro Buscador

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *