El paso a paso o código que verás en este artículo es la resolución más sencilla y efectiva que hallamos a tus dudas o problema.
Solución:
Usar tldextract
que es la versión más eficiente de urlparse
, tldextract
separa con precisión el gTLD
o ccTLD
(dominio de nivel superior genérico o de código de país) del registrado domain
y subdomains
de una URL.
>>> import tldextract
>>> ext = tldextract.extract('http://forums.news.cnn.com/')
ExtractResult(subdomain='forums.news', domain='cnn', suffix='com')
>>> ext.domain
'cnn'
Parece que puede usar urlparse https://docs.python.org/3/library/urllib.parse.html para esa url y luego extraer netloc.
Y desde netloc puede extraer fácilmente el nombre de dominio usando split
Nos puedes ayudar nuestra faena dejando un comentario y dejando una valoración te damos la bienvenida.
¡Haz clic para puntuar esta entrada!
(Votos: 0 Promedio: 0)