Saltar al contenido

¿Cómo guardar un documento Jsoup en un archivo HTML?

Puede darse el caso de que halles algún fallo en tu código o trabajo, recuerda probar siempre en un entorno de testing antes subir el código al trabajo final.

Solución:

Usar doc.outerHtml().

import org.apache.commons.io.FileUtils;

public void downloadPage() throws Exception 
        final Response response = Jsoup.connect("http://www.example.net").execute();
        final Document doc = response.parse();

        final File f = new File("filename.html");
        FileUtils.writeStringToFile(f, doc.outerHtml(), StandardCharsets.UTF_8);
    

No te olvides de capturar Excepciones. Agregue dependencia o descargue la biblioteca Apache commons-io para una manera fácil y rápida de guardar archivos en formato UTF-8.

El hecho de que haya elementos que se ignoren, debe ser debido al intento de normalización por parte de Jsoup.

Para obtener la salida exacta del servidor sin ningún tipo de normalización, use esto.

Connection.Response html = Jsoup.connect("PUT_URL_HERE").execute();
System.out.println(html.body());

Comentarios y valoraciones

Si tienes algún titubeo o disposición de ascender nuestro escrito te inspiramos añadir una crítica y con mucho placer lo observaremos.

¡Haz clic para puntuar esta entrada!
(Votos: 0 Promedio: 0)



Utiliza Nuestro Buscador

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *