html - trabajo - requisitos para trabajar en una tienda de ropa
¿Cómo puedo convertir HTML a Textil? (5)
Este es un simple reemplazo de marcado, nada que una buena expresión regular no pueda arreglar.
Recomiendo Perl, LWP :: Simple y algunos regexes para hacer todo (spidering, stripping, diseño y menús, convertir a textil, y luego publicar en la base de datos).
Estoy raspando un sitio html estático y moviendo el contenido a un CMS respaldado por una base de datos. Me gustaría usar Textile en el CMS.
¿Existe alguna herramienta que convierta HTML en Textil, para poder raspar el sitio existente, convertir el HTML en Textil e insertar esos datos en la base de datos?
Aquí hay un textil c # lib converting html 2 . Aunque es textil con sus adiciones. No es puro textil.
Sé que esta es una vieja pregunta, pero me encontré tratando de hacer esto el otro día y no encontrar nada útil, hasta que encontré a Pandoc . También puede convertir montones de otros formatos de marcado: es bastante brillante.
prueba este simple código java espero que te sirva
import java.net.*;
import java.io.*;
class Crawle
{
public static void main(String ar[])throws Exception
{
URL url = new URL("https://www.google.co.in/#q=i+am+happy");
InputStream io = url.openStream();
BufferedReader br = new BufferedReader(new InputStreamReader(io));
FileOutputStream fio = new FileOutputStream("crawler/file.txt");
PrintWriter pr = new PrintWriter(fio,true);
String data = "";
while((data=br.readLine())!=null)
{
pr.println(data);
System.out.println(data);
}
}
}
}
Como no había implementación de javascript, escribí uno: https://github.com/cmroanirgo/to-textile
Es un poco primitivo en este momento, ya que es un puerto ciego del equivalente ''a la rebaja'', pero debe hacer el trabajo.