c# - httputility - Renderice o convierta Html a texto ''formateado''(.NET)
string to html c# (2)
En lugar de regex, ¿podrías intentar cargarlo en el paquete de agilidad de HTML ? Si era xhtml, entonces una transformación xslt podría ser una buena opción.
Estoy importando algunos datos de otra prueba / herramienta de seguimiento de errores en tfs, y me gustaría convertir su descripción, que está en HTML simple, por lo que una cadena simple, donde se conserva el ''diseño'' del HTML.
Por ejemplo:
<body>
<ol>
<li>Log on with user Acme & Co.</li>
<li>Navigate to the details tab</li>
<li>Check the official name</li>
</ol>
<br>
<br>
Expected Result:<br>
official name is filled in<br>
<br>
Actual Result:<br>
The &-sign is not shown correctly<br>
See attachement.
</body>
Se convertiría en texto sin formato con líneas nuevas insertadas y entidades HTML traducidas como:
1. Log on with user Acme & Co. 2. Navigate to the details tab 3. Check the official name Expected Result: official name is filled in Actual Result: The &-sign is not shown correctly See attachment
Actualmente puedo reemplazar algunas etiquetas con nuevas líneas usando una expresión regular y quitar el resto, pero reemplazar las entidades HTML y cosas como <ol>
y <ul>
parece que estoy reinventando algo (¿navegador?). Entonces me preguntaba si alguien hizo esto antes que yo. No puedo encontrarlo usando Google.
Al final, una vez que me sentí más cómodo con TFS, personalicé el tipo de elemento de trabajo para incluir un nuevo campo de HTML y simplemente copié los contenidos en ese campo.
Esta solución era mucho mejor, porque ahora podíamos ver el formato previsto del campo.