c# - Forzar XDocument para escribir en String con codificación UTF-8
xml linq-to-xml (3)
Quiero poder escribir XML en una cadena con la declaración y con la codificación UTF-8. Esto parece muy difícil de lograr.
He leído un poco y he intentado algunas de las respuestas populares para esto, pero todos tienen problemas. ¡Mi código actual sale correctamente como UTF-8 pero no mantiene el formato original de XDocument (es decir, sangrías / espacios en blanco)!
¿Alguien puede ofrecer algún consejo, por favor?
XDocument xml = new XDocument(new XDeclaration("1.0", "utf-8", "yes"), xelementXML);
MemoryStream ms = new MemoryStream();
using (XmlWriter xw = new XmlTextWriter(ms, Encoding.UTF8))
{
xml.Save(xw);
xw.Flush();
StreamReader sr = new StreamReader(ms);
ms.Seek(0, SeekOrigin.Begin);
String xmlString = sr.ReadToEnd();
}
El XML requiere que el formateo sea idéntico al modo en que .ToString()
lo formatearía, es decir,
<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<root>
<node>blah</node>
</root>
Lo que estoy viendo actualmente es
<?xml version="1.0" encoding="utf-8" standalone="yes"?><root><node>blah</node></root>
Actualización He logrado hacer que esto funcione al agregar la configuración de XmlTextWriter
... ¡Parece MUY torpe!
MemoryStream ms = new MemoryStream();
XmlWriterSettings settings = new XmlWriterSettings();
settings.Encoding = Encoding.UTF8;
settings.ConformanceLevel = ConformanceLevel.Document;
settings.Indent = true;
using (XmlWriter xw = XmlTextWriter.Create(ms, settings))
{
xml.Save(xw);
xw.Flush();
StreamReader sr = new StreamReader(ms);
ms.Seek(0, SeekOrigin.Begin);
String blah = sr.ReadToEnd();
}
Prueba esto:
using System;
using System.IO;
using System.Text;
using System.Xml.Linq;
class Test
{
static void Main()
{
XDocument doc = XDocument.Load("test.xml",
LoadOptions.PreserveWhitespace);
doc.Declaration = new XDeclaration("1.0", "utf-8", null);
StringWriter writer = new Utf8StringWriter();
doc.Save(writer, SaveOptions.None);
Console.WriteLine(writer);
}
private class Utf8StringWriter : StringWriter
{
public override Encoding Encoding { get { return Encoding.UTF8; } }
}
}
Por supuesto, no nos has mostrado cómo estás construyendo el documento, lo que hace que sea difícil de probar ... Acabo de probar con un XDocument
construido a XDocument
y que también contiene el espacio en blanco relevante.
Pruebe XmlWriterSettings:
XmlWriterSettings xws = new XmlWriterSettings();
xws.OmitXmlDeclaration = false;
xws.Indent = true;
Y pásalo como
using (XmlWriter xw = XmlWriter.Create(sb, xws))
Ver también https://.com/a/3288376/1430535
return xdoc.Declaration.ToString() + Environment.NewLine + xdoc.ToString();