c# - ser - La forma más sencilla de procesar el texto del archivo de MS Word
microsoft word (2)
Necesito extraer texto de un viejo archivo MS Word .doc en C #. ¿Cuál es la forma más fácil (o la mejor) de hacer ese trabajo?
Dependiendo de sus necesidades y presupuesto, es posible que desee consultar la biblioteca Aspose.Words . No es barato, pero podría reducir el esfuerzo necesario para extraer ese texto. La ventaja es que no necesita tener MSOffice instalado en su computadora de implementación (que es obligatoria en mi humilde opinión si está ejecutando esto en un servidor).
Primero, debe agregar en la biblioteca de objetos de MS Word. Vaya a Proyecto => Agregar referencia, seleccione la pestaña COM, luego busque y seleccione "Microsoft Word 10.0 Object Library". El número de versión puede ser diferente en su computadora. Haga clic en Aceptar.
Después de haber hecho eso, puede usar el siguiente código. Abrirá un documento de MS Word y mostrará cada párrafo en un cuadro de mensaje.
// Read an MS Word Doc
private void ReadWordDoc()
{
try
{
Word.ApplicationClass wordApp = new Word.ApplicationClass();
// Define file path
string fn = @"c:/test.doc";
// Create objects for passing
object oFile = fn;
object oNull = System.Reflection.Missing.Value;
object oReadOnly = true;
// Open Document
Word.Document Doc = wordApp.Documents.Open(ref oFile, ref oNull,
ref oReadOnly, ref oNull, ref oNull, ref oNull, ref oNull,
ref oNull, ref oNull, ref oNull, ref oNull, ref oNull,
ref oNull, ref oNull, ref oNull);
// Read each paragraph and show
foreach (Word.Paragraph oPara in Doc.Paragraphs)
MessageBox.Show(oPara.Range.Text);
// Quit Word
wordApp.Quit(ref oNull, ref oNull, ref oNull);
}
catch (Exception ex)
{
MessageBox.Show(ex.Message);
}
}