son ser que proteger pegar para modifiquen microsoft los formatos formato extensiones documento deshabilitar cuales copiar copiado como archivo c# ms-word

c# - ser - La forma más sencilla de procesar el texto del archivo de MS Word



microsoft word (2)

Necesito extraer texto de un viejo archivo MS Word .doc en C #. ¿Cuál es la forma más fácil (o la mejor) de hacer ese trabajo?


Dependiendo de sus necesidades y presupuesto, es posible que desee consultar la biblioteca Aspose.Words . No es barato, pero podría reducir el esfuerzo necesario para extraer ese texto. La ventaja es que no necesita tener MSOffice instalado en su computadora de implementación (que es obligatoria en mi humilde opinión si está ejecutando esto en un servidor).


Primero, debe agregar en la biblioteca de objetos de MS Word. Vaya a Proyecto => Agregar referencia, seleccione la pestaña COM, luego busque y seleccione "Microsoft Word 10.0 Object Library". El número de versión puede ser diferente en su computadora. Haga clic en Aceptar.

Después de haber hecho eso, puede usar el siguiente código. Abrirá un documento de MS Word y mostrará cada párrafo en un cuadro de mensaje.

// Read an MS Word Doc private void ReadWordDoc() { try { Word.ApplicationClass wordApp = new Word.ApplicationClass(); // Define file path string fn = @"c:/test.doc"; // Create objects for passing object oFile = fn; object oNull = System.Reflection.Missing.Value; object oReadOnly = true; // Open Document Word.Document Doc = wordApp.Documents.Open(ref oFile, ref oNull, ref oReadOnly, ref oNull, ref oNull, ref oNull, ref oNull, ref oNull, ref oNull, ref oNull, ref oNull, ref oNull, ref oNull, ref oNull, ref oNull); // Read each paragraph and show foreach (Word.Paragraph oPara in Doc.Paragraphs) MessageBox.Show(oPara.Range.Text); // Quit Word wordApp.Quit(ref oNull, ref oNull, ref oNull); } catch (Exception ex) { MessageBox.Show(ex.Message); } }