c# pdf itext

c# - Leyendo un archivo PDF usando iText5 para.NET



(1)

Estoy usando C # como plataforma de programación e iTextSharp para leer contenido PDF. He usado el siguiente código para leer el contenido, pero parece que se lee por página.

public string ReadPdfFile(object Filename) { string strText = string.Empty; try { PdfReader reader = new PdfReader((string)Filename); for (int page = 1; page <= reader.NumberOfPages; page++) { ITextExtractionStrategy its = new iTextSharp.text.pdf.parser.SimpleTextExtractionStrategy(); String s = PdfTextExtractor.GetTextFromPage(reader, page, its); s = Encoding.UTF8.GetString(ASCIIEncoding.Convert(Encoding.Default, Encoding.UTF8, Encoding.Default.GetBytes(s))); strText = strText + s; } reader.Close(); } catch (Exception ex) { MessageBox.Show(ex.Message); } return strText; }

¿Alguien me puede ayudar en cómo puedo escribir un código que lea el contenido del pdf por línea?


Intente esto, use LocationTextExtractionStrategy lugar de SimpleTextExtractionStrategy para agregar nuevos caracteres de línea al texto devuelto. Luego puede usar strText.Split(''/n'') para dividir su texto en una string[] y consumirlo por línea.