Lectura de archivos PDF como cadena a través de la aplicación de iPhone.
objective-c xcode (3)
Si desea extraer algo de contenido de un archivo pdf, puede leer lo siguiente:
De la guía de programación Quartz 2D.
Básicamente, utilizará un objeto CGPDFScanner
para analizar el contenido, que funciona de la siguiente manera. Registra algunas devoluciones de llamada que serán invocadas automáticamente por Quartz 2D al encontrarse con algunos operadores de pdf en el flujo de pdf. Después de este paso inicial, comenzarás a analizar el flujo de pdf.
Mirando brevemente su código, parece que no está siguiendo los pasos necesarios para analizar el contenido pdf de la página que obtiene a través de CGPDFDocumentGetPage()
. Primero debe configurar las devoluciones de llamada usando CGPDFOperatorTableCreate()
y CGPDFOperatorTableSetCallback()
, luego debe obtener la página, debe crear un flujo de contenido usando esa página (usando CGPDFContentStreamCreateWithPage()
) y luego crear una instancia de CGPDFScanner
escaneo a través de CGPDFScannerScan()
.
La sección "Contenido de PDF de análisis" del documento señalado por la URL anterior le brinda toda la información necesaria para implementar el análisis de PDF.
Espero que esto ayude.
Estoy enfrentando un problema en el desarrollo de aplicaciones para iPhone para "Leer PDF". He intentado seguir el código. Sé que he usado métodos incorrectos para analizar, los métodos de análisis solo se utilizan para fines de búsqueda. Pero quiero convertir el texto completo del pdf en una cadena. Por ejemplo, MobileHIG.pdf de Apple: lo he usado en este código.
@implementation NetPDFViewController
size_t totalPages; // a variable to store total pages
// a method to get the pdf ref
CGPDFDocumentRef MyGetPDFDocumentRef (const char *filename) {
CFStringRef path;
CFURLRef url;
CGPDFDocumentRef document;
path = CFStringCreateWithCString (NULL, filename,kCFStringEncodingUTF8);
url = CFURLCreateWithFileSystemPath (NULL, path, kCFURLPOSIXPathStyle, 0);
CFRelease (path);
document = CGPDFDocumentCreateWithURL (url);// 2
CFRelease(url);
int count = CGPDFDocumentGetNumberOfPages (document);// 3
if (count == 0) {
printf("`%s'' needs at least one page!", filename);
return NULL;
}
return document;
}
// table methods to parse pdf
static void op_MP (CGPDFScannerRef s, void *info) {
const char *name;
if (!CGPDFScannerPopName(s, &name))
return;
printf("MP /%s/n", name);
}
static void op_DP (CGPDFScannerRef s, void *info) {
const char *name;
if (!CGPDFScannerPopName(s, &name))
return;
printf("DP /%s/n", name);
}
static void op_BMC (CGPDFScannerRef s, void *info) {
const char *name;
if (!CGPDFScannerPopName(s, &name))
return;
printf("BMC /%s/n", name);
}
static void op_BDC (CGPDFScannerRef s, void *info) {
const char *name;
if (!CGPDFScannerPopName(s, &name))
return;
printf("BDC /%s/n", name);
}
static void op_EMC (CGPDFScannerRef s, void *info) {
const char *name;
if (!CGPDFScannerPopName(s, &name))
return;
printf("EMC /%s/n", name);
}
// a method to display pdf page.
void MyDisplayPDFPage (CGContextRef myContext,size_t pageNumber,const char *filename) {
CGPDFDocumentRef document;
CGPDFPageRef page;
document = MyGetPDFDocumentRef (filename);// 1
totalPages=CGPDFDocumentGetNumberOfPages(document);
page = CGPDFDocumentGetPage (document, pageNumber);// 2
CGPDFDictionaryRef d;
d = CGPDFPageGetDictionary(page);
// ----- edit problem here - CGPDFDictionary is completely unknown
// ----- as we don''t know keys & values of it.
CGPDFScannerRef myScanner;
CGPDFOperatorTableRef myTable;
myTable = CGPDFOperatorTableCreate();
CGPDFOperatorTableSetCallback (myTable, "MP", &op_MP);
CGPDFOperatorTableSetCallback (myTable, "DP", &op_DP);
CGPDFOperatorTableSetCallback (myTable, "BMC", &op_BMC);
CGPDFOperatorTableSetCallback (myTable, "BDC", &op_BDC);
CGPDFOperatorTableSetCallback (myTable, "EMC", &op_EMC);
CGPDFContentStreamRef myContentStream = CGPDFContentStreamCreateWithPage (page);// 3
myScanner = CGPDFScannerCreate (myContentStream, myTable, NULL);// 4
CGPDFScannerScan (myScanner);// 5
// CGPDFDictionaryRef d;
CGPDFStringRef str; // represents a sequence of bytes
d = CGPDFPageGetDictionary(page);
if (CGPDFDictionaryGetString(d, "Thumb", &str)){
CFStringRef s;
s = CGPDFStringCopyTextString(str);
if (s != NULL) {
//need something in here in case it cant find anything
NSLog(@"%@ testing it", s);
}
CFRelease(s);
// CFDataRef data = CGPDFStreamCopyData (stream, CGPDFDataFormatRaw);
}
// -----------------------------------
CGContextDrawPDFPage (myContext, page);// 3
CGContextTranslateCTM(myContext, 0, 20);
CGContextScaleCTM(myContext, 1.0, -1.0);
CGPDFDocumentRelease (document);// 4
}
- (void)viewDidLoad {
[super viewDidLoad];
// --------------------------------------------------------
// code for simple direct image from pdf docs.
UIGraphicsBeginImageContext(CGSizeMake(320, 460));
initialPage=28;
MyDisplayPDFPage(UIGraphicsGetCurrentContext(), initialPage, [[[NSBundle mainBundle] pathForResource:@"MobileHIG" ofType:@"pdf"] UTF8String]);
imgV.image=UIGraphicsGetImageFromCurrentImageContext();
imgV.image=[imgV.image rotate:UIImageOrientationDownMirrored];
}
- (void)touchesBegan:(NSSet *)touches withEvent:(UIEvent *)event{
UITouch *touch = [touches anyObject];
CGPoint LasttouchPoint = [touch locationInView:self.view];
int LasttouchX = LasttouchPoint.x;
startpoint=LasttouchX;
}
- (void)touchesMoved:(NSSet *)touches withEvent:(UIEvent *)event{
}
- (void)touchesEnded:(NSSet *)touches withEvent:(UIEvent *)event{
UITouch *touch = [touches anyObject];
CGPoint LasttouchPoint = [touch locationInView:self.view];
int LasttouchX = LasttouchPoint.x;
endpoint=LasttouchX;
if(startpoint>(endpoint+75)){
initialPage++;
[self loadPage:initialPage nextOne:YES];
} else if((startpoint+75)<endpoint){
initialPage--;
[self loadPage:initialPage nextOne:NO];
}
}
-(void)loadPage:(NSUInteger)page nextOne:(BOOL)yesOrNo{
if(page<=totalPages && page>0){
UIGraphicsBeginImageContext(CGSizeMake(720, 720));
MyDisplayPDFPage(UIGraphicsGetCurrentContext(), page, [[[NSBundle mainBundle] pathForResource:@"MobileHIG" ofType:@"pdf"] UTF8String]);
CATransition *transition = [CATransition animation];
transition.duration = 0.75;
transition.timingFunction = [CAMediaTimingFunction functionWithName:kCAMediaTimingFunctionEaseInEaseOut];
transition.type=kCATransitionPush;
if(yesOrNo){
transition.subtype=kCATransitionFromRight;
} else {
transition.subtype=kCATransitionFromLeft;
}
transition.delegate = self;
[imgV.layer addAnimation:transition forKey:nil];
imgV.image=UIGraphicsGetImageFromCurrentImageContext();
imgV.image=[imgV.image rotate:UIImageOrientationDownMirrored];
}
}
Pero no tuve éxito al leer ni una sola línea del documento pdf. ¿Qué falta todavía?
Tengo una biblioteca que puede hacer esto exactamente enlazado aquí: Extracción de texto pdf en Objective C
Vea cómo la aplicación de ejemplo QuartzDemo hace esto, específicamente la clase QuartzPDFView en los archivos QuartzImages.h y QuartzImages.m. Muestra un ejemplo de carga de un PDF a través de Quartz.