sharepoint - ¿Cómo implementar un IFilter para indexar formatos pesados?

search (2)

Todavía no he desarrollado ningún filtro, así que básicamente estoy adivinando, pero la forma en que siempre entendí las cosas es que el IFilter está basado en fragmentos exactamente por esta razón. Depende de la implementación del filtro asegurarse de que los fragmentos devueltos sean "lo suficientemente pequeños", por lo que el daemon de búsqueda que llama puede simplemente salir entre dos fragmentos si las cosas tardan demasiado.

Aparentemente, mi suposición es incorrecta, o no harías esta misma pregunta.

Necesito desarrollar un IFilter para Microsoft Search Server 2008 que realice cálculos prolongados para extraer texto. Extraer texto de un archivo puede llevar de 5 segundos a 12 horas. ¿Cómo puedo diseñar un IFilter así para que el daemon no lo reinicie en tiempo de espera y también otros IFilters se pueden restablecer en tiempo de espera si cuelgan?

12 horas, ¡guau!

Si toma tanto tiempo y hay muchos archivos, su mejor opción sería crear una aplicación de procesamiento previo que extraería el texto y lo haría disponible para que el iFilter pueda acceder.

Otra opción sería crear resúmenes html de los documentos e indicar al rastreador que los indexe. Si la página de resumen puede vincularse fácilmente con el documento en sí, si es necesario.