textos texto qué que problemas online minería mineria importancia ejemplos definición consiste beneficios nlp information-retrieval text-mining information-extraction

nlp - qué - minería de textos definición



¿Cuál es la diferencia entre extracción de información y minería de texto? (2)

Puede parecer fácil. Pero estoy confundido

¿Cuál es la diferencia entre Text Mining y Information Extraction?


Primero, echemos un vistazo al significado de estas dos palabras importantes.

Text Mining es el descubrimiento automático de información nueva previamente desconocida, mediante el análisis automático de varios recursos textuales. Comienza extrayendo hechos y eventos de fuentes textuales y luego permite formar nuevas hipótesis que son exploradas por métodos tradicionales de minería de datos y análisis de datos.

La extracción de información es más un problema de NLP (procesamiento del lenguaje natural) y aprendizaje automático donde se entrena a la máquina para extraer información oculta del texto sin formato.

Entonces la diferencia se puede decir como: la extracción de texto es un área extensa en comparación con la extracción de información. La minería de texto se refiere a buscar patrones en el texto no estructurado. La tarea relacionada de Extracción de información (IE) consiste en localizar elementos específicos en documentos en lenguaje natural


Extracción de información

(IE) es la tarea de extraer automáticamente información estructurada de documentos no estructurados y / o semiestructurados legibles por máquina. En la mayoría de los casos, esta actividad se refiere al procesamiento de textos en lenguaje humano mediante el procesamiento del lenguaje natural (NLP). Las actividades recientes en el procesamiento de documentos multimedia como la anotación automática y la extracción de contenido de imágenes / audio / video podrían verse como extracción de información.

Extracción de textos

es la actividad de obtener recursos de información relevantes para una necesidad de información de una colección de recursos de información. Las búsquedas pueden basarse en metadatos o en la indexación de texto completo.

La extracción de texto es un área extensa en comparación con la recuperación de información. Las tareas típicas de minería de textos incluyen clasificación de documentos, agrupamiento de documentos, ontología de construcción, análisis de sentimientos, resumen de documentos, extracción de información, etc. Donde la recuperación de información normalmente trata sobre rastreo, análisis e indexación de documentos, recuperación de documentos.

Fuente