Procesamiento del lenguaje natural: inicio

En este capítulo, discutiremos el inicio del lenguaje natural en el procesamiento del lenguaje natural. Para empezar, primero entendamos qué es la gramática del lenguaje natural.

Gramática del lenguaje natural

Para la lingüística, el lenguaje es un grupo de signos vocales arbitrarios. Podemos decir que el lenguaje es creativo, se rige por reglas, innato y universal al mismo tiempo. Por otro lado, también lo es humanamente. La naturaleza del idioma es diferente para diferentes personas. Hay muchos conceptos erróneos sobre la naturaleza del idioma. Por eso es muy importante comprender el significado del término ambiguo‘grammar’. En lingüística, el término gramática puede definirse como las reglas o principios con la ayuda de qué idioma funciona. En sentido amplio, podemos dividir la gramática en dos categorías:

Gramática descriptiva

El conjunto de reglas, donde los lingüistas y gramáticos formulan la gramática del hablante, se llama gramática descriptiva.

Gramática de perspectiva

Es un sentido gramatical muy diferente, que intenta mantener un estándar de corrección en el idioma. Esta categoría tiene poco que ver con el funcionamiento real del idioma.

Componentes del lenguaje

El lenguaje de estudio se divide en componentes interrelacionados, que son divisiones convencionales y arbitrarias de la investigación lingüística. La explicación de estos componentes es la siguiente:

Fonología

El primer componente del lenguaje es la fonología. Es el estudio de los sonidos del habla de un idioma en particular. El origen de la palabra se remonta al idioma griego, donde 'teléfono' significa sonido o voz. La fonética, una subdivisión de la fonología, es el estudio de los sonidos del habla del lenguaje humano desde la perspectiva de su producción, percepción o sus propiedades físicas. IPA (Alfabeto Fonético Internacional) es una herramienta que representa los sonidos humanos de forma regular mientras se estudia fonología. En IPA, cada símbolo escrito representa un solo sonido de voz y viceversa.

Fonemas

Puede definirse como una de las unidades de sonido que diferencian una palabra de otra en un idioma. En lingüística, los fonemas se escriben entre barras. Por ejemplo, fonema/k/ ocurre en palabras como kit, sketch.

Morfología

Es el segundo componente del lenguaje. Es el estudio de la estructura y clasificación de las palabras en un idioma en particular. El origen de la palabra es del idioma griego, donde la palabra 'morphe' significa 'forma'. La morfología considera los principios de formación de palabras en un idioma. En otras palabras, cómo los sonidos se combinan en unidades significativas como prefijos, sufijos y raíces. También considera cómo las palabras se pueden agrupar en partes del discurso.

Lexeme

En lingüística, la unidad abstracta de análisis morfológico que corresponde a un conjunto de formas tomadas por una sola palabra se llama lexema. La forma en que se usa un lexema en una oración está determinada por su categoría gramatical. Lexeme puede ser palabra individual o multipalabra. Por ejemplo, la palabra hablar es un ejemplo de un lexema de palabra individual, que puede tener muchas variantes gramaticales como habla, habla y habla. El lexema de varias palabras puede estar compuesto por más de una palabra ortográfica. Por ejemplo, hablar, salir, etc. son ejemplos de lexemas de varias palabras.

Sintaxis

Es el tercer componente del lenguaje. Es el estudio del orden y la disposición de las palabras en unidades más grandes. La palabra se remonta al idioma griego, donde la palabra suntassein significa "poner en orden". Estudia el tipo de oraciones y su estructura, de cláusulas, de frases.

Semántica

Es el cuarto componente del lenguaje. Es el estudio de cómo se transmite el significado. El significado puede estar relacionado con el mundo exterior o puede estar relacionado con la gramática de la oración. La palabra se remonta al idioma griego, donde la palabra semainein significa "significar", "mostrar", "señal".

Pragmática

Es el quinto componente del lenguaje. Es el estudio de las funciones del lenguaje y su uso en contexto. El origen de la palabra se remonta al idioma griego, donde la palabra "pragma" significa "hecho", "asunto".

Categorías gramaticales

Una categoría gramatical puede definirse como una clase de unidades o características dentro de la gramática de un idioma. Estas unidades son los componentes básicos del lenguaje y comparten un conjunto común de características. Las categorías gramaticales también se denominan características gramaticales.

El inventario de categorías gramaticales se describe a continuación:

Número

Es la categoría gramatical más simple. Tenemos dos términos relacionados con esta categoría: singular y plural. Singular es el concepto de 'uno' mientras que, plural es el concepto de 'más de uno'. Por ejemplo, perro / perros, esto / estos.

Género

El género gramatical se expresa mediante la variación de los pronombres personales y la tercera persona. Los ejemplos de géneros gramaticales son singulares: él, ella, eso; las formas de la primera y segunda persona - yo, nosotros y usted; la tercera persona del plural ellos, es género común o género neutro.

Persona

Otra categoría gramatical simple es persona. Bajo esto, se reconocen los siguientes tres términos:

  • 1st person - La persona que está hablando se reconoce como 1ª persona.

  • 2nd person - La persona que es el oyente o la persona con la que se habla se reconoce como 2ª persona.

  • 3rd person - La persona o cosa de la que estamos hablando se reconoce como 3ª persona.

Caso

Es una de las categorías gramaticales más difíciles. Puede definirse como una indicación de la función de un sintagma nominal (NP) o la relación de un sintagma nominal con un verbo o con los otros sintagmas nominales de la oración. Tenemos los siguientes tres casos expresados ​​en pronombres personales e interrogativos:

  • Nominative case- Es la función del sujeto. Por ejemplo, yo, nosotros, tú, él, ella, eso, ellos y quienes son nominativos.

  • Genitive case- Es la función del poseedor. Por ejemplo, mi / mio, nuestro / nuestro, el, el / ella, su, el / ellos, que son genitivos.

  • Objective case- Es la función del objeto. Por ejemplo, yo, nosotros, tú, él, ella, ellos, que somos objetivos.

La licenciatura

Esta categoría gramatical está relacionada con adjetivos y adverbios. Tiene los siguientes tres términos:

  • Positive degree- Expresa una cualidad. Por ejemplo, grande, rápido, hermoso son grados positivos.

  • Comparative degree- Expresa mayor grado o intensidad de la calidad en uno de dos ítems. Por ejemplo, más grande, más rápido, más hermoso son grados comparativos.

  • Superlative degree- Expresa el mayor grado o intensidad de la calidad en uno de tres o más ítems. Por ejemplo, más grande, más rápido, más hermoso son los grados superlativos.

Definición e indefinición

Ambos conceptos son muy simples. La definición como la conocemos representa un referente, que es conocido, familiar o identificable por el hablante o el oyente. Por otro lado, la indefinición representa un referente que se desconoce o se desconoce. El concepto puede entenderse en la co-ocurrencia de un artículo con un sustantivo -

  • definite article- el

  • indefinite article- a / an

Tiempo

Esta categoría gramatical está relacionada con el verbo y se puede definir como la indicación lingüística del tiempo de una acción. Un tiempo establece una relación porque indica el tiempo de un evento con respecto al momento de hablar. En términos generales, es de los siguientes tres tipos:

  • Present tense- Representa la ocurrencia de una acción en el momento presente. Por ejemplo, Ram trabaja duro.

  • Past tense- Representa la ocurrencia de una acción antes del momento presente. Por ejemplo, llovió.

  • Future tense- Representa la ocurrencia de una acción después del momento presente. Por ejemplo, lloverá.

Aspecto

Esta categoría gramatical puede definirse como la visión que se tiene de un evento. Puede ser de los siguientes tipos:

  • Perfective aspect- La vista se toma en conjunto y completa en el aspecto. Por ejemplo, el tiempo pasado simple comoyesterday I met my friend, en inglés tiene un aspecto perfectivo, ya que ve el evento como completo y completo.

  • Imperfective aspect- La vista se toma como continua e incompleta en el aspecto. Por ejemplo, el tiempo presente del participio comoI am working on this problem, en inglés tiene un aspecto imperfecto, ya que considera que el evento es incompleto y en curso.

Estado animico

Esta categoría gramatical es un poco difícil de definir, pero se puede expresar simplemente como una indicación de la actitud del hablante hacia lo que está hablando. También es la característica gramatical de los verbos. Es distinto de los tiempos gramaticales y del aspecto gramatical. Los ejemplos de estados de ánimo son indicativo, interrogativo, imperativo, mandato judicial, subjuntivo, potencial, optativo, gerundios y participios.

Acuerdo

También se le llama concordia. Sucede cuando una palabra cambia dependiendo de las otras palabras con las que se relaciona. En otras palabras, implica hacer coincidir el valor de alguna categoría gramatical entre diferentes palabras o partes del discurso. Los siguientes son los acuerdos basados ​​en otras categorías gramaticales:

  • Agreement based on Person- Es la concordancia entre sujeto y verbo. Por ejemplo, siempre usamos “Yo soy” y “Él es” pero nunca “Él soy” y “Yo es”.

  • Agreement based on Number- Este acuerdo es entre el sujeto y el verbo. En este caso, hay formas verbales específicas para la primera persona del singular, la segunda persona del plural y así sucesivamente. Por ejemplo, 1ª persona del singular: Realmente soy, 2ª persona del plural: Realmente somos, 3ª persona del singular: El niño canta, 3ª persona del plural: Los niños cantan.

  • Agreement based on Gender- En inglés, hay concordancia de género entre pronombres y antecedentes. Por ejemplo, llegó a su destino. El barco llegó a su destino.

  • Agreement based on Case- Este tipo de acuerdo no es una característica significativa del inglés. Por ejemplo, ¿quién vino primero, él o su hermana?

Sintaxis del lenguaje hablado

La gramática del inglés escrito y del inglés hablado tienen muchas características comunes pero, junto con eso, también difieren en varios aspectos. Las siguientes características distinguen entre la gramática inglesa hablada y escrita:

Disfluencias y reparación

Esta característica sorprendente hace que la gramática inglesa hablada y escrita sean diferentes entre sí. Se conoce individualmente como fenómenos de disfluencias y colectivamente como fenómenos de reparación. Las discrepancias incluyen el uso de lo siguiente:

  • Fillers words- A veces, entre la oración, usamos algunas palabras de relleno. Se denominan rellenos de pausa de relleno. Ejemplos de tales palabras son uh y um.

  • Reparandum and repair- El segmento repetido de palabras entre la oración se llama reparandum. En el mismo segmento, la palabra cambiada se llama reparación. Considere el siguiente ejemplo para comprender esto:

Does ABC airlines offer any one-way flights uh one-way fares for 5000 rupees?

En la oración anterior, el vuelo de ida es una reparación y los vuelos de ida es una reparación.

Reinicia

Después de la pausa de llenado, se reinicia. Por ejemplo, en la oración anterior, los reinicios ocurren cuando el orador comienza a preguntar sobre vuelos de ida y luego se detiene, se corrige a sí mismo mediante una pausa de relleno y luego vuelve a preguntar sobre tarifas de ida.

Fragmentos de palabras

A veces, pronunciamos las oraciones con fragmentos de palabras más pequeños. Por ejemplo,wwha-what is the time? Aquí las palabras w-wha son fragmentos de palabras.