6

Palabras
6.1. Introducción

La consecución de este experimento ha sido posible gracias a que el corpus de habla espontánea estaba etiquetado con información morfológica. Como hemos comprobado en nuestros ejemplos y podemos volver a ver en la figura 6.1, cada palabra está acompañada de información gramatical codificada en XML:


Figura 6.1: Ejemplo de etiquetado de una palabra en SESCO 2.0

<t id=”s2_w9” word=”QUERER” pos=”V” morph=”indp1s”>quiero</t>


En este caso, la palabra etiquetada es “quiero” y la etiqueta incluye información sobre el lema (“QUERER”), la clase morfológica (“V” verbo) y la flexión (“indp1s”: primera persona singular del presente de indicativo). Este tipo de codificación estuvo inspirada en el formato MULTEX [Amstrong, 1995] y adaptada para C-ORAL-ROM 1Todas las posibilidades de descripción morfosintáctica que acepta esta clasificación se pueden consultar en los documentos del proyecto [C-ORAL-ROM]. .

Aprovechando esta información preexistente, hemos desarrollado aplicaciones para extraer los datos sintácticos que nos han parecido de mayor interés para nuestra gramática y que expondremos en los siguientes capítulos.

Comenzaremos con un rápido recorrido por las definiciones que en C-ORAL-ROM Madrid se dieron a las distintas clases de palabras. Vamos a recorrer así un círculo partiendo de la anotación morfosintáctica del proyecto C-ORAL-ROM y terminando en una nueva propuesta determinada únicamente por nuestro enfoque semántico y por los datos. Algo interesante de este experimento desde el punto de vista del trabajo con corpus es que estos datos los obtendremos gracias a que la anotación original, aunque no coincidente con nuestra visión, es coherente con sus propios criterios y fácilmente interpretable y reutilizable.

El planteamiento básico del proyecto era el siguiente:

Desde el punto de vista del equipo de C-ORAL-ROM Madrid, la posición sintáctica no es suficiente para justificar el cambio de clase de palabra de una unidad léxica; este cambio debe fundamentarse también en criterios tanto semánticos como morfológicos [...] De acuerdo con esto, las características semánticas de la clase de una palabra concreta conllevan consecuencias morfológicas y sintácticas en la lengua que estamos analizando 2From the point of view of C-ORAL-ROM Madrid, the “syntactic position” premise is not enough to justify the change of POS in a lexical unit; this change must as well be based on semantic and morphological criteria [...] According to this, the semantics of a concrete word’s POS has morphological and syntactic consequences in the language we’re dealing with. .[MSandoval, 2005]

Por lo tanto, el análisis morfológico se realizó a partir de definiciones semánticas que conllevaban características morfosintácticas. De este modo,

comprobaremos cómo los nombres se definen como un grupo de propiedades que distinguen un grupo de individuos de otro. Esas palabras que, en el caso del español, designan clases de individuos, tienen información sobre el género y el número, ocupan una posición central en un sintagma, aceptan modificadores de su significado (por ejemplo, artículos, determinantes o cuantificadores) y siempre tienen una función sintáctica dentro de la oración (principalmente sujeto, objeto directo, etc.) 3we will see how nouns are defined as a group of properties which tell one group of individuals from another. Those words which, in Spanish, designate classes of individuals, have gender and number information, occupy the central position in a phrase, allow meaning modifiers (such as articles, determiners or quantifiers) and always have a syntactic function inside the sentence (mainly: subject, direct object, etc.) .

Hemos resaltado en negrita los criterios semánticos en la primera cita porque nosotros los consideraremos de valor distinto a los morfológicos para la clasificación. Los semánticos son los únicos que nosotros vamos a tener en cuenta aquí para distinguir entre clases de palabras. Los morfológicos, aunque relacionados, son conclusiones gramaticales que podemos deducir a posteriori una vez que la tipología esté terminada.

La siguiente tabla resume las clases de palabras tenidas en cuenta en la parte española de C-ORAL-ROM y las etiquetas que se utilizaron para marcarlas en el corpus 4La tabla ha sido traducida del documento del proyecto C-ORAL-ROM [MSandoval, 2005] . Nos remitiremos a ellas a partir de ahora para el estudio de la composición de los sintagmas, especialmente en la sección 7.




Clase de palabra Categoría Etiqueta



Nombre común NC



Nombre propio N



Adjetivo ADJ



Determinante DET



Cuantificador Q



Pronombre P



Personales PPER



Relativos REL



Verbo V



Auxiliar AUX



Preposición PREP



Adverbio ADV



Conjunción C



Marcador discursivo MD



Interjección INTJ



La visión de esta tabla no desvela importantes novedades con respecto a los usos habituales, pero una lectura más detallada de sus definiciones nos puede mostrar algunos rasgos que se alejan de las concepciones típicas de la gramática tradicional. Estos rasgos afectan principalmente a las tres clases de palabras siguientes.

De las 14 clases de palabras que reconoce el analizador de C-ORAL-ROM, encontraremos 13 en los sintagmas más frecuentes que analizaremos en el capítulo 7. La única que no aparecerá en las gráficas y tablas correspondientes es la de las interjecciones, que se definía en el proyecto como aquellas palabras que, siendo morfológicamente invariables, expresan un estado mental. Al igual que con los marcadores discursivos, nosotros añadiremos a su definición que no forman parte de la estructura eventiva.

La inclusión de los marcadores discursivos contradice aparentemente la propia definición que de ellos hemos dado, pero la causa es técnica y se deriva de la dificultad existente en realizar un análisis automático correcto de esta clase de palabras. Como vemos en los ejemplos de 60, 61 y 62, la mayoría de los marcadores discursivos son palabras de otras clases que pierden su contenido original y se utilizan en el nivel discursivo en determinadas ocasiones. La ambigüedad es muy elevada y provoca que el etiquetado sea menos fiable.

(60) a.

y entonces hablaba el húngaro 5[enatco03].

b.

entonces le digo que vienes 6[etelef03].

(61) a.

el día luego me lo organizaba de la siguiente manera 7[epubmn02].

b.

y luego es que este primo mío tiene un amigo 8[epubdl02].

(62) a.

mucho mejor ya 9[etelef03].

b.

y ya el colmo de los colmos el poder cada día más poderoso ejerce un mecenazgo sobre todas estas actividades 10[emedsc04].

Tanto “entonces” como “luego” y “ya” son típicos marcadores discursivos, sobre todo cuando aparecen en las primeras o últimas posiciones de la oración, y ese es el análisis que el sistema de etiquetado morfológico les ha dado. Sin embargo, estas palabras funcionan como pronombres en las oraciones a. de estos ejemplos ya que, por un lado, son parte de los eventos (relaciones indirectas concretamente) y, por otro lado, no tienen un referente constante, sino dependiente de las coordenadas espacio-temporales y del conocimiento compartido por los hablantes.

A pesar de la problemática señalada con relación a la desambiguación de los marcadores discursivos, debemos advertir que esta clase de palabras sólo aparece en el grupo de las relaciones indirectas y que ahí sólo lo hace con la décima mayor frecuencia (el 1,2%). Podemos aventurarnos a afirmar que este porcentaje pertenece, en realidad, al primer y al cuarto tipo más frecuentes en las RI, que son las ocupadas por los adverbios y los pronombres con un 12,2% y un 7,3% de frecuencia respectivamente.

Un segundo problema evidenciado en los datos es el de la anotación de los cuantificadores. A pesar de que la definición que se les da en C-ORAL-ROM es la de un tipo de artículo, comprobaremos que aparecen solos en muchos elementos (por ejemplo, como agentes). Esto desvela también un problema de desambiguación con estas palabras en aquellos casos en los que son pronombres, como comprobamos en los ejemplos 63a., 63b. y 63c..

(63) a.

a mí cualquiera no me la ganaba a peleárselas a todos juntos 11[efammn01].

b.

fractura desde el momento en el que unos agreden y matan a otros 12[emedin01].

c.

para hacer el dúo con Serrat que uno también se quiere marcar este pegote 13[emedrp01].

Una vez aclarados estos problemas heredados del etiquetado morfosintáctico del corpus que utilizamos, estableceremos las primeras generalizaciones. Dejaremos a un lado el análisis de las relaciones indirectas para retomarlo más adelante individualmente por ser un grupo excesivamente amplio y heterogéneo.

La observación de las tablas de los argumentos de los eventos y de los predicados que detallaremos en el capítulo 7 desvela una diferencia evidente entre la composición de los primeros y la de los segundos. Ninguna de las estructuras de los predicados, formadas por verbos (principales y auxiliares) y adverbios, aparecen solas en los argumentos al igual que las estructuras de las entidades no lo hacen como predicados. De este modo, podemos establecer dos grandes tipos de clases de palabras, las que se utilizan para expresar predicados y las que se utilizan para denotar entidades.



PredicadosEntidades




Verbo Pron. PERsonal


ADVerbios Nombre Común


verbo AUXiliar Nombre propio


Pronombre


ADJetivo


DETerminante


cuantificador(Q)


PREPosición


Conjunción


INTerjección


Marcador Discursivo


6.2. Las palabras del predicado

La primera distinción que podemos hacer con los datos de las clases de palabras que expresan predicados es entre aquellas que pueden aparecer solas, es decir, que son un predicado en sí mismas y aquellas otras que necesitan de la presencia de otras palabras.



Predicados completosPredicados incompletos


Verbo verbo AUXiliar


ADVerbio


Como veremos más adelante en la sección 7.2.1, el verbo aislado es la forma más común de expresar un predicado. Señalamos algunos ejemplos que nos servirán después resaltando los verbos en cursiva:

(64) a.

y luego operaron a mi madre 14[efamcv02].

b.

y eso explica el por qué soy yo el que lo cuenta de manera divertida 15[efammn05].

c.

la terapia génica tiene dos acepciones 16[emedts09].

d.

hace dos domingos recordáis que el evangelio nos hablaba también de una viña 17[enatpr05].

En todos ellos observamos que el predicado de los eventos está compuesto por una sola palabra que es de la clase Verbo y a la que acompañan otras con las funciones de argumentos (como “a mi madre”), de relaciones indirectas (“de manera divertida”) o simplemente discursivas (los “y” de inicio de las dos primeras oraciones).

La característica morfológica más interesante de este tipo de predicados es la unión que establecen con el primer argumento del evento, sea éste una entidad, un agente o, en el caso de las construcciones pasivas, un paciente. Es el rasgo tradicionalmente denominado concordancia de verbo y sujeto, utilizado para identificar el sujeto sintáctico de la oración. De este modo, en el ejemplo 64a., que carece de agente explícito, sabemos que el argumento agente del evento operar está constituido por más de un individuo y que este grupo no incluye ni al productor ni al receptor de la oración. Igualmente, el ejemplo 64d. tiene como primer argumento del estado la audiencia a la que se dirige el hablante a pesar de que esta no está explícita en la oración a través de un elemento léxico.

En realidad y siguiendo la lógica de nuestra exposición, debemos señalar que tanto el agente de la primera como el poseedor de la segunda sí están explicitados en sus respectivas oraciones, pero lo están morfológicamente dentro de la flexión del verbo y no en un sintagma distinto, algo motivado por las características de la gramática española. Estas referencias son, no obstante, diferentes de algunas de las realizadas mediante sintagmas independientes. El sintagma “la terapia génica”, por ejemplo, nos proporciona más información de la que una terminación flexiva es capaz. El tipo de datos sobre los argumentos que obtenemos a través del verbo es similar al que, como veremos más adelante en la sección 6.3, nos proporcionan los pronombres, muy basada en la información compartida entre los interlocutores y de carácter deíctico. Podemos afirmar gracias al corpus que esta información es suficiente en la mayoría de los casos o, expresado de otra forma, que la aparición de sintagmas más explícitos resultaría redundante. Esto es lo que explica que el argumento no tenga un sintagma propio en el 58,3% de las ENTidades de los estados y en el 69,8% de los AGentes. Más adelante analizaremos en mayor detalle este fenómeno.

Una construcción similar a la formada por un Verbo y también muy frecuente (con un 6,6% de los casos) es la compuesta por un Verbo acompañado por un ADVerbio. A continuación ejemplificamos este tipo:

(65) a.

pero si no interfiere en el juego ni nada 18[efamdl03].

b.

ahí las potencias pues sí difiere un poco con lo que se venía utilizando 19[enatbu02].

c.

pero en ocasiones tenemos también la posibilidad de echar la vista atrás 20[emedsc04].

d.

pero esto tampoco es nada difícil 21[etelef10].

Estas estructuras son exactamente iguales que las de los ejemplos de 64 en cuanto a su función dentro del evento. La diferencia reside en que aquí está explícita la polaridad del predicado, esto es, su valor positivo o negativo. Siendo el valor por defecto de un evento el positivo, es más común que se explicite a través de un adverbio la polaridad negativa que la positiva. Como comprobamos en los ejemplos, es posible que el verbo aparezca tanto antes como después del elemento polarizador.

El otro tipo de predicados completos, además del de los Verbos y la variante ADVerbio Verbo, es precisamente el de los adverbios aislados, que pasamos a ejemplificar en 66 en cursivas poniendo entre paréntesis la oración que las precede inmediatamente.

(66) a.

(dieciocho ya son de bachillerato ?) no 22[enatpe02].

b.

(Pedrito es el de Almudena no ?) claro 23[efamcv03].

c.

(Cuenca es un escenario atractivo estos días) aunque también en cualquier momento del año 24[emednw01]. Hemos simplificado la oración original, que aparecerá completa en la página §.

Como vimos en la sección 4.4.1, estos adverbios han constituido uno de los mayores problemas de análisis especialmente al intentar considerarlos desde el punto de vista de las gramáticas existentes [Demonte, 1999Alarcos, 1994Esbozo, 1975Alcina, 1975Marcos, 1998]. Sin embargo, su importancia es evidente con un 7% de apariciones (véase la sección 7.2.1), una frecuencia de aparición mayor que la del grupo analizado anteriormente de ADVerbio Verbo.

Aunque los tres ejemplos tomados del corpus han sido analizados en él como predicados, distinguiremos entre los dos primeros y el último por conllevar una forma de análisis diferente, pero sin olvidar que todos los casos de predicados compuestos por adverbio comparten una característica básica: su significado depende directamente del anterior evento expresado.

En los dos primeros casos, el adverbio es la respuesta a una pregunta y su análisis se podía haber realizado de dos maneras distintas y admisibles en SESCO:

1.
Equiparando la estructura de ADV a la de ADV V. Así, el “claro” del segundo ejemplo se analizaría como “Pedrito sí (claro) es el de Almudena”. Este análisis, aunque coherente con nuestra propuesta, habría sido problemático en muchos casos porque nos hubiera obligado a realizar cambios importantes. De hecho, hemos cambiado en el ejemplo “claro” por “sí”, considerando que la oración “Pedrito claro es el de Almudena” se siente como anómala, como también lo sería “dieciocho ya no son de bachillerato”, que habría que cambiar por (por ejemplo) “dieciocho todavía no son de bachillerato” para mantener el sentido.
Como vimos en el capítulo dedicado a detallar el funcionamiento de SESCO (especialmente en la sección 3.4), el contenido de los elementos de nuestros análisis eventivos provienen invariablemente de los sintagmas expresados en las oraciones ya sea en la analizada o en otra anterior a través de referencias, y la inclusión de nuevos elementos léxicos que no estén presentes en los textos sería completamente arbitraria e inaceptable.
2.
Estos problemas nos han llevado a realizar un análisis diferente en el que tomamos el evento precedente como contenido de uno de los argumentos del adverbio. El análisis de respuestas del tipo “claro”, “sí”, “no”, etc... se equipara al de otras similares como “sí que es verdad” o “verdad”. De este modo, “no” en el primer ejemplo constata un estado atributivo compuesto por un primer argumento que es el evento aseverado anteriormente (“dieciocho ya son de bachillerato”) y un segundo que es su condición de verdad (representado en SESCO por la constante VERDADERO). “No” implica un estado de este tipo con valor negativo y “claro” otro igual, pero con valor positivo.
Estos análisis nos permiten mantener el formato del sistema a la vez que recogen fielmente el sentido de los predicados, que son analizados como estados.

Los adverbios del tipo del ejemplo 66c. necesitan un análisis diferente ya que no son respuestas a oraciones anteriores aunque sí requieran igualmente de un evento antecedente. Citaremos a continuación la oración del ejemplo incluyendo algo de contexto para permitir una comprensión más exacta de su sentido:

(67)

Cuenca es en cualquier caso un escenario indudablemente atractivo para ello estos días con Situaciones aunque también en cualquier momento del año

Aquí “también” no sólo confirma el valor de verdad del anterior evento (“Cuenca es en cualquier caso un escenario indudablemente atractivo para ello estos días con Situaciones”), sino que toma elementos del anterior evento, que sí se presuponen verdaderos, para expresar un evento nuevo. Podemos parafrasear la oración “también en cualquier momento del año” como “Cuenca también es en cualquier caso un escenario indudablemente atractivo para ello en cualquier momento del año”. La estructura eventiva (un estado atributivo), los dos argumentos (“Cuenca” y “un escenario indudablemente atractivo”) y las relaciones indirectas (“en cualquier caso” y “para ello”) son heredados con la sustitución de la relación indirecta de “estos días con Situaciones” por “en cualquier momento del año”.

El único requisito para que esta sustitución sea posible es que ambas partes de la oración sean, en el nivel eventivo, el mismo elemento (aquí una relación indirecta concomitante de tiempo). El hecho de que sean contradictorios, es decir, que no sea lógico decir que Cuenca es atractiva “estos días en cualquier momento del año”, no es necesario para que se produzca el cambio. Por ejemplo, podría decirse “Cuenca es atractiva los martes y Mataró también”, lo que podríamos analizar como dos estados de estructura idéntica con un cambio del primer argumento del segundo estado (“Cuenca es atractiva los martes y Mataró es atractivo los martes”) 25Al no repetirse explícitamente estos elementos en las segundas oraciones, la estructura del segundo evento se completa en el análisis de SESCO con referencias a los elementos del primero. .

Por último dentro las palabras de los predicados, nos encontramos un 8% de apariciones de la estructura AUXiliar Verbo. Citamos algunas oraciones a modo de ejemplo:

(68) a.

por regla general estamos hablando de una cantidad [enatps01]

b.

todo lo demás ya ha tenido la acción humana presente [enatte01]

c.

así vamos recogiendo ese material [epubdl02]

Como veremos más detalladamente en 7.2.1 y ya hemos mencionado antes, estas estructuras no se diferencian de las compuestas únicamente por un Verbo salvo en el hecho de que la información de concordancia y gramatical (aspecto, tiempo y modo) se expresa en la palabra auxiliar. Por el mismo motivo, podemos considerar la estructura ADVerbio AUXiliar Verbo (con un 1,1% de apariciones) idéntica a la anteriormente analizada ADVerbio Verbo.

Lo expuesto en esta sección nos sirve para redefinir los tipos de palabras que aparecen como predicados:

6.3. Las palabras de los argumentos

Presentamos las clases de palabras ordenadas según su frecuencia de aparición en los argumentos. Para facilitar su estudio, los diferentes tipos de determinantes que distingue la anotación original de C-ORAL-ROM (véase la tabla de la página §) aparecen bajo la denominación común de DET así como los pronombres relativos aparecen englobados en los pronombres (P).


Clase de palabra

Nombre Común

DETerminante

PREPosición

cuantificador (Q)

ADJetivo

Pron. PERsonal

Conjunción

Pronombre

Nombre propio

Marcador Discursivo

INTerjección

Los argumentos denotan típicamente entidades y estas pueden ser expresadas mediante una palabra o mediante un conjunto de ellas. Como hicimos anteriormente con los predicados, distinguiremos aquí entre las clases de palabras que pueden formar solas un argumento y aquellas otras que requieren estar acompañadas por otras:



Argumentos completosArgumentos incompletos


Pron. PERsonal Conjunción


DETerminante PREPosición


Nombre Común


ADJetivo


Nombre propio


Pronombre


cuantificador (Q)


En esta tabla hemos realizado una nueva reducción puesto que sólo aparecen nueve clases de palabras. El motivo fue explicado en la anterior sección: algunas palabras aparecen erróneamente anotadas en el corpus por problemas con la desambiguación en el proceso de etiquetado y esto hace que tipos como el de los marcadores discursivos y las interjecciónes, que no pueden formar parte de ningún argumento, sí aparezcan dentro de ellos en resultados extraídos automáticamente.

De esta división podemos deducir que, según el etiquetado morfológico de C-ORAL-ROM y la teoría semántica que seguimos, las clases de palabras de la primera columna denotan entidades o propiedades mientras que las de la segunda sólo pueden aparecer en una denotación compleja. Esta afirmación contradice aún en dos casos nuevos las propias definiciones estipuladas en el proyecto [MSandoval, 2005]. A continuación citaremos estas contradicciones e intentaremos explicar su causa.

Por lo tanto, tres de los tipos de palabras que pueden ser argumentos completos por sí solos son similares: los pronombres, los determinantes y los cuantificadores (los ejemplos 69a., 69b. y 69c. respectivamente). Para evitar la confusión, los denominaremos a partir de ahora genéricamente como pronombres.

(69) a.

ella sigue estando ahí 27[efamcv02].

b.

el diente es suyo 28[efamcv06].

c.

hay dos 29[efamcv03].

Los elementos de la columna de argumentos incompletos, esto es, las preposiciones y las conjunciones, sí nos ofrecen unos resultados coherentes con sus definiciones típicas. En el caso de las PREP, C-ORAL-ROM las define como elementos que “establecen relaciones semánticas asociadas a conceptos espaciales” 30“establish sematic relationships associated to spatial concepts”. y que sintácticamente “establecen relaciones entre dos elementos” 31“establish relationships between two elements”. . En esto último, coinciden las preposiciones y las conjunciones, que “relacionan oraciones o elementos de una oración” 32“relate sentences or elements in a sentence”. mientras que, en el plano semántico, “establecen límites lógicos o discursivos” 33“establish logical or discourse bounds”. .

Ambas clases de palabras se diferencian en el tipo de elementos a los que acompañan. La mayoría de las preposiciones preceden a nombres comunes (precedidos o no a su vez de cuantificadores o determinantes) o a pronombres; por lo tanto, preceden a palabras que denotan entidades. En contraposición, las conjunciones preceden a subeventos completos.

Para diferenciar las distintas clases que encontramos dentro de cada una de las dos columnas, estudiamos qué tipo de argumentos suelen ocupar y qué relación tienen con los identificadores y las referencias (IDE y REF en SESCO), es decir, cómo se denotan a través de ellas los argumentos a lo largo del discurso.

Para lo primero, revisamos las tablas con los cinco casos más frecuentes de cada parte eventiva y ordenamos cada clase de palabras con aquellos elementos en los que es relevante. Como hemos señalado, incluimos como pronombres aquellos determinantes y cuantificadores que aparecen solos. Distinguiremos, sin embargo, entre nombres comunes y nombres propios puesto que presentan una distribución significativamente diferente.

Las cuatro clases de palabras que aparecen solas con más frecuencia son los pronombres, los nombres (comunes y propios) y los adjetivos. Los siguientes porcentajes nos sirven para conocer la importancia de la clase dentro de los elementos eventivos en los que son más frecuentes. Es importante tener en cuenta que, como veremos en el próximo capítulo, un número muy elevado de argumentos no aparecen explícitos.

1.
Pronombres
a)
19,1% de los agentes
b)
15,8% de las entidades
c)
12,4% de los pacientes
d)
9,2% de los argumentos locativos
e)
3,5% de las propiedades
2.
Nombres Comunes
a)
12% de los pacientes
b)
9,5% de las entidades
c)
7,1% de los argumentos locativos
d)
4,5% de los agentes
e)
2,4% de las propiedades
3.
ADJetivos
a)
4,7% de las propiedades
4.
Nombres propios
a)
2,6% de los argumentos locativos
b)
2,5% de los agentes

Los datos muestran una distinción clara entre las clases de palabras que pueden representar entidades y las que sólo expresan propiedades (los adjetivos).

La cantidad de nombres comunes y pronombres que forman PROpiedades demuestra que, aunque es una función menor de estas clases de palabras, también se utilizan para expresar cualidades. En el caso de los nombres comunes como el del ejemplo 70, el estado expresado significa que la entidad (“eso”) no tiene las propiedades mínimas para ser considerado “un hospital”.

(70)

eso no era un hospital 34[efamcv02].

También vemos en los datos que el uso de pronombres, de nombres y de nombres propios no coincide en su distribución. Cada uno de ellos tiene una importancia mayor en un tipo diferente de argumento:

Los pronombres predominan en todos los argumentos, pero lo hacen especialmente en los agentes, que es el argumento donde menos nombres comunes y propios encontramos. Es interesante comprobar que el argumento más típico de los nombres propios, el segundo argumento de los estados locativos, ocupa un puesto mucho más discreto en el caso de los otros dos tipos. Los nombres comunes y los pronombres también coinciden en la relevancia de las ENTidades y en la marginalidad de las PROpiedades, algo lógico si tenemos en cuenta que denotan típicamente individuos.

Para distinguir mejor estos tipos de palabras nos fijaremos ahora en su relación con las referencias y los identificadores. Como vimos anteriormente (sección 4.2), nuestro sistema de etiquetado permite relacionar los argumentos de un evento o el evento completo con las referencias que se hayan realizado a ellos anteriormente o se vayan a realizar con posterioridad en el discurso. Para ello, los eventos, las entidades y las propiedades pueden vincularse a un código único que después volverá a utilizarse en caso de que se vuelvan a mencionar en los siguientes eventos. La etiqueta para vincular por primera vez un evento/entidad/propiedad con el código es lo que denominamos identificador (IDE) y las siguientes apariciones estarán marcadas con referencias (REF) a dicho código.

Para introducir esta nueva variable en nuestro estudio, incluimos los datos relativos al porcentaje de identificadores y de referencias que corresponde a cada elemento eventivo sobre un total de 11348 referencias y 2035 identificadores (5,58 referencias de media para cada identificador). Los representamos en las figuras 6.2 y 6.3.


Figura 6.2: Identificadores en los diferentes elementos

PIC



Figura 6.3: Referencias en los diferentes elementos

PIC


Casi la mitad de los elementos que tienen un identificador son pacientes de acciones, mientras que la mayoría de las referencias parten del primer elemento de los estados. Estos dos datos están claramente relacionados ya que, en SESCO, una acción se define como un proceso provocado por un agente, y es generalmente el paciente de la acción la entidad que sufre dicho proceso (3.4) y a la que, por lo tanto, se hace referencia en los primeros argumentos de los estados que componen dicha transición.

Estos datos también confirman la idea, a la que volveremos en la sección 7.1, de que los primeros argumentos de los eventos (ENT y AG) son los más propensos a aparecer implícitos. En estos casos, la referencia se resuelve gracias al paralelismo con el evento que tiene el identificador o a la concordancia gramatical [Alcántara, 2005b]. En el otro extremo, también señalábamos al hablar de los elementos implícitos y explícitos que las relaciones indirectas eran las menos propensas a la elisión, y eso explica su escasa importancia en estos gráficos.

Relacionamos los datos de las referencias con las estructuras sintácticas con las que suelen aparecer centrándonos en los casos más frecuentes. Casi todas las ocasiones en que aparecen referencias se trata de elementos implícitos (un 84,1%). El contenido de estos elementos no se expresa mediante palabras y, por ese motivo, es necesaria la referencia a la mención previa de las entidades o eventos que denotan. Estos elementos implícitos se corresponden mayoritariamente con oraciones en las que el predicado es un adverbio (como en los ejemplos 66 de la página §) o en aquellas en las que el argumento es expresado a través de la flexión verbal (como en los ejemplos 64a., 64b. y 64c. de la página §).

En la gráfica 6.4, mostramos los porcentajes de las estructuras sintácticas de aquellos casos en que la referencia está acompañada de elementos léxicos. Para calcular dichos porcentajes no se ha tenido en cuenta el de las elipsis.


Figura 6.4: Estructuras de las referencias

PIC


Es evidente el predominio de los pronombres (PPER y P), que suman el 62% de las apariciones, a las que también podríamos añadir el 3% de casos en los que aparece el pronombre precedido por una preposición.

Además de este 65% de pronombres, encontramos entre las cinco estructuras más frecuentes dos formadas por nombres (DET NC y N), pero que apenas suman un 9,4%. Podemos afirmar, por lo tanto, que el pronombre es la clase de palabra característica de las referencias.

Repetimos ahora la gráfica, pero esta vez con las estructuras típicas de los identificadores:


Figura 6.5: Estructuras de los identificadores

PIC


Aunque el número de elementos implícitos es mucho menor que con los referentes (aquí todos los porcentajes se relacionan con el total de casos), es interesante señalar que siguen siendo los más frecuentes. Aquí están representados por constantes debido a que, en SESCO, todas las partes de un evento deben estar completas, ya sea por constantes (que definimos en la sección 4.2), elementos léxicos o referencias.

Siguiendo la comparación realizada con las referencias, observamos aquí que las estructuras que se basan en las clases de palabras de los nombres (que son todos nombres comunes) suman el 19% de los casos, mientras que los pronombres son aproximadamente la mitad (un 10%). El nombre parece ser la clase de palabra más característica de los identificadores.

El hecho de que los porcentajes sean menores aquí que en el caso de las referencias se debe a que estas tienen una menor diversidad sintáctica, con aprox. 160 estructuras distintas frente a las casi 540 que encontramos en los identificadores.

Los resultados coinciden a grandes rasgos con lo que podríamos esperar teniendo en cuenta las teorías pragmáticas sobre la anáfora. El identificador se establece en el momento en que se realiza la primera mención de la entidad (o, en menos casos, a la propiedad o al evento) y es normal que requiera de un sintagma nominal en lugar de un pronombre ya que el primero incluye más información.

Una vez designada una entidad con claridad y asignado su ID, ya no será necesario repetir su denominación con un sintagma nominal, sino únicamente señalar a través de un pronombre que seguimos hablando de ella.

Los pronombres contienen información gramatical y espacial (volvemos a entender las coordenadas espaciales como válidas para una interpretación temporal) y, por lo tanto, basan su significación en otra información que ya es compartida por los interlocutores. A pesar de esta afirmación, debemos resaltar que los resultados de los pronombres, sin ser dominantes, tienen una importancia más que evidente en los ID. Encontramos dos tipos principales de casos en los que el pronombre funciona directamente como identificador y que pasamos a detallar a continuación.

1.
Yo, tú... La interacción tiene unos referentes pronominales evidentes en los propios interlocutores y en las coordenadas tiempo-espaciales en que tiene lugar el diálogo. De hecho, el yo y el tú, así como el ahora y el aquí, son pronombres de uso mucho más frecuente que sus análogos él, ella, entonces, allí... A diferencia de estos últimos, los primeros denotan una entidad sin ambigüedad posible.


PronombreApariciones




yo 560


150


él/ella 114


nosotros/as 83


vosotros 15


ellos/ellas 71


Como se aprecia en la tabla, el pronombre yo es el más utilizado con una frecuencia casi cuatro veces superior al segundo. En los plurales, sin embargo, el orden varía dándole a la tercera persona una importancia similar a la primera, y quedando el uso de la segunda en una cifra casi marginal. Los pronombres singulares se utilizan para mencionarse a uno mismo o para mencionar al interlocutor, y de manera menos frecuente a una tercera persona, mientras que los plurales se utilizan para la primera y la tercera personas, siempre más inusuales que los singulares 35Ya que ambos referentes se encuentran presentes en la interacción, la diferencia de frecuencia entre la primera y la segunda persona está probablemente relacionada con aspectos de la cortesía en español. .
La siguiente tabla compara los cuatro pronombres más frecuentes para referirse a las coordenadas espacio-temporales:



PronombreApariciones




aquí 139


ahora 130


entonces 82


allí 52


En los casos de aquí y allí, el primero aparece 2,7 veces más que el segundo, mientras que en los temporales ahora lo hace 1,6 veces más que entonces. Las referencias pronominales al contexto de la interacción vuelven a ser más frecuentes que aquellas que se realizan a entidades o circunstancias ajenas a esta.

2.
Algunas construcciones sintácticas típicas del español requieren que una entidad a la que se hace referencia a través de un nombre aparezca a la vez como pronombre. Así, por ejemplo, ocurre en “a mi padre le han operado también” [efamcv02], donde el paciente del evento operar aparece como “a mi padre” y como “le”. En estos casos, ambas partes son analizadas conjuntamente como paciente y, por lo tanto, comparten el identificador.

6.4. Morfosintaxis de las relaciones indirectas

6.5. Nueva definición de las clases de palabras

A partir de lo expuesto en este capítulo, proponemos la siguiente redefinición de las distintas clases de palabras y hacemos notar que es una tipología de sólo diez clases:

Volver al índice -- Capítulo siguiente: Sintagmas