3

El análisis semántico oracional
3.1. Introducción

Este capítulo presenta la base teórica sobre la que se fundamenta nuestro etiquetado semántico. Como se ha explicado en su introducción, este libro no tiene la pretensión de ser una revisión exhaustiva del estado de la cuestión en semántica, sino simplemente proponer unos cimientos que nos parecen lo suficientemente sólidos como para analizar con ellos la estructura del lenguaje. La propuesta es principalmente empírica y esta base es una herramienta más, de especial importancia, para lograr los análisis propuestos.

Durante nuestro trabajo de adaptación de la parte teórica a los fenómenos que nos han ido apareciendo en el trabajo directo con el corpus, dimos siempre prioridad a este sobre aquella. Por este motivo, necesitábamos buscar un marco flexible y robusto, evitando aquellos que podían ser excesivamente restrictivos. Como se ha indicado anteriormente, partimos del requisito de que la teoría debía ser lo más general posible, idealmente universal.

Este planteamiento nos lleva a rechazar no sólo el acercamiento sintactista, sino también la mayoría de los modelos más extendidos en la semántica computacional de hoy en día como, por ejemplo, RMRS [Copestake, 2003] y EuroWordNet [EUROWORDNETVossen, 1999]. EuroWordNet, que no se dedica a la estructura proposicional y que está basado en WordNet [WordNet], quizás sea, por su importancia y amplio uso, el ejemplo ideal para explicar nuestra posición teórica discrepante.

EWN es un sistema formado por ontologías de base lingüística que se consideran autónomas. Hay una ontología conceptual con 63 distinciones semánticas, la denominada Top Concept Ontology, y una jerarquía de etiquetas con los significados agrupados según temas, la Domain Ontology. El significado de cada palabra se describe por medio de estas ontologías y a través de sus relaciones semánticas con las otras palabras. El resultado es una clasificación minuciosa de la que destacamos dos grandes inconvenientes:

1.
Su exhaustividad conlleva una visión del corpus muy restringida a un modelo del mundo que es anterior al texto que analizamos. La teoría se impone plenamente a la lengua. Además, el desarrollo de estas versiones europeas del original WordNet se realizó en muchos casos tomando este como base absoluta, lo que significa que es la teoría del inglés la que se impone sobre la estructuración de las otras lenguas.
2.
La complejidad de la clasificación dificulta la fluidez del etiquetado, convirtiéndolo en un proceso que nos parece excesivamente complejo para desarrollar corpus extensos, coherentes y representativos del habla libre.

Nosotros hemos preferido un análisis eventivo enmarcable dentro de las teorías de la semántica relacional y, más exactamente, en la estructura eventiva. Sus fundamentos se basan principalmente en los estudios de Juan Carlos Moreno Cabrera (véase en la bibliografía), que suponen una recuperación de la visión de James D. McCawley [McCawley, 1973McCawley, 1981] y cuya aproximación minimista y composicional se adapta perfectamente a nuestras exigencias. Para otro trabajo utilizando un análisis similar al nuestro, en ese caso de las construcciones sintácticas del vasco, el húngaro, el georgiano y el chucoto, remitimos a Moreno Cabrera (1998) 1Como su título indica, este libro de Juan Carlos Moreno Cabrera fue pensado como apoyo complementario a su curso de sintaxis general de la Universidad Autónoma de Madrid al que yo tuve la suerte de poder asistir. Por este motivo, el libro es bastante esquemático y quizás excesivamente críptico para una lectura independiente, pero ofrece una cantidad estimable de ejemplos en las cuatro lenguas señaladas.

A partir de estas consideraciones, repasaremos en la sección 3.2 los distintos acercamientos que se han producido en el estudio de la lengua desde una perspectiva semántica para introducirnos en la sección 3.3 dentro de la corriente de la semántica relacional, es decir, aquella que más ha influido en nuestro etiquetado.

En la sección 3.4, se introducirán los primeros conceptos básicos que tienen una repercusión directa en nuestro etiquetado, que son los relativos a los tipos eventivos y a los eventos.

Las secciones 3.5 y 3.7 están dedicadas a la descripción cuidadosa de aquellos elementos que aparecen en nuestros análisis. La mayoría habrán sido descritos en las secciones que les preceden, pero ahí aparecerán en una presentación sistemática que incluirá todos los rasgos que se reflejan en SESCO, y sólo ellos. Los dividiremos entre aquellos relacionados con los argumentos y con las relaciones indirectas y aquellos que lo están con el análisis discursivo.

En la sección 3.6, introduciremos un nuevo concepto denominado relación abstracta que está relacionado con la estructura interna de los eventos complejos.


PIC Figura 3.1: Partes del discurso


La gráfica 3.1 muestra las diferentes partes en que consideramos dividido el discurso y que veremos en estas secciones. El núcleo es la información básica para la expresión de un evento y centro de nuestros análisis. Las relaciones indirectas transmiten información relacionada con el evento, pero no necesaria para que este se considere como tal. La capa más externa es la de los elementos plenamente discursivos, que están fuera del alcance de este libro.

3.2. El significado

La semántica es la disciplina lingüística que estudia el significado. Concretar esta definición es una tarea tan compleja como polémica, pero nos es inevitable en un estudio como el que presentamos. Al igual que ocurre con el resto de disciplinas, desentrañar la esencia del objeto de estudio de la semántica ha sido un reto que ha obligado a revisar su sentido en múltiples ocasiones y diferentes corrientes han propuesto distintos acercamientos a lo que se debe entender como significado.

Un primer aspecto que diferencia estos planteamientos es la unidad de análisis. Dependiendo de la que tomemos como referencia, estudiaremos el significado de un morfema, un elemento léxico, una suboración, una oración o un discurso. Esta jerarquía de menor a mayor tamaño es la que comúnmente se utiliza para diferenciar las distintas semánticas. De este modo y como ejemplos, tenemos la semántica léxica, la semántica suboracional y la semántica discursiva.

No seguiremos aquí esta distinción por parecernos semánticamente inapropiada. Es evidente que los distintos grados han sido derivados de las diferentes partes sintácticas de la lengua y, por lo tanto, la jerarquía está motivada por cualidades no semánticas. Esto es peligroso principalmente por dos razones. La primera es que se asume a priori una dependencia absoluta y demasiado literal del contenido con respecto a la forma que, en el mejor de los casos, complica la transportabilidad del sistema de una lengua a otra. Algunas expresarán partes de su significado básicamente a través de su morfología y otras lo harán a través de su sintaxis oracional. Creemos que decidir desde un principio con qué parte de la formas lingüísticas nos quedamos le restaría poder a nuestras futuras investigaciones semánticas.

Este acercamiento le otorga una gran importancia a la sintaxis y el nuestro es prácticamente el opuesto, inspirado en la siguiente reflexión de Richard Montague [Montague, 1974]:

Me parece que los análisis sintácticos de lenguajes fragmentarios determinados que han sugerido las gramáticas transformacionales, si bien tienen éxito a la hora de caracterizar el conjunto de las sentencias declarativas de esas lenguas, resultarán tener poca relevancia semántica; y, particularmente, no veo ningún interés en la sintaxis si no es como algo preliminar a la semántica. 2Ït appears to me that the syntactic analyses of particular fragmentary languages that have been suggested by transformational grammarians, even if successful in correctly characterizing the declarative sentences of those languages, will prove to lack semantic relevance; and I fail to see any great interest in syntax except as a preliminary to semantics.

Estudiar la sintaxis sin la semántica es como analizar la estructura de un motor sin tener en cuenta que su objetivo es el movimiento, lo cual no sólo le quita sentido al estudio, sino que lo hace aún más complicado. El significado debe ser la base de cualquier acercamiento a la lengua.

Podemos recordar que los estudios sintactistas llevan años declarando la independencia de la sintaxis con respecto a la semántica. En los inicios de la corriente generativista [Chomsky, 1956Chomsky, 1957] y siguiendo las ideas de Zellig S. Harris, los estudios sintácticos no tenían en cuenta el contenido semántico a la hora de analizar sus estructuras. Citamos una aseveración rotunda de la obra de Noam Chomsky a la que estamos haciendo referencia [Chomsky, 1957]:

No conozco ningún intento detallado de desarrollar la teoría de la estructura sintáctica en términos parcialmente semánticos ni ninguna propuesta específica y rigurosa a favor del uso de información semántica en la construcción o evaluación de las gramáticas.

La afirmación es exagerada y errónea, como se puede comprobar simplemente revisando las categorías morfológicas aristotélicas, pero es una buena ilustración del pensamiento imperante. En las últimas revisiones de la teoría generativista, en concreto dentro del marco minimalista [Chomsky, 1995], el planteamiento es menos radical, pero se continúa diferenciando claramente entre lo que es la forma o sonido y lo que es el contenido o significado.

La segunda razón por la que no seguiremos un planteamiento semántico basado en la sintaxis es de carácter puramente práctico. No hemos encontrado ninguna teoría sintáctica que permita el etiquetado con garantías de un corpus no restringido. Esta realidad es clara cuando se trabaja con habla espontánea, la cual nos puede hacer dudar incluso de los conceptos más básicos y tradicionales de las teorías morfosintácticas [MSandoval, 2005].

Preferimos definir los tipos de semántica a través del concepto de significado que manejen, dejando a un lado las formas con las que se relacionan y, en la dirección opuesta, definir estas últimas según los criterios que nos faciliten los rasgos semánticos. A pesar de ello, debemos advertir que aún es frecuente en la literatura actual el uso de términos semánticos sobre una base claramente sintáctica.

Desde el punto de vista que nosotros adoptamos, se suelen dividir las concepciones del significado en dos grandes tradiciones. La primera, más propia del ámbito filosófico y de la lógica, entiende el significado como aquello que determina las condiciones de verdad y ha inspirado las teorías denominadas como teorías de verdad y teorías de modelos. La segunda concepción es más frecuente entre los trabajos de lingüistas, sicólogos e informáticos (inteligencia artificial en general), y entiende el significado como aquello que el receptor comprende cuando procesa las palabras que ha recibido. Como advierte Kamp [Kamp, 1981], ambas concepciones han estado casi siempre separadas a pesar de esfuerzos por unificarlas como el realizado por este autor y por los autores que mencionaremos en la sección 3.3, y el nuestro puede entenderse como un nuevo intento de acercamiento.

3.3. La semántica relacional

Las definiciones semánticas que manejaremos en nuestro etiquetado serán relacionales. El origen de este tipo de análisis con referencia a las lenguas naturales, englobados en lo que comúnmente se denomina como semántica formal, lo encontramos en los estudios del ya citado lógico Richard Montague [Montague, 1970], quien formuló rigurosamente las relaciones formales existentes entre las estructuras sintácticas y los sucesos que estas expresan. Sus ideas han sido posteriormente utilizadas y renovadas por un buen número de filósofos, lingüistas y lógicos.

La contraposición del tipo de estudios que nosotros seguimos con otros de tipo más puramente generativista ha pasado por momentos de cierta tensión intelectual, con ataques no siempre justos desde ambos bandos; sin embargo, parece claro que, dentro de la lingüística, su desarrollo surge de la confluencia entre la lógica filosófica (desarrollo de la semántica intensional con nombres como Frege, Tarski, Carnap, Davidson, Kripke, Hintikka y Kaplan) y precisamente la gramática generativa.

Como señalan Paul Portner y Barbara H. Partee como introducción a su excelente selección de artículos sobre la materia [Portner, 2002], los rasgos más característicos y duraderos del planteamiento de Montague han sido la importancia dada a las condiciones de verdad, la concepción teórica de modelos de la semántica y el protagonismo del principio de composicionalidad.

La semántica formal nació así en contraposición a otras aproximaciones al estudio del significado más sicológicas encabezadas por autores como Jerry Fodor [Fodor, 1975Katz, 1963], Ray Jackendoff [Jackendoff, 1983] y George Lakoff [Lakoff, 1970Lakoff, 1987]. El posicionamiento radicalmente matemático de los primeros autores de la semántica formal (Frege, Tarski, Carnap y el propio Montague) hizo que algunos llegaran a distinguir entre la semántica pura y el conocimiento semántico (knowledge of semantics). Esta distinción refleja también la separación existente entre la idea anterior de que la semántica era un nivel de representación similar al fonológico o al sintáctico [Katz, 1963Newmeyer, 1980Harris, 1993] y la idea de que la semántica formal no es representacional, sino que sigue la teoría de modelos. Una aproximación que siga la teoría de modelos con ortodoxia no planteará la semántica como la relación entre expresiones y conceptos, sino entre expresiones y elementos de modelos mentales. Estos elementos pueden ser, por poner un ejemplo, valores de verdad y propiedades.

El acercamiento de Montague lleva a lo que Bach (1976) denominó la “rule to rule”, la correspondencia de reglas entre la semántica y la sintaxis. Así como las reglas sintácticas unen expresiones para formar otras más complejas, reglas semánticas paralelas interpretarán el todo composicionalmente a partir de la interpretación de las subpartes.

La gramática de inspiración montagueana ha sido desarrollada por multitud de autores ya desde los años 70 (para una revisión de esa década de trabajo, donde destacaron Michael Bennett, Barbara Partee, Greg Carlson, David Dowty, Lauri Karttunen y Emmon Bach entre otros, recomendamos la colección de Partee titulada Montague Grammar [Partee, 1976]).

Su uso se combinó con distintas visiones sintácticas preexistentes, surgiendo así nuevas teorías como la Generalized Phrase Structure Grammar [Gazdar, 1982Gazdar,1985], Categorial Grammar [Bach, 1984Chierchia, 1984], Head-Driven Phrase Structure Grammar [Pollard, 1994] y las Tree Adjunction Grammars [Joshi, 1985], todas ellas gramáticas no transformacionales 3Son más frecuentemente citadas por sus respectivas siglas: GPSG, CG, HPSG y TAG. . Al mismo tiempo y, sobre todo, a partir de los años 80, otros estudiosos han probado a integrar la semántica formal dentro de la teoría transformacional con trabajos como los de Heim [Heim, 1983Heim, 1983b] y Partee [Partee, 1976Partee, 1984].

Paralelamente, la gramática montagueana se fue escindiendo en diversas teorías. Especial importancia tienen la semántica dinámica, que estudia el significado como la contribución que una expresión hace a la información existente en un contexto [Stalnaker, 1978Lewis, 1979] y que tiene claros precursores en la sicología y en la pragmática [Clark, 1977], y la semántica situacional [Barwise, 1983] que, al igual que la semántica davidsoniana, no se basa en una teoría de modelos de mundos, sino de “situaciones posibles”.

Por último dentro de esta brevísima introducción a este tipo de estudios semánticos, señalaremos que, como es normal en estos desarrollos, el de la semántica formal tiene parientes en otras disciplinas entre los que puede ser especialmente interesante la pragmática formal por el hecho de compartir estudiosos con la nuestra y por la frecuencia con la que ambas se influyen. Casos de autores que hayan ayudado al avance en ambos campos son los de Karttunnen y Peters [Karttunen, 1979], Keenan [Keenan, 1971] y Heim [Heim, 1983b], todos ellos centrados en los problemas de las presuposiciones.

Nosotros procuraremos mantenernos dentro de la idea de la Lógica natural propuesta por George Lakoff [Lakoff, 1970], la cual implica un lenguaje formal motivado empíricamente por las lenguas naturales y que busca evidencia en estas para desarrollar sus principios y formalismos.

En nuestro planteamiento, propio de la semántica teórica de modelos, los significados serán relaciones y tomaremos el evento como unidad de análisis. Siguiendo a Bouchard [Bouchard, 1995] y Moreno Cabrera [MCabrera, 1985MCabrera, 1991bMCabrera, 1997MCabrera, 2004], partiremos de la idea de que las lenguas no expresan directamente eventos, sino que únicamente proporcionan un esbozo abstracto sobre el que después se sitúan los conocimientos del mundo. El significado, por lo tanto, carece de contenido sustantivo: lo que analizamos en él es la relación formal que posibilita la conexión entre la estructura sintáctica y el evento, algo así como el esqueleto de la comunicación.

Esta definición nos permite evitar la conocida paradoja de Searle [Searle, 1972], que Moreno Cabrera resume del siguiente modo:

Si decimos que la entidad S es el significado de la expresión X, entonces surge la siguiente pregunta: ¿qué significa S?

3.4. Eventos

Si nuestra anotación y nuestro análisis gira en torno al concepto de evento, debemos comenzar aclarando nuestro uso de este término puesto que no hay un consenso generalizado en la literatura especializada.

Denominamos evento en un sentido equivalente a lo que en Moreno Cabrera (2004) se define como suceso:

[Sucesos/eventos] son las categorías lingüístico/cognitivas mediante las que clasificamos las expresiones que describen diversos tipos de situaciones. Los estados se conciben como resultado de las operaciones de situación y los procesos y acciones como resultado de la operación de ocupación.

No se debe confundir con el sentido que le dan otros autores, como por ejemplo Emmon Bach (1986), que lo utilizan para denominar lo que nosotros definiremos más abajo como acciones 4Nuestra preferencia por el término evento en detrimento de suceso, que es el que se utiliza en la bibliografía que más fielmente seguimos, se debe a varios motivos. En primer lugar, evento tiene una tradición más extendida en la literatura sobre el tema. Una razón para cambiarlo por suceso es evitar el calco de su origen, la palabra event de la bibliografía anglosajona. Sin embargo, consideramos que tanto event como suceso contienen en su significado la idea de sucedido y, por lo tanto, son demasiado específicos para englobar todos los tipos de eventos que deseamos. Evento es para nosotros un calco que nos permite reunir en una sola palabra todas las situaciones que queremos estudiar. Además, su semejanza con la terminología inglesa permite relacionar ambas ideas de forma directa y fácil. .

También el modelo que seguimos, basado en la lógica relacional, ha sido denominado de diversas maneras que queremos explicitar para dejar lo más claro posible el tipo de estudios entre los que se enmarca nuestro análisis. Bouchard [Bouchard, 1995] la denominó semántica mentalista selectiva, Moreno Cabrera [MCabrera, 1997] semántica de esquemas eventivos, y fue P. M. Postal [Postal, 1971] quien propuso por primera vez la denominación de semántica relacional.

El número ideal de tipos de eventos ha sido un tema de discusión recurrente en la literatura sobre semántica relacional y se han propuesto sistemas con distinta complejidad tipológica. El acercamiento de Moreno Cabrera, como el de Bouchard, es minimalista si consideramos que reduce la famosa clasificación de Vendler (1973) a sólo tres clases mayores que permitirán duplicar su especificidad en una subdivisión posterior. Esta cualidad y su definición formal, que facilita su relación con la infinidad de tipos que encontramos en la realidad extralingüística, nos permiten manejar un etiquetado viable, eficiente y exento de ambigüedades.

Los tipos que utilizamos son los estados, los procesos y las acciones. Este sistema trimembre ha sido propuesto con distintos matices por varios autores como John Lyons [Lyons, 1977], S. C. Dik [Dik, 1978Dik, 1997], David R. Dowty [Dowty, 1977] y Chafe [Chafe, 1976]. Este último, el más antiguo de los citados, llegó a titular un capítulo con esta tricotomía, pero sin establecer una distinción real: para él, el esquema de un estado y el de un proceso están compuestos por un verbo y un agente, mientras que el de las acciones es un agente y un paciente.

La reducción de la clasificación de Vendler se debe a la consideración de que sus actividades, logros y realizaciones pueden tratarse como procesos o acciones. De un modo similar a como Chafe (1976) trata el dinamismo entre tipos de eventos, nuestra tipología trimembre se fundamenta en una visión composicional de las diferentes situaciones, que podemos utilizar gracias a las características de la lógica de cálculo de predicados de primer orden. Esta composicionalidad la resumimos en el siguiente esquema:

Estado = Entidad + Propiedad Proceso = Estado Origen >Estado Final Acción = Agente + Proceso

Esta estructura nos permite establecer la siguiente jerarquía universal de composicionalidad [MCabrera, 1997]:

Acciones >Procesos >Estados

Los eventos estados, que representamos con la letra E, plantean una relación entre entidades y propiedades. La oración 1 nos sirve de ejemplo:

(1)

yo soy una enciclopedia andante[efamcv07].

En ella, se expresa un estado en el que la entidad denotada por “yo” tiene la propiedad de ser “una enciclopedia andante”. Siguiendo a Richard Montague (1970), podemos representar los eventos estado del siguiente modo:

E: Ser(yo, una enciclopedia andante)

Donde la clase eventiva del estado se representa mediante el infinitivo Ser y precede a una fórmula en la que el primer elemento es la entidad y el segundo la propiedad. Como se aprecia en el ejemplo, los predicados que denotan estados son bivalentes, con un argumento para la entidad de la que predicamos una cualidad y con otro para expresar esta. Distinguiremos entre estados atributivos cuando el segundo estado sea una propiedad y estados locativos cuando sea la localización en la que se encuentre la entidad. 1 es un ejemplo de atribución y 2 es uno de estado locativo:

(2)

ella sigue estando ahí[efamcv02].

La siguiente clase eventiva, de mayor complejidad, es la de los procesos. Estos eventos reflejan una transición de una o más entidades entre estados. El símbolo con el que lo representamos es la P. Un proceso engloba los estados del siguiente modo:

(3) a.

allí pues llegamos[efamdl05]. La oración tal como aparece en el corpus es “allí pues llegamos a las dos o por ahí”. Hemos omitido el final por no ser relevante para el tipo eventivo. Esta clase de informaciones externas al núcleo del evento se analizarán, como veremos en la siguiente sección, como relaciones indirectas.

b.

P: Llegar(no estar(nosotros,allí), estar(nosotros,allí))

De este modo, el modelo expresa una transición mediante la cual “nosotros” ha pasado de un estado inicial en el que no estaba allí a un estado final en el que sí está allí. Como veremos en la sección 3.6, “nosotros” en SESCO será una constante deducida a partir de la persona del verbo.

Los procesos son definidos composicionalmente a partir de sólo dos estados, uno inicial y otro final, sin tener en cuenta la posibilidad de estados intermedios. Si analizamos “un individuo va desde Buenos Aires a Barcelona”, no representamos los estados intermedios por los que pasa, sino sólo el inicial (con el individuo en la capital argentina) y el final (con el individuo en Barcelona). El problema de la transición entre estados ha sido largamente debatido (recomendamos el texto clásico de Dowty (1977), pero también Vendler (1973), Partee (1984), von Wright (1968), Moreno Cabrera (1997)) y claramente expuesto por David R. Dowty a propósito del estudio de lo que él denominó the imperfective paradox. Esta paradoja está relacionada con un tipo de sintagmas verbales llamados de realización (accomplishment) que se caracterizan por el hecho de no permitir el paso de los tiempos progresivos a los tiempos simples. En el siguiente ejemplo tomado de su artículo, comprobamos cómo dibujar es un sintagma verbal de realización porque la inferencia de 4a. a 4b. no es necesaria.

(4) a.

Juan estaba dibujando un círculoJohn was drawing a circle.

b.

Juan dibujó un círculo

Sin embargo y coincidiendo con las reflexiones de Dowty, proponemos un análisis que obvia esta problemática y que supone que todo verbo que expresa un proceso se define a través de un cambio de estado. De este modo, el estado final (en este caso, el expresado por 4b.) se requiere aun cuando reconocemos que en la realidad pueda no llegar a existir. Esta postura supone una reducción que equipara los verbos de realización con otros que no lo son (por ejemplo, los que Vendler (1967) denomina actividades), pero estas distinciones podrán realizarse a través de las bases según explicaremos también en la sección 3.6.

Creemos que Dowty muestra en el artículo citado pruebas suficientes para justificar nuestra postura y la subsecuente separación entre el análisis semántico y lo que realmente ocurre. Citaremos, a modo de ejemplo, aquellos casos en que expresamos la realización de una acción por el mero hecho de que su agente tiene la intención de llevarla a cabo. Así, podríamos emitir 4a. simplemente porque alguien ha visto a Juan meditativo observando una hoja en blanco con un compás en la mano y nos ha preguntado qué era lo que estaba haciendo. Nuestra respuesta no implica que en la realidad el círculo pase de no existir a sí hacerlo, pero es el modo más idóneo que encontramos para definir la acción expresada.

Dowty justifica aún este análisis con otra reflexión. Para él, el estado final que define el proceso expresado por un sintagma verbal de realización no tiene por qué darse en el mundo real, sino que basta con que sea posible (es decir, que se dé) en otros mundos paralelos que sean idénticos a él hasta el momento en que ocurre el estado original del cambio.

Al igual que tenemos dos tipos de estados, Juan Carlos Moreno Cabrera distingue los procesos que son desplazamientos de los que son mutaciones [MCabrera, 1997] según reflejen un cambio de localización o de cualidad. Nosotros respetaremos esta distinción, pero preferiremos referirnos a ellos como transiciones locativas y transiciones cualitativas de modo que sea más transparente que ambos tipos pertenecen a una misma clase de evento y que no excluimos aquellos procesos que no son mutaciones de una entidad, sino su creación o desaparición, como en la oración 5.

(5)

y qué pasa?

La tercera y última clase de eventos es la de las acciones. Una acción es un proceso dominado por un agente, entidad que provoca la transición entre los estados. La representaremos mediante la letra A:

(6) a.

que el Ayuntamiento pues diseñe este tipo de aparcamientos

b.

A: diseñar(el ayuntamiento, P(E(este tipo de aparcamientos, no diseñado), E(este tipo de aparcamientos, diseñado)))

Las acciones las subdividiremos en dos tipos [MCabrera, 1997MCabrera, 2004]: las acciones efectuadoras cuando suponen la creación del paciente (por ejemplo en 6) y las acciones afectadoras cuando realizan un cambio sobre el paciente (por ejemplo “yo eché castañas pilongas” ).

Debemos señalar que, a diferencia de lo propuesto en las obras citadas y que seguimos para el resto del planteamiento, nosotros consideraremos también acciones aquellos eventos expresados en tiempo progresivo. Moreno Cabrera, al igual que Mateu Fontanals y Amadas Simon [Mateu, 1999b], defiende su análisis como estados a partir del siguiente ejemplo cuya representación copiamos del autor en 7b.:

(7) a.

Juan está leyendo el periódico

b.

Een(Juan,[=>leído(pm)=>,...,=>leído(pp)=>])

Este tipo de procesos se denominan abiertos porque carecen de estado final y, frecuentemente, también del inicial. La definición de acción que estos autores utilizan implica una relación entre un agente y un proceso cerrado. Si el proceso es abierto, la entidad agentiva deja de serlo para convertirse en un controlador del proceso: está presente durante la transición. Esto último es lo que permite el análisis como estado ya que el hecho de que la entidad “esté presente” no es otra cosa sino un estado locativo. Parafraseamos la fórmula de 7b. del siguiente modo: hay un estado locativo en el que Juan se encuentra presente en el proceso de ser leído el periódico, algo que es consecuente con el análisis del verbo “estar” cuando este aparece solo.

Una vez expuesto este planteamiento, defendemos el nuestro remitiéndonos a lo dicho anteriormente con relación a los procesos y a la imperfective paradox expuesta por Dowty. Debemos añadir que el análisis como estado no refleja fielmente un rasgo fundamental del evento expresado, esto es, que “Juan” no es un controlador del proceso, sino que es el agente que lo provoca. En nuestra opinión, 7b. no permite distinguir entre la oración de 7a. y la de 8:

(8)

Juan está en la lectura del periódico.

Por otro lado y realizando una consideración práctica con vistas al trabajo con corpus, el otro acercamiento obliga a establecer que todos los verbos que expresan acciones también pueden eventualmente expresar estados, provocando una ambigüedad grave a la hora de su análisis. Un ejemplo de este problema nos lo ofrece la siguiente variación de 8:

(9)

estuve mirando lo de los proyectos Profit

Parece claro que el hecho de que “lo de los proyectos Profit” fuera leído desde la primera página hasta la última no es relevante para la interpretación de esta oración como una acción. Se detuviera el agente en leerlo entero o simplemente ojeara los titulares, el evento expresado muestra que el texto pasó de no estar leído a sí estarlo en alguna medida, ya que contamos con los argumentos típicos de cualquier acción y un agente que mira.

Por último con respecto a las definiciones de los eventos, debemos advertir que, aunque hasta el momento nos hemos referido a los elementos analizados con la denominación de eventos, este uso del término es simplificador. En realidad, los análisis proporcionados en las secciones precedentes, a diferencia de los ejemplos, no lo son de eventos, sino de tipos eventivos.

Un tipo eventivo es un modelo de evento que no se concreta espacio-temporalmente. La fórmula Ser(yo, una enciclopedia andante) representa un tipo eventivo que podríamos parafrasear como “yo ser una enciclopedia andante” ya que no está indicada la información de cuándo tiene lugar el supuesto evento mientras que es claro que un evento tiene que suceder en algún momento obligatoriamente para poder ser tal.

Greg Carlson (1998) explica la distinción entre eventos y tipos eventivos del siguiente modo:

Entiendo por “evento” un constituyente efímero y limitado espacial y temporalmente que solamente tiene una ocurrencia. Debe de diferenciarse de los tipos eventivos que, a diferencia de los eventos, pueden ocurrir y reocurrir .

Moreno Cabrera (1997) representa la fórmula del evento del siguiente modo:

3eR(e, TE)

Y desarrolla:

e denota una variable sobre eventos concretos y R denota la relación que se da entre un evento concreto y un tipo eventivo. La leemos como existe un evento e que realiza (R) un tipo eventivo TE.

Para determinar el tiempo del evento, tomamos como punto de referencia el momento en que se produce el acto de habla. La falta de otros puntos de referencia se debe a la complejidad de los textos de habla espontánea, en los que el cambio de tópico y de referentes es casi constante. Como ocurre con los demás aspectos del sistema, también aquí hemos optado por simplificar. Para una revisión del estado actual de la cuestión y una propuesta de mayor complejidad, recomendamos las publicaciones del proyecto TimeML [TimeML].

El tiempo pasado es para nosotros todo aquel que precede a la producción del mensaje lingüístico, el tiempo presente es el relativamente simultáneo a dicha producción y el tiempo futuro es el posterior al acto de habla. Aunque el caso más claro es el del presente, los tres rangos son en realidad relativos y dependen de la percepción de los interlocutores. De este modo, los límites entre presente y pasado o futuro no empiezan necesariamente donde termina el instante mismo de la enunciación y no hacen referencia a puntos concretos en el tiempo, sino a espacios temporales flexibles.

Con la tipología eventiva presentada en esta sección así como con la interpretación que de ella estamos proponiendo es posible estructurar cualquier producción lingüística. Como primera muestra de ello, citaremos el problema, señalado por Mateu (1999), del análisis de los ejemplos de 10 tomados de Ray Jackendoff (1990).

(10) a.

The chimney smoke.

b.

The chimney gave smoke off.

c.

The smoke went out of the chimney.

Mateu Fontanals advierte del conflicto para la visión uniforme de la relación semántica-sintaxis que constituye el análisis de 10a. por Jackendoff, que copiamos a continuación:

(11)

CS: [GO([SMOKE],[FROM[IN[CHIMNEY]]])]

Comprobamos que el análisis de su CS(Conceptual Structure) no tiene paralelismo con su representación sintáctica y, además, la equipara con 10b. y 10c. . Mateu Fontanals advierte de que, a pesar de este análisis, se trata de oraciones sintácticamente diferentes puesto que representan modelos de inergatividad, transitividad e inacusatividad.

En la tipología que nosotros presentamos, las tres oraciones se corresponden con tres estructuras semánticas distintas: un estado, una acción y un proceso respectivamente. En el primer ejemplo, se nos presenta un estado en el que la chimenea humea. En 10b., la chimenea es la agente de una acción que consiste en expulsar el humo. Por último, the smoke went out of the chimney expresa una transición locativa en la que el humo pasa de estar dentro de la chimenea a estar fuera de esta.

Estamos denominando a los tres extractos del ejemplo 10 oraciones obviando la controversia que conlleva este término. El tema es aún más complejo cuando se trata de textos de habla espontánea que, como veremos en la segunda parte del libro, acostumbran a aparecer sin ni tan siquiera un verbo. El problema es grave si consideramos que es uno de los conceptos sobre los que se sustentan las gramáticas de todas las lenguas (a pesar de que la realidad de una oración suele variar dramáticamente de una a otra).

Una solución conocida a la aparente ausencia de oraciones en la lengua hablada es su análisis en sintagmas y sintagmas complejos que surgen de la combinación de los primeros [Halliday, 1989]. Sin embargo, no podemos aceptar esta propuesta porque desgraciadamente no resuelve el mayor problema, esto es, la decisión de cómo dividir el texto en unidades menores a un discurso o un texto entero, pero aún completas semánticamente.

Miller (1998) cita otros conceptos que se han propuesto para sustituir al de oración: idea unit [Kroll, 1977], turn unit, tone unit [Quirk, 1985Cresti, 2000], inter alias, t-unit [Hunt, 1966] y utterance [Crookes, 1990Cresti, 2000]. Ninguno de los términos citados cumple la finalidad que buscamos para nuestra gramática y se fundamentan en conceptos prosódicos que no son regulares. Como señala Crystal [Crystal, 1987], son frecuentes las pausas entonativas que no se corresponden con estructuras completas así como hay textos amplios sin pausas que, al traducirlos a lenguaje escrito, se convertirían en varias oraciones (muy frecuente en los monólogos). Lo observamos en las transcripciones originales de C-ORAL-ROM (aquí presentamos una muestra en el apéndice A.1) en las que ni las proferencias ni las unidades tonales siguen unos patrones fácilmente trasladables a términos sintácticos o semánticos.

Nuestra solución proviene de la descripción que estamos dando de los eventos, la cual nos permite proponer aquí una definición del concepto de oración más adecuada para los corpus:

Una oración es toda estructura morfosintáctica que expresa un evento completo. El significado de la oración es la relación veritativa que posee con la situación que expresa.

De este modo, evento y oración quedan unidos: el primero es la estructura semántica del segundo mientras que éste es la estructura morfosintáctica del primero.

3.5. Argumentos y relaciones indirectas

Como hemos señalado anteriormente, los tres tipos de eventos pueden subdividirse a su vez en pares más específicos. Esta subclasificación depende directamente del tipo de argumentos que conlleven.

Todas las lenguas naturales que se han estudiado hasta el momento tienen como núcleo de su estructura semántica la forma de predicado y argumentos [Jurafsky, 2000]. Hemos tenido acceso a estudios en los que se relacionan listas de palabras con aquellos argumentos que pueden tomar cada una de ellas [Fillmore, 2001], pero este es un trabajo que hasta la fecha no se ha realizado con corpus amplios del español . Esta clase de aproximaciones permiten predecir los argumentos que pueden aparecer junto con un verbo y, a su vez, permiten especificar el significado de un verbo por medio de los argumentos que utiliza. Todos asumen la existencia de una relación clara entre la función semántica que tiene cada argumento y el tipo de evento al que pertenece [MCabrera, 1991a].

El estudio de los argumentos se ha englobado tradicionalmente dentro del de la noción semántica de caso, introducida por Fillmore (1968) y que se basa en el uso de un sistema general de dependencias para expresar las conexiones entre una relación semántica y sus argumentos. Las teorías sobre los casos son abundantes y tienen una larga tradición [Hjelmslev, 1978Samlowsky, 1976] y presentan sistemas con distintas cantidades de tipos. Para nosotros, es útil la distinción entre aquellos autores que establecen un sistema casual concreto al menos para una lengua (p. ej. [Hjelmslev, 1978]) de aquellos otros que varían la definición de los casos dependiendo del dominio sobre el que se trabaje (p. ej. [Thayse, 1991]). Nosotros nos mantendremos en el camino iniciado por los primeros.

Para profundizar en la problemática de los argumentos, presentamos a continuación los siguientes tres principios que propuso Joan Bresnan (1982) con relación a los papeles temáticos:

1.
Coherencia: dos papeles distintos no pueden ser asignados al mismo argumento.
2.
Completitud: cada argumento debe tener asignado un papel.
3.
Unicidad: cada argumento tiene asignado un papel único (con respecto a los otros argumentos del mismo predicado).

Este último principio hace que Greg Carlson (1998) interprete algunas oraciones aparentemente sencillas con un análisis que las divide en varios eventos distintos. El autor propone el siguiente ejemplo:

(12)

Cinco chicos llevaron un piano arriba de las escaleras .

La oración es ambigua y permite dos interpretaciones diferentes a partir de los agentes de la acción. El primer sentido entiende “cinco chicos” como un grupo, esto es, los cinco chicos suben juntos un único piano. El segundo sentido es el distributivo, en el que cada chico se esfuerza en subir un piano distinto. Esta última interpretación implicaría cinco eventos diferentes. Carlson formaliza los dos sentidos del siguiente modo:

(13) a.

3e[llevar(e) & Agente (e, cinco chicos) & Tema (e, piano)]

b.

Cinco x [3e[llevar(e) & Agente (e, cinco chicos) & Tema (e, piano)]]

No desgranaremos ahora los detalles de la formalización neodavidsoniana que propone, muy similar a la nuestra. Sin embargo, sí señalaremos que la segunda interpretación nos parece problemática por varios motivos. En primer lugar por su importancia, dificulta el paralelismo que defendemos entre las reglas semánticas y las sintácticas hasta el punto que de un sólo predicado debemos derivar cinco estructuras eventivas (o mil en el caso de “Mil hombres llevaban una embarcación de gran tamaño”).

En segundo lugar, la disgregación de la oración en varios eventos no añade información estructural al análisis ya que son el mismo evento repetido e idéntico. Tendremos la misma predicación, el mismo tipo de Agente y el mismo Tema en todos ellos.

Finalmente, pensamos que la desambiguación de este tipo de oraciones no debe realizarse en el nivel de análisis que nosotros planteamos. Conocer si realmente eran mil hombres en una embarcación o mil hombres en mil embarcaciones (cada uno en una) no afecta en ningún modo a la estructura del evento “llevar”, que es lo que realmente nos interesa aquí. Su desambiguación dependerá de otros elementos externos al análisis eventivo tales como que una embarcación de gran tamaño requiera de más de un hombre para ser llevada, o que este tipo de frases épicas tiendan a la exageración de las capacidades de los héroes que en ellas aparecen, capaces incluso de llevar grandes embarcaciones por sí solos.

Para los análisis, necesitamos cinco tipos distintos de argumentos. Aunque ya hemos hecho referencia a todos ellos anteriormente, los definiremos ahora de forma sistemática:

Por último sobre los argumentos, señalaremos una cualidad que afecta directamente al tipo eventivo en el que se enmarcan. Nos referimos a su definitud. Una acción o un proceso será télico si su estado resultante es definido [MCabrera, 1997], y este lo será si la entidad y la cualidad denotadas en él también lo son. Si esta última condición no se cumple, tendremos un estado indefinido y un proceso o una acción atélicos.

Además de estos argumentos, contaremos con la posibilidad de incluir en nuestros análisis relaciones indirectas [MCabrera, 1997], esto es, relaciones que no son partes imprescindibles de la estructura eventiva como los argumentos, sino contingentes y que no pertenecen a lo que denominaremos el núcleo del evento, formado sólo por el predicado y sus argumentos (como vimos en la figura 3.1 de la página §).

Las relaciones indirectas pueden ser de muy diversos tipos y su clasificación depende del grado de especificidad que se quiera adoptar. Analizaremos a continuación dos relaciones a modo de ejemplo.

En ambos casos, se ha relacionado un evento con una entidad externa que ha concretado la localización (en el primer ejemplo) y el instrumento (en el segundo).

Juan Carlos Moreno Cabrera (1997) propone cinco tipos de relaciones indirectas: instrumentales, de origen, de destino, de modo y de compañía. Otros autores han propuesto clasificaciones más exhaustivas (p. ej. Croft (1991)) y, como se ha señalado ya, el número depende fundamentalmente de la profundidad de detalle que se quiera establecer.

Aquí se ha optado por una posición intermedia en la que partimos de sólo tres grandes grupos (de origen, de concomitancia y de destino) que pueden especificarse en subtipos en un segundo nivel de análisis. La distinción entre las tres grandes clases viene definida temporalmente tomando el predicado como referencia, pero se interpreta de una forma amplia. Así, por ejemplo, las relaciones indirectas de origen, esto es, las que se relacionan con el tiempo anterior al predicado, no sólo admiten relaciones temporales, sino también otras que preceden igualmente a la predicación como son la causalidad, la condición o el origen espacial. Las relaciones de concomitancia incluyen la instrumental y la de localización (espacial o temporal) del evento. Por último, las relaciones posteriores al evento (de destino) incluyen, por ejemplo, de finalidad o benefactivas. En el apéndice C, exponemos como modelo una relación completa de aquellos subtipos que hemos tenido en cuenta en la anotación de nuestros corpus.

3.6. Relaciones abstractas

Hemos definido dos de los tres tipos eventivos a través de otros tipos más simples. Las acciones son eventos compuestos por un agente y un proceso así como los procesos lo son por dos estados.

Estas subpartes de las que se compone un evento y que tienen a su vez estructura eventiva no son eventos, sino relaciones abstractas. Una relación abstracta se diferencia de un evento en que su predicado no está expresado de ningún modo en el discurso. Desglosamos a continuación el análisis del ejemplo número 3 que veíamos mas arriba:

P: Llegar
[
E: no estar(nosotros,allí)
E: estar(nosotros,allí)
]

Los subestados no estar(nosotros,allí) y estar(nosotros,allí) son ejemplos típicos de relaciones abstractas puesto que sus predicados (estar con valor negativo y positivo) no son análisis directos del discurso, sino de la estructura del evento llegar.

Estos predicados de las relaciones abstractas se denominan bases de las relaciones y existen en una variedad muy pequeña puesto que no pueden contradecir la universalidad del sistema, esto es, deben servir para definir eventos expresados en cualquier lengua.

En el estudio de Alcántara y Bertomeu (2005), se muestra que más del 90% de los eventos elididos en los corpus que manejamos en este libro (presentados anteriormente en las secciones 2.4.1 y 2.4.2) se corresponden con cuatro estados muy generales con poco contenido léxico, en concreto de los predicados ser, estar, tener y haber, con el sentido que explicaremos a continuación. Esto parece indicar que son los predicados más esenciales y, por lo tanto, los que se toman por defecto en caso de que ninguno se exprese explicitamente y de que el discurso no permita ninguna recuperación anafórica.

Podemos definir todos los procesos y acciones utilizando estos cuatro predicados esenciales como bases. Los definimos de la siguiente forma:

1.
ser: Base de relación abstracta con estructura de estado atributivo. Conforma aquellos procesos que implican la creación de la entidad o las entidades a las que hace referencia el primer argumento del estado. Por este motivo, se utiliza también para definir acciones efectuadoras.
En 14, la enunciación que era un gol que era válido pasa de no existir a sí hacerlo gracias a que unos agentes lo decían.

(14)

que decían que era un gol que era válido

Su estructura es:

A: Decir
[
P: Decir
[
E: no ser(que era un gol que era válido,DICHO)
E: ser(que era un gol que era válido,DICHO)
]
]

2.
haber: Base de relación abstracta con estructura de estado locativo. A diferencia de la base ser, estar no implica la creación de entidades, sino su cambio de localización. Se utiliza para definir las transiciones locativas y las acciones afectadoras que contienen procesos de este tipo.
En el ejemplo 15, el subcomandante Marcos pasa de no estar en la plaza El Zócalo de Ciudad de México a sí estarlo el once de marzo. Por lo tanto, el subcomandante Marcos no se crea por medio de este proceso, sino que se mueve de una localización a otra.

(15)

el subcomandante Marcos llegaba el once de marzo a la plaza El Zócalo de Ciudad de México

Lo analizamos del siguiente modo:

P: Llegar
[
E: no haber(el subcomandante Marcos,la plaza El Zócalo de Ciudad de México)
E: haber(el subcomandante Marcos,la plaza El Zócalo de Ciudad de México)
]
el once de marzo

3.
estar: Similar a haber, pero con estructura de estado atributivo. Los procesos y las acciones de las que forma parte implican el cambio de cualidades en las entidades. Por lo tanto, se utiliza en las transiciones cualitativas y las acciones afectadoras que contienen procesos de este tipo.
En 16, la entidad a la que hace referencia el me pasa de no estar constipada a sí estarlo, sufriendo así una transición cualitativa.

(16)

me he constipado

El análisis sería el siguiente:

P: Constiparse
[
E: no estar(me,CONSTIPADO)
E: estar(me,CONSTIPADO)
]

4.
tener: Base de relación abstracta con estructura de estado atributivo. Se utiliza en aquellos procesos o acciones en los que una entidad adquiere o pierde una posesión. En realidad, es una subclase de las relaciones que hemos analizado utilizando la base estar, pero que nos permite distinguir entre casos en los que la entidad tiene la cualidad en sí misma o simplemente la incluye entre sus posesiones.

17 es un ejemplo que analizamos debajo:

(17)

me cogido unas pelis de vídeo

A: Coger
[
P: Coger
[
E: no tener(me,unas pelis de vídeo)
E: tener(me,unas pelis de vídeo)
]

En el etiquetado que presentaremos en el capítulo 4, veremos que la frecuencia de estas distintas relaciones abstractas es muy variada, destacando “ser” con el 27,3% del total de los subeventos (es decir, en 2008 casos) y “estar” con el 36,6% (2693 casos).

Las bases no son los únicos elementos abstractos, además de la propia estructura eventiva, que están presentes en estas relaciones. Si nos fijamos en el ejemplo 14, observamos que el segundo argumento de estos estados (es decir, el de la propiedad) tampoco aparece en la oración original. En estos casos en los que el segundo argumento del estado se deriva del predicado, utilizamos unas constantes que diferenciaremos por estar escritas entre paréntesis y en mayúsculas. El uso de los participios de los predicados que encontramos en las bases son un modo cómodo de asegurarnos que siempre utilizaremos las mismas constantes con cada predicado sin confundir los matices de verbos similares.

Es importante señalar que ni las bases ni las constantes que utilizamos con ellas son, a diferencia de lo que ocurre con los predicados y con los demás argumentos, las palabras del castellano que utilizamos para representarlas. Como acabamos de ver, las bases tienen unos sentidos muy concretos, no ambiguos y establecidos por las definiciones que aquí les estamos dando, no por aquellas que se puedan encontrar en cualquier diccionario de castellano. Las constantes deben de ser interpretadas del mismo modo. Una constante no es el participio de un predicado, sino un concepto abstracto que representa la propiedad que aparece relacionada en el estado con la/s entidad/es del primer argumento. Más adelante (en la sección 4.2) comprobaremos que este tipo de constantes no tienen siempre la forma de participios, sino que también pueden aparecer con formas más intuitivamente arbitrarias. La preferencia de CONSTIPADO en lugar de, por ejemplo, XY295 sólo se debe a que la primera es más fácil de memorizar y más difícil de confundir con la constante de otro predicado (que podría ser, por ejemplo, XY296).

3.7. Los eventos en el discurso

Volver al índice -- Capítulo siguiente: El etiquetado con información semántica