5

Estructuras sintácticas

El diseño de un corpus anotado tiene siempre la finalidad de permitir la extracción de información para su estudio. Nosotros propondremos en los capítulos siguientes el ejemplo de una gramática básica del español hablado basada en la parte de nuestro corpus descrita en la sección 2.4.1. Se trata de una gramática limitada a la lengua de nuestro corpus. Por ese motivo, sus conclusiones no son necesariamente extrapolables a toda la lengua española, pero son indudablemente parte de ella. Hemos visto que el corpus es variado y nosotros creemos que suficiente para poder sacar conclusiones válidas al menos para el estudio de las estructuras más frecuentes.

La motivación para realizar esta gramática surgió precisamente del trabajo dentro del grupo de investigación español del proyecto europeo C-ORAL-ROM en la fase del etiquetado morfosintáctico del corpus de habla espontánea. En dicho trabajo, tuvimos que diseñar un conjunto de etiquetas para anotar la información morfosintáctica y pronto descubrimos, con cierta sorpresa, hasta qué punto las clasificaciones tradicionales eran inconsistentes en cuanto a los criterios por los que definían sus categorías. Esta sorpresa no es exclusiva del español. Como muestra, fue imposible llegar a un compromiso entre los cuatro grupos del proyecto para el conjunto de etiquetas por problemas con las respectivas tradiciones que se derivaban de la incapacidad de racionalizar los criterios.

Algunas categorías suelen describirse de acuerdo a justificaciones puramente morfosintácticas en el caso del español, como ocurre con los verbos (aquellas palabras con conjugación que concuerdan con el sujeto en número y persona), mientras que otras se definen según planteamientos claramente semánticos, como es el caso de la diferenciación entre nombres y adjetivos. El caso que consideramos más grave es el del grupo de palabras denominadas adverbios, cuya definición es siempre excesivamente amplia y permite incluir una gran heterogeneidad entre la que caben casos como “allí”, “rápidamente” y “muy” que apenas comparten rasgos entre sí y que pueden aparecer juntas (el análisis de “Fue allí muy rápidamente” es “verbo adverbio adverbio adverbio”, lo que es escasamente informativo). Ignacio Bosque alude con claridad a este problema en su libro sobre las categorías gramaticales [Bosque, 1990]:

El problema de las categorías gramaticales está aún lejos de ser resuelto. Casi todos los autores modernos reconocen que las listas de clases de palabras con las que trabajan están basadas en una extraña mezcla de criterios [...] La paradoja habitual de las categorías gramaticales es precisamente que no existe autor ni escuela que no reconozca la dificultad de obtenerlas formalmente, mientras que a la vez son unidades básicas de análisis en casi todos los marcos teóricos.

Para el proyecto C-ORAL-ROM y con el fin de evitar en lo posible estos problemas, se decidió utilizar un planteamiento teórico basado en la semántica y muy próximo a la propuesta de Juan Carlos Moreno Cabrera (1991a,1997), asumiendo que las diferentes características semánticas se verían reflejadas en el comportamiento morfosintáctico de las palabras. Los detalles de dicho etiquetado se pueden encontrar en las especificaciones finales del proyecto [MSandoval, 2005].

La gramática que proponemos en este capítulo está basada en la misma teoría eventiva y, por lo tanto, comparte los fundamentos con la que ya desarrollamos para C-ORAL-ROM. Sin embargo, se diferenciará claramente de aquella por su base empírica y por el seguimiento radical de ese planteamiento. El conjunto de etiquetas del proyecto fue creado a priori para anotar el corpus; el nuestro, por el contrario, surgirá de un corpus etiquetado previamente con información de otro nivel lingüístico, semántico-oracional en lugar de morfosintáctico, y seguirá sin excepciones los resultados que el corpus nos ofrezca.

Una segunda diferencia consiste en que, mientras la versión antigua definía elementos centrados en la palabra, esto es, clase morfológica y flexión, nosotros partimos de unidades más grandes que se derivan de lo que las partes de nuestros eventos contienen. Siempre tendremos en mente el nivel oracional (o, más exactamente, proposicional), heredado de nuestra definición del concepto de oración (expuesta más arriba en la página §).

Ya vimos anteriormente que el planteamiento semántico nos obligaba a redefinir la idea de oración, difícil de aplicar en corpus de habla espontánea en su forma tradicional que, además, no podíamos aceptar aquí por tener una base sintáctica. Esta redefinición nos llevará inevitablemente a replantearnos también los conceptos de sintagmas y de clases de palabras. Recordamos el significado del término oración:

Una oración es toda estructura morfosintáctica que expresa un evento completo. El significado de la oración es la relación veritativa que posee con la situación que expresa.

Añadiremos que los valores de verdad están concebidos desde una perspectiva más amplia que atañe al discurso a pesar de tomar la oración como unidad de estudio equivalente al evento. Esto es así desde el momento que incluimos en nuestros análisis la interpretación de elementos que, como algunos usos de los pronombres (cuyos valores deícticos y anafóricos tratamos de forma similar, siguiendo a Kamp (1981)), conllevan enlaces anafóricos entre distintas oraciones.

No debe confundirse esto con la idea, expresada por Ramsay (1990) entre otros, de que el análisis del significado de una oración deba tener en cuenta de forma obligada la visión del mundo del hablante (la cual debería incluir también, para ser coherentes, la visión del oyente y el contexto comunicativo). Este tipo de análisis hace depender la interpretación del contenido de cada oración de la verificación de las presuposiciones del oyente. Sin embargo, cualquier hablante puede afirmar si una oración tiene sentido semántico o no incluso sin compartir con el emisor de dicha oración el conocimiento que autores como Allan Ramsay considerarían básico. Proponemos la interpretación descontextualizada del ejemplo 57 para -intentar- demostrar nuestra postura:

(57)

pero sabemos que el máximo va a ser muy difícil de conseguir 1[enatps01] .

No conocemos quiénes son los afortunados que saben que el máximo de algo que también ignoramos va a ser muy difícil de conseguir para alguien que tampoco podemos identificar. A pesar de que el ejemplo es extremo, es claro que 57 es una oración semántica y morfosintácticamente bien formada. No sólo eso: podemos definir su sentido con precisión. Esta oración expresa un estado en el que hay una entidad que tiene la propiedad de saber que en el futuro se dará un estado en el que el máximo tendrá la propiedad de ser muy difícil de conseguir. Como hemos visto en la primera parte, nuestros análisis de las oraciones se centran en este tipo de descripciones semánticas, que son las que nos permiten estructurar el discurso.

Esta forma de entender lo que es una oración no pretende negar que existan las presuposiciones ni la idea de J. R. Searle (1969), que compartimos, de que la finalidad última de una oración (o de un enunciado) esté íntimamente conectada con la relación entre los deseos del hablante y las acciones del oyente, pero esas informaciones no son necesarias para el análisis de la estructura.

Las oraciones suelen analizarse en las gramáticas en elementos menores denominados sintagmas. Una de las definiciones más influyentes y clásicas es la que encontramos en el Curso de Lingüística general de Ferdinand de Saussure (1911), que reproducimos a continuación:

...en el discurso, las palabras contraen entre sí, en virtud de su encadenamiento, relaciones fundadas en el carácter lineal de la lengua [...] Estas combinaciones que se apoyan en la extensión se pueden llamar sintagmas. El sintagma se compone siempre, pues, de dos o más unidades consecutivas [...] No basta considerar la relación que une las diversas partes de un sintagma [...] hace falta también tener en cuenta la relación que enlaza la totalidad con sus partes.

Charles Bally (citado en Lázaro (1974)) matiza esta definición del siguiente modo:

[El sintagma es] el producto de una relación de interdependencia gramatical establecida entre dos signos léxicos que pertenecen a dos categorías que se complementan entre sí.

Nosotros nos tendremos que alejar sensiblemente de estas definiciones para ajustarlas a las características de nuestro estudio y a nuestra idea de oración:

Un sintagma es una estructura lingüística (formada por elementos que pueden aparecer consecutivamente o no) mediante la que se expresa una de las partes de un evento, ya se trate del predicado, de un argumento o de una relación indirecta.

El motivo de esta definición se encuentra en la propia naturaleza de SESCO. Aceptamos que un sintagma es una combinación de signos léxicos interdependientes gramaticalmente entre sí, pero los únicos elementos que poseemos para poder diferenciar límites entre grupos de palabras son aquellos que nos proporcionan el etiquetado semántico. De este modo, nos aseguramos de que la estructura lingüística tenga sentido como tal.

Es comúnmente aceptado que el sintagma no es el elemento más pequeño en el que podemos descomponer sintácticamente una oración. Los sintagmas se dividen en las gramáticas en palabras, y este es posiblemente el concepto más conflictivo de los que utilizaremos en esta parte del libro puesto que no tiene relación directa con ningún elemento de SESCO. Volveremos a empezar por una definición clásica, por ejemplo la del Diccionario de la Real Academia Española en su 22 edición:

[Una palabra es un] Segmento del discurso unificado habitualmente por el acento, el significado y pausas potenciales inicial y final.[RAE]

Como prueba de su dificultad, esta descripción contiene dos matices que podríamos considerar sospechosos: “habitualmente” y “potenciales”, es decir, que ni el acento ni el significado son medidores fiables ni las pausas aparecen siempre. Una vez que hemos eliminado estos elementos de la definición, lo único que tenemos es que las palabras son “elementos del discurso”.

Efectivamente, ni el acento ni el significado son cualidades definitorias puesto que las características del primero varían de una palabra a otra mientras que el segundo es una cualidad igualmente del discurso completo, de la oración, del sintagma, del morfema... En cuanto a las pausas potenciales, nos tememos que este rasgo responde más al lenguaje escrito que al hablado 2Estrictamente hablando, este rasgo tampoco es válido para lo escrito puesto que las palabras no aparecen siempre separadas por dos espacios. Un ejemplo clásico de esto en español es “ojo de buey”, que es una palabra con dos espaciados internos. En otras lenguas como el chino, esta característica está aún más invalidada. .

A pesar de lo dicho, continúa pareciendo recomendable encontrar un modo de dividir los sintagmas en partes menores para poder analizar sus estructuras con detalle. Cuanto más analítica es una lengua, más sencilla parece la distinción. En lenguas sintéticas, la división puede ir un paso más allá. El ejemplo 58 lo es del español:

(58) a.

cant-aba

b.

cant-a

En 58a. tenemos dos partes con significado que aparecen siempre analizadas como una única palabra. “Cant” es la raíz del verbo cant-ar y “aba” nos da la información referente al tiempo, la persona y el número. 58a. y 58b. se diferencian en la segunda parte, pero comparten la raíz.

La distribución de la información en estas distintas subpartes no es siempre igual ni tan siquiera dentro de una misma lengua. Lo mostramos en 59:

(59) a.

amig-o

b.

amig-o-s

En 59a., la segunda parte “o” contiene la información de género y número, pero estos datos aparecen divididos en dos elementos diferentes en 59b., donde “o” nos indica el género y “s” el número 3Por este motivo, el singular podría describirse como “ausencia de -s”. .

Estas unidades menores suelen diferenciarse de las palabras por el hecho de que no tienen un significado completo por sí solas, pero este aspecto tampoco nos permite aceptar como palabras a, al menos, las preposiciones y las conjunciones.

Por todos estos motivos, también seguiremos aquí una definición distinta:

Una palabra es la parte mínima del discurso que es independiente en cuanto a su sentido o función oracional.

Como ejemplo de independencia, “buey” no puede ser considerado una palabra en la construcción “ojo de buey” puesto que requiere del resto para expresar su sentido. En el caso de los ejemplos 58 y 59, las partes en las que dividimos cada construcción tampoco pueden considerarse palabras ya que no tienen ningún sentido ni función oracional por sí mismas. La distinción entre sentido y función nos permite englobar tanto aquellas palabras que tienen un significado sustantivo claro, por ejemplo la mayoría de los verbos y los adjetivos, como aquellas otras con un contenido funcional, como las preposiciones y las conjunciones.

Esta segunda parte de nuestro estudio se dedicará por entero a buscar estas formas sintácticas en nuestras estructuras semánticas. Empezaremos nuestro análisis en el capítulo 6 por las palabras por ser estas las partes más pequeñas de las que se componen las demás estructuras. En el capítulo 7, mostraremos las estructuras sintagmáticas típicas del español hablado de nuestro corpus. El capítulo 8, por último, estará dedicado al estudio de las partes discursivas que juegan un papel importante en la estructura lingüística de nivel oracional.

Volver al índice -- Capítulo siguiente: Palabras