8

Notas para una estructuración del discurso
8.1. Introducción

A pesar de que la base semántica sobre la que se sustenta este estudio es claramente oracional, ésta puede ser usada para fundamentar unidades mayores discursivas al igual que lo hicimos en los anteriores capítulos para fundamentar otras menores morfosintácticas. Como muestra de la importancia que puede tener una aproximación de este tipo, presentamos aquí el análisis de las correferencias que aparecen en nuestro corpus 1El contenido de este capítulo se basa en los estudios hechos por el autor en colaboración con Nuria Bertomeu, de la Universidad del Sarre, y que dieron lugar al artículo Alcántara y Bertomeu (2005b) sobre el uso de la elipsis en el habla espontánea. .

Cuando en un mismo discurso dos o varias expresiones se refieren a una misma realidad, ya sea ésta una entidad, un predicado o un evento completo, suelen hacerlo de formas diferentes. La elección de estas formas depende de diversos factores que afectan a su estructura lingüística final entre los que destacan el conocimiento compartido por los hablantes, la presencia de dicha realidad en el discurso reciente o que esté presente físicamente donde tiene lugar la interacción, y su relevancia con el tema de la conversación. El estado actual de la cuestión nos hace pensar que este tipo de variables afectan al lenguaje indirectamente a través del modo en que la información se recupera de la memoria de los hablantes. Mostraremos en este capítulo cómo se pueden analizar estos factores desde una perspectiva puramente lingüística.

Si nos referimos a una “ella” en el discurso será porque los que nos escuchan saben de qué ella estamos hablando y la retienen en la memoria en una posición preferente por delante de las demás ellas posibles. El caso contrario sería la referencia a “la amiga alta de mi hermano Javier que se llama Patricia”, cuya explicitud advierte de que probablemente quienes nos escuchan no habrían sido capaces de identificarla con menos información. Estas ideas se establecen, por supuesto, como líneas generales en un uso normal y sin tener en cuenta preferencias más estilísticas.

Las etiquetas de SESCO diseñadas para relacionar las diferentes referencias a una misma entidad o a un mismo evento a través del discurso serán la información clave para este capítulo. Como explicábamos en la sección 4.2, el sistema diferencia a través de dos marcas las primeras referencias a un elemento (etiquetadas con IDE) y las posteriores (con REF). Estos datos, que nos permitirán estudiar las referencias y sus antecedentes, serán analizados en relación a las estructuras eventivas y a las formaciones morfosintácticas para extraer conclusiones sobre cómo funciona el discurso.

Añadiremos signos de puntuación ortográficos en aquellos ejemplos en que faciliten su comprensión y delimiten más claramente las diferentes oraciones.

8.2. Los tipos de referencias y sus distancias

Como hemos señalado, la frescura del elemento referido en la memoria del interlocutor es uno de los factores que se consideran más influyentes en las teorías existentes sobre las correferencias. Esta frescura se suele denominar técnicamente saliencia y, como hemos advertido en la introducción, no depende únicamente de la distancia a la que se encuentre la última referencia al mismo elemento en el discurso, sino también de otros aspectos como su relevancia temática.

Para comprobar la importancia real de la distancia, variable analizable en términos lingüísticos, medimos la que hay entre cada tipo -morfosintáctico- de referencia y su más inmediato antecedente. El cuadro 8.1 muestra los resultados midiendo la distancia en número de oraciones (en el sentido eventivo que nosotros le hemos dado al concepto oración) y poniendo el número de casos en que una referencia de ese tipo ocurre a esa distancia. Los datos se expresan en dos cifras porcentuales: la proporción de esa distancia dentro de la clase y la proporción (separada por una “-”) con relación al total. Para evitar interferencias de otras variables, no se han tenido en cuenta las referencias a las primera y segunda personas, esto es, al hablante y a su interlocutor puesto que en esos casos no se utilizan algunas formas como los sintagmas nominales con determinantes y las entidades referidas tienen una presencia física en la interacción que podría afectar a su saliencia. De hecho, las referencias a la primera y a la segunda persona aparecen en el corpus en posiciones mucho más distantes que el resto y son casos elididos con mucha mayor frecuencia.









Dis. Implícito Clíticos Pron. Pers. Pron. Deíct. SN Deíct. SN. Defin.
0 26,87%-16,97%1714%-2,33% 24,07%-0,84% 6,82%-0,39% 16,67%-0,39%8,29%-0,97%







1 48,82%-30,83%57,62%-7,83%44,44%-1,55%65,9%-3,76% 41,67%-0,97%34,8%-4,08%







2 10,87%-6,86% 14,76%-2% 9,26%-0,32% 18,18%-1,04%11,11%-0,26% 17,13%-2%







3 4,82%-3,04% 3,33%-0,45% 12,97%-0,45%6,82%-0,39% 11,11%-0,26%7,73%-0,9%







4 1,95%-1,23% 1,9%-0,26% 3,7%-0,13% - 2,78%-0,06% 3,31%-0,39%







5 2,05%-1,3% 0,48%-0,06% - - 2,78%-0,06% 7,18%-0,84%







6 1,03%-0,65% 0,95%-0,13% - 1,14%-0,06% 2,78%-0,06% 4,42%-0,52%







7 1,23%-0,78% 0,48%-0,06% 1,85%-0,06% - - 2,76%-0,32%







8 0,72%-0,45% 0,48%-0,06% - - - 1,1%-0,13%







9 0,41%-0,26% 0,48%-0,06% - - - 0,55%-0,06%







10 - 0,48%-0,06% 1,85%-0,06% 1,14%-0,06% - 2,2%-0,26%







11-20 0,62%-0,39% 1,9%-0,26% 1,85%-0,06% - 5,54%-0,13% 6,08%-0,71%







21-30 0,30%-0,19% - - - 2,78%-0,06% 3,31%-0,39%







31-50 0,30%-0,19% - - - 2,78%-0,06% 1,1%-0,13%







Totales 100%-63,26% 100%-13,56% 100%-3,47% 100%-5,7% 100%-2,31% 100%-11,7%







Cuadro 8.1: Distancia en oraciones entre las referencias y sus antecedentes.

El dato que más destaca en la tabla es el de que el 63,15% de las referencias no aparecen explícitas en el discurso. Este hecho implica un aspecto sintáctico relevante: los sujetos sintácticos de las oraciones son los elementos que dan continuidad al discurso (de modo que las referencias pueden desambigüarse a través de la flexión verbal). La importancia de los sujetos también ayuda a explicar que el segundo grupo más abundante, el de los clíticos, sólo tenga una frecuencia del 13,6% ya que estos pronombres sólo pueden expresar objetos directos e indirectos en español y nunca sujetos. De igual modo, justifica en gran medida la escasez de pronombres personales ya que el 78% de los 54 que aparecen son sujetos y, por lo tanto, se corresponden sólo con casos en los que la flexión verbal resulta ambigua.

Los sintagmas nominales definidos (con artículos definidos o nombres propios) son el tercer grupo de mayor importancia con un 11,72% de los casos, seguido de los pronombres deícticos (5,69%). La escasez de pronombres personales (3,49%) nos muestra que su uso en español es muy restringido a diferencia de lo que podemos observar en otras lenguas como el francés o el inglés. Su uso se reduce en la práctica a la resolución de ambigüedades, la introducción de elementos que no disfrutan de saliencia en el discurso o para resaltar un elemento. En la oración 101, por ejemplo, el pronombre “yo” evidencia que la hablante no quiere negar la posibilidad de que alguien haya estado en ese hospital, pero deja claro que no fue ella misma en ningún caso.

(101)

yo no he estado nunca en ese hospital 2[efamcv02].

En cuanto a las distancias, una oración es la más frecuente para todos los tipos, seguida -pero con cifras menores- de las referencias intraoracionales. Los números se reducen drásticamente a partir de las 4 oraciones de distancia en todos los casos y sólo las referencias implícitas y los sintagmas nominales tienen alguna representación en las distancias más extremas. Este dato es contradictorio y reune en una misma categoría dos tipos de referencias que parecen opuestas: las que menos y las que más información aportan. El caso de los sintagmas nominales es el esperable en referencias lejanas ya que ayudan con su explicitud a volver a identificar el elemento al que se refieren.

La explicación de los casos implícitos tan alejados se encuentra en que hacen referencia a entidades cuya presencia es inherente al discurso como, por ejemplo, el tema que está explicando un profesor a sus alumnos (a pesar de que lleve unas cuantas oraciones hablando de otras cosas probablemente relacionadas). En estos casos, no es necesario recuperar el tópico con una referencia explícita puesto que él es el motivo de que se esté produciendo el discurso y todos los participantes lo tienen presente.

Observamos las cifras internas de cada tipo expuestas en la tabla 8.2 para poder compararlas en detalle. Los implícitos aparecen en el 70% de los casos en referencias intraoracionales o a una oración de distancia, datos que coinciden con los de los clíticos. Los pronombres personales tienen un porcentaje mayor en las distancias de 3 y 4 oraciones que la que aparecen en las dos clases señaladas mientras que la práctica totalidad de los pronombre deícticos (el 83%) aparecen alejados por 1 ó 2 oraciones de sus antecedentes.

Los sintagmas nominales -deícticos y, especialmente, definidos- no presentan tanta desproporción en las diferentes distancias aunque también son mayoritarias las de 1 y 0.


DistanciaImplícitoClíticosPron. Pers.Pron. Deíct.SN Deíct.SN Defin.
0 26.93% 17.14% 22.22% 6.82% 13.89% 8.29%
1 48.8% 57.6% 44.46% 65.9% 41.65% 36.49%
2 10.89% 14.76% 9.26% 18.18% 11.11% 17.13%
3 4.83% 3.33% 11.11% 6.82% 11.11% 7.73%
4 1.95% 1.9% 3.7% - 2.78% 3.31%
5 2.06% 0.48% - - 2.78% 7.18%
6 1.08% 0.95% - 1.14% 2.78% 4.42%
7 1.13% 0.48% 1.85% - - 2.76%
8 0.72% 0.48% - - 2.78% 1.1%
9 0.41% 0.48% - - - 0.55%
10 - 0.48% 3.7% 1.14% - 1.1%
11-20 0.6% 1.92% 3.7% % 5.56% 5.54%
21-30 0.3% - - - 2.78% 3.3%
31-50 0.3 - - - 2.78% 1.1%
Totales 100% 100% 100% 100% 100% 100%
Cuadro 8.2: Distribución de las distancias dentro de cada tipo.

Este análisis de la tabla 8.2 nos proporciona de nuevo resultados contradictorios y conflictivos con algunos de los presupuestos teóricos que se asumen en la literatura especializada. Por un lado, vemos confirmada la idea de que las formas menos explícitas aparecen cerca de sus antecedentes para que su escasez de información se compense con la saliencia del elemento al que hace referencia mientras que las formas más explícitas reparten sus porcentajes por las diferentes distancias. Sin embargo, no podemos obviar el hecho de que también los sintagmas nominales tienen más probabilidad de aparecer en referencias intraoracionales o a una sola oración de distancia que en posiciones más alejadas. Esta circunstancia demuestra que la elección de una forma u otra de referencia no se reduce a la distancia, sino que otros factores, los más relevantes de los cuales fueron citados en la introducción, también juegan un papel importante. Los hablantes no sólo utilizan referencias explícitas cuando el antecedente no está cerca, sino también cuando éste no tiene la suficiente saliencia por motivos de ambigüedad o porque el hablante quiere cambiar a un tema que, aunque ha sido recientemente nombrado, es secundario.

Relacionaremos ahora las formas de las referencias con la parte de la estructura eventiva de SESCO con la que se relacionan. Los datos aparecen resumidos en la tabla 8.3 con los porcentajes de cada parte eventiva para cada forma sintáctica teniendo en consideración si aparecen antes o después del predicado.


Tipos PosiciónImplícitoClíticosPron. Pers.Pron. Deíct.SN Deíct.SN Defin.
ENT before 59.79% 3.8% 35.23% 71.63% 47.22% 22.65%






after - 3.7% 7.95% 8.33% 9.39%








AG before 40.21% 0.95% 29.62% 7.95% 11.11% 14.36%






after - 9.25% - 5.55% 9.94%








PA before - 64.8% 5.55% 4.54% 16.66% 2.2%







after - 0.47% - 2.27% - 18.78%








PRO before - 25.23% 3.7% 1.13% - 1.1%







after - 0.47% 3.7% - - 9.94%








LOC before - 0.95% 1.85% - - 1.1%







after - - - - 2.77% 1.1%








IR before - 3.33% 5.55% 2.27% 5.55% 3.31%







after - - - 1.13% - 1.65%








REFE before - - 1.85% 1.13% - 1.65%







after - - - - 2.77% 3.31%








Cuadro 8.3: Partes eventivas de las referencias

Como ya hemos advertido en varias ocasiones en este libro, la mayoría de los sujetos sintácticos son agentes o entidades, y esto es lo que explica que todas las referencias implícitas -las expresadas por la flexión verbal- pertenezcan a estos dos tipos.

Es interesante comprobar cómo la mayoría de los clíticos aparecen utilizados con anterioridad al verbo. Según las gramáticas del español, este tipo de pronombres tienen una posición fija posterior cuando el verbo está conjugado, pero pueden variar si acompañan a un imperativo o a una forma perifrástica. De forma paralela en el plano semántico, los clíticos son los únicos que tienen la mayoría de sus apariciones en elementos que no son primeros argumentos de los eventos, sino mayoritariamente pacientes de acciones o propiedades de estados, partes semánticas que se corresponden generalmente con los objetos directos y los atributos sintácticos. Debemos apuntar que hay un buen número de clíticos que no han sido tomados en cuenta en nuestros análisis porque aparecen obligatoriamente acompañando a pronombres personales plenos con los que coinciden en la referencia. Veremos un caso en el pronombre “le” del ejemplo 104 (página §).

El 83,35% de los pronombres personales aparecen antes del verbo y un 77,8% son entidades o agentes. Los pronombres deícticos tienen un uso aún más especializado: el 71,63% son entidades anteriores al verbo. Esta diferencia se explica por el tipo de elementos a los que se refieren: la mayoría de los pronombres personales hacen referencia a entidades animadas (generalmente personas) mientras que los pronombres deícticos suelen referir a eventos completos como en el ejemplo 102 donde i marca el primer evento y j la referencia a las entidades que realizan la acción de responder y que tiene la propiedad de no sentirse tan seguros.

(102)

[Respondenj con insultos]i Yo creo que esoi indica que no se sientenj tan seguros.

Los que hemos denominado sintagmas nominales deícticos tienen un alto porcentaje de entidades anteriores al verbo (47,22%) aunque también tienen porcentajes importantes como agentes y como pacientes (16,66% en ambos casos).

Los sintagmas nominales definidos son los únicos que aparecen en todas las partes del evento y lo hacen con altas cantidades tanto antes como después del verbo. Una posible explicación puede encontrarse en la restricción ya descrita de los pronombres personales a entidades animadas, utilizándose un sintagma nominal cuando el uso del pronombre no es posible.

Si traducimos las partes semánticas a aquellas sintácticas con las que se suelen corresponder, observamos que los sujetos (esto es, las entidades y los agentes) son la función sintáctica típica para las correferencias, seguida por los objetos directos y por los atributos (pacientes y propiedades). Los argumentos locativos y las relaciones indirectas (sintácticamente objetos indirectos y adjuntos) son los menos propensos a aparecer con una etiqueta de REF.

En la tabla 8.4, repetimos el experimento de la 8.3, pero fijándonos ahora en las partes eventivas de los antecedentes. Por cada forma de correferencia, aparecen los porcentajes de antecedentes para cada parte eventiva antes del verbo, después o implícita (expresada en la flexión verbal).










TypesPositionNull-inst.Clitics PPRONDeic. PDeic. NP NP
ENT before 12.23% 10.64%16.66% 12.5% 19.44% 11.05%







after 3.49% - - 3.4% 2.77% 4.97%







in verb 31.27% 22.33%11.11%18.18%38.96% 16.59%








AG before 4.62% 10.64%12.96% - 5.55% 6.08%







after 1.75% 4.26% 3.7% - - 4.42%







in verb 17.68% 21.28%14.87% 3.4% 2.77% 8.29%








PA before 3.49% 2.13% 5.55% 3.4% 8.33% 3.31%







after 1.64% - 1.85% 2.27% 5.55% 14.36%







in verb 5.14% 6.38% 3.7% 3.41% 2.77% 6.08%








PRO before 1.34% 7.45% 5.55% 1.14% - 0.55%







after 1.85% 1.06% 1.85% 4.54% 5.55% 6.08%







in verb 1.03% - - 3.41% - 1.66%








LOC before 0.2% - - - - 2.21%







after 0.2% - - - 2.77% 1.1%







in verb 0.31% - - - - 1.1%








IR before 3.39% 11.7% 7.4% - - 6.08%







after 1.03% 2.13% 7.4% - - 2.21%







in verb 0.1% - - - - 0.55%








E all 4.93% - 1.85% 39.81% - -








REFE before 0.62% - - - 2.77% 0.55%







after 3.49% - 5.55% 4.54% 2.77% 2.76%







in verb 0.2% - - - - -








totals 100% 100% 100% 100% 100% 100%
Cuadro 8.4: Partes eventivas de los antecedentes

Un dato interesante desvelado por la tabla es que el 71,04% de los antecedentes de las referencias implícitas son agentes o entidades, y el 55,73% son también implícitos. Esto hace prever una predominancia de continuidad discursiva en la que el elemento que se mantiene a través de las oraciones es generalmente el mismo sujeto, lo que coincide con las teorías expuestas en los últimos años [Taboada, 2002]. Esto no significa que esta sea la única posición de los antecedentes de las referencias implícitas ya que se utilizan también, como veremos, en cualquier caso en que no haya ambigüedad semántica.

Los antecedentes de los pronombres clíticos suelen ser entidades o agentes tanto anteriores al verbo como implícitos. Las oraciones numeradas como 103 son un ejemplo en el que observamos que, a pesar de que las entidades marcadas con i pasan de ser sujeto (agente) a ser objeto indirecto (propiedad), “nuestros gobernantes” mantienen su condición de elemento con mayor saliencia en el discurso.

(103)

Nuestros gobernantesi nos muestran la cara, no? No lesi importa nada.

Más de la mitad de los pronombres personales (59,3%) tienen como antecedentes un agente o una entidad, lo que quita cualquier sorpresa al hecho de que el 48,12% de ellos hubieran aparecido antes del verbo. El uso de pronombres en estos casos, que coinciden con los expuestos para las referencias implícitas, se debe a la necesidad de resolver una ambigüedad (por ejemplo, en casos en que el antecedente-sujeto incluía varias entidades de las que se quiere aislar ahora una) o para resaltar un contraste.

Es interesante apuntar a este respecto el alto porcentaje de antecedentes que aparecen en funciones sintácticas oblicuas como las relaciones indirectas y los REFE. Un 20,35% de los antecedentes son de estos tipos mientras que un 18,5% son objetos directos o atributos. Este dato nos indica que los pronombres se utilizan con frecuencia para hacer referencia a elementos con escasa saliencia poniendo sobre ellos de este modo el foco de atención.

El grupo mayor de pronombres deícticos hace referencia a eventos completos (39,81%), característica que no se repite en ninguna otra forma. Entidades anteriores al verbo e implícitas también son antecedentes frecuentes para estos pronombres (12,5% y 18,8% respectivamente).

Vimos en la tabla 8.3 que la mayoría de las referencias realizadas a través de sintagmas nominales deícticos eran entidades de estados y la tabla 8.4 muestra que sus antecedentes también pertenecen a la misma clase (61,17%). No obstante, señalaremos que también son frecuentes en el corpus los casos en los que los sintagmas nominales deícticos se utilizan para realizar un cambio de topicalización.

Por último, los sintagmas nominales definidos parecen ser los más adecuados para recuperar un elemento poco saliente puesto que sus antecedentes aparecen en todas las partes eventivas y en cualquier posición. Su frecuencia de uso también se debe al hecho apuntado anteriormente de que permiten una desambiguación mayor que los pronombres personales y, además, no se restringen únicamente a entidades animadas.

8.3. Otras variables en juego

8.4. To be continued...

Volver al índice -- Capítulo siguiente: Conclusiones y trabajo futuro