You are on page 1of 13

A aparecer en Tratado de Neuropsicologa, Editores: Andrea Slachevsky, Patricio

Fuentes y Facundo Manes. Editorial Akadia. Buenos Aires, 2008.

Modelos Cognitivos del Lenguaje

Marcela Pea1,2,3

1. Laboratorio de Neurociencias, Escuela de Psicologa, Pontificia Universidad Catlica


de Chile, 2. Centro de Investigacin Avanzada en Educacin, Universidad de Chile, 3.
International School for Advanced Studies, Trieste, Italy.

Direccin: Av Vicuna Mackenna 4860, Mcul, Santiago, Chile


Email: pena@sissa.it

Agradecimientos: Financiado por Fondecyt 1060767.


La conducta lingstica esta gobernada por una serie de convenciones que deben ser
compartidas por los oyentes y los hablantes de una lengua determinada. Estas
convenciones regulan la manera como organizamos las unidades sin significado del
lenguaje para construir unidades con significados. El inters por explorar las leyes y
modelos que explican el lenguaje humano se remonta a los albores de la humanidad1. Sin
embargo, el estudio cientfico del habla humana as como su modelamiento se ha
sistematizado slo a partir de 1950. Luego de los pioneros estudios de Noam Chomsky.
Chomsky [1] se inicio la exploracin de dos cuestionamientos bsicos relevantes al habla
humana: Qu significa saber una lengua? y Cmo se adquiere este conocimiento?. En
las dcadas siguientes, varias propuestas se han generado a la luz de los avances en la
investigacin emprica en psicologa cognitiva, neuropsicologa, neurociencias, psico-
lingstica e inteligencia artificial. A la fecha no se ha logrado concebir un modelo
general del lenguaje que de cuenta de los diferentes aspectos de esta habilidad cognitiva.
Por el contrario, centenas de modelos especficos han sido propuestos y su discusin
sobrepasa las posibilidades de esta seccin. No obstante, este captulo describe de manera
sucinta aspectos relevantes a la naturaleza y organizacin del lenguaje humano y al
modelamiento de la percepcin y la produccin del lenguaje, particularmente vlidos en
adultos, sanos, normo-oyentes, diestros, monolinges en la modalidad oral.

Que es el lenguaje humano? El lenguaje es un sistema de signos simblicos [2] que nos
sirve para comunicarnos [3] con sonidos y/o gestos como primitivos perceptuales y para
configurar nuestro pensamiento [4]. El lenguaje humano es creativo, impredecible y
posee propiedades especficas que lo hacen diferente de todos los cdigos de
comunicacin conocidos en animales no-humanos. Segn Charles Hockett [5] son
propiedades especificas del habla humana: a) Dualidad de patrones: la combinacin de un
sistema de sonidos (sin significado) y un sistema gramatical (con significado); b)
Productividad: la habilidad de crear y comprender enunciados nunca antes realizados; c)
Arbitrariedad: el uso de signos simblicos usados como las palabras no se parecen en
nada a los conceptos que representan y d) Desplazamiento: la habilidad de referirse a
eventos no actuales y cosas no presentes. Un sistema que como este que permite construir
infinitos enunciados a partir de un set reducido de sonidos, palabras y reglas no ha sido
encontrado en ninguna especie.

Qu significa saber una lengua? Una lengua puede ser definida como el conjunto de
frases correctamente construidas de esa lengua y a sus descripciones estructurales [1]. En
general, saber una lengua significa haber aprendido su repertorio de sonidos, de palabras
y de reglas gramaticales [6].

El lenguaje, cmo est estructurado? Los enunciados son concatenaciones de palabras y


las palabras concatenaciones de sonidos. Esta linealidad describe la dinmica de los
procesos de percepcin y produccin que resultan de la integracin en el tiempo de
diferentes unidades lingsticas. A grosso modo el estudio de las unidades lingsticas
incluye la fonologa, el lxico, le morfologa y la sintaxis. La fonologa resume las

1
Modelo es una descripcin o analoga usada para ayudar a visualizar algo que no puede ser visto
directamente. En ciencias cognitivas incluye los conceptos o teoras que pretenden explicar como funciona
la mente y el cerebro en global o en parte.
propiedades de los sonidos de una lengua. Esto incluye los rasgos distintivos, los fonemas
(que en espaol corresponden aproximadamente a los sonidos de las consonantes y las
vocales) y a las variaciones prosdicas (de ritmo y entonacin). El lxico corresponde a
las unidades lingsticas almacenadas en nuestro diccionario mental. Las palabras pueden
transmitir significados (palabras de contenido e.g. verbos) o bien servir principalmente de
unidad de conexin a otras palabras (palabras de funcin, e.g. conjunciones). La
morfologa se refiere la posibilidad de cambiar la forma de las palabras segn sus
relacin con las palabras que la. Por ejemplo, el castellano es posible modificar la palabra
/nio/ por /nia/ cambiando el sufijo segn el gnero. La sintaxis describe el orden de las
palabras al interior de los enunciados respetando reglas gramaticales. Por ejemplo, en
castellano, los enunciados sigue un orden sujeto-verbo-objeto.
Segn la tradicin de la gramtica generativa slo la sintaxis y la morfologa son
productivas mientras que la fonologa y la semntica son interpretativas. La sintaxis y la
morfologa son concebidas en trminos de un conjunto de reglas que generan nicamente
frases bien formadas y permiten comprender las relaciones entre los elementos de la frase.
Estas reglas regulan las funciones combinatorias de las palabras y hacen posible la
generacin de un nmero potencialmente infinito de frases y oraciones, utilizando un
nmero finito de palabras. Por ejemplo, las oraciones: El me dijo hoy que no podr
venir y El me dijo que hoy no podr venir, evocan significados diferentes con relacin
cuando alguien no podr venir. Este efecto est originado en el hecho de que las reglas
gramaticales permiten ciclos recursivos en la construccin de las oraciones. Vale decir
que en un enunciado una regla puede contenerse a si misma. Este bucle de funciones
recursivas es observado en todas las lenguas conocidas.

Modelos cognitivos de la adquisicin de la lengua materna


Resulta asombrosa la facilidad con que los nios aprender su lengua materna sin
necesidad de instruccin dirigida y an en las ms variadas condiciones de crianza. El
modelamiento de la adquisicin de la(s) lengua(s) materna(s) ha sido uno de los mas
explorados. A pocas horas de nacer, y durante los primeros meses de edad, el beb
manifiesta notables habilidades para tratar estmulos lingsticos: discrimina slabas y
sonidos extrados tanto de su lengua materna como de lenguas extranjeras [7], prefiere la
voz humana a otras vocalizaciones [8,9]. Aparentemente los nios nacen dotados de
habilidades y estructuras particularmente sensibles al estmulo lingstico [1,10]. Sin
embargo, a los nios no les sirve este saber general sino que deben aprender las
especificaciones de al menos una lengua natural. Para ello, deben ser estimulados
sistemticamente por la lengua que se practica en tu entorno, as, los nios slo aprenden
los lenguajes a los que estn expuestos y comienzan a inventar frases nuevas alrededor de
los tres aos.
Los modelos de adquisicin del lenguaje intentan explicar la adquisicin de la fonologa,
el lxico y la gramtica y se pueden agrupar en deductivos e inductivos.

a) Los modelos simblico-deductivo enfatizan el rol de la facilidad con que los humanos
adquieren el habla an cuando el habla es un estimulo pobre. El estimulo lingstico
llega a los nios con una forma indeterminada y degradada. En efecto, la informacin
sobre cmo es una frase bien hecha en una lengua particular no est reflejada de manera
sistemtica en ninguna propiedad fsica del habla (indeterminacin), adems, el habla
est llena de omisiones y complejas variaciones entonacionales o de pronunciacin
(degradacin).
Hacia 1960 se defendi la hiptesis que visto que el estimulo es tan inconsistente y el
habla tan compleja los humanos podran nacer dotados de una predisposicin biolgica
innata que facilite este aprendizaje. Hacia los 1980 se sugiri adems que la mente
humana esta equipada de un aparato cognitivo innato operacionalizado en trminos de
principios y reglas simblica y categricamente definidos. Tanto indeterminacin como
degradacin podran ser resultas a travs de transformaciones simblicas.
Desde una perspectiva neurocognitiva, estos sistemas podran ser implementados en
mdulos neurales. Los mdulos cognitivos pueden ser comprendidos como grupos de
neuronas con propiedades funcionales similares localizadas en regiones discretas con
bordes ntidos e involucradas en el procesamiento preferencial de un tipo de estimulo.
En sus inicios, los modelos modulares, proponen modelos incrementales. Vale decir, que
las funciones cognitivas se acceden preferentemente en serie. Por ejemplo, las teoras de
sintaxis-primero sugieren que los oyentes acceden a la estructura sintctica de los
enunciados sobre la base de la informacin de la categora gramatical de las palabras
percibidas, independientemente de la informacin semntica que ellas contengan. La
extraccin de significado ocurrira en una segunda etapa [11].
La vulnerabilidad de las propuestas simblicas subyace en la falta de evidencia emprica
de un sistema simblico. Hasta ahora nadie ha trazado el curso de una representacin
simblica en el cerebro.

b) Los modelos subsimbolico-inductivos Una visin alternativa de la habilidad para


aprender el habla es propuesta por el conexionismo, sostenida particularmente por los
principios de la inteligencia artificial y las evidencias obtenidas de la simulacin
computacional. Las simulaciones computacionales del conexionismo son evaluaciones
cientficas entre la ciencia terica y la experimental que asumen un mapa distribuido de
funciones cognitivas. Un mapa puede ser comprendido como un grupo de neuronas
distribuidas con propiedades funcionales similares caracterizadas por una progresin
gradual en la preferencia por procesar ciertos estmulos en el cerebro. Esta perspectiva
propone una representacin subsimbolica-inductiva. Los modelos conexionistas proponen
un conocimiento distribuido del lenguaje y no codifican directamente informacin
simblica. Hay elementos fijos (neuronas) interconectados que por si mismos no
representan nada pero que en conjunto pueden generar una representacin lingstica. Las
interacciones entre los elementos fijos pueden ser de gran complejidad y las conductas
observadas muy variadas en funcin a lo aprendido. ptimamente, los sistemas deben
tener la capacidad de aprender, modulando el peso de sus interacciones, y de auto-
organizarse continuamente. Los modelos distribuidos interactivos asumen que el oyente
usa los diferentes tipos de informacin inmediatamente en una manera interactiva [12-15].
Los modelos conexionistas del lenguaje pueden resolver los problemas de deterioro de la
seal lingstica. En efecto, la seal acstica puede ser mejorada simulando las constante
biolgicas del odo humano. Sin embargo, los problemas de indeterminacin son menos
posibles de explicar sin reconocer que simular las representaciones simblicas de los
estmulos lingsticos. En general, los modelos conexionistas cuestionan la necesidad de
reglas y categoras lingsticas y proponen modelos que resultan de la explotacin de
claves observables en el estimulo y de las relaciones que resultan de las conexin de esas
claves [16]. Uno de los problemas de estos modelos es que no pueden explicar
satisfactoriamente hechos lingsticos basados en reglas poco frecuentes como el agregar
una /-s/ en el plural alemn [17]. Adems, la gran limitacin de estos modelos es el
exceso de informacin. En efecto, visto su poder estadstico excesivo las simulaciones
computacionales encuentran la respuesta correcta en medio de una enorme cantidad de
eventos nunca observados en una lengua natural, teniendo gran dificultad en generalizar
aspectos lingsticos observables en ms de una lengua. El cerebro no tiene la
arquitectura de un computador, por ejemplo, no tiene memoria de destinacin [18], de
manera que las simulaciones computacionales no siempre pueden encontrar lo que
encuentra la mente y el cerebro humano, sin embargo, ayudan a comprender procesos
lingsticos particularmente de naturaleza estadstica.

En general, tanto deductivos como inductivos, los modelos cognitivos que mejor han
explicado la adquisicin del lenguaje son aquellos que simulan la arquitectura y los
principios biolgicos observados en la mente y el cerebro humanos. Por ejemplo, los que
incluyen las variaciones en el tamao de la memoria de trabajo.

Modelos de percepcin del lenguaje


Para la mayora de los adultos sanos, comprender el habla es una tarea fcil. Sin embargo,
la comprensin del habla evidencia grandes enigmas tales como la linealidad y la
ausencia de invarianza entre lo acstico y lo lingstico, que han guiado en gran parte los
estudios y modelos de percepcin.
La linealidad se ilustra en el hecho que aunque los oyentes perciben el habla como una
concatenacin de sonidos discretos i.e. fonemas, silabas, palabras, no hay un correlato de
unidades discretas en la seal fsica del habla. Los sonidos y gestos del habla ocurren de
manera continua sobreponindose unos a otros [19]. Hasta hoy, no hay un indicio fsico
conocido que sistemticamente indique donde termina une evento lingstico y donde
comienza el adyacente. En diversas etapas la comprensin del habla resulta de la
extraccin, manipulacin, memorizacin y mapeo de estas unidades discretas en
informacin lingstica.
La ausencia de invarianza describe el hecho que a pesar de que los sonidos que se
realizan durante el habla difieren grandemente en sus propiedades fsicas, el mapeo
lingstico no varia. Una misma palabra dicha lentamente por un hombre adulto difiere,
entre otros, en su frecuencia fundamental, en sus formantes y en su velocidad de
realizacin de aquella dicha rpidamente por una mujer joven. Sin embargo, en un mismo
contexto, los humanos mapeamos la misma informacin lingstica. En efecto, la
representacin lingstica de los fonemas no cambia aun cuando su realizacin fsica
vare significativamente en funcin a los fonemas vecinos [20], al tamao del aparato
fonador [21], a la identidad del hablante o a la velocidad del habla [22]. Los oyentes
realizan una serie de adaptaciones perceptuales para filtrar las variaciones irrelevantes e
identificar la ocurrencia de fonemas. Se piensa que los oyentes ajustan su sistema
perceptual a las caractersticas especficas del hablante, por ejemplo a la proporcin de
formantes [23-25], y a la velocidad del habla. Esta habilidad probablemente es adquirida
precozmente en la infancia.
Uno de los efectos de las adaptaciones en la percepcin de fonemas es la percepcin
categorial. Los adultos percibimos a los fonemas como unidades discretas ya que los
limites de percepcin de un fonema coinciden con estrechas ventanas en sus cambios
fsicos. Por ejemplo, la diferencia entre la /b/ y la /p/ se sustenta en parte en la diferencia
de tiempo con que comienzan a vibrar las cuerdas vocales al pronunciarlas. De esta
manera, la palabra /bar/ comienza con una rpida vibracin de las cuerdas vocales, que la
hace sentirse sonora, mientras que la palabra /par/ presenta un pequeo retraso en el
inicio de esta vibracin, que la hace sentirse muda. En ingles, la percepcin de una /b/
ocurre cuando el retraso en la sonoridad es de 0 a 20 ms y la de una /p/ si es mayor a 25
ms. Slo en la breve ventana de 20 y 25 ms los adultos tienen gran dificultad a diferenciar
estos fonemas. De esta manera los humanos percibimos sin esfuerzo ni dificultad las
diferencias entre fonemas presentados aisladamente o al interior de las frases. Por el
contrario, somos malos encontrando diferencias entre diferentes pronunciaciones de un
mismo fonema. Esta habilidad se conoce como percepcin categorial [26] y no la
observamos sistemticamente en el procesamiento de estmulos auditivos no lingsticos
[27]. Aunque no todos los fonemas evidencian percepcin categorial este fenmeno
cognitivo ha sido muy til para ilustrar la complejidad de la percepcin del habla y para
modelar como funciona la mente cuando hace lenguaje. A continuacin se presentan
sucintamente algunos modelos de percepcin del habla.

Teora motora. La teora motora de percepcin del habla postula que el habla es percibida
en funcin de lo que se pronuncia [26]. Al hablar, escuchamos lo que decimos y
aprendemos acerca de las propiedades articulatorias de la pronunciacin de los sonidos.
Gestos articulatorios tales como juntar los labios son unidades de percepcin que
directamente aportan al oyente informacin fontica que explica de mejor manera la
ausencia de invarianza observada en la percepcin. Algunos aspectos de la articulacin
del habla estn visualmente disponibles para quienes observan el habla de otro. El
ejemplo mas claro es el efecto McGurk que refleja la modificacin de la percepcin
cuando integramos la informacin auditiva y visual del habla. En efecto, si escuchamos la
silaba /ba/ y simultneamente vemos un video de una persona pronunciando la silaba /ga/,
los adultos escuchamos /da/ [28]. Esto ocurre porque tenemos una vasta experiencia en
escuchar y en ver como la gente habla, de manera que la representacin mental de los
fonemas seria producto de la creacin de una representacin multimodal de la manera
como stos se realizan. En efecto, las representaciones no entrenadas de los fonemas no
se guardan en la memoria y no son consideradas en su representacin. Por ejemplo, el
pareo entre el sonido /a/ y la letra escrita /a/ no ocurre naturalmente aun en personas
alfabetizadas [29].

Modelo TRACE. El modelo TRACE de percepcin de fonemas y acceso a las palabras


[30], es un modelo conexionista que describe el habla como un proceso en que las
unidades lingsticas son accedidas y procesadas a diferentes niveles de manera
incremental. TRACE propone que las palabras son representadas en tres niveles: rasgos
distintivos (o acsticos), fonemas y palabras. El procesamiento en cada nivel ocurre en
unidades llamadas nodos que interactan entre ellas y sesgan el procesamiento hacia la
solucin mas fuertemente representada en la memoria. La percepcin del habla en el
tiempo ocurrira as: inicialmente se accede a los rasgos distintivos del primer fonema,
seguidamente se activa el fonema completo y de manera incremental se va descubriendo
la palabra. Al inicio la activacin es bottom-up pero segn se avanza en el
descubrimiento de la palabra posible, se desencadena una activacin top-down que
termina con el acceso a la palabra. Por ejemplo, al percibir la vibracin de las cuerdas
vocales al inicio de la palabra, activamos las palabras que hemos guardado en nuestro
diccionario mental que comienzan con una consonante-sonora, luego en decenas de
milisegundos percibimos que el fonema inicial es /b/ y restringimos nuestras
expectativas de palabra a aquellas del diccionario mental que comienzan con /b/, y luego
al avanzar escuchando los fonemas de la palabra continuamos afinando nuestras
expectativas de palabra para llegar a un punto en que sabemos de que palabra se trata aun
antes que haya sido terminada de pronunciar. Por ejemplo, si hemos escuchado /bana/ lo
ms probable es que se active la palabra /banana/ aun antes de terminar de escuchar toda
la palabra, ya que un efecto top-down nos hacen preferirla. Palabras vecinas como
/banalidad/ son competidores menos buenos ya que son usadas con menor frecuencia y
serian segundas alternativas. Numerosos modelos de percepcin del habla incluyen el
contexto como una variable crucial. El efecto del contexto y de la habilidad del sistema
cognitivo humano a anticiparse al cierre de los eventos se evidencia en algunos estudios
que demuestran que, si el contexto lo facilita, la deteccin de un fonema blanco ocurre
aun cuando el fonema en cuestin ha sido totalmente removido [31].

Modelo fuzzy-logical. El modelo de percepcin fuzzy logical theory propone que el


humano aproxima sus percepciones de la realidad acstica y fonmica al contexto y a la
experiencia y expectativas del oyente [32]. En este modelo, las unidades lingsticas
estaran representadas mentalmente en prototipos, que corresponden a las formas bien
hechas de stas. Sin embargo, el humano frecuentemente realiza formas menos buenas.
La decisin de si un ejemplar menos bueno corresponde a un fonema o a una palabra
determinados depende del observador basado en otras mltiples claves o fuentes de
informacin no necesariamente lingsticas. De esta manera, la percepcin del habla es el
resultado de la interpretacin de la integracin de informacin proveniente de diferentes
fuentes de informacin. Un mismo sonido puede ser interpretado de una manera por un
oyente mientras es interpretado de otra por otro oyente. Es frecuente observar que dos
hablantes comentan sus diferencias, por ejemplo, al escuchar /doceymedia/ uno escucha a
las 2 y media mientras que otro a las 12 y media.

Anlisis acstico de rasgos distintivos. Este modelo propone que la cognicin humana es
sensible a las propiedades acsticas de los sonidos lingsticos. De esta manera, la
percepcin de ciertas propiedades acsticas permite la identificacin de un fonema, no es
necesaria la nocin de ausencia de invarianza. En este modelo lo que se percibe son
agrupaciones de rasgos distintivos que difieren de un fonema a otro de manera quntica,
no continua. El paso de un fonema a otro involucra la superacin de umbrales de
percepcin del conjunto de rasgos distintivos. Los indicadores acsticos contienen
adems informacin acerca de los gestos articulatorios que los producen [33].

Teora del ejemplar. El modelo del ejemplar se refiere a que el reconocimiento de la


palabra ocurre separadamente al del hablante. De esta manera, la variacin a travs de los
hablantes o de la velocidad del habla es un ruido que necesita ser filtrado. El modelo de
ejemplar propone que los oyentes almacenan separadamente informacin acerca de cada
enunciado pronunciado por cada hablante, logrando una representacin ms eficiente de
las palabras pronunciadas por hablantes familiares [34]. Este modelo requiere de grandes
requerimientos de memoria y supone que el propio hablante reconoce sus gestos
articulatorios de manera separada al acceso a las palabras.

Teora de anlisis por sntesis. La percepcin del habla se apoya en un sistema de


comparacin del anlisis del estimulo acstico y los modelos generados por un conjunto
de reglas abstractas comunes a la percepcin y la produccin. Este modelo necesita de un
conjunto de reglas que se han definido durante el aprendizaje de una lengua. La
comparacin se realiza entre el correlato articulatorio y la representacin acstica del
habla [36].

Modelos de Produccin del lenguaje


Normalmente los adultos producimos cuatro slabas y cerca de diez a doce fonemas por
segundo. Las palabras son elegidas desde un extenso depsito de palabras, el diccionario
mental o lxico, que contiene unas 50100 mil unidades. El estudio y la modelizacin de
la produccin del habla intentan explicar como el humano construye un enunciado
hablado a partir de un concepto mental. El estudio de la produccin del habla tiene dos
grandes limitaciones: la imposibilidad de evaluar directamente los procesos que generan
los conceptos y las infinitas posibles combinaciones capaces de ser articuladas para
generar un mismo mensaje. En particular, la manera como el pensamiento se realiza a
travs de un formato lingstico y como involucra estructuras particulares del sistema
nervioso es an un misterio. Estas limitaciones han llevado, an bajo gran controversia, a
fundamentar muchos de los modelos en el estudio de errores de pronunciacin. El hablar
agramatical es extremadamente raro i.e. 2%. Sin embargo, en una conversacin natural
las dudas, las pausas y las repeticiones ocurren con mayor frecuencia i.e. una cada siete u
ocho palabras. Los errores en la produccin pueden involucrar fonemas o silabas o
palabras enteras y en la mayora de los casos se presentan con ciertas regularidades que
permiten su estudio sistemtico dando cuenta de la naturaleza jerrquica de la
organizacin del habla. En efecto, los errores de fonemas y de palabras ocurren
mayormente entre unidades de la misma categora. Por ejemplo, las vocales se
intercambian frecuentemente entre ellas, lo mismo las consonantes, pero prcticamente
nunca se observa el intercambio de vocales por consonantes o viceversa, igualmente, los
verbos se intercambian con verbos y los sustantivos con sustantivos pero no entre ellos.
Adems, los errores ocurren en su mayora al interior de una frase entonacional. La
ocurrencia de estos errores sugiere que ellos suceden despus de haber definido las
propiedades fonolgicas de las palabras. Los errores seran por una seleccin errada de
los fonemas o de las palabras una vez que la palabra apropiada fue elegida.
Alternativamente, las pausas inadecuadamente distribuidas al interior de las frases son
ms frecuentes en frases sintcticamente ms complejas, indicando que coinciden con un
esfuerzo activo de organizacin en el programa del habla. A continuacin se presentan
algunos modelos de produccin del habla.

El modelo de generador de enunciados desarrollado por Fromkin [36] propone un


generador top-down que distingue seis etapas de representacin del enunciado. Las etapas
son: a) la generacin del significado a transmitir; b) el mapeo de significado en una
estructura sintctica; c) la generacin de un contorno entonacional; d) la seleccin de las
palabras desde el diccionario mental; e) la seleccin de los aspectos fonolgicos de la
unidad a pronunciar y f) la generacin del programa motor del habla.

El modelo de Garrett [37] hace implcitos ciertos aspectos explcitos del modelo de
Fromkin. Este modelo diferencia un nivel conceptual de un nivel funcional y un nivel
posicional de las unidades al interior de las unidades lingsticas a producir.

El modelo de Dell es un modelo conexionista que incluye adems el concepto de


activacin diseminada. El modelo interactivo de dos etapas de Dell [38] es una red neural
que se activa en dos etapas, una primera a nivel semntica y una segunda a nivel
fonolgico. El nodo semntico dispersa su activacin hacia el nodo lexical y este hacia el
nodo fonolgico. La cascada de activacin es interactiva porque todas las conexiones son
bidireccionales. La funcionalidad de las conexiones bi-direccionales hara posible la
fluencia en la seleccin lexical y explicara algunos sntomas observados en pacientes
afsicos que tienen buen acceso a la palabra pero mal acceso al fonema o vice versa.

El modelo de Levelt [39] recurre a varias etapas que ocurren en serie. Cada etapa debe
ser completada para comenzar la siguiente. La primera etapa es la activacin del concepto
lexical. El concepto lexical activa la forma de la palabra indirectamente a travs de una
unidad intermediaria llamada lemma. El lemma contiene informacin sintctica de la
palabra. Una vez que el lemma ha sido activado y seleccionado, la forma fonolgica de la
palabra puede ser recuperada. La forma fonolgica incluye la morfologa de la palabra
(por ejemplo, la adhesin de sufijos), la estructura mtrica (por ejemplo, el acento) y la
lista de fonemas. Los segmentos, las silabas y los morfemas son incluidos en la forma
mtrica uno por uno para construir una unidad lingstica mayor. Asume que los fonemas
y la prosodia son planeados de manera independiente primero los fonemas y luego la
prosodia, lo que no explica la influencia de la prosodia en el articulacin de los fonemas.
Una vez definida la forma fonolgica de la palabra se inicia la preparacin de la
articulacin de la palabra. El modelo no precisa como se realiza la articulacin en si pero
propone que hay ciertas silabas de uso frecuente que son ms fcilmente accedidas que
otras. Finalmente, un sistema auditivo de automonitoreo del habla chequea los errores de
produccin. Errores del habla del tipo en-la-punta-de-la-lengua son explicados por
dificultades de la transicin del concepto a la seleccin de la palabra. La principal
objecin a este modelo es que propone un procesamiento serial. El modelo WEAVER
[40,41] es una implementacin conexionista de la propuesta de Levelt.

DIVA (Directions Into Velocities of Articulators). DIVA [42] usa lo que omos y
sentimos para guiar la produccin, esta basado en un modelo conexionista y se focaliza
en la caracterizacin de los procesos articulatorios en si. DIVA aprende a construir mapas
auditivos desde gestos articulatorios como lo que ocurre en el balbuceo. Supone que hay
varias maneras de producir un ejemplar de habla perceptualmente aceptable que se afina
con el aprendizaje. El correlato neural de DIVA involucra a las reas motoras, auditivas y
orosensoriales del cerebro y cerebelo. Este modelo agrega a otros, como el de Levelt por
ejemplo, la descripcin del feedback auditivo y la descripcin precisan de la
programacin de los gestos articulatorios durante la produccin del habla. Desde esta
perspectiva, considera la influencia de la prosodia que envuelve a las frases o a las
palabras. La articulacin de los fonemas es de mayor intensidad en los fonemas que
ocurren al inicio con respecto a aquellos que ocurren al final de los enunciados.
Igualmente, son mayores para los fonemas al inicio de la palabra que al final de ella. Esta
simetra seria til para corregir la menor predictibilidad de los fonemas localizados al
inicio de los enunciados [43].

Algunos aspectos neurocognitivos del lenguaje


El diseo de modelos neurocognitivos del lenguaje requiere de un enfoque del sistema
nervioso que describa la manera como la actividad de un conjunto de rganos genera
lenguaje. Numerosos enfoques han sido propuestos desde el estudio de lesiones. En
efecto, el modelo clsico de Wernicke-Leichteim, S19 [44] ha sido la base de los modelos
modernos de procesamiento del lenguaje [45-47]. Sin embargo, en las ltimas dcadas los
ms grandes avances han reposado en el uso de mtodos de neuroimagen.
Particularmente de la resonancia magntica funcional, que permite detallar la anatoma de
los procesos lingsticos y de la magneto-electroencefalografa que informa de la
dinmica temporal de stos. En esta seccin se ejemplifican las bases neurales del
lenguaje en dos temas: la lateralizacin cerebral y los sistemas ventrales-dorsales.

Lateralizacin cerebral. Se ha sugerido que a nivel de la corteza cerebral habra


diferencias inter-hemisfricas y regionales en el procesamiento del lenguaje. Estudios
recientes han propuesto que la base de estas diferencias reposa en el tipo de
procesamiento que desarrollan las redes neurales de ambos hemisferios. El hemisferio
derecho (HD) estara dotado de redes neurales especialmente dedicadas a procesar los
sonidos del habla en escalas temporales largas, mientras que el hemisferio izquierdo
tendra redes especializadas en el procesamiento lingstico en ventanas temporales
cortas. Una ventana temporal larga corresponde a un rango de cientos de milisegundos,
y corresponden al tiempo necesario para realizar y procesar unidades lingsticas con
significado, tales como una palabra, una slaba o una frase. El procesamiento a escala
temporal corta involucrara el anlisis de unidades lingsticas que ocurren en decenas
de milisegundos como los fonemas, y permitira discriminar eventos como /la/ de /las/. El
acceso global al significado de las frases necesita de la integracin ptima de ambos
sistemas que operan a diferente escala temporal [48,49]. La evidencia actual soporta al
menos la propuesta de que el HI procesa eventos lingsticos breves. En efecto, el HI se
activa predominantemente durante tareas en que se pide procesar categricamente los
fonemas mientras que tareas que requieren el anlisis de eventos ms extensos como el
reconocimiento de palabras y de los aspectos entonacionales del habla presentan una
activacin de ambos hemisferios.

Sistemas ventrales y dorsales. La neuroanatoma del lenguaje permanece poco clara en


muchos aspectos, sin embargo, datos recientes apoyan la idea que en adultos habra
circuitos ventrales y dorsales en ambos hemisferios cerebrales. Los circuitos ventrales
estaran involucrados en la percepcin y la comprensin del objeto lingstico del habla,
similar a qu observado en el sistema visual [50-54]. Los circuitos dorsales, fuertemente
lateralizados a izquierda, permitiran el mapeo de los componentes sub-semnticas hacia
regiones anteriores en el lbulo frontal, influyendo en los circuitos articulatorios que
permiten la produccin del habla. Los circuitos ventrales involucran a los giros temporal
medio (GTM) y superior (GTS) mientras que los dorsales corresponderan a las regiones
posteriores del lbulo frontal, el oprculo parietal y la regin ms postero-dorsal del
lbulo temporal.
El GTS en sus regiones mas anteriores y el sulcus temporal superior predominantemente
a izquierda mapean el componente fonmico del lenguaje [55-57]. Desde all se
distribuye ampliamente esta informacin hacia la red semntica sobre gran parte de
ambos hemisferios [58]. Las redes sintcticas se distribuiran a partir de la regin anterior
del lbulo temporal (LTA). El rea LTA esta mas activa cuando las personas leen o
escuchan historias mas que una lista desestructurada de palabras o sonidos [59-61], y su
lesin provoca problemas en la comprensin de estructuras sintcticas [62].
Las redes dorsales estaran relacionadas con la traduccin de sonido a accin. Sera
similar a la va del donde observada en el sistema visual y hara interfase con el sistema
motor [63,64]. La integracin auditivo-motora es crucial para el habla. El modelo de
Wernicke incluye una va directa [44], las teoras motoras de percepcin auditiva asumen
una conexin directa auditivo motor [65] y recientemente se ha sugerido que el rea
temporo-parietal alrededor de la cisura de Silvio (rea Spt) se encargara de la traduccin
de lo sensorial a lo motor [66].

Resumen. Comprender y modelar el lenguaje ha sido uno de los principales objetivos de


las ciencias cognitivas modernas. En las ltimas dcadas se ha avanzado en la obtencin
de datos empricos que han contribuido al modelamiento de numerosos aspectos
especficos del lenguaje tales como la percepcin y produccin de fonemas. La meta
actual es proponer modelos generales que expliquen de manera integrada la estructura del
lenguaje en los diferentes momentos de su desarrollo y en condiciones normales y
patolgicas.

Referencias
1. Chomsky N (1957). Syntactic structures. The Hague, Mouton
2. Holdcroft D (1991). Saussure: Signs, System, and Arbitrariness, Cambridge: Cambridge University Press.
3. Jakobson R (1960). Style in Language. Ed. Thomas Sebeok
4. Cassirer B (1923). Philosophie der symbolischen Formen. Erster Teil: Die Sprache. Berlin: Bruno
Cassirer. Translated as The Philosophy of Symbolic Forms. Volume One: Language. New Haven: Yale
University Press, 1955.
5. Hockett C (1960). The Origin of Speech. Scientific American, 203:89-97.
6. Pinker S (1984). Language learnability and language development. Cambridge, Harvard University Press.
7. Kuhl PK (2004). Early language acquisition: cracking the speech code. Nature Review Neuroscience.
5(11):831-43.
8. DeCasper A, Spence S (1986). Prenatal maternal speech influences newborns' perception of speech
sounds. Infant Behavior and Development, 9, 133-150.
9. DeCasper AJ, Fifer WP (1980). Of human bonding: newborns prefer their mothers' voices. Science. 6;
208:1174-6.
10. Lenneberg EH (1967). Biological Foundations of Language. New York, John Wiley and sons.
11. Mehler J, Dupoux E (1990). Natre Humain. Paris, Editions Odile Jacob.
12. Fodor J. (1983). The Modularity of Mind MIT Press Cambridge, Mass.
13. Bates EA, MacWhinney B (1987). Competition, Variation, and Language Learning. In Mechanisms of
Language Acquisition, Ed. Brain MacWhinney, 157-193. Hillsdale, NY: Lawrence Erlbaum.
14. MacDonald MC, Pearlmutter NJ, Seidenberg MS (1994). Lexical nature of syntactic ambiguity
resolution, Psychol. Rev. 101(4): 676703.
15. Marslen-Wilson WD, Tyler LK (1980). The temporal structure of spoken language understanding,
Cognition 8:171.
16. Taraban R, McClelland JL (1988). Constituent attachment and thematic role assignment in sentence
processing: Influences of content-based expectations. Journal of Memory and Language. 27(6): 597-632.
16. Rumelhart DE, McClelland JL, the PDP research group (1986). Parallel distributed processing:
Explorations in the microstructure of cognition. Volume I. Cambridge, MA: MIT Press.
17. Marcus GF, Brinkmann U, Clahsen H, Wiese R, Pinker S (1995). German inflection: the exception that
proves the rule. Cognit Psychol. 29(3): 189-256.
18. Squire LR (1987).Memory and the Brain, New York, Oxford University Press.
19. Fowler CA (1995). Speech production. Handbook of Perception and Cognition: Speech, Language, and
Communication. Ed. J.L. Miller, P.D. Eimas. San Diego: Academic Press.
20. Lisker L, Abramson AS (1967). Some effects of context on voice onset time in English stops. Language
and Speech, 10: 1-28.
21. Nygaard LC, Pisoni DB (1995). Speech Perception: New Directions in Research and Theory.
Handbook of Perception and Cognition: Speech, Language, and Communication. Ed. J.L. Miller, P.D.
Eimas. San Diego: Academic Press.
22. Hillenbrand J, Getty LA, Clark MJ, Wheeler K (1995). Acoustic characteristics of American English
vowels. Journal of the Acoustical Society of America 97: 3099-3111.
23. Syrdal AK, Gopal, HS (1986). "A perceptual model of vowel recognition based on the auditory
representation of American English vowels". Journal of the Acoustical Society of America 79: 1086-1100
24. Strange W (1999). Perception of vowels: Dynamic constancy. The Acoustics of Speech
Communication: Fundamentals, Speech Perception Theory, and Technology. Ed. JM Pickett. Needham
Heights (MA): Allyn & Bacon
25. Johnson K (2005). Speaker Normalization in speech perception. The Handbook of Speech Perception.
Ed. Pisoni DB, Remez R. Oxford: Blackwell Publishers
26. Liberman AM, Harris KS, Hoffman HS, Griffith BC (1957). The discrimination of speech sounds
within and across phoneme boundaries. Journal of Experimental Psychology, 54: 358-368.
27. Kewley-Port D, Luce PA (1984). Time-varying features of initial stop consonants in auditory running
spectra: A first report. Perception and psychophysics, 35: 353-360.
28. McGurk H, MacDonald J (1976). Hearing lips and seeing voices. Nature, 264: 746-748
29. Fowler CA, Dekle, DJ (1991). Listening with eye and hand: Cross-modal contributions to speech
perception. Journal Experimental Psychology: Human Perception and Performance, 17: 816-828.
30. McClelland JL, Elman JL (1986). The TRACE model of speech perception. Cognitive Psychology 18:
1-86.
31. Warren RM (1970). Restoration of missing speech sounds. Science 167: 392-393.
32. Massaro DW (1989). Testing between the TRACE Model and the Fuzzy Logical Model of Speech
perception. Cognitive Psychology 21:398-421
33. Stevens KN (2002). Toward a model of lexical access based on acoustic landmarks and distinctive
features. Journal of the Acoustical Society of America 111(4): 1872-1891)
34. Johnson K (2005). Speaker Normalization in speech perception. The Handbook of Speech Perception.
Ed. Pisoni, DB, Remez, R Oxford: Blackwell Publishers
35. Halle & Stevens, 1964.
36. Fromkin V (1971). The non-anomalous nature of anomalous utterances. Language, 47, 27-52.
37. Garrett MF (1975). The analysis of sentece production. Ed. GH Bower. The Psychology of Learning
and Memory, Vol 9. Academic Press.
38. Dell GS (1986) A spreading-activation theory of retrieval in sentence production Psychol. Rev. 93,
283321)
39. Levelt WJM (1989). Speaking: From Intention to Articulation. Cambridge: MIT Press.
40. Levelt WJM, Roelofs A, Meyer AS (1999). A theory of lexical access in speech production. Behavioral
and Brain Sciences. 22: 1-75
41. Roelofs A (1997). The WEAVER model of wordform encoding in speech production Cognition 64,
249284
42. Guenther F, Perkell J (2004). A neural model of speech production and its application to studies of the
role of auditory feedback in speech. In Motor Control in Normal and Disordered Speech. Eds. B. Maassen,
R Kent. Oxford: OUP. pp. 29-49.
43. Keating PA (2005). Phonetic encoding of prosodic structure. In Speech Production: Models, Phonetic
Processes and Techniques. Psychology Press, Eds. J Harrington, M Tabain, New York.
44. Wernicke (1874). Der aphasiche Symptomenkomplex. Breslau, Poland: Cohen & Weigert.
45. Hickok G, Poeppel D (2007). The cortical organization of speech processing. Nature Reviews
Neuroscience 8: 393:402
46. Price C (2000).The anatomy of language: contributions from functional neuroimaging. J. Anat.
197:335-359
47. Friederici AD (2002). Towards a neural basis of auditory sentence processing. Trends in Cognitive
Sciences, 6(2): 78-84
48. Goldsmith JA (1990). Autosegmental and Metrical Phonology, Blackwell
49. Meyer AS (1992). Investigation of phonological encoding through speech error analysis: achievements,
limitations, and alternatives Cognition 42, 181211.
50. Hickok G, Poeppel D (2000). Towards a functional neuroanatomy of speech perception. Trends Cogn.
Sci. 4, 131138.
51. Hickok G, Poeppel D (2004). Dorsal and ventral streams: A framework for understanding aspects of the
functional anatomy of language. Cognition 92, 6799.
52. Rauschecker JP (1998). Cortical processing of complex sounds. Curr. Opin. Neurobiol. 8, 516521.
53. Scott SK (2005). Auditory processing speech, space and auditory objects. Curr. Opin. Neurobiol. 15,
197201.
54. Scott SK, Wise RJ (2004). The functional neuroanatomy of prelexical processing in speech perception.
Cognition 92, 1345
55. Price CJ, Wise RJS, Warburton E, Moore CJ, Patterson K, Howard D et al. (1996). Hearing and saying:
the functional neuroanatomy of auditory word processing. Brain 119: 919-931.
56. Liebenthal E, Binder JR, Spitzer SM, Possing ET Medler DA (2005). Neural substrates of phonemic
perception. Cereb. Cortex 15, 16211631
57. Indefrey P, Levelt WJ (2004). The spatial and temporal signatures of word production components.
Cognition 92, 101144.
58. Damasio AR, Damasio H (1994). Large-scale neuronal theories of the brain. Eds. C. Koch, JL Davis.
MIT Press, Cambridge, Massachusetts, pp. 6174.
59. Friederici AD, Meyer M, von Cramon DY (2000). Auditory language comprehension: an event-related
fMRI study on the processing of syntactic and lexical information. Brain Lang. 74, 289300.
60. Humphries C, Willard K, Buchsbaum B, Hickok G (2001). Role of anterior temporal cortex in auditory
sentence comprehension: an fMRI study. Neuroreport 12:17491752.
61. Humphries C, Love T, Swinney D, Hickok G (2005). Response of anterior temporal cortex to syntactic
and prosodic manipulations during sentence processing. Hum. Brain Mapp. 26, 128138.
62. Dronkers NF, Wilkins DP, Van Valin RDJr, Redfern BB, Jaeger JJ (2004). in The New Functional
Anatomy of Language: A special issue of Cognition. Eds. G. Hickok, D Poeppel. 145177. Elsevier
Science.
63. Hickok G, Poeppel D (2000). Towards a functional neuroanatomy of speech perception. Trends Cogn.
Sci. 4:131138.
64. Hickok G, Poeppel D (2004). Dorsal and ventral streams: A framework for understanding aspects of the
functional anatomy of language. Cognition 92: 6799
65. Liberman AM, Mattingly IG (1985). The motor theory of speech perception revised. Cognition 21, 1
36.
66. Hickok, G, Buchsbaum, B, Humphries, C, Muftuler, T (2003). Auditorymotor interaction revealed by
fMRI: Speech, music, and working memory in area Spt. J. Cogn. Neurosci. 15, 673682

You might also like