You are on page 1of 12

La aplicación de las bases de datos al estudio histórico del español

Author(s): Gloria Clavería Nadal and Carlos Sánchez Lancis


Source: Hispania, Vol. 80, No. 1 (Mar., 1997), pp. 142-152
Published by: American Association of Teachers of Spanish and Portuguese
Stable URL: http://www.jstor.org/stable/345994
Accessed: 30-11-2015 23:10 UTC

Your use of the JSTOR archive indicates your acceptance of the Terms & Conditions of Use, available at http://www.jstor.org/page/
info/about/policies/terms.jsp

JSTOR is a not-for-profit service that helps scholars, researchers, and students discover, use, and build upon a wide range of content
in a trusted digital archive. We use information technology and tools to increase productivity and facilitate new forms of scholarship.
For more information about JSTOR, please contact support@jstor.org.

American Association of Teachers of Spanish and Portuguese is collaborating with JSTOR to digitize, preserve and extend
access to Hispania.

http://www.jstor.org

This content downloaded from 130.64.11.153 on Mon, 30 Nov 2015 23:10:43 UTC
All use subject to JSTOR Terms and Conditions
THEORETICAL
LINGUISTICS
/ MEDIA
Preparedby John Lipski/ RichardA. Raschio

La aplicaci6n de las bases de datos al estudio


hist6rico del espafiol
GloriaClaveriaNadaly CarlosSainchezLancis
UniversidadAut6nomade Barcelona
Abstract:El empleode bases de datosaplicadasal estudiode la historiade unalenguase configuracomouna
metodologiaque permitemejorarsustancialmentela calidadde las investigaciones.Se presentancomo prue-
ba de ello dos aplicacionesal estudiodel espafioldesarrolladasen el Seminariode Filologiae Informiticade
la UniversitatAut6nomade Barcelona:1) la elaboraci6nde una base de datos de elementos lingiiisticosde
espacioy tiempodel espafiolmedieval,que recoge distintasinformacionescuya combinaci6nmediantepro-
cedimientosinformiticospermitela caracterizaci6ngramaticaldel sistemadeictico;2) la informatizaci6n del
Diccionariocriticoetimoldgicocastellanoe hispdnicode J. Corominasy J.A. Pascualparala constituci6nde un
granbanco de datoshist6ricosy etimol6gicosdel espafiol,que serviri como principiorenovadory continua-
dor a la vez de los estudios etimol6gicosdedicadosal espafiol.

Key Words: bases de datos,lengua espafiola,sintaxishist6rica,deixis, lexicografia,etimologia

1. La ayuda de la informAtica. Lainfor- ademais,actualmenteun vinculoinformiti-


mitica ofrece grandesventajasal lingiiista co entre texto, concordanciay base de da-
hist6rico y al filblogo en algunas labores tos, porcuantose puedeobtener,a partirde
que han de llevarsea cabo en el transcurso las concordanciasde un texto antiguo,una
de todainvestigaci6n;se trataespecialmen- base de datos de sus formas16xicasde ma-
te de los trabajosrelacionadoscon la reco- nerasemiautomitica;ello es posiblegracias
lecci6n y almacenamientode datos, y su al programaTRANSCALCelaboradopor
posteriorgesti6n. Los medios informiticos Ramon Capsada y Joan Torruella en el
pueden intervenirde maneraactivay deci- Seminari de Filologia i Informaiticade la
sivacomo herramientaen la elaboraci6nde Universitat Autbnoma de Barcelona
ediciones y de concordanciasde textos, de (Torruella1993;Capsada-Torruella 1995).
diccionarioso vocabulariosde textos anti- 1.1. La base de datos y su estructu-
guos, de corpus formadoscon fuentes do- ra. El disefio de la estructurade una base
cumentalesantiguas,etc.' de datosrelacionalaplicadaa cualquierdis-
Un caso concreto de la aplicaci6nde la ciplinalingiiisticaexige dos pasos: en pri-
informaitica a la lingiifsticahist6ricase ha- mer lugar, el anailisisprevio de los datos
lla en la utilizaci6n de sistemas de gesti6n para establecer los tipos de informaci6n
de bases de datos.Se presentandos posibi- (campos) que van a introducirseen cada
lidades distintas:la aplicaci6nde las bases fichero;y, en segundo lugar,la comproba-
de datos en estudios de sintaxis y de ci6n continuade la fiabilidadde la base de
lexicografia.Lasbases de datos se configu- datos y la correspondenciade la estructu-
ran en estas investigacionescomo un me- ra disefiadacon los objetivosde la investi-
dio que facilitael manejode un grannmime- gaci6n.Este procedimientorepresentauna
ro de datosy la elaboraci6nde corporahis- gran ventaja respecto a otros tipos de
t6ricos;a la vez intervienenactivamenteen metodologiasde investigaci6nque no utili-
la mismaconfiguraci6nde la investigaci6n, zan herramientasinformiticas,ya que per-
pues en si mismaslas bases de datos cons- mitela continuaconstataci6nde lafiabilidad
tituyen un preanailisisde los datos, y los de la estructura disefiada, asi como su
resultadosobtenidosa partirde ellas ofre- remodelaci6n y mejora con un esfuerzo
cen siempre mayores posibilidadesde re- minimo. Este tipo de herramientas
visi6n, ampliaci6ny reutilizaci6n.Existe, informiticas resulta de gran utilidadpor-

This content downloaded from 130.64.11.153 on Mon, 30 Nov 2015 23:10:43 UTC
All use subject to JSTOR Terms and Conditions
THEORETICALLINGUISTICS/ MEDIA 143

que, a partirde un corpusde datos lingfiis- en soporteinformitico,ofreciendocon ello


ticos de diferenteclase y naturaleza,permi- nuevasviasde investigaci6n.Nos referimos
te la creaci6nde distintosmicrocorporade alas edicionesdigitalizadas(MarcosMarin
caricter mis o menos especifico.Ademis, 1991;Faulhaber1991), por ejemplo,el Ar-
facilitael manejoy la interrelaci6nde 6stos. chivoDigital de Manuscritosy TextosEspa-
holes (ADMYTE).La elecci6n de una de
2. El corpus de datos. La lingfiistica estas posibilidadespuede hacervariarsen-
hist6rica tiene como material de andlisis siblemente los resultados obtenidos en la
diferentes tipos de datos lingtiisticos; la investigaci6n: las ediciones criticas, por
granmayoriade 6stos provienende fuentes ejemplo,se alejande la realidadlingiitstica
escritas,pues son pricticamentelos tinicos hist6ricaal tratarse,en general,de recons-
restos que pervivende un estadiode lengua trucciones de una obraa partirde la com-
antiguo.A pesar de todas sus limitaciones, binaci6nde diversosmanuscritoscon posi-
especialmentecomoreflejode la pronuncia- ble cronologia y procedencia geograifica
ci6n y de la lengua coloquial,resultanim- diferentes,por lo que el resultadono deja
prescindiblese irremplazables.Ante la au- de ser un mero productohipot6ticoque no
sencia de hablantes nativos de una 6poca puede ser tomadocomo representaci6nde
anterior,"the written documentationof a un estado de lengua determinado.El mis-
language can thus be regardedas a useful mo documento antiguo (manuscrito),por
model of the relevant linguistic environ- formar parte de una pervivencia textual
ment for (pre-)adult learning of this compleja,puede no ser reflejode un solo
linguisticmodality,in the same sense as the idiolecto,sino ser depositariode estratosde
spoken register is accepted as the proper lengua de epoca y zona distintas,de ahi la
linguistic context determining the many aplicaci6ndel conceptode diasistemaa esta
stages of infantlanguagelearning"(Wanner esfera (Echenique1992,235).
1991, 174-75). b) La palabracomo unidadde andlisis.
El vinculo entre texto y estudio hist6ri- El corpusde datospuede tambiknobtener-
co lieva a plantearla relaci6n privilegiada se no directamentedel texto, sino de mane-
entre este y la filologia.El lingifistahist6ri- ra indirecta;aunqueel texto siempre es la
co debe combinarla explicaci6n estricta- fuente iltima y basica, es posible utilizar
mente lingiistica con la rigurosidaden el como punto de partidalas concordancias
tratamientoe interpretaci6nde los datos del textoo las obraslexicogrificasde caraic-
escritos, propiasde la investigaci6nespeci- ter hist6rico.En amboscasos la palabraes
ficamente filol6gica. Tambien el fil6logo el elementofundamentala travesdel que se
necesita del auxiliode la lingifisticahist6ri- extrae un corpus de datos paracualquier
ca en sus estudios. tipo de andlisis lingiiistico.
2.1. Caracteristicas del corpus. Una
vez establecidoel texto como base de estu- 3. Bases de datos y sintaxis hist6ri-
diofundamentaldel lingiiistahist6rico,con- ca. La aplicaci6n de la informaiticay las
viene precisarde que manerase puede ac- bases de datosrelacionalesal estudio de la
ceder a 1: sintaxis del espafiol es bastante reciente,
a) El texto como unidadde andlisis.La como lo demuestranlos trabajosde G.Rojo
particulary complicadapervivenciade los (1992;1993;1994).Lafinalidadde la inves-
textos antiguosy los distintostipos de edi- tigaci6nde este lingilistaconsiste en crear
ci6n moderna que se pueden hacer de ellos una base de datos sinticticos del espafiol
proporcionan al lingiista hist6rico diversas actual (BADSEA), cuya derivaci6n mis in-
posibilidades de acceder al material de es- mediata es la realizaci6n de un Diccionario
tudio; asi, es posible elegir desde el manus- de construccionesverbalesdel espalol actual
crito hasta la edici6n critica e incluso actual- (DICVEA). En palabras de G. Rojo (1993,
mente se dispone de versiones del texto que 19), la gran utilidad de un proyecto de es-
compatibilizan el manuscrito con la edici6n tas caracteristicas estriba en el hecho de

This content downloaded from 130.64.11.153 on Mon, 30 Nov 2015 23:10:43 UTC
All use subject to JSTOR Terms and Conditions
144 HISPANIA 80 MARCH1997

que, con su obtenci6n,"todoscuantos tra- pafiol medieval de la Universidad de


bajamossobre el espafiolactualdispondre- Wisconsin, y tras la obtenci6n de concor-
mos en ese momentode una enormecanti- dancias,se ha realizadounacodificaci6n2 de
dad de materialesanalizadoscon los que, los textos tanto a nivel morfol6gico (pala-
estamos seguros, nuestros conocimientos bras) como a nivel sintaictico(sintagmasy
del componente sintaicticode esta lengua oraciones), de tal modo que sean posibles
serin mis amplios y, sobre todo, estarfin las blisquedas, incluso interrelacionadas,
mejorfundamentadosen el uso real"(6nfa- por palabras, categorias morfol6gicas y
sis nuestro). constituyentes.Lacodificaci6npresentaun
Lasbases de datosno s61ose han aplica- andlisisneutralde los datos, con el fin de
do al estudio del espafiol,sino que han ser- que sirva parafuturos andlisisde diferen-
vidotambi6nparala comparaci6ntipol6gica tes investigadores.3Lacombinaci6nde con-
de lenguas distintas, como explica J. C. cordanciasautomatizadas juntocon la crea-
MorenoCabrera(1995,63-66). ci6n manualde ficheros constituye,seglin
En el estudio de la sintaxishist6ricadel D. Wanner(1991,183),"acontrolcorpusto
espafiol,el uso de herramientasinformiti- delimit some dimensions of a linguistic
cas se perfilacomo una gran ayudaparala norm within the rich spectrum of Old
renovaci6nde esta disciplina,tan necesita- Spanish."
da en la actualidadde nuevas investigacio- En la linea descritaanteriormente,pre-
nes y metodologiasque le permitanenfren- sentamosa continuaci6nun tipoparticular
tarse al anailisisde nuevos corpora. de base de datos que se ocupa de un pro-
Lasexcelencias de la aplicaci6nde la in- blema especifico de sintaxis hist6rica del
formaiticaal estudio de la sintaxishist6rica espafiol medieval.4A partir de un corpus
del espahiol han sido explicitadas compuestoportextos literariosmedievales
pormenorizadamente por D. Wanner de diferentesg6nerosde los siglosXIIalXV
(1991).Lacreaci6nde unabase de datosdel (Cantarde Mio Cid, GeneralEstoria, Los
espafiolmedievalse postulacomo unagran Milagros de Nuestra Seniora, El conde
necesidad parael desarrolloactual de los Lucanor,Librode Buen Amor,Corbacho,y
estudios de sintaxishist6rica,ya que dicha La Celestina),se obtuvierondos ficheros,
disciplinadebe manejaruna gran cantidad formadosen totalpor 16.708registros,que
de datos,procedentesde corporatextuales, recogen uno los elementos lingitisticosde
con el fin de caracterizarla lenguay suplir espacioy otro los de tiempo.Cadaregistro
en lo posible la ausenciade hablantesnati- presenta la estructura que aparece en el
vos. Tomandocomo base el corpus del es- cuadro1.

VARIANTE GRAFICA: delant oy


LEMA: delante hoy
CLASE GRAMATICAL: adverbio adverbio
FUNCION GRAMATICAL: preposici6n adverbio
SENTIDO GRAMATICAL: espacial temporal
SIGNIFICADO: 'delantede' 'hoy'
TIPO SIGNIFICADO: espacial temporal
TIEMPO VERBAL: presente presente
POSICION VERBAL: pospuesto pospuesto
TEXTO: Enbraqanlos escudos delant los coraqones vailamela tu gracia oi en esti dia,
AUTOR: an6nimo Berceo
OBRA: Cid Milagros
GENERO: verso verso
FECHA: h. 1140 1244-55
PAGINA/VERSO: vs. 715 vs. 475b
Cuadro 1

This content downloaded from 130.64.11.153 on Mon, 30 Nov 2015 23:10:43 UTC
All use subject to JSTOR Terms and Conditions
THEORETICALLINGUISTICS/ MEDIA 145

Esta estructuraresulta de la aplicaci6n En segundo lugar,resulta imprescindi-


de un procesode andlisisque obtienecomo ble saber, primeramente, la categoria
resultado la combinaci6n, dentro de una morfol6gica(clasegramatical)del elemen-
mismabase de datos, de unas informacio- to lingtiisticoestudiado,la cual es determi-
nes textuales (frutode un proceso mecani- nante paraconocer sus posibles funciones
co/informitico) y unas determinadasinfor- sintaicticas,establecersi existe o no un pro-
macioneslingfiisticas(frutode un proceso ceso de gramaticalizaci6n,etc.; asi como
manual/intelectual). anotar todos aquellos datos de indole
3.1. Tipos de informaciones. morfosintaictica(morfemasde concordan-
3.1.1. Informaciones lingiiisticas. cia,etc.) que puedanser ritilesparala inves-
Las informacionesde tipo lingiiisticoabar- tigaci6n.Por ejemplo,encimapertenece a
can los diferentesniveles de andlisis.Estas la clase gramaticalde los adverbios,y sobre
se pueden desglosar en informaciones a la de las preposiciones. Sin embargo,
grifico-foneticasy en informacionesgrama- ambos elementos no s61locomparten un
ticales. En primerlugar,si se toman como mismo significado,sino que presentanun
modelo los estudios lexicogrificos, resulta comportamientosintActico(funci6ngrama-
imprescindibleincluir,dentrode cadaficha, tical) similar,ya que el primeropuedeequi-
el elementoo elementoslkxicosque se ana- valer tambienen algunas ocasiones a una
lizanseg6inla formagraificacon que apare- preposici6n,lo cualnos Ilevaa replantearla
cen (variantegrdifica),asi como la unidad ?diferente?naturalezamorfol6gicade am-
lkxica a la que corresponden (lema), que bos.
nos permite relacionare identificartodas La funci6n sintaictica(funci6ngramati-
las variantesgrificas aparecidas.Porejem- cal) que desempefiael elemento o elemen-
plo, en el cuadroanteriorla formagrifica tos estudiados,asi como su posici6ndentro
delant, convive en espafiol medieval con de la oraci6n,son los rasgos minimos,ade-
delante,deland;y o' aparecejuntoa oy,hoy. mis de otros muchos, que deben conside-
La comparaci6n de todas las formas rarse en un andlisis de este tipo. Es muy
grificas que presenta el adverbioende en importanteparael estudiode los adverbios
espafiolmedieval,tal como se recogen en de espacio conocer su posici6nrespecto al
el cuadro2, puede ser de gran ayudapara verbo (antepuestoo pospuesto),ya que este
estudiarla evoluci6ngramaticalque presen- dato,por ejemplo,puede ayudara explicar
ta dicho elemento adverbial (y al mismo la progresivagramaticalizaci6ny perdida
tiempo pronominal)a lo largo de su histo- del adverbioy 'alli' en espafiol medieval,
ria. quedandofusionadocon el verbo haberen

LEMA S.V. SIGNIF. OBRA REF.


den ende 'dealli' Cid vs. 1507
dend ende 'deello' Cid vs. 1063
dende ende 'deello' Lucanor p. 107
dent ende 'deello' Cid vs. 1038
dente ende 'deallif' Celestina p. 177
desend ende 'despues' Milagros vs. 208d
desende ende 'despues' Milagros vs. 493a
desent ende 'despues' Milagros vs. 848a
dessende ende 'despues' Milagros vs. 193d
dessent ende 'despues' Milagros vs. 192c
end ende 'dealli' Milagros vs. 128d
ende ende 'deello' Cid vs. 2100
ent ende 'de ello' Milagros vs. 815b
Cuadro2

This content downloaded from 130.64.11.153 on Mon, 30 Nov 2015 23:10:43 UTC
All use subject to JSTOR Terms and Conditions
146 HISPANIA 80 MARCH 1997

la formahay,comoconstatamosen los ejem- 3.1.2. Informaciones textuales. En


plos siguientes:"talesi a que prenden,ta- ellas se incluyendiferentesdatos sobre el
les i a que non" (Cid);"Nohay cosa tan li- texto analizado.En el campotexto se reco-
gera para huyr como la vida" (Celestina). ge el contextoen dondeapareceel elemen-
Ademais,tambienes necesario conocer la to o elementosl6xicosestudiados.Suexten-
funci6nsintaicticaque realizantodos aque- si6n puede variaren funci6ndel problema
llos elementos usados parala expresi6nde sintaictico,por lo que se toma como limite
la deixis temporal (nficleo de un SN, SP, el sintagma, la oraci6n (en parte o en su
SAdv;complementode un SP;sujeto,CRV, totalidad)o incluso diferentesfragmentos
CC;etc.), de tal modo que podamos estu- del texto. Es imposible justificar el valor
diar y justificarel valor circunstancialde deictico de los adverbios estudiados, sin
aquellos sintagmasnominalescon sentido que se incluyael referente, el cual puede
temporalque aparecen en la misma posi- apareceren oracionesanteriores,como en:
ci6n que los adverbios de tiempo, como "Elpradoqe vos digo avidotrabondat:/ ...
vemos en el siguienteejemplo:"quelos cas- / qui alli se morasse serie bienventurado"
tigo como aquel dia onrrassen cada anno (Milagros).
ellos e aquellosotros delos agenos que con Lainformaci6nde referenciase expresa
ellos lo quisiessen, como es dicho, e su en un conjuntode camposdistintos.En es-
linage por siempre iamas" (General tos campos se incluye el autor,la obra, el
Estoria).La comparaci6ny relaci6n de to- g6nero, la fechay la paiginao verso de don-
das estas informaciones permite extraer de procedeel texto transcrito,con el fin de
consecuenciasque de otro modo no serian localizary situarhist6ricamenteel proble-
posibles. ma analizado,y determinarsi se tratade un
El sentido gramaticalde todo elemento rasgo general,dialectalo idiolectal(propio
16xico, y en especial de los deicticos, pue- de una 6pocadeterminada,de una zona,de
de variaren funci6ndel contextosintaictico una obra o un autor en concreto), o estai
en el que se inserta.Porello, es muyimpor- regido por condicionamientosestilisticos.
tante registrareste tipo de casos con el fin 3.2. Explotaci6n de la base de datos.
de constatarcualquiercambio semiantico La confecci6n de una base de datos so-
cuyo origen se encuentre en una determi- bre elementos deicticos de espacio y tiem-
nada construcci6nsintaictica.Por ejemplo, po del espafiolmedievalha ayudadoa carac-
gracias a la posibilidad de relacionar el terizar morfosintacticamente una 6poca
fichero de los adverbiosde espacio con el concretade esta lengua,gracias al andlisis
ficherode los adverbiosde tiempoa traves y confrontaci6nde las informacionesreco-
de los campos sentido gramaticaly signifi- gidas en los distintoscamposde esta base
cado, se observa una conexi6n entre los de datos sintaictica.
adverbios de espacio y los adverbios de Entre las caracteristicasmaisimportan-
tiempoen espafiolmedieval,como aparece tes de la lengua medieval, se ha podido
en el siguienteejemplo,en donde el adver- constatar,como sefialanJ. Gutierrezy J.A.
bio de espacio cerca posee el significado Pascual (1995,148-51), la existenciade un
temporaldepronto:"aunpercao tardeel rey cambiorevolucionarioen el sistema deicti-
quererm'apor amigo"(Cid). co en su evoluci6ndel espafiolmedievalal
Por la propianaturalezade esta clase de espafiol clisico: el paso de la oposici6n
informaciones, s6lo el investigador, previo medieval aqui / alli(y) indicadora de dos
anilisis y estudio detenido del fen6meno campos de referencia en el discurso (proxi-
sintictico dentro de su contexto, es capaz midad / no proximidad al hablante), a la
de elegir los datos que constituyen la base moderna oposici6n aqui / ahi / alli (proxi-
de su investigaci6n. No existen en la actua- midad al hablante / oyente / 61-ella),reali-
lidad analizadores sinticticos lo suficiente- zada esta iltima a partir del siglo XV,como
mente potentes como para suplir al lingiiis- reflejan los datos obtenidos al cruzar la in-
ta en este tipo de situaciones. formaci6n de distintos campos. La relaci6n

This content downloaded from 130.64.11.153 on Mon, 30 Nov 2015 23:10:43 UTC
All use subject to JSTOR Terms and Conditions
THEORETICALLINGUISTICS/ MEDIA 147

entre el desarrollo de un sistema de tres B. Mtiller[1987])y Wisconsin (Dictionary


camposde referenciay la perdidalkxicade of Old Spanish Language, dirigido por J.
los adverbiosendee y no parecedescartar- Nitti)abarcans61lola EdadMediay afintar-
se totalmente,y se puede sostener,incluso, darfinen concluirse (Dworkin1994). Por
que no se tratade una simple casualidad. tanto,los investigadoresdedicadosal espa-
Ademais,la relaci6n de aquendey allende fiol no disponen de un acervo de datos
tanto con los adverbios pronominales lexicogrificos comolos que retinenel OED
locativos espaciales (aqui, all ) como con (The OxfordEnglish Dictionary), el TLF
los adverbiosprepositivos(suso,yuso,etc.) (Trisorde la languefrangaise)o el Diccio-
es evidente si se comparanlos valores de nariodela AcademiaSueca (SAOB:Ordbok
los camposlema, clase gramatical,funci6n iver svenska sprdketutgiven av Svenska
gramaticaly significado. Akademien).Este panoramapermiteenten-
Es posible afirmar,porotrolado,la exis- der que primero el DCELCy despues el
tencia de unarelaci6nentrelas estructuras DCECH hayan servido de diccionarios
que presentan adverbios de espacio pos- etimol6gicos e hist6ricos a la vez, aunque
puestos (rioarriba)y otrasintroducidaspor tanto su estructura como la informaci6n
una preposici6n (por el cobdoayuso). La que incluyenno respondenal esquemabai-
confrontaci6nde los campos lema, clase sico de diccionariohist6rico.
gramatical,funci6ngramatical,sentidogra- El panoramaque presentala lexicografia
matical,textoy fechaha sido de vitalimpor- hist6ricadel espahiolnos impuls6a desarro-
tanciaparaobtenerestos resultados. llar un proyecto de investigaci6nque con-
Por iltimo, la conexi6n entre el sistema juga la aplicaci6nde las nuevast6cnicasin-
de elementos lingfiisticos espaciales y el formiticas y los datos hist6rico-etimol6gi-
sistema temporalquedaclaraa travesde la cos del DCECH.Su objetivoconsiste en la
observaci6n de las informaciones de los confecci6n de un gran banco de datos de
campos sentido gramaticaly tipo de signi- caricter hist6rico-etimol6gicocuya finali-
ficado,en donde se demuestraque el valor dad, entre otrasmuchas,es la de servir de
espaciales el no marcadofrente al tempo- base en la elaboraci6nde un futurodiccio-
ral. nario etimol6gicodel espafiol;de esta for-
ma, el empleo de metodologiasy t6cnicas
4. Bases de datos y lexicografia his- modernas como las bases de datos permi-
t6rica: la informatizaci6n del DCECH. ten bfisquedasmucho maisavanzadasque
La lexicografiahist6ricadedicadaal espa- el diccionariotradicional,como se expone
Aiolofrece un panoramaespecialmentepo- mis adelante.
bre: existen diccionarios etimol6gicos El aprovechamiento de los datos del
como el Diccionarioetimol6gicoespai0ole DCECHes un modode procederque cuen-
hispdnicode V. Garciade Diego (1954);y el ta con la aquiescenciade filblogos de pres-
Diccionariocriticoetimolkgicode la lengua tigio dedicados al estudio etimol6gicodel
castellana(1954-57),cuyarevisi6nha dado espafiol (Col6n1994):
lugaral Diccionariocriticoetimolkgicocas-
tellanoe hispdnico(DCECH)del mismo J. ...paranuestraetimologiatenemosque actuarcon o16
Corominas con la colaboraci6n de J. A. que hay. No cabe, a mi parecer,partirde cero, y po-
nerse a realizaruna magna obra etimol6gicapor el
Pascual (1980-91). estilo de la llevadaa cabo paraFranciapor Walther
No existe, sin embargo,un diccionario vonWartburg
con su Franzdisisches
Etymologisches
hist6rico de la lengua espafiola que incluya (= FEW)o como la que esti procurando
Wiirterbuch
los textos del espafiol desde los origenes realizarMaxPfisterconsuLessico italia-
etimologico
hasta la actualidad, pues el Diccionario his- no (=LEI).
Talproyectohubiesesidodeseableantes
delosafioscincuenta;
ahora,conlapublicaci6n
dedos
thrico de la lengua espaiola (1960-) elabo- edicionesdel diccionario de Corominas
etimol6gico
rado por la Academia se halla todavia en la (el DCELCde 1954-57 y el DECH de Corominas-
letra A, y los proyectos de Heidelberg (Dic- Pascualde 1980-91),lasituaci6nes bastanteparticu-
cionario del espafol medieval, dirigido por lar.Esteesfuerzoes gigantesco,
y todosdebemosun

This content downloaded from 130.64.11.153 on Mon, 30 Nov 2015 23:10:43 UTC
All use subject to JSTOR Terms and Conditions
148 HISPANIA 80 MARCH1997

granagradecimientoal autorprincipal(sin olvidarlas cide on the relationsbetweeninformationtypes that


mejorasdebidasa la perseverantecriticade Jos6 A. are to be expressed. (169)
Pascual).El sentimientode gratitudno debe ni pue- La informatizaci6nimplicacomo proce-
de hacernos olvidar que, al lado de aciertos
magnificos,la obracontienelagunasno menos llama- sos fundamentalesun analisisprofundode
tivas y errores de monta. Es lo que, con el respeto la estructurade los articulosy de los tipos
debido, habriamosde ir enmendandopara llegar a de informaci6nque aparecen en ellos, lo
poseer un cuerpode doctrinadigno. (599) cual es complicadoen un diccionariotan
Existenactualmentedistintosproyectos heterog6neocomoel DCECHen el queuno
de elaboraci6nde unabase de datostoman- de sus fundamentoses la argumentaci6n
do comopuntode partidala informatizaci6n etimol6gica.Todoello ha llevadoal estable-
de diccionarioshist6ricosya existentes en cimiento de las Basespara la informatiza-
forma impresa. Estos se pueden Ilevara cidndelDCECH(1995),normasque siguen
cabo tanto mediante una informatizaci6n los investigadores que llevan a cabo el
manual,este es el procedimientoutilizado trasvasede informaci6ndel diccionarioa la
en la "HistoricalThesaurus Database"ela- base de datos.
boradaen la Universidadde Glasgowque Unavez concluidala informatizaci6ny en
recoge los datos del OED, (cfr.Kay-Chase un segundo estadio del proyecto,se inicia-
1987;Wotherspoon1992) y el proyectode r~ unafase de revisi6n,ampliaci6ny explo-
informatizaci6ndel TLF(Gorcy1992);tam- taci6n de la base de datos especialmente
bi6n se desarrollande maneraparcialmen- desde dos puntos de vista: 1) Adici6n de
te automatizadacon lector 6ptico, como materialbibliogrificoprocedentede otras
sucede en la informatizaci6n del SAOB(cfr. fuentes lexicogrnficasy de estudios mono-
Malmgren1988).Todo ello avalala consti- gr'ficos posteriores a la publicaci6n del
tuci6n de un corpuspor este procedimien- DCECH;y ampliaci6ndel corpus textual
to (cfr.Atkins-Clear-Ostler1992). con un conjuntode textosmuyvariadosque
El primerestadiode este ambiciosopro- completariny hardnm~s representativala
yecto, por tanto,consiste en la conversi6n base documentaldel DCECH.2) Aprove-
del DCECHen una base de datos. En este chamientode la informaci6ndel dicciona-
caso, resultaimposiblerealizarla informa- rio cruzandolos datos obtenidosen las di-
tizaci6nde maneraautomaitica porlas pecu- versas entradasdel DCECHy contrastan-
liares caracteristicasdel diccionarioen el dolos con los datos afiadidos.
que la criticay discusi6netimol6gicalo ha- Actualmente se esta desarrollando la
cen poco sistemaitico en la informaci6n primerafase con una ayudade la DGICYT
lingiiistica que aparece en cada entrada. del Ministeriode Educaci6ny Ciencia,y el
Ademaisen la informatizaci6nni se aprove- apoyo del Comissionatper Universitatsi
chantodos los datosque proporcionael dic- Recerca de la Generalitat de Catalunya.
cionario,ni los datos que se informatizan Para ello se estin elaborando diversos
tienen el mismo tratamiento,por lo que la ficheros interconectados (bases de datos
intervenci6nhumanase hace indispensable. relacionales)en los que se organizaparte
La transformaci6ndel diccionariotradi- del materialdel DCECH:
cionalal diccionarioinformatizadoes com-
plejapor muiltiplesrazones;la maisimpor- 1. Fichero general o matriz que contiene
tante es el cambiode concepci6nde la obra todas las palabrasque aparecencomo le-
lexicogrfifica que media entre uno y otro, mas en el DCECHy las que aparecenen el
porque, como sefiala H. Ruus (1988): interior de la entrada en el apartado de
DERIVADOSy COMPUESTOS. Por ejem-
Dictionary data present a challenge to computational plo, juzgar, juzgado, juicio, enjuiciar, adju-
processing. Any entry in a standard dictionary con-
tains an abundance of information that is presented in dicar, prejuicio figuran como "derivados
a very compressed form. To make such information etimol6gicos" del lema JUEZ; paczificary
amenable to computational processing it is necessary apaciguamiento se hallan en el apartado de
to classify the different kinds of information and de- "compuestos" de PAZ. En este fichero se

This content downloaded from 130.64.11.153 on Mon, 30 Nov 2015 23:10:43 UTC
All use subject to JSTOR Terms and Conditions
THEORETICALLINGUISTICS/ MEDIA 149

recogeninformacionesde muyvariadotipo las lenguas, dialectosy otras palabrasque


(cuadro3): sostienen algtintipo de relaci6ncon la pa-

•re haza•rias aaas


i: d8 rigAcr A ,4 S
rechazar (urna-pretensi. ,n) Ac 6desbaratar, t~stomars, Ac. 6:

5i

...RM
A .A ..s ..
e .......... 6

-..-. . . . . . . . . . . . . . . . . . .

Cuadro 3

- LEMA.Puedecorrespondera un lemadel labraestudiada.


DCECHo a una palabraque figura en el - Campos en los que se recoge el tipo de
interiordel articulo. informaci6nadicionala los camposanterio-
- SUBVOCE.Voz bajola que aparecela pa- res. Puede tratarsede informaci6ngr~fica,
labra (lema) en el DCECH. fon6tica,morfol6gica,sintaictica,de forma-
- CATEGORIA. Categoriaa la que pertene- ci6n de palabras,semantica, etimol6gica,
ce la palabra. etc. Cadauno de estos camposse llenacon
-APARTADO. Apartadodel articulodel dic- un c6digo que especifica exactamente el
cionarioen el que apareceel lema (lema, tipo de informaci6n.
deriv.o cpt.).
- DERIVADOS, COMPUESTOS. Campos 2. Ficherode informaci6netimol6gica.Or-
en los que se marcasi el articulotiene apar- ganiza la transmisi6netimol6gicade cada
tadode derivadoso de compuestosparalos palabradel vocabularioen una estructura
casos de las palabrasque se constituyenen que responde a todas las posibilidades
lemas en el diccionario. etimol6gicasdel espafioltal como aparece
- ETI,DOC,PER.Camposque testimonian en el ejemplodel cuadro4.
si los ficheros con informaci6n
etimol6gica,documentalo de pervivencia 3. Fichero documental en el que se
contienendatos. desglosanlas diversasdocumentacionesen
- SIGNIFICADO. Campoen el que se inclu- textos antiguosque aportael DCECH(cua-
ye significado la palabra.
el de dro 5).
- LENGUAS RELACIONADAS, DIALEC-
TOS RELACIONADOS,LEMASRELA- 4. Ficherode pervivenciaen el que se reco-
CIONADOS.
Camposen los que se indican gen variosaspectosrelacionadoscon lahis-

This content downloaded from 130.64.11.153 on Mon, 30 Nov 2015 23:10:43 UTC
All use subject to JSTOR Terms and Conditions
150 HISPANIA 80 MARCH 1997

LEMA datil TRANSMISION 2 heredada


SUBVOCE datil LENGUA 2 latin
ETIMOLOGIA1 cierta FORMA 2 dactylus
TRANSMISION 1 pr6stamo SIGNIFICADO 2 idem
LENGUA 1 catalan ETIMOLOGIA3 cierta
FORMA 1 d til TRANSMISION 3 prestamo
SIGNIFICADO 1 'datil' FORMA 3 8K'cTJkog
ETIMOLOGIA2 cierta SIGNIFICADO 3 'dedo', 'daitil'
Cuadro 4

LEMA IFECHA AUTOR OBRA jREFERENCIA


IEJEMPLO
daza 1533 Hist.de adaza directa
Morgante

daza Autoridades daza directa


Cuadro5

toria del termino desde las perspectivas mogenea, que permanentementeadmitiri


diat6pica,diastritica,etc. usos variados,con objetivoscompletamen-
te diferentes;entre los fundamentales:
Con este disefio y organizaci6nse pue-
den cruzar las informaciones de los a) Conexi6ncon otros bancos de datos.
ficheros de lemas con los de algin tipo de b) Ampliaci6ny puestaal dia permanente.
informaci6nespecifica (etimol6gica,docu- c) Simpleconsulta,como ahorase hace con

LEMA FECHA LENGUA1 LENGUA2


damasonio 1555 latin griego
dauco 1555 latin Igriego
Cuadro6

mental,lingfiistica)y obtener subcorpora el DCECH,pero con todas las ventajasque


de terminoscon caracteristicascomunes; suponetenerla informaci6nalmacenadaen
por ejemplo,el grupo de lemas que tienen una base de datos.
un mismo origen, documentadosen una d) Utilizaci6nde la base de datos para el
epocao en unaobradeterminada(cuadro6). estudio e investigaci6nde los maisdiversos
Dadala faltade sistematicidadde las in- aspectos sobre la historiadel espafiol.
formacionesdel DCECH,los ficheros con
los que se trabajaintentanaprovecharla Creemos que con un proyecto de estas
informaci6n estable de este diccionario caracteristicasapareceun nuevo concepto
daindoleuna configuraci6nunitaria.El re- de lexicografia,en este caso de lexicografia
sultado no constituiri un diccionario hist6rica,en la que el diccionarioes supe-
etimol6gicoinformatizadotomandocomo radopor un banco de datos cuyos usos so-
base el DCECH,paralo que hubiese bas- brepasantambienen mucholos del diccio-
tado con su simple digitalizaci6n,sino un nario tradicional,de forma que podemos
gran banco de datos etimol6gicos,hist6ri- recordarlas palabrasde J. M. Blecua(1995)
cos e hispainicos,organizadode maneraho- sobre la versi6nelectr6nicadel Diccionario

This content downloaded from 130.64.11.153 on Mon, 30 Nov 2015 23:10:43 UTC
All use subject to JSTOR Terms and Conditions
THEORETICALLINGUISTICS/ MEDIA 151

de la lenguaespaiiolade la RealAcademia, abrilde 1994).


al sefialarque "el texto del diccionariose
convierteen un espacio sin fronterasporel 0 OBRAS CITADAS
que se puede viajarcon absolutalibertad" AcademiaEspafiola.Diccionariohist6ricodela lengua
(15). espailola.Madrid:RAE,1960-.
En el caso del DCECH,el banco de da- ACLE:Actasdel congresode la lenguaespaiola. Sevi-
tos que surge como productoaguardaria lla, 7 al 10 de octubrede 1992.Madrid:Instituto
Cervantes,1994.
m'iltiplesinvestigacionesde carficterhist6- Atkins,Sue,JeremyClear,andNicholasOstler."Cor-
rico sobre el lkxico espafiolcon esta nueva pus Design Criteria." LiteraryandLinguisticCom-
manerade viajar. puting7 (1992):1-16.
G. Gorcy (1992, 105) anuncia que con Blecua,Jose Manuel."LaAcademiaen CD-ROM." El
este tipo de instrumentos"unnouvelage et Pais 25 nov. 1995:15.
Capsada,Ramon,y JoanTorruella.TRANSCALC. Del
un nouvel apprentissage de la lecture manuscrita la base de dades. Bellaterra:UAB,
commence";en realidad,el diccionariono 1995.
es unaobrade lecturasino de consulta,pero Claveria,Gloria,Jose ManuelBlecua,CarlosSAnchez,
no es hasta las postrimeriasdel segundo yJoanTorruella.Basesparala informatizacidn del
DCECHdeJ.CorominasyJ. A. Pascual.Bellaterra:
milenioque el conceptode consultaadquie-
UAB,1995.
re un sentido amplioy profundo. Col6n, Germfan."Sobrelos estudios de etimologia
Laaplicaci6nde las bases de datos al es- espaiiola."ACLE.1994.597-610.
tudio hist6rico de la lengua abre nuevos Corominas,Juan.Diccionariocriticoetimol6gicodela
horizontes tanto desde el punto de vista lenguacastellana.Madrid-Berna: Gredos-Francke,
1954-57.
metodol6gicocomo desde la perspectivade Corominas,Juan,y Jose AntonioPascual.Dicciona-
la concepci6n misma del trabajo,pero de rio criticoetimol6gicocastellanoe hispdnico.Ma-
ninguna manerapueden sustituirla mano drid:Gredos,1980-91.
inteligentedel lingtiistahist6rico.5 Dworkin,Steven N. "Progressin MedievalSpanish
Lexicography." RomancePhilology47 (1994):406-
0 NOTAS 25.
EcheniqueElizondo,MariaTeresa."Eldiasistemalin-
1Puedeencontrarse un panoramacompleto en giiistico de la Leyendadel Caballerodel Cisne."
MarcosMarin(1994b).Cfr.,por ejemplo,la partede- Estudiosfilol6gicosen homenajea E. de Bustos
dicadaa "Lacodificaci6ntextualelectr6nica"en ACLE Tovar,L Salamanca:Universidad,1992.235.
(1994):Faulhaber(1994),Mackenzie(1994),Marcos Faulhaber,CharlesB. '"Textual Criticismin the 21st
Marin(1994a).TambienNitti (1993). Century."RomancePhilology41 (1991):123-48.
2Unadescripci6npormenorizadadel etiquetado -. "LaText Initiativey su aplicaci6na la codificaci6n
utilizadoy de las normasde codificaci6nse encuen- textualy explotaci6n."ACLE.1994.331-40.
tra en D. Wanner(1991,184,nota20). Garciade Diego, Vicente.Diccionarioetimol6gicoes-
3Laconfiguraci6nde la base de datos gramatical pagol e hispdnico.Madrid:Espasa-Calpe,1954/
uinicamentea partirde los datossintfacticosobtenidos 1985.
(el corpusde ejemplosanalizadosy clasificados),y el Gorcy, Georges. "Apropos de l'informatisationdu
caricter neutraldesde un puntode vista te6ricode la Trisorde la languefranpaise(TLF)." ActasdoXIX
informaci6nintroducida,son las principalespropues- Congresointernacionalde lingiiistica e filoloxia
tas defendidasporR.Panckhurst(1994)en la realiza- romdnicas. Universidade de Santiago de
ci6n de una "databasequeryingsystem (DBQS)"so- Compostela,1989.Vol. 2. A Corufia:Fundaci6n
bre las oracionesinterrogativasen francesmoderno. PedroBarriede la Maza,1992.95-106. 5 vols.
4Laaplicaci6nde las bases de datos al estudio de GutierrezCuadrado,Juan,y Jose AntonioPascual.
la deixis espacialy temporaldel espafiolmedievalha "Observacions des del sentitcomfia algunesidees
sido desarrolladaen C. Sinchez Lancis(1992). usuals sobre la histbriade la llengua."Problemes
5Lainvestigaci6nnecesariaparadesarrollareste i metodesde la histbriade la llengua.Eds. S. Marti
trabajoha sido parcialmentefinanciadacon una ayu- y F. Feliu.Barcelona:QuadernsCrema,1995.129-
dade la DGICYTparael proyecto"Informatizaci6n del 67.
DCECHde J. Corominasy J. A. Pascual"(no de refe- Jucker,AndreasH. "NewDimensionsin Vocabulary
renciaPB92-0599)y con el apoyodel Comissionatper Studies:ReviewArticleof the OED (2ndedition)
Universitatsi Recercade la Generalitatde Catalunya on CD-ROM." Literaryand LinguisticComputing
(no de referenciaGRQ94-2006). Este articuloes una 9 (1994):149-54.
versi6nrevisaday ampliadade unacomunicaci6npre- Kay,ChristianJ., andThomasJ.P.Chase."Construct-
sentada en el XII Congreso de AESLA(Barcelona, ing a ThesaurusDatabase."LiteraryandLinguis-

This content downloaded from 130.64.11.153 on Mon, 30 Nov 2015 23:10:43 UTC
All use subject to JSTOR Terms and Conditions
152 HISPANIA 80 MARCH 1997

tic Computing2 (1987):161-63. Congresode LenguajesNaturalesy LenguajesFor-


Mackenzie,David."Problemasde transcripci6ntex- males. Barcelona:Promocionesy Publicaciones
tual electr6nica:lenguas, dialectos, miquinas." Universitarias,1992.41-50.
ACLE.1994.341-44. -. "Labase de datos sintacticosdel espafiolactual."
Malmgren, Sven-Goran. "The O.S.A. Project: EspailolActual59 (1993):15-20.
Computarisation of the Dictionaryof the Swedish -. "Problemaslingiiisticose informiticosen los dic-
Academy."Literaryand LinguisticComputing3 cionariosde construcci6ny regimen."ACLE. 1994.
(1988):166-68. 307-15.
MarcosMarin,Francisco."ComputersandText Ed- Ruus,Hanne."LexicalDataStructures."Literaryand
iting."RomancePhilology45 (1991):102-22. LinguisticComputing3 (1988):169-76.
-. "Estaindaresy estandar:ADMYTE,el archivo SanchezLancis,CarlosE. Estudiode los adverbiosde
digital de manuscritosy textos espafioles y sus espacioy tiempoen el espaiol medieval.Bellaterra:
solucionesparacodificare intercambiar datostex- UAB, 1992.
tuales."ACLE.1994a.345-59. Torruella, Joan. "Bases de dades per a textos
-. Informdtticay humanidades. Madrid:Gredos, medievals:el cas de l'Arxiuinformatitzatde textos
1994b. catalans medievals." Actes du XXe Congrks
Milller, Bodo. Diccionario del espaiol medieval. International de Linguistique et Philologie
Heidelberg:CarlWinterUniversitlitsverlag, 1987-. Romanes.Vol. 4. Universitede Zurich(6-11 avril
Nitti,John. El taller lexicogrdfico
de Wisconsin,(con 1992).Tiibingen:FranckeVerlag,1993.749-60.4
una adendadeN. Sdnchez,Diccionariogeneralde vols.
los textosmedicosantiguosespaioles). Bellaterra: Wanner,Dieter. "HistoricalSyntaxand Old Spanish
UAB,1993. Text Files."LinguisticStudiesin MedievalSpan-
MorenoCabrera,JuanCarlos.La lingiiisticate6rico- ish.Eds.R.Harris-NorthallyTh. D. Cravens.Madi-
tipol6gica.Madrid:Gredos,1995. son:The HispanicSeminaryof MedievalStudies,
Panckhurst,Rachel."ADatabasefor Linguists:Intel- 1991.166-90.
ligent QueryingandIncreaseof Data."Computers Wotherspoon,Irene."Historical ThesaurusDatabase
and theHumanities28 (1994):39-52. Using Ingres."LiteraryandLinguisticComputing
Rojo,Guillermo."ElfuturoDiccionariode construc- 7 (1992):218-25.
ciones verbalesdel espafiolactual."Actasdel VIII

This content downloaded from 130.64.11.153 on Mon, 30 Nov 2015 23:10:43 UTC
All use subject to JSTOR Terms and Conditions

You might also like