Filólogos y lingüistas de
voces
La frontera entre filología y lingüística no está clara. Si nos ceñimos a la
etimología, todos son filólogos; si nos atenemos a la función, un filólogo,
término clásico, trabaja en la gramática y en la lengua compaginada con el
estudio textual y literario de una época concreta. Pero también todos son
lingüistas, porque su objeto es la lengua y el habla. Véase el María Moliner.
Disquisiciones aparte, hoy por hoy, la información que aparece en Internet es muy
valiosa y útil para el trabajo de los filólogos y lingüistas hasta el punto de
que muchos hablan de que les ha cambiado la perspectiva de su profesión; otros,
sin embargo, opinan que se está empezando, aunque ya hay hitos como el de Real
Academia, que puede ser un acicate para los más reacios y una confirmación de
las ventajas de la red para los ya convencidos.
Un corpus de 125 millones de palabras
Los profesionales de la lengua española y, por qué no, los muchos aficionados a
su evolución, van a disponer a partir de este mes de una nueva fuente de
consulta que estará disponible a través de Internet. Se trata del Corpus
Diacrónico del Español (CORDE), un banco de textos que reunirá, cuando esté
concluido, 125 millones de palabras. Este proyecto se inscribe en la nueva
filosofía de la Academia de la Lengua (www.rae.es), que ha ido introduciendo
desde hace algunos años en su hacer diario las herramientas informáticas y los
nuevos soportes, como atestigua la versión en CD-ROM del más popular de los
diccionario de la institución, el DRAE.
Abraham Madroñal (madronal@rae.es).
doctor en Filología Hispánica, especializado en literatura del Siglo de Oro,
trabajó en su día en el Diccionario Histórico de la Lengua Española, otra de
las obras capitales de la Academia, y en la actualidad se ocupa del diseño del
conjunto de obras que van a engrosar el CORDE. “Hemos tratado de obtener el
mayor número posible de textos en formato electrónico, con el objeto de
facilitar el trabajo a las personas que tienen que introducirlos en el corpus
–dijo Madroñal a iWorld– y, por esa razón, utilizamos Internet desde hace
bastante tiempo. Gracias a la Red hemos conseguido encontrar algunos textos muy
interesantes, que no han de ser tecleados ni pasados por un escáner. Las obras
que se encuentran en Internet proceden tanto de universidades como de
particulares, y sobre ellas se puede trabajar porque su disponibilidad es
total, aunque no necesariamente se trata de versiones fiables”.
Por esta última razón, los textos que van a formar parte del corpus son
analizados minuciosamente, y antes de introducirlos en el CORDE se cotejan con
la edición que dicen haber manejado las fuentes. “Se busca ante todo la calidad
de los textos –afirma– así como que no hayan perdido nada en la conversión al
formato que utilizamos. Los textos que se encuentran en la red también son
seleccionados por ediciones, prefiriendo en general las primeras y, si no, las
más fiables. Hay casos en los que las ediciones en formato electrónico no
ofrecen las garantías necesarias. Cuando esto sucede, prescindimos de la obra y
usamos las ediciones en papel que se reproducen con un escáner. Al final del
año 2000 deberán estar recogidas los 125 millones de palabras, aunque esta es
una obra abierta, a la que se deberán incorporar nuevos textos. En la Academia,
hay otro proyecto, el Corpus de Referencia del Español Actual, que abarca los
25 últimos años de la historia de nuestra lengua y que también va tener que
actualizarse a medida que vayan apareciendo nuevas obras”.
Todos los filólogos con los que ha hablado iWorld están esperando como agua de
mayo la aparición del CORDE. Para ellos, dicen, será una herramienta
fundamental que va a facilitar mucho su tarea. El corpus en sí mismo no es un
fin, es un medio magnífico, cuyo uso puede servir a los investigadores para
confeccionar un diccionario o anotar un texto clásico. “Este trabajo –subraya
Madroñal– aun siendo posible sin Internet, se hubiera dilatado en el tiempo
mucho más que de esta manera. Afortunadamente, hay suficientes textos en
español y algunos de ellos muy significativos. No hay que olvidar que el corpus
pretende abarcar toda la historia de la lengua española, desde las primeras
Glosas Silenses y Emilianenses. Todo lo que es significativo en nuestra lengua,
porque la obra recoge, también, aquellos textos que son raros pero que se han
leído mucho en una época concreta como las novelas semanales, las novelas de
cordel o romances de ciego. Hoy pueden parecer textos disparatados, pero en su
momento todo el mundo los conocía y representan una forma del habla que no
puede estar fuera de esta obra. Su validez reside en que tiene que ser
representativa para que aquellos filólogos que se interesen por una época,
encuentren en el corpus una representación de la misma”.
Para Miguel Angel Pineda, profesor titular de la Universidad de Sevilla,
(mpined
@siff.us.es) el corpus es capital para el mundo hispano. Pineda no ahorra
calificativos. “Lo que ha hecho la Academia con el Corpus –dijo a esta revista–
supone un avance de la investigación filológica española que la sitúa a primer
nivel mundial. Cuando esté disponible va a ser asombroso. Nosotros estamos en
esa línea y el equipo de investigación que dirijo va a poner en la red todo el
corpus del habla de Sevilla, tanto en crudo como la obra de referencia, lo que
permitirá, entre otras posibilidades, buscar concordancias de palabras. La
ventaja del corpus de la Academia es que va a estar a disposición de todos, no
sólo de la comunidad científica”.
Estudios lingüisticos catalanes
L’Institut d’Estudis Catalans (www.iec.es) tiene una historia, si no larga,
dramática. Nacido en 1932, con la República, su actividad fue prohibida por la
dictadura franquista, lo que obligó a los miembros que no habían emigrado a
trabajar en la clandestinidad. Hoy, después de veinte años de democracia, su
actividad se ha normalizado y el número de proyectos en marcha indica que goza
de buena salud. “El Instituto viene a ser lo que para el castellano es la
Academia de la Lengua”, dijo Xavier Rofes (xrofes@iec.es).
coordinador de la Gramática del Institut. En 1995 salió publicado el
Diccionario Normativo de la Lengua Catalana. “Ahora estamos trabajando en la
gramática de la lengua catalana, de acuerdo con las necesidades y usos del
catalán actual. Para estos y otros proyectos, además de los estudios que hayan
hecho universidades y estudiosos del catalán, necesitamos el soporte de todos
los recursos disponibles que hay en Internet”.
La explotación de recursos documentales accesibles desde la red, como los que
proporcionan bibliotecas, editoriales y librerías, les permite obtener una
bibliografía de partida, que evita los desplazamientos y las búsquedas
manuales. “Si no fuera por Internet –afirma Rofes– la inversión de tiempo en
estos menesteres sería enorme, tiempo del que no disponemos por las
características de los proyectos. Hemos combinado las búsquedas para, por
ejemplo, cotejar en las diferentes editoriales los precios y poder adquirir una
biblioteca de investigación para el proyecto de la Gramática. También hemos
accedido a librerías, para conseguir libros antiguos o publicaciones que no
están en Internet. Asimismo, usamos la red para recopilar la información que se
encuentra en universidades y centros de investigación extranjeros dedicados a
la investigación lingüística”.
La búsqueda de toda esta información ha permitido al Institut tener una visión
muy completa de las diferentes líneas de investigación de estas instituciones,
sobre todo en el terreno metodológico. Además de los recursos lingüísticos de
la red que se pueden consultar en línea como información de las lenguas que se
hablan en el mundo, estudios sobre sociolingüística, diccionarios y gramáticas.
“También son importantes las aplicaciones informáticas para los trabajos
lingüísticos, que van desde las fuentes tipográficas o fuentes del alfabeto
fonético mundial, hasta los programas informáticos que permiten el análisis
gramatical –fonético morfológico y sintáctico– y los que permiten la
conjugación automática de los verbos. No obstante –dice Rofes– los recursos
gratuitos que hay en Internet en estas materias están dispersos y son de
difícil acceso. Además los pocos recursos que hay se refieren a lenguas
mayoritarias; en catalán prácticamente no hay nada”.
El problema de las lenguas minoritarias en Internet consiste, pues, en que hay
pocos recursos lingüísticos y el interés científico por lenguas como el catalán
es apenas una curiosidad para los lingüistas de otros territorios mientras para
los del país no tiene el interés suficiente que justifique una proliferación de
trabajos. “En algunas universidades americanas que tienen departamentos de
filología hispánica y que tienen incluso profesores de catalán –concluye Rofes–
se han desarrollado algunas páginas de información sobre el catalán, dirigidas
a un público no experto. A nosotros nos sirven como información sintomática,
pero para poco más. Tenemos proyectos en colaboración con la Unión Europea, en
los que aprovechamos todo el potencial de Internet. Gracias a esos proyectos
obtenemos un mayor volumen de textos en catalán, que podremos procesar y nos
permitirá centrarnos en el trabajo de investigación, la fase crítica de nuestro
trabajo”.
De la escritura cuneiforme al siglo de oro
Los expertos en escritura cuneiforme en España son una minoría, apenas una
decena. Manuel Molina Martos (molina@fresno.csic.es).
colaborador científico del Instituto de Filología dependiente del Centro
Superior de Investigaciones Científicas (CSIC) (filol.csic.es) forma parte de
esa minoría. Su campo de especialidad son las escrituras de la Mesopotamia
antigua, concretada en la documentación legal y administrativa de la tercera
dinastía de Ur del tercer milenio A.C. “Hay muchas maneras de usar la red es mi
especialidad –dijo a iWorld–. Una de ellas como método de consulta, accediendo
a servidores de universidades y centros de investigación que ponen a nuestra
disposición bases de datos con contenidos muy variados. Algunos son simplemente
transcripciones o transliteraciones de textos, pero también podemos encontrar
fotografías de las tablillas de barro en las que aparecen los textos, datos con
la catalogación de los mismos, estudios de textos, en suma, mucha información
que está a disposición de la comunidad científica. Para la consulta de estas
bases de datos se usa la web y el lenguaje HTML, pero para el intercambio de
datos usamos el protocolo FTP, por la dimensión de los ficheros”.
Una grafía tan específica como la cuneiforme añade problemas a la comunicación
a través de Internet. Aunque en líneas generales se trabaja con
transliteraciones, convenciones de signos diacríticos que permiten pasar la
escritura cuneiforme a nuestro alfabeto. En el caso de que sea imprescindible
el uso de originales se usa el formato de imagen, aunque no es muy común.
“Depende del contacto que se quiera establecer con otros investigadores. En
todo caso –añade Molina– lo importante es la propia red, que para España ha
significado un salto cualitativo porque los programas que usábamos antes daban
muchos más problemas en relación a la gestión de los datos. Soy más escéptico
sobre el uso que se hace de Internet. Hay tal cantidad de datos, que podemos
dedicar demasiado tiempo a su recopilación y a su gestión y menos a lo que es
la creación, la utilización y el manejo de esos datos. La red es
imprescindible, pero hay que usarla de forma racional para no perder de vista
nuestro objetivo”.
Como casi siempre, los grandes científicos que trabajan de manera estable en
Internet y con Internet están en Estados Unidos. Según Molina Martos, en esta
disciplina hay pocos problema de copyright. La razón es que las tiradas de los
libros son cortas y se agotan relativamente pronto. “Se tiende a poner en la
red las obras agotadas y no reimpresas, y la transliteraciones de los textos.
Pero mucho de lo que se edita y que contiene, además, los comentarios críticos
y los índices, no suele aparecer en Internet. En relación con lo foros de
discusión –concluye Molina– el mejor, desde mi punto de vista, es el de la
Universidad de Chicago, al que están suscritos todos los orientalistas que
trabajan con Internet. En él aparecen todas las novedades bibliográficas,
arqueológicas y epigráficas. Las discusiones suelen ser bastante interesantes,
aunque sobre todo es un foro que sirve para estar al día de lo que se publica y
de lo que se encuentra en las excavaciones arqueológicas.
Mientras que la investigación sobre escritura cuneiforme y otras lenguas
muertas o minoritarias es escasa en España, los investigadores sobre el Siglo
de Oro son legión: no hay universidad española que no tenga un departamento
dedicado el estudio de las obras de estos excelsos escritores. La Universidad
de Navarra es una de ellas. Rafael Zafra (rzafra@unav.es).
doctor en Filología, de su Departamento de Literatura Española, trabaja en
proyectos de investigación sobre la literatura del Siglo de Oro como parte de
un grupo muy entusiasta que tiene su propio web (griso.cti.unav.es) con el
objetivo de difundir los trabajos que se realizan en el estudio de este
periodo, con la novedad de que en él se encuentran estudios de obras de los
autores menos conocidos de un periodo que se caracteriza por su excelencia.
“Aunque cada vez más la informática es usada por los responsables del
departamento –dijo a iWorld– lo cierto es que se va poco a poco. Aunque parezca
mentira, la información filológica que aparece en Internet sobre la literatura
del siglo XVII español es poco significativa. En la web todavía hay muy pocos
sitios y la mayoría de los que están son de Estados Unidos, que no es el país
en el que se encuentran los mejores investigadores. Yo destacaría, en todo
caso, la labor de la Universidad de Arizona porque ha colocado en la red un
buen número de comedias del Siglo de Oro. Por eso nuestra idea es ser la punta
de lanza para que la gente empiece a publicar”.
De momento, parece que los investigadores que más pueden aportar en este campo
se resisten a entrar en Internet. Una de las razones puede residir en el temor
a que publicar en la red signifique una merma en las ventas de los libros que
editan, que ya de por sí tienen poca tirada y ventas escasas. Puede haber, no
obstante, otras razones menos tangibles, debidas a prejuicios sobre las nuevas
herramientas y su uso. “Me parece –matiza Zafra– que es cuestión de pocos años.
Nosotros hemos empezado con una revista, La Pirindola, que aunque se publica en
papel, dentro de poco tiempo quizá se distribuya sólo a través de Internet. Esta
es una opinión mía, porque también en nuestro departamento hay resistencia a
publicar electrónicamente. Me parece que la reticencia a Internet se produce en
casi todas las disciplinas. Quizás influya el desconocimiento informático,
cuyos efectos se notan en estas reservas de las que hablo. Pero lo que tengo
muy claro es que si alguien debe informar sobre el Siglo de Oro somos los
españoles, porque es aquí donde están los centros de investigación más
importantes”.
Para depende qué épocas, y el Siglo de Oro es una de ellas, lo primero que hay
que hacer es fijar la cronología de las obras. Hay obras muy conocidas, como el
Buscón, de Quevedo cuya datación tiene no pocas controversias. Por eso, hasta
que se da el texto de una obra hay que realizar no pocas investigaciones para
que su publicación despierta pocas dudas. “Nosotros, cuando damos un texto, lo
damos fijado y limpio para hacer una edición, y ya nos está pasando que muchos
textos nuestros son reproducidos sin permiso. Por eso, el problema a solucionar
es conseguir el equilibrio entre proporcionar obras que interesen, porque si no
merece la pena tener el web, y al mismo tiempo no se apropien de tu trabajo.
Ahora estamos trabajando en la edición de una parte no publicada del
diccionario de Cobarruvias, unas 1500 páginas. Como es lógico, la edición no se
va a poner en Internet por las razones que he indicado, pero pensamos dar a
conocer una parte para hacer búsquedas de determinadas entradas. De esta manera
será útil, además de dar a conocer el trabajo y la obra para su posible
adquisición en papel o en CD ROM”.
Para Miguel Angel Pineda, de la Facultad de Filología de la Universidad de
Sevilla (www.siff.us.es/www/principal.html) el uso de la red puede llegar a
tener una dimensión ética. “Internet –dice– nos va a llevar a una situación en
la que el egoísmo profesional desaparecerá totalmente, porque todo el mundo que
trabaja y lo hace en serio pone los resultados de sus trabajos a disposición de
todo el mundo. Consecuentemente, se va a dar un cambio de mentalidad, porque
antes sólo se publicaban los resultados de las investigaciones. Ahora ya no se
puede hacer porque es fácil encontrar en Internet corpus completos que se ponen
a disposición de la comunidad científica; quien no lo haga quedará relegado a
un segundo plano. Dentro de poco tiempo, los medios con los que vamos a contar
los filólogos van a ser extraordinarios, una vez que se solucionen los
problemas legales todavía no están resueltos ni en España ni en el resto del
mundo”.
Sitios web para filólogos y lingüistas
---------------------------------------------------
www.idg.es/iworld/199810/articulos/filologos.html
Filología española en la red
Real Academia de la Lengua Española
www.rae.es
A partir de este mes de octubre, la Academia pondrá en servicio su web, al que
se ha dedicado largos meses de diseño. En él se incorporará el resultado de sus
trabajos, entre ellos el CORDE.
Instituto Cervantes
www.cervantes.es
El organismo que se ocupa de la difusión de nuestra lengua fuera de España
presenta en su excelente web materiales de interés para especialistas y público
en general. Son muy recomendables las páginas del Centro Virtual Cervantes.
Instituto da Lingua Galega
sansecus.usc.es
Antología de textos gallegos, bibliografía, mapas dialectales, además de
secciones sobre fonología y morfosintáxis, forman el contenido de este web del
ILG, que se integra en la Universidad de Santiago de Compostela.
Círculo de Lingüística Hispánica
203.181.30.143/linghis/clhk.html
Nada menos que desde Kansai, Japón, llegan estas páginas mantenidas por un
grupo de hispanistas nipones, que editan publicaciones y organizan seminarios.
Tiene mérito.
Institut Universitari de Lingüística Aplicada. UPF
www.iula.upf.es
El Iula trabaja en la investigación fundamental y en la construcción de
herramientas y recursos relacionados con las aplicaciones del lenguaje.
Colabora con el IEC en la elaboración del Diccionario del Catalán
Contemporáneo.
Sociedad Española de Lingüística
www.sel.csic.es/docs/mnupral.htm
La SEL publica en su web el programa del próximo simposio anual (que hace el
número 28), a celebrarse en Madrid a mediados de diciembre de este año.
Institut d´Estudis Catalans
www.iec.es
Además un diccionario en línea, el web del Institut ofrece un servicio de
consultas lingüisticas y otras páginas de interés.
Institut Interuniversitari de Filología Valenciana
www.uv.es/~iifv
Este organismo, dedicado al estudio de la lengua valenciana, tiene algunas
páginas en la WWW, sin otro contenido que no sea informativo y testimonial.
Instituto de Filología. CSIC
www.filol.csic.es
Centro nacional de investigación que cuenta, entre otros, con un departamento
de filología bíblica y de lenguas antiguas (hebreo, arameo, griego y latín),
semíticas y textos cuneiformes.
Biblioteca Joan Fuster de Textos Electrónicos
nti.uji.es/fuster
Proyecto embrionario de la Universidad Jaime I de Castellón, en el que se
explora la publicación de textos digitales aplicados a la educación, empezando
con una antología de Joan Fuster sobre la historia cultural valenciana.
Laboratorio de Lingüística Informática. UAM
www.lllf.uam.es
Entre las líneas de investigación del laboratorio que dirige Francisco Marcos
Martín se encuentran la gramática computacional y los corpus lingüisticos, así
como herramientas para su manejo.
filología española en la red
seminario de Filología e Informática. UAB
gould.uab.es/castella.html
Páginas informativas sobre la actividad de los grupos de trabajo -
Lexicografía, Lope de Vega y Fonética - del departamento de Filología Española
de la UAB.
Depto. de Filologia Galego-Portuguesa. Univ. da Corunha
www.udc.es/dep/lx/lingpor.html
Aparte de la información académica, este web contiene versiones online de
artículos y trabajos científicos de los miembros del departamento.
Facultad de Filología. Universidad de Sevilla
www.siff.us.es/www/principal.html
El español hablado en Andalucía es una de las importantes áreas de trabajo en
esta facultad, pero en su web se echa en falta contenidos menos burocráticos.
Grupo de Sintaxis del Español. USC
www.usc.es/sintx/EspWelcome.html
Entre otros materiales, presenta una muy completa página de enlaces, preparada
por Celso Alvarez Cáccamo.
Grupo de Investigación del Siglo de Oro. Univ. de Navarra
griso.cti.unav.es/Home.html
Otro equipo de investigadores que trabajan en cuatro líneas: Calderón, Quevedo,
Tirso y la comedia burlesca. Editan la revista quevediana (y electrónica) La
Perinola.
QQQ Qué Quevedo Quieres
www.usc.es/quevd
El grupo de investigación quevediana de la Universidad de Santiago de
Compostela mantiene unas interesantes páginas sobre el autor del Buscón.
La Celestina Interactiva
ww.duke.edu/web/cibertextos/CELESTINA.HTML
Inicio de un ambicioso proyecto de cibertextos, en el que se presenta
(parcialmente) una edición interactiva de La Celestina. Esperan completarla a
comienzos de 1999.colecciones: españoles, catalanes y galaicoportugueses.
Biblia Políglota
138.87.135.33/bibl-span/luke.htm
Es sabido que la Biblia, el libro más traducido del mundo, es un yacimiento
inagotable para la investigación lingüística. En esta página se comparan las
versiones de San Lucas en latín, español antiguo y español moderno.
Philopbiblon
sunsite.berkeley.edu/Philobiblon
Interesante bibliografía de textos antiguos, que contiene tres españoles,
catalanes y galaicoportugueses.
Espéculo
www.ucm.es/info/especulo
Se define como revista de estudios literarios y se publica sólo en edición
digital cada cuatrimestre (ya llevan ocho números en la red). Incluye una
Biblioteca Quijotesca.
Filología en Internet. Univ. Complutense de Madrid
www.ucm.es/BUCM
Valioso centro de recursos, catálogos y bases de datos sobre filología, que se
aloja en el web de la biblioteca de Humanidades de la Universidad Complutense
Interletras
fyl.unizar.es/gcorona/interlet.htm
Revista de crítica y literatura en lengua española, que se edita en el
departamento de Filología Española de la Universidad de Zaragoza. Ya hay cuatro
números en la red.
Textos de Literatura Española Medieval y del Renacimiento
www.uv.es/lemir/Textos.html
La revista electrónica Lemir, que se edita en la Universidad de Valencia, se
ocupa de un campo muy fértil para los investigadores españoles. Interesante
sección sobre el Tirant.
Sitios web internacionales
Semiotics
www.cudenver.edu/~mryder/itc_data/semiotics.html
Recopilación de materiales didácticos, con referencias y textos de autores,
desde Saussure y Vigotsky a Barthes y Eco.
Computation and Language E-Print Archive
xxx.lanl.gov/cmp-lg
Servidor electrónico de documentos y ponencias sobre lingüística computacional,
lenguaje natural y campos afines.
Linguistic List
www.linguistlist.org
El mejor centro de recursos para conocer lo que hacen
y publican los lingüistas en todo el mundo y en todas (bueno, en muchas)
lenguas.
International Association of Semiotics Studies
www.bm.lu.se/~arthist/assoc/IASShp2.html
Páginas institucionales que informan sobre las actividades de esta asociación,
pionero en la promoción de esta rama de la ciencia y sus disciplinas afines.
Poco contenido.
Comedia
www.con.arizona.edu/spanish/comedia/escomedi.html
La Association for Hispanic Classical Theater ha emprendido una labor de
titanes: una biblioteca electrónica de textos del teatro del Siglo de Oro
español.
Linguistics Working Papers Abstracts
www.lingref.com/lwpa-example/index.html
Importante colección de literatura gris especializada en las ciencias del
lenguaje. Resúmenes de tesis publicadas en todo el mundo.
Concordances and Corporal Tutorial
www.usc.es/sintx/EspFrames.html
Materiales del curso dictado en 1997 por la profesora Catherine Bell en su
cátedra de la Universidad de Georgetown.
Umberto Eco Page
www4.ncsu.edu/eos/users/m/mcmesser/
www/eco.html
Página que homenajea en vida al célebre autor italiano y reproduce algunos de
sus artículos de reflexión y entrevistas publicadas en la prensa internacional.
Association for Computational Linguistics
www.cs.columbia.edu
Esta asociación internacional agrupa a los profesionales y cientificos que
trabajan en las llamadas industrias de la lengua. Publica la revista
Computational Linguistics.
European Language Resources Association
www.icp.grenet.fr/ELRA/home.html
Entidad creada para validar y distribuir herramientas lingüisticas a la
comunidad de investigadores en las tecnologías de la información.
International Phonetic Association
www.arts.gla.ac.uk/IPA/ipa.html
En el sobrio web de esta asociación internacional se puede encontrar el Alfabeto
Fonético Internacional, publicado en 1993 y actualizado tres años más tarde.
Piedad
Bullón. [01/10/1998 ]