Filólogos y lingüistas de voces

La frontera entre filología y lingüística no está clara. Si nos ceñimos a la etimología, todos son filólogos; si nos atenemos a la función, un filólogo, término clásico, trabaja en la gramática y en la lengua compaginada con el estudio textual y literario de una época concreta. Pero también todos son lingüistas, porque su objeto es la lengua y el habla. Véase el María Moliner. Disquisiciones aparte, hoy por hoy, la información que aparece en Internet es muy valiosa y útil para el trabajo de los filólogos y lingüistas hasta el punto de que muchos hablan de que les ha cambiado la perspectiva de su profesión; otros, sin embargo, opinan que se está empezando, aunque ya hay hitos como el de Real Academia, que puede ser un acicate para los más reacios y una confirmación de las ventajas de la red para los ya convencidos.

Un corpus de 125 millones de palabras
Los profesionales de la lengua española y, por qué no, los muchos aficionados a su evolución, van a disponer a partir de este mes de una nueva fuente de consulta que estará disponible a través de Internet. Se trata del Corpus Diacrónico del Español (CORDE), un banco de textos que reunirá, cuando esté concluido, 125 millones de palabras. Este proyecto se inscribe en la nueva filosofía de la Academia de la Lengua (www.rae.es), que ha ido introduciendo desde hace algunos años en su hacer diario las herramientas informáticas y los nuevos soportes, como atestigua la versión en CD-ROM del más popular de los diccionario de la institución, el DRAE.
Abraham Madroñal (madronal@rae.es). doctor en Filología Hispánica, especializado en literatura del Siglo de Oro, trabajó en su día en el Diccionario Histórico de la Lengua Española, otra de las obras capitales de la Academia, y en la actualidad se ocupa del diseño del conjunto de obras que van a engrosar el CORDE. “Hemos tratado de obtener el mayor número posible de textos en formato electrónico, con el objeto de facilitar el trabajo a las personas que tienen que introducirlos en el corpus –dijo Madroñal a iWorld– y, por esa razón, utilizamos Internet desde hace bastante tiempo. Gracias a la Red hemos conseguido encontrar algunos textos muy interesantes, que no han de ser tecleados ni pasados por un escáner. Las obras que se encuentran en Internet proceden tanto de universidades como de particulares, y sobre ellas se puede trabajar porque su disponibilidad es total, aunque no necesariamente se trata de versiones fiables”.
Por esta última razón, los textos que van a formar parte del corpus son analizados minuciosamente, y antes de introducirlos en el CORDE se cotejan con la edición que dicen haber manejado las fuentes. “Se busca ante todo la calidad de los textos –afirma– así como que no hayan perdido nada en la conversión al formato que utilizamos. Los textos que se encuentran en la red también son seleccionados por ediciones, prefiriendo en general las primeras y, si no, las más fiables. Hay casos en los que las ediciones en formato electrónico no ofrecen las garantías necesarias. Cuando esto sucede, prescindimos de la obra y usamos las ediciones en papel que se reproducen con un escáner. Al final del año 2000 deberán estar recogidas los 125 millones de palabras, aunque esta es una obra abierta, a la que se deberán incorporar nuevos textos. En la Academia, hay otro proyecto, el Corpus de Referencia del Español Actual, que abarca los 25 últimos años de la historia de nuestra lengua y que también va tener que actualizarse a medida que vayan apareciendo nuevas obras”.
Todos los filólogos con los que ha hablado iWorld están esperando como agua de mayo la aparición del CORDE. Para ellos, dicen, será una herramienta fundamental que va a facilitar mucho su tarea. El corpus en sí mismo no es un fin, es un medio magnífico, cuyo uso puede servir a los investigadores para confeccionar un diccionario o anotar un texto clásico. “Este trabajo –subraya Madroñal– aun siendo posible sin Internet, se hubiera dilatado en el tiempo mucho más que de esta manera. Afortunadamente, hay suficientes textos en español y algunos de ellos muy significativos. No hay que olvidar que el corpus pretende abarcar toda la historia de la lengua española, desde las primeras Glosas Silenses y Emilianenses. Todo lo que es significativo en nuestra lengua, porque la obra recoge, también, aquellos textos que son raros pero que se han leído mucho en una época concreta como las novelas semanales, las novelas de cordel o romances de ciego. Hoy pueden parecer textos disparatados, pero en su momento todo el mundo los conocía y representan una forma del habla que no puede estar fuera de esta obra. Su validez reside en que tiene que ser representativa para que aquellos filólogos que se interesen por una época, encuentren en el corpus una representación de la misma”.
Para Miguel Angel Pineda, profesor titular de la Universidad de Sevilla, (mpined
@siff.us.es) el corpus es capital para el mundo hispano. Pineda no ahorra calificativos. “Lo que ha hecho la Academia con el Corpus –dijo a esta revista– supone un avance de la investigación filológica española que la sitúa a primer nivel mundial. Cuando esté disponible va a ser asombroso. Nosotros estamos en esa línea y el equipo de investigación que dirijo va a poner en la red todo el corpus del habla de Sevilla, tanto en crudo como la obra de referencia, lo que permitirá, entre otras posibilidades, buscar concordancias de palabras. La ventaja del corpus de la Academia es que va a estar a disposición de todos, no sólo de la comunidad científica”.

Estudios lingüisticos catalanes
L’Institut d’Estudis Catalans (www.iec.es) tiene una historia, si no larga, dramática. Nacido en 1932, con la República, su actividad fue prohibida por la dictadura franquista, lo que obligó a los miembros que no habían emigrado a trabajar en la clandestinidad. Hoy, después de veinte años de democracia, su actividad se ha normalizado y el número de proyectos en marcha indica que goza de buena salud. “El Instituto viene a ser lo que para el castellano es la Academia de la Lengua”, dijo Xavier Rofes (xrofes@iec.es). coordinador de la Gramática del Institut. En 1995 salió publicado el Diccionario Normativo de la Lengua Catalana. “Ahora estamos trabajando en la gramática de la lengua catalana, de acuerdo con las necesidades y usos del catalán actual. Para estos y otros proyectos, además de los estudios que hayan hecho universidades y estudiosos del catalán, necesitamos el soporte de todos los recursos disponibles que hay en Internet”.
La explotación de recursos documentales accesibles desde la red, como los que proporcionan bibliotecas, editoriales y librerías, les permite obtener una bibliografía de partida, que evita los desplazamientos y las búsquedas manuales. “Si no fuera por Internet –afirma Rofes– la inversión de tiempo en estos menesteres sería enorme, tiempo del que no disponemos por las características de los proyectos. Hemos combinado las búsquedas para, por ejemplo, cotejar en las diferentes editoriales los precios y poder adquirir una biblioteca de investigación para el proyecto de la Gramática. También hemos accedido a librerías, para conseguir libros antiguos o publicaciones que no están en Internet. Asimismo, usamos la red para recopilar la información que se encuentra en universidades y centros de investigación extranjeros dedicados a la investigación lingüística”.
La búsqueda de toda esta información ha permitido al Institut tener una visión muy completa de las diferentes líneas de investigación de estas instituciones, sobre todo en el terreno metodológico. Además de los recursos lingüísticos de la red que se pueden consultar en línea como información de las lenguas que se hablan en el mundo, estudios sobre sociolingüística, diccionarios y gramáticas. “También son importantes las aplicaciones informáticas para los trabajos lingüísticos, que van desde las fuentes tipográficas o fuentes del alfabeto fonético mundial, hasta los programas informáticos que permiten el análisis gramatical –fonético morfológico y sintáctico– y los que permiten la conjugación automática de los verbos. No obstante –dice Rofes– los recursos gratuitos que hay en Internet en estas materias están dispersos y son de difícil acceso. Además los pocos recursos que hay se refieren a lenguas mayoritarias; en catalán prácticamente no hay nada”.
El problema de las lenguas minoritarias en Internet consiste, pues, en que hay pocos recursos lingüísticos y el interés científico por lenguas como el catalán es apenas una curiosidad para los lingüistas de otros territorios mientras para los del país no tiene el interés suficiente que justifique una proliferación de trabajos. “En algunas universidades americanas que tienen departamentos de filología hispánica y que tienen incluso profesores de catalán –concluye Rofes– se han desarrollado algunas páginas de información sobre el catalán, dirigidas a un público no experto. A nosotros nos sirven como información sintomática, pero para poco más. Tenemos proyectos en colaboración con la Unión Europea, en los que aprovechamos todo el potencial de Internet. Gracias a esos proyectos obtenemos un mayor volumen de textos en catalán, que podremos procesar y nos permitirá centrarnos en el trabajo de investigación, la fase crítica de nuestro trabajo”.

De la escritura cuneiforme al siglo de oro
Los expertos en escritura cuneiforme en España son una minoría, apenas una decena. Manuel Molina Martos (molina@fresno.csic.es). colaborador científico del Instituto de Filología dependiente del Centro Superior de Investigaciones Científicas (CSIC) (filol.csic.es) forma parte de esa minoría. Su campo de especialidad son las escrituras de la Mesopotamia antigua, concretada en la documentación legal y administrativa de la tercera dinastía de Ur del tercer milenio A.C. “Hay muchas maneras de usar la red es mi especialidad –dijo a iWorld–. Una de ellas como método de consulta, accediendo a servidores de universidades y centros de investigación que ponen a nuestra disposición bases de datos con contenidos muy variados. Algunos son simplemente transcripciones o transliteraciones de textos, pero también podemos encontrar fotografías de las tablillas de barro en las que aparecen los textos, datos con la catalogación de los mismos, estudios de textos, en suma, mucha información que está a disposición de la comunidad científica. Para la consulta de estas bases de datos se usa la web y el lenguaje HTML, pero para el intercambio de datos usamos el protocolo FTP, por la dimensión de los ficheros”.
Una grafía tan específica como la cuneiforme añade problemas a la comunicación a través de Internet. Aunque en líneas generales se trabaja con transliteraciones, convenciones de signos diacríticos que permiten pasar la escritura cuneiforme a nuestro alfabeto. En el caso de que sea imprescindible el uso de originales se usa el formato de imagen, aunque no es muy común. “Depende del contacto que se quiera establecer con otros investigadores. En todo caso –añade Molina– lo importante es la propia red, que para España ha significado un salto cualitativo porque los programas que usábamos antes daban muchos más problemas en relación a la gestión de los datos. Soy más escéptico sobre el uso que se hace de Internet. Hay tal cantidad de datos, que podemos dedicar demasiado tiempo a su recopilación y a su gestión y menos a lo que es la creación, la utilización y el manejo de esos datos. La red es imprescindible, pero hay que usarla de forma racional para no perder de vista nuestro objetivo”.
Como casi siempre, los grandes científicos que trabajan de manera estable en Internet y con Internet están en Estados Unidos. Según Molina Martos, en esta disciplina hay pocos problema de copyright. La razón es que las tiradas de los libros son cortas y se agotan relativamente pronto. “Se tiende a poner en la red las obras agotadas y no reimpresas, y la transliteraciones de los textos. Pero mucho de lo que se edita y que contiene, además, los comentarios críticos y los índices, no suele aparecer en Internet. En relación con lo foros de discusión –concluye Molina– el mejor, desde mi punto de vista, es el de la Universidad de Chicago, al que están suscritos todos los orientalistas que trabajan con Internet. En él aparecen todas las novedades bibliográficas, arqueológicas y epigráficas. Las discusiones suelen ser bastante interesantes, aunque sobre todo es un foro que sirve para estar al día de lo que se publica y de lo que se encuentra en las excavaciones arqueológicas.
Mientras que la investigación sobre escritura cuneiforme y otras lenguas muertas o minoritarias es escasa en España, los investigadores sobre el Siglo de Oro son legión: no hay universidad española que no tenga un departamento dedicado el estudio de las obras de estos excelsos escritores. La Universidad de Navarra es una de ellas. Rafael Zafra (rzafra@unav.es). doctor en Filología, de su Departamento de Literatura Española, trabaja en proyectos de investigación sobre la literatura del Siglo de Oro como parte de un grupo muy entusiasta que tiene su propio web (griso.cti.unav.es) con el objetivo de difundir los trabajos que se realizan en el estudio de este periodo, con la novedad de que en él se encuentran estudios de obras de los autores menos conocidos de un periodo que se caracteriza por su excelencia. “Aunque cada vez más la informática es usada por los responsables del departamento –dijo a iWorld– lo cierto es que se va poco a poco. Aunque parezca mentira, la información filológica que aparece en Internet sobre la literatura del siglo XVII español es poco significativa. En la web todavía hay muy pocos sitios y la mayoría de los que están son de Estados Unidos, que no es el país en el que se encuentran los mejores investigadores. Yo destacaría, en todo caso, la labor de la Universidad de Arizona porque ha colocado en la red un buen número de comedias del Siglo de Oro. Por eso nuestra idea es ser la punta de lanza para que la gente empiece a publicar”.
De momento, parece que los investigadores que más pueden aportar en este campo se resisten a entrar en Internet. Una de las razones puede residir en el temor a que publicar en la red signifique una merma en las ventas de los libros que editan, que ya de por sí tienen poca tirada y ventas escasas. Puede haber, no obstante, otras razones menos tangibles, debidas a prejuicios sobre las nuevas herramientas y su uso. “Me parece –matiza Zafra– que es cuestión de pocos años. Nosotros hemos empezado con una revista, La Pirindola, que aunque se publica en papel, dentro de poco tiempo quizá se distribuya sólo a través de Internet. Esta es una opinión mía, porque también en nuestro departamento hay resistencia a publicar electrónicamente. Me parece que la reticencia a Internet se produce en casi todas las disciplinas. Quizás influya el desconocimiento informático, cuyos efectos se notan en estas reservas de las que hablo. Pero lo que tengo muy claro es que si alguien debe informar sobre el Siglo de Oro somos los españoles, porque es aquí donde están los centros de investigación más importantes”.
Para depende qué épocas, y el Siglo de Oro es una de ellas, lo primero que hay que hacer es fijar la cronología de las obras. Hay obras muy conocidas, como el Buscón, de Quevedo cuya datación tiene no pocas controversias. Por eso, hasta que se da el texto de una obra hay que realizar no pocas investigaciones para que su publicación despierta pocas dudas. “Nosotros, cuando damos un texto, lo damos fijado y limpio para hacer una edición, y ya nos está pasando que muchos textos nuestros son reproducidos sin permiso. Por eso, el problema a solucionar es conseguir el equilibrio entre proporcionar obras que interesen, porque si no merece la pena tener el web, y al mismo tiempo no se apropien de tu trabajo. Ahora estamos trabajando en la edición de una parte no publicada del diccionario de Cobarruvias, unas 1500 páginas. Como es lógico, la edición no se va a poner en Internet por las razones que he indicado, pero pensamos dar a conocer una parte para hacer búsquedas de determinadas entradas. De esta manera será útil, además de dar a conocer el trabajo y la obra para su posible adquisición en papel o en CD ROM”.
Para Miguel Angel Pineda, de la Facultad de Filología de la Universidad de Sevilla (www.siff.us.es/www/principal.html) el uso de la red puede llegar a tener una dimensión ética. “Internet –dice– nos va a llevar a una situación en la que el egoísmo profesional desaparecerá totalmente, porque todo el mundo que trabaja y lo hace en serio pone los resultados de sus trabajos a disposición de todo el mundo. Consecuentemente, se va a dar un cambio de mentalidad, porque antes sólo se publicaban los resultados de las investigaciones. Ahora ya no se puede hacer porque es fácil encontrar en Internet corpus completos que se ponen a disposición de la comunidad científica; quien no lo haga quedará relegado a un segundo plano. Dentro de poco tiempo, los medios con los que vamos a contar los filólogos van a ser extraordinarios, una vez que se solucionen los problemas legales todavía no están resueltos ni en España ni en el resto del mundo”.


Sitios web para filólogos y lingüistas
---------------------------------------------------
www.idg.es/iworld/199810/articulos/filologos.html

Filología española en la red
Real Academia de la Lengua Española
www.rae.es
A partir de este mes de octubre, la Academia pondrá en servicio su web, al que se ha dedicado largos meses de diseño. En él se incorporará el resultado de sus trabajos, entre ellos el CORDE.

Instituto Cervantes
www.cervantes.es
El organismo que se ocupa de la difusión de nuestra lengua fuera de España presenta en su excelente web materiales de interés para especialistas y público en general. Son muy recomendables las páginas del Centro Virtual Cervantes.

Instituto da Lingua Galega
sansecus.usc.es
Antología de textos gallegos, bibliografía, mapas dialectales, además de secciones sobre fonología y morfosintáxis, forman el contenido de este web del ILG, que se integra en la Universidad de Santiago de Compostela.

Círculo de Lingüística Hispánica
203.181.30.143/linghis/clhk.html
Nada menos que desde Kansai, Japón, llegan estas páginas mantenidas por un grupo de hispanistas nipones, que editan publicaciones y organizan seminarios. Tiene mérito.
Institut Universitari de Lingüística Aplicada. UPF
www.iula.upf.es
El Iula trabaja en la investigación fundamental y en la construcción de herramientas y recursos relacionados con las aplicaciones del lenguaje. Colabora con el IEC en la elaboración del Diccionario del Catalán Contemporáneo.

Sociedad Española de Lingüística
www.sel.csic.es/docs/mnupral.htm
La SEL publica en su web el programa del próximo simposio anual (que hace el número 28), a celebrarse en Madrid a mediados de diciembre de este año.

Institut d´Estudis Catalans
www.iec.es
Además un diccionario en línea, el web del Institut ofrece un servicio de consultas lingüisticas y otras páginas de interés.

Institut Interuniversitari de Filología Valenciana
www.uv.es/~iifv
Este organismo, dedicado al estudio de la lengua valenciana, tiene algunas páginas en la WWW, sin otro contenido que no sea informativo y testimonial.

Instituto de Filología. CSIC
www.filol.csic.es
Centro nacional de investigación que cuenta, entre otros, con un departamento de filología bíblica y de lenguas antiguas (hebreo, arameo, griego y latín), semíticas y textos cuneiformes.

Biblioteca Joan Fuster de Textos Electrónicos
nti.uji.es/fuster
Proyecto embrionario de la Universidad Jaime I de Castellón, en el que se explora la publicación de textos digitales aplicados a la educación, empezando con una antología de Joan Fuster sobre la historia cultural valenciana.

Laboratorio de Lingüística Informática. UAM
www.lllf.uam.es
Entre las líneas de investigación del laboratorio que dirige Francisco Marcos Martín se encuentran la gramática computacional y los corpus lingüisticos, así como herramientas para su manejo.

filología española en la red

seminario de Filología e Informática. UAB
gould.uab.es/castella.html
Páginas informativas sobre la actividad de los grupos de trabajo - Lexicografía, Lope de Vega y Fonética - del departamento de Filología Española de la UAB.

Depto. de Filologia Galego-Portuguesa. Univ. da Corunha
www.udc.es/dep/lx/lingpor.html
Aparte de la información académica, este web contiene versiones online de artículos y trabajos científicos de los miembros del departamento.

Facultad de Filología. Universidad de Sevilla
www.siff.us.es/www/principal.html
El español hablado en Andalucía es una de las importantes áreas de trabajo en esta facultad, pero en su web se echa en falta contenidos menos burocráticos.

Grupo de Sintaxis del Español. USC
www.usc.es/sintx/EspWelcome.html
Entre otros materiales, presenta una muy completa página de enlaces, preparada por Celso Alvarez Cáccamo.

Grupo de Investigación del Siglo de Oro. Univ. de Navarra
griso.cti.unav.es/Home.html
Otro equipo de investigadores que trabajan en cuatro líneas: Calderón, Quevedo, Tirso y la comedia burlesca. Editan la revista quevediana (y electrónica) La Perinola.

QQQ Qué Quevedo Quieres
www.usc.es/quevd
El grupo de investigación quevediana de la Universidad de Santiago de Compostela mantiene unas interesantes páginas sobre el autor del Buscón.

La Celestina Interactiva
ww.duke.edu/web/cibertextos/CELESTINA.HTML
Inicio de un ambicioso proyecto de cibertextos, en el que se presenta (parcialmente) una edición interactiva de La Celestina. Esperan completarla a comienzos de 1999.colecciones: españoles, catalanes y galaicoportugueses.

Biblia Políglota
138.87.135.33/bibl-span/luke.htm
Es sabido que la Biblia, el libro más traducido del mundo, es un yacimiento inagotable para la investigación lingüística. En esta página se comparan las versiones de San Lucas en latín, español antiguo y español moderno.

Philopbiblon
sunsite.berkeley.edu/Philobiblon
Interesante bibliografía de textos antiguos, que contiene tres españoles, catalanes y galaicoportugueses.

Espéculo
www.ucm.es/info/especulo
Se define como revista de estudios literarios y se publica sólo en edición digital cada cuatrimestre (ya llevan ocho números en la red). Incluye una Biblioteca Quijotesca.

Filología en Internet. Univ. Complutense de Madrid
www.ucm.es/BUCM
Valioso centro de recursos, catálogos y bases de datos sobre filología, que se aloja en el web de la biblioteca de Humanidades de la Universidad Complutense

Interletras
fyl.unizar.es/gcorona/interlet.htm
Revista de crítica y literatura en lengua española, que se edita en el departamento de Filología Española de la Universidad de Zaragoza. Ya hay cuatro números en la red.

Textos de Literatura Española Medieval y del Renacimiento
www.uv.es/lemir/Textos.html
La revista electrónica Lemir, que se edita en la Universidad de Valencia, se ocupa de un campo muy fértil para los investigadores españoles. Interesante sección sobre el Tirant.

Sitios web internacionales

Semiotics
www.cudenver.edu/~mryder/itc_data/semiotics.html
Recopilación de materiales didácticos, con referencias y textos de autores, desde Saussure y Vigotsky a Barthes y Eco.

Computation and Language E-Print Archive
xxx.lanl.gov/cmp-lg
Servidor electrónico de documentos y ponencias sobre lingüística computacional, lenguaje natural y campos afines.

Linguistic List
www.linguistlist.org
El mejor centro de recursos para conocer lo que hacen
y publican los lingüistas en todo el mundo y en todas (bueno, en muchas) lenguas.

International Association of Semiotics Studies
www.bm.lu.se/~arthist/assoc/IASShp2.html
Páginas institucionales que informan sobre las actividades de esta asociación, pionero en la promoción de esta rama de la ciencia y sus disciplinas afines. Poco contenido.

Comedia
www.con.arizona.edu/spanish/comedia/escomedi.html
La Association for Hispanic Classical Theater ha emprendido una labor de titanes: una biblioteca electrónica de textos del teatro del Siglo de Oro español.

Linguistics Working Papers Abstracts
www.lingref.com/lwpa-example/index.html
Importante colección de literatura gris especializada en las ciencias del lenguaje. Resúmenes de tesis publicadas en todo el mundo.

Concordances and Corporal Tutorial
www.usc.es/sintx/EspFrames.html
Materiales del curso dictado en 1997 por la profesora Catherine Bell en su cátedra de la Universidad de Georgetown.

Umberto Eco Page
www4.ncsu.edu/eos/users/m/mcmesser/
www/eco.html
Página que homenajea en vida al célebre autor italiano y reproduce algunos de sus artículos de reflexión y entrevistas publicadas en la prensa internacional.

Association for Computational Linguistics
www.cs.columbia.edu
Esta asociación internacional agrupa a los profesionales y cientificos que trabajan en las llamadas industrias de la lengua. Publica la revista Computational Linguistics.

European Language Resources Association
www.icp.grenet.fr/ELRA/home.html
Entidad creada para validar y distribuir herramientas lingüisticas a la comunidad de investigadores en las tecnologías de la información.

International Phonetic Association
www.arts.gla.ac.uk/IPA/ipa.html
En el sobrio web de esta asociación internacional se puede encontrar el Alfabeto Fonético Internacional, publicado en 1993 y actualizado tres años más tarde.

 Piedad Bullón. [01/10/1998 ]