Se abrirá la página principal de la UPV/EHU en nueva ventana

Euskara Institutua
Prosa de Referencia (PR)

El Instituto de Euskara está trabajando sobre un proyecto científico que pretende poner en la red una enciclopedia sobre la lengua vasca: gramática, diccionario, información histórica, etc. Algunas de las partes de este proyecto están disponibles ya en red, de forma íntegra, o en parte. Los apartados siguientes se pueden consultar ya:

  • Prosa de Referencia (PR)
  • Diccionario Unificado en la Prosa Actual (DUPA)
  • Léxico: tradición y actualidad (LTA)
  • Diccionario de la Lengua Vasca Actual (DLVA)

Además de esos proyectos, ha realizado varias jornadas de trabajo (2002, 2005, 2008) en torno a la terminología y ha recopilado distintos materiales para la docencia universitaria en lengua vasca. Se puede consultar también una gramática escrita en lengua inglesa.

Los trabajos están disponibles, básicamente, en lengua vasca, dado su carácter. Aquí incluimos esta explicación en español para que sirva de ilustración sobre el tipo de trabajos desarrollados por el Instituto.

El llamado Corpus de Referencia se refiere a un corpus de textos lingüísticos escritos en prosa en el período 2000-2007. En conjunto son 25,1 millones de palabras, de los que 13,1 millones son libros escogidos por su calidad (287 libros) y 12 millones son textos publicados en prensa, tanto en España (Berria) como en Francia (Herria).

Se trata de un corpus cerrado, porque el equipo de investigadores entiende, después de haber realizado numerosas pruebas, que la información que se pueda obtener por encima de estos 25 millones de palabras no es pertinente para los objetivos que se persiguen y sólo añade mayor confusión y pérdida de tiempo en el tratamiento de los datos. En cualquier caso, en el futuro se integrarán otros corpus lingüísticos, con características diferentes, en la página del Instituto de Euskera.

En este corpus se pueden consultar las palabras utilizadas por los escritores en el uso actual de la lengua, en la prosa escrita. La palabra sobre la que se solicita información aparecerá en su contexto, incluyendo la frase entera. Se indica la frecuencia (número de veces que aparece, en libros y en prensa), el escritor que lo utiliza, especificando título del libro y página.

Este corpus ha dado lugar a varios trabajos académicos que se han podido desarrollar gracias a la información que el corpus recoge: Diccionario Unificado en la Prosa Actual (Hiztegi Batua Euskal Prosan), http://www.ehu.es/ehg/; Diccionario de la Lengua Vasca Actual (Egungo Euskararen Hiztegia), http://www.ehu.es/eeh/; Léxico, Tradición y Actualidad (Lexikoa, Atzo eta Gaur), http://www.ehu.es/lag/, etc., disponibles en la página web del Instituto de Euskera.

Esta parte del proyecto ha sido financiado, en parte, por el Ayuntamiento de San Sebastián y la Diputación Foral de Gipuzkoa.

PR (en lengua vasca)

Fecha de la última modificación: 25/01/2009