Se abrirá la página principal de la UPV/EHU en nueva ventana

Euskara Institutua
Estructura de Frecuencias del Léxico Vasco (EFLV)

El Instituto de Euskara está trabajando sobre un proyecto científico que pretende poner en la red una enciclopedia sobre la lengua vasca: gramática, diccionario, información histórica, etc. Algunas de las partes de este proyecto están disponibles ya en red, de forma íntegra, o en parte. Los apartados siguientes se pueden consultar ya:

  • Prosa de Referencia (PR)
  • Diccionario Unificado en la Prosa Actual (DUPA)
  • Léxico: tradición y actualidad (LTA)
  • Diccionario de la Lengua Vasca Actual (DLVA)

Además de esos proyectos, ha realizado varias jornadas de trabajo (2002, 2005, 2008) en torno a la terminología y ha recopilado distintos materiales para la docencia universitaria en lengua vasca. Se puede consultar también una gramática escrita en lengua inglesa.

Los trabajos están disponibles, básicamente, en lengua vasca, dado su carácter. Aquí incluimos esta explicación en español para que sirva de ilustración sobre el tipo de trabajos desarrollados por el Instituto.

Esta aplicación pone a disposición del público numerosos datos relacionados con la estructura de las frecuencias internas de las palabras vascas:

  • frecuencia de las palabras
  • estructura silábica de las palabras vascas: número de letras, número de sílabas, cadenas de CV, VV, VC, etc.
  • Palabras similares: añadiendo una letra, quitando letras, alterando letras, etc.
  • Sílabas repetidas, letras en grupos de dos, tres... su situación dentro de la palabra
  • Morfología relativa a cada lema, su frecuencia, su categoría gramatical, etc.

Los datos se han obtenido a partir del corpus Ereduzko prosa Gaur (EPG), aunque solo se han tenido en cuenta entradas de léxico común, es decir, las que constituyen verdaderos lemas en vasco, sin tener en cuenta los nombres propios, palabras de otros idiomas, errores, etc. De esta forma, de los 25,1 millones de palabras de EPG se han utilizado 22,7 millones en esta aplicación.

Las consultas son de tres tipos:

  • Datos: datos generales de la base de datos.
  • De los datos a las palabras: el consultante puede seleccionar los criterios sobre los que quiere hacer la consulta, de forma que la aplicación devuelve la respuesta en listas de palabras con numerosa información.
  • De las palabras a los datos: se escribe de forma una lista de palabras (puede ser cualquier texto), o se sube un fichero de texto, sobre los que la aplicación hará un análisis en cada una de las palabras.

EFLV (en lengua vasca)

Fecha de la última modificación: 30/03/2011