Tu ouvriras la page principale d'UPV/EHU en une fenêtre nouvelle (espagnol)

Euskara Institutua
Prose de Référence (PRC)

L'Institut de la langue basque (ILB) travaille à un projet scientifique visant à mettre en ligne une encyclopédie de la langue basque : grammaire, dictionnaire, information historique, etc. Certains volets de ce projet sont à ce jour entièrement ou partiellement disponibles en ligne. On peut consulter notamment :

  • Prose de référence contemporaine (PRC)
  • Dictionnaire du basque standard dans la prose contemporaine (DBSPC)
  • Lexique: Passé et Présent (LPP)
  • Dictionnaire du basque contemporain (DBC)

Outre ces projets, l'ILB a organisé plusieurs journées de travail (2002, 2005, 2008) sur la terminologie et a compilé différents matériels pour l'enseignement universitaire en basque. On peut également consulter une grammaire écrite en langue anglaise.

Etant donné leur nature, la plupart des travaux sont également disponibles, en langue basque. Cette explication en français vise à informer le lecteur du type de travaux menés par l'Institut.

Ce que nous appelons Corpus de Référence se réfère à un corpus de textes linguistiques en prose écrits dans la période 2000-2007. Au total, il contient 25,1 millions de mots, dont 13,1 millions sont extraits de livres choisis pour leur qualité (287 livres) et 12 millions sont des articles de presse publiés aussi bien en Espagne (Berria) qu'en France (Herria).

Il s'agit d'un corpus fermé. L'équipe de chercheurs a conclu, en effet, au terme de maintes recherches, que l'information qui pourrait être glanée au-dessus de ces 25 millions de mots n'est pas pertinente pour les objectifs poursuivis et ne fait qu'ajouter confusion et perte de temps dans le traitement des données. En tout état de cause, dans le futur on intègrera d'autres corpus linguistiques, dont les caractéristiques seront différentes, sur le site de l'Institut de la langue basque.

Ce corpus permet de consulter les mots employés par les écrivains dans l'emploi actuel de la langue, dans la prose écrite. Le mot à propos duquel on demande des informations s'affiche dans son contexte, dans la phrase complète. On indique aussi la fréquence d'utilisation (nombre de fois qu'il apparaît dans les livres et les articles de presse), le nom de l'écrivain qui l'utilise, le titre du livre et la page.

Ce corpus a donné lieu à divers travaux académiques qui n'ont été possibles que grâce l'information contenue dans le corpus : Dictionnaire du basque standard dans la prose contemporaine (Hiztegi Batua Euskal Prosan), http://www.ehu.es/ehg/; Dictionnaire du basque contemporain (Egungo Euskararen Hiztegia), http://www.ehu.es/eeh/; Lexique, Passé et Présent (Lexikoa, Atzo eta Gaur), http://www.ehu.es/lag/, etc., disponibles sur le site de l'Institut de la langue basque.

Cette partie du projet a été financée en partie par la mairie de San Sebastián et Conseil général (Diputación Foral) de Gipuzkoa.

PR (en langue basque)

Fecha de la última modificación: 25/01/2009