Confirman nueva actualización del CORPES XXI de la RAE
- El CORPES XXI supera los 312 millones de formas ortográficas
- Base de datos del español dirigida por el académico de la RAE Guillermo Rojo.
Sala de Redacción / Al Día Panamá
Ya está disponible para su consulta en línea la nueva actualización del Corpus del Español del Siglo XXI (CORPES XXI) de la Real Academia Española en colaboración con la Asociación de Academias de la Lengua Española (ASALE).
La versión 0.92 de esta herramienta lingüística reúne más de 300 000 documentos, que suman en torno a 312 millones de formas ortográficas, procedentes tanto de textos escritos como de transcripciones orales. Con respecto a la versión anterior, esta actualización supone un incremento de alrededor de 33 millones de nuevas formas incorporadas a esta excepcional base de datos del español dirigida por el académico de la RAE Guillermo Rojo.
Desde su lanzamiento en 2013, el CORPES XXI ha ampliado sus contenidos y mejorado su herramienta para lograr el propósito básico de este corpus de referencia: ser un fiel retrato del español de nuestros días.
Para ello contiene textos de todos los tipos (novelas, obras de teatro, guiones de cine, noticias de prensa, ensayos, transcripciones de noticiarios radiofónicos o televisivos, transcripciones de conversaciones, discursos, etc.) y también de todos los países que constituyen el mundo hispánico.
Respecto a la procedencia de los documentos del CORPES XXI, el equilibro previsto entre España y América (30 %-70 %) se mantiene: las formas producidas en textos clasificados como pertenecientes a España suponen algo más del 30 % y los de América superan los 204 millones de formas. Más información ir a
Fuente: Real Academia Española.