jueves, 12 de abril de 2012

Mar Abierto en el Corpus del Español siglo XXI



Qué es el Corpus
El Corpus del Español del Siglo XXI es una tarea para reunir un amplísimo conjunto de textos recopilados en el ámbito hispanoamericano, que contribuyan al mejor conocimiento del español a través de la forma gráfica de una palabra. Dicho así todavía no suena simple de entender. Lo cierto es que para actualizar los diccionarios publicados por la Real Academia de la Lengua (RAE) y la Asociación de Academias de la Lengua Española, se requiere de una monumental tarea: recoger multiplicidad de textos en todos los países de habla hispana, de varias épocas y de diversos tipos, para encontrar en ellos las palabras (formas) que con mayor o menor frecuencia se utilicen.

Este material pasa por las manos de lexicógrafos (personas que recopilan los vocablos que han de entrar en un léxico) y gramáticos que definirán la selección de materiales, diseño y sistemas de codificación en un ritmo constante y rápido. Frenético se diría dado el ambicioso objetivo de pasar desde 75 millones de formas que se tenían hasta el año 2000, para llegar hasta las 300 millones de formas en los nuevos textos del periodo 2001-2012.




Organización y búsqueda
La búsqueda para ampliar el banco de datos léxicos, parte de un proyecto exitoso desde 1975, un equipo central de la RAE supervisa las tareas a una buena cantidad de grupos de apoyo que se sustentan en las distintas universidades hispanoamericanas, todos dirigidos por un investigador. Participa activamente, como debe ser la Academia Ecuatoriana de la Lengua Española con valiosa información.

Todos se vinculan para la codificación manteniendo un equilibrio en cada bloque y se agrupan por años, países y zonas lingüísticas que abren amplios abanicos, por tipos de textos, medios de publicación y áreas temáticas. Midiendo en cada tramo que no se rebase el número de palabras asignadas para cada uno.

Así por ejemplo en el año 2008 si publicaron en el Ecuador acerca de la salud por medios como prensa, textos, oralidad (transcrita), se conforma un bloque o sector para recopilar la información.



Mar Abierto y el Corpus
Para nada resulta extraño que la Editorial Mar Abierto, creada e impulsada por la Universidad Laica Eloy Alfaro de Manabí, después de 12 años de trabajo perseverante y creativo, con más de un centenar de obras publicadas, se encuentre en el ciberespacio con una solicitud del Coordinador del Proyecto Corpus, Guillermo Rojo, para que se integre con 20 de sus textos publicados entre los años 2001 y 2012, en áreas y temas que relacionan la educación, salud, memoria-testimonio, comunicación, política, filosofía, historia, teatro, literatura, entre otros. Para hacer una síntesis de todo lo descrito un extracto de la comunicación del Coordinador: “Poder disponer de sus materiales nos facilitaría nuestro trabajo, que, como he indicado, está destinado a proporcionar gratuitamente los materiales básicos que necesitan las Academias de la lengua y todas las personas interesadas en la investigación sobre el español…El propósito de esta carta es, como habrá imaginado ya, solicitar la colaboración de su editorial en esta tarea”.

Nos honra y decididamente prestamos nuestra colaboración, creemos firmemente en el talento y las capacidades de los manabitas y hemos abierto las puertas a los autores de todo el país.

No hay comentarios: