Este es un proyecto de extracción de información gramatical a partir de corpus que por el momento está centrado en el reconocimiento del plural en castellano. Es un proyecto de código abierto consistente en un script en código Perl que implementa el algoritmo descrito en la siguiente publicación: Además del artículo citado, existe como documentación la serie de comentarios disponibles en el mismo script. Es necesario editar las primeras líneas del código para ejecutarlo. A continuación puede descargar el código fuente del script y el modelo ya generado a partir del corpus EsTenTen. Ambos son archivos comprimidos (zip). Se tienen que descomprimir después de descargarlos y antes de ejecutar.
|