temout/ling

/LING

Update: February 24, 2023 The new version of Termout.org is now online, so this web site is now obsolete and will soon be dismantled.

Lista de candidatos sometidos a examen:
1) categorizador (*)
(*) Términos presentes en el nuestro glosario de lingüística

1
paper corpusSignosTxtLongLines332 - : Resumen: En este trabajo se presenta un nuevo categorizador de texto para bases de datos documentales. El categorizador propuesto corresponde a una extensión del categorizador Naive Bayes que permite obtener buenos resultados en bases documentales con desbalance en datos de entrenamiento . Resultados experimentales permiten afirmar que el categorizador supera a Naive Bayes y se compara favorablemente con otras técnicas más sofisticadas como máquinas de soporte vectorial y regresión logística sin incurrir en costos computacionales significativos en la fase de entrenamiento.

2
paper corpusSignosTxtLongLines332 - : Los categorizadores basados en aprendizaje de modelos incorporan un requerimiento en espacio menor, ya que les basta con almacenar |C| vectores de tamaño |V|. Sin embargo, el tiempo de entrenamiento de un categorizador Naive Bayes solo considera el llenado de la base de datos. No existen procesos de optimización para sintonización o validación interna lo cual lo compara favorablemente con cualquier método de máquinas de aprendizaje basado en optimización, como es el caso de regresión logística o máquinas de soporte vectorial. En rigor, el tiempo entrenamiento de un categorizador Naive Bayes extendido corresponde a la suma de los tiempos de pre procesamiento del texto y a la inserción de los documentos en la base de datos . La tabla que tarda más en llenar corresponde a la tabla Índice, la cual requiere Θ(¦V¦¦ C¦) operaciones de escritura.

3
paper corpusSignosTxtLongLines332 - : Como trabajo futuro evaluaremos el desempeño del categorizador propuesto en colecciones de referencia de gran escala, como es el caso de RCV1 o TREC . En esta dirección, la aplicación de estrategias que permitan aprender la función discriminante usando por ejemplo algoritmos genéticos se visualiza como una de las alternativas más atractivas.

4
paper corpusSignosTxtLongLines505 - : Por ejemplo, la diferencia entre ‘amar’ y ‘amor’ tiene que ver con el tipo de categorizador con el que se ensambla la raíz √AM: verbal (v ) y nominal (n), respectivamente. En el primer caso, tendremos una forma que luego se podrá ensamblar con las proyecciones propias del ámbito verbal en español (Tiempo, por ejemplo), mientras que en el segundo, los núcleos funcionales involucrados serán los propios del ámbito nominal (en principio, Número y Determinante). Entre las discusiones con respecto a los categorizadores tienen especial relevancia las referidas a los rasgos sintáctico-semánticos presentes en ellos y las que se vinculan con la manifestación de argumentos, es decir, si los categorizadores, además de categorizar, introducen argumentos (ver, por ejemplo, ^[39]Harley & Noyer, 2000). Estos aspectos son retomados en el próximo apartado, ya que resultan centrales para nuestro análisis sobre los nombres de relación simétrica.

Evaluando al candidato categorizador:

1) naive: 4
2) bayes: 4
3) corresponde: 3
4) máquinas: 3

categorizador
Lengua: spa
Frec: 37
Docs: 6
Nombre propio: / 37 = 0%
Coocurrencias con glosario:
Puntaje: 0.785 = ( + (1+3.90689059560852) / (1+5.24792751344359)));
Candidato aceptado

No se encontraron referencias bibliográficas sociadas al/ alos término(s)

(Que existan referencias dedicadas a un término es también indicio de terminologicidad.)

/LING

1) Candidate: categorizador

Evaluando al candidato categorizador:

No se encontraron referencias bibliográficas sociadas al/ alos término(s)