Update: February 24, 2023
The new version of
Termout.org is now online,
so this web site is now obsolete and will soon be dismantled.
|
Lista de candidatos sometidos a examen:
1)
tf-idf (*)
(*) Términos presentes en el nuestro glosario de lingüística
Is in goldstandard
1
paper corpusSignostxt332 -
: Usando las versiones derivadas del modelo BM25 para categorización de textos expresadas en las ecuaciones [17] y [22], proponemos la siguiente variación para Tf' [i,d] , dado por el producto Tf-Idf que queda expresado de la siguiente forma:
2
paper corpusSignostxt375 -
: A continuación, describimos brevemente nuestra adaptación de la medida tf-idf para determinar el peso y la relevancia de los n-gramas en el corpus:
Evaluando al candidato tf-idf:
tf-idf
Lengua:
Frec: 17
Docs: 7
Nombre propio: 1 / 17 = 5%
Coocurrencias con glosario:
Puntaje: 0.193 = ( + (1+0) / (1+4.16992500144231)));
Candidato aceptado
Referencias bibliográficas encontradas sobre cada término
(Que existan referencias dedicadas a un término es también indicio de
terminologicidad.)
tf-idf |
: Kadhim A. I. (2019). Term weighting for feature extraction on Twitter: A comparison between BM25 and TF-IDF. En actas de la International Conference on Advanced Science and Engineering (ICOASE) (pp. 124-128). Kurdistán: University of Zakho and Duhok Polytechnic University.
|