Termout.org logo/LING


Update: February 24, 2023 The new version of Termout.org is now online, so this web site is now obsolete and will soon be dismantled.

Lista de candidatos sometidos a examen:
1) coseno (*)
(*) Términos presentes en el nuestro glosario de lingüística

1) Candidate: coseno


Is in goldstandard

1
paper corpusSignosTxtLongLines176 - : Las medidas, por tanto, se utilizan para la disposición de los elementos en el espacio así como para responder al requerimiento de un usuario. Se pueden usar todas juntas o considerar solo alguna, dependiendo de los objetivos que guían el uso del LSA. La medida de coseno es la más usada y resulta especialmente apropiada cuando se tiene alguna intuición acerca de la relación de similitud semántica que los elementos a comparar mantienen (Kintsch, 2001 ; Dennis et al., 2003). En el caso contrario, es decir, cuando el usuario previamente no tiene ninguna hipótesis respecto de dicha relación o cuando la que tenía no es corroborada al aplicar coseno, será apropiado saber cuánta información tiene el sistema del LSA respecto de los elementos a comparar, para lo cual se usa la medida de largo del vector (Quesada, 2003b). La distancia entre vectores, por su parte, resulta de gran utilidad para clasificar los vectores por agrupamiento, formando, como ya señaláramos, barrios semánticos o conjuntos de

2
paper corpusSignosTxtLongLines176 - : Ahora bien, para probar si el LSA puede predecir automáticamente este razonamiento con la misma certeza con que lo han estado haciendo de modo manual, los investigadores conforman un espacio semántico con un corpus de textos de historia antigua tomados de los libros que los estudiantes utilizan en la escuela. Sobre esta base y utilizando la medida de coseno comparan la similitud de las declaraciones de los protocolos verbales de los estudiantes con los textos representados en el espacio semántico, comprobando que el LSA arroja: (a ) cosenos muy altos cuando las declaraciones verbales de los estudiantes son un parafraseo del texto; (b) cosenos muy bajos cuando en las declaraciones predomina información referida al conocimiento previo y, por tanto, se encuentran muy alejadas del texto mismo; y (c) cosenos medios cuando hay equilibrio entre la información textual y el conocimiento previo, es decir, cuando los protocolos verbales muestran una adecuada integración de ambas fuentes de

3
paper corpusSignosTxtLongLines181 - : Por último, la similitud entre vectores es calculada usando medidas de coseno, cuyos valores van de 1 para vectores con la misma dirección (esto significa que lo medido es igual) a 0 para aquellos vectores ortogonales (perpendiculares en el espacio multivectorial, es decir, que lo medido es completamente distinto ). Los valores deben ser normalizados, para hacer más efectiva la comparación entre ellos, ya que si no se hace, vectores más largos (correspondiente a documentos más largos) podrían tener una ventaja injusta respecto de los vectores más cortos. Además, la normalización de los valores de coseno permite que estos sean calculados como un producto simple (multiplicación de los vectores) (Deerwester et al, 1990; Landauer et al, 1998; Manning & Schütze, 2003).

4
paper corpusSignosTxtLongLines259 - : entre ellas, un espacio del que se han eliminado las connotaciones espurias de las palabras y donde emerge una estructura más abstracta o latente. Para analizar la relación semántica entre dos palabras se utiliza el coseno del ángulo entre los vectores que las representan. Cuanto más próximo a uno es el coseno mayor es la relación semántica entre las palabras y cuanto más próximo a cero es el coseno menor es la relación entre las palabras . Pero las relaciones semánticas se pueden examinar además entre una palabra y un texto, o entre dos textos de cualquier longitud. Al fin y al cabo el modelo asume que un texto es el vector suma de los vectores de las palabras que lo componen[25]^1, por lo que el significado de un texto queda representado por la suma de los significados de sus palabras. La [26]Figura 1 representa vectorialmente a tres textos.

5
paper corpusSignosTxtLongLines259 - : Los resúmenes contaban con un máximo de 50 palabras y se evaluaron por 4 jueces expertos, que fueron entrenados específicamente para la tarea. Las evaluaciones se dieron en una escala de 0 a 10 puntos. Por su parte, LSA evaluó los resúmenes con uno de los procedimientos utilizados habitualmente (Foltz, 1996; León et al., 2006), esto es, comparar con el coseno el vector del resumen con los vectores de 6 resúmenes expertos[27]^2. Los 6 vectores representan 6 resúmenes que elaboran expertos y que por lo tanto representan una muestra de resúmenes idóneos. La calificación que LSA da a cualquier resumen es el coseno medio que el resumen del estudiante tenga con los 6 resúmenes expertos. Se parte de que cuanto más alto sea el coseno medio, mejor es el resumen o mejor están representados los contenidos en el resumen ; y viceversa, cuanto más pequeño sea el coseno promedio, peor se considera el resumen. Supongamos dos resúmenes comparados con los 6 resúmenes expertos, como se indica en la [28]Tabla

6
paper corpusSignosTxtLongLines259 - : La primera fila (0,70; 0,64, etc.) representa los cosenos del primer resumen con cada uno de los resúmenes expertos (E1, E2, etc.). La segunda fila lo mismo pero para el segundo resumen. La puntuación final es el coseno medio representado en la última columna. El primer resumen obtiene una calificación de 0,69 y el segundo de 0,34. El primer resumen es mejor porque se parece más a los resúmenes expertos. Una de las ideas fundamentales del LSA, como se ha señalado antes, es que el espacio semántico del LSA recoge la estructura latente y profunda que tienen las palabras, así que no es necesario que el vocabulario recogido en el resumen se solape con el de ningún resumen experto para que el coseno entre sus vectores sea próximo a 1, es decir, para que el resumen sea considerado bueno . Este hecho es realmente lo que le confiere ventaja al LSA sobre otras herramientas, la sutilidad con la que representa el vocabulario en un espacio semántico latente.

7
paper corpusSignosTxtLongLines322 - : El espacio semántico construido utilizando el LSA permite calcular las similitudes semánticas existentes entre palabras y párrafos de textos, estableciendo mediciones de su representación vectorial, a través del cálculo de coseno de sus ángulos en un espacio multivectorial (Landauer & Dumais, 1997; Landauer, Foltz & Laham, 1998; Martin & Berry, 2007). Los valores de coseno corresponden a 1 para vectores con la misma dirección (esto significa que lo medido es igual) y a 0 para aquellos vectores ortogonales (perpendiculares en el espacio multivectorial, es decir, que lo medido es completamente distinto ), en tanto que todos los valores intermedios corresponden a diferentes grados de similitud entre los vectores, que representan a las palabras o párrafos (Deerwester et al., 1990; Landauer et al., 1998; Manning & Schütze, 2003).

8
paper corpusSignosTxtLongLines322 - : Utilizando ES-COTEGE se calculó el valor de coseno para cada uno de los 373 resúmenes comparándolos a partir de tres métodos, a saber: en el primer método, se calculó la similitud léxico-semántica entre cada resumen y el correspondiente texto fuente completo ; en el segundo método, el cálculo se realizó entre el resumen de cada alumno con un resumen consensuado por un grupo de investigadores en lingüística, realizado a partir de cada texto fuente. En el tercer método, se calculó la similitud léxico-semántica entre cada resumen con tres resúmenes a partir de los textos fuente, escritos por cada uno de los que serían los tres evaluadores. La [28]Figura 1 esquematiza los métodos para el cálculo de similitud léxico-semántica utilizados en este estudio.

Evaluando al candidato coseno:


1) vectores: 16 (*)
2) resumen: 15
3) resúmenes: 12
5) palabras: 8 (*)
6) texto: 7 (*)
8) similitud: 7 (*)
11) expertos: 5
12) semántico: 5 (*)
13) textos: 5 (*)
14) valores: 5
17) landauer: 4
19) medido: 4
20) léxico-semántica: 3

coseno
Lengua: spa
Frec: 24
Docs: 9
Nombre propio: / 24 = 0%
Coocurrencias con glosario: 6
Puntaje: 7.347 = (6 + (1+6.59991284218713) / (1+4.64385618977472)));
Candidato aceptado

No se encontraron referencias bibliográficas sociadas al/ alos término(s)

(Que existan referencias dedicadas a un término es también indicio de terminologicidad.)