Termout.org logo/LING


Update: February 24, 2023 The new version of Termout.org is now online, so this web site is now obsolete and will soon be dismantled.

Lista de candidatos sometidos a examen:
1) vectorial (*)
(*) Términos presentes en el nuestro glosario de lingüística

1) Candidate: vectorial


Is in goldstandard

1
paper CO_CuadernosdeLingüísticaHispánicatxt76 - : ^14 Esta explicación, metodológicamente basada en la oposición entre continuo y discontinuo, es particular y consecuente. Otros autores siguen, en principio, su propio enfoque y terminología cuando comparan entre había amado y hube amado (cf. Toledo y Huerta & Rodríguez Molina, 2008, p. 34 ss. y ^[206]García Fernández, 2008, p. 359 ss.). El objetivo de este artículo es llevar a cabo lo propuesto en la introducción; no es una revisión crítica de lo que tantos autores entienden por aspecto -diversas son las teorías y cuantiosas son las referencias-. Veiga (2015), adhiriéndose todavía al sistema vectorial de la temporalidad lingüística de Rojo y al propio sistema modal, tiene que concluir que el aspecto no es una categoría funcional independiente . Alarcos, defensor del aspecto, es aquí el gramático de más interés.

2
paper corpusSignostxt322 - : El espacio semántico construido utilizando el LSA permite calcular las similitudes semánticas existentes entre palabras y párrafos de textos, estableciendo mediciones de su representación vectorial, a través del cálculo de coseno de sus ángulos en un espacio multivectorial (Landauer & Dumais, 1997; Landauer, Foltz & Laham, 1998; Martin & Berry, 2007). Los valores de coseno corresponden a 1 para vectores con la misma dirección (esto significa que lo medido es igual) y a 0 para aquellos vectores ortogonales (perpendiculares en el espacio multivectorial, es decir, que lo medido es completamente distinto ), en tanto que todos los valores intermedios corresponden a diferentes grados de similitud entre los vectores, que representan a las palabras o párrafos (Deerwester et al., 1990; Landauer et al., 1998; Manning & Schütze, 2003).

3
paper corpusSignostxt181 - : En un esfuerzo por aportar a la discusión respecto del problema de la escritura científica en español, en este trabajo llevamos a cabo un estudio cuyos objetivos son: a) comparar, utilizando una herramienta computacional de análisis vectorial denominada Análisis Semántico Latente (LSA, por su sigla en inglés), la relación léxico-semántica entre tres variables textuales presentes en artículos de investigación científica, estas son: palabras clave, resumen y contenido del artículo y b) comparar, a partir de los valores de similitud léxico-semántica de las variables textuales, una muestra de artículos de investigación científica de dos áreas de la ciencia (ciencias biológicas y ciencias sociales ).

4
paper corpusSignostxt181 - : Como planteamos en la introducción de este trabajo, los objetivos de esta investigación son: a) comparar, utilizando una herramienta computacional de análisis vectorial denominada LSA, la relación léxico-semántica entre tres variables textuales presentes en artículos de investigación científica, estas son: palabras clave, resumen y contenido del artículo ; y b) comparar, a partir de los valores de similitud léxico-semántica de las variables textuales, una muestra de artículos de investigación científica de dos áreas de la ciencia (ciencias biológicas y ciencias sociales).

5
paper corpusSignostxt213 - : Las técnicas empleadas para la clasificación de documentos, como ya mencionamos, son originarias de los métodos clásicos de recuperación de información, es por ello que antes de describir las técnicas a utilizar en esta investigación, presentamos brevemente el modelo vectorial, ya que, sin duda, es la base conceptual para las técnicas de clasificación actuales (Figuerola et al ., 2000; Manning & Schütze, 2003). El modelo vectorial fue definido inicialmente por Salton (1968) y es ampliamente usado en operaciones de recuperación de información, así como también en operaciones de categorización automática, filtrado de información, etc. (Zazo et al., 2002; Manning & Schütze, 2003).

6
paper corpusSignostxt213 - : Ahora bien, dado que en nuestro caso nos interesa describir el Corpus PUCV-2006 e identificar las similitudes y diferencias entre las disciplinas consideradas en este corpus, compararemos dos métodos de clasificación supervisada, basados en el modelo vectorial: el Bayes Ingenuo (Multinomial Naïve Bayes ) y la Máquina de Soporte de Vectores (Support Vector Machine), con el fin de conocer cuál de ellas es más eficiente en la clasificación de los textos.

7
paper corpusSignostxt555 - : En el caso particular de los documentos, la representación del texto tiene un alto impacto en la tarea de clasificación (^[62]Keikha, Razavian, Oroumchian & Razi, 2008). El modelo espacio vectorial es uno de los modelos más usados para recuperación de información, principalmente por su simplicidad conceptual y el atractivo de su metáfora subyacente, de usar una proximidad espacial para proximidad semántica (^[63]Manning & Schütze, 1999 ). En el modelo de espacio vectorial (Vector Space Model), los contenidos de un documento son representados por un vector de términos d = {w[ 1 ],…,w[ k ]}, donde k es el tamaño del conjunto de términos w[ i ](o características). Algunos elementos usados en la representación de un texto son los N-gramas, palabras, frases, lógica de términos y declaraciones o cualquier otra unidad léxica, semántica y/o sintáctica que pueda ser utilizada para representar el contenido del texto.

8
paper corpusSignostxt393 - : Each document can be represented by a vector where each entry corresponds to the ‘tf-idf’ value obtained by each vocabulary term of the given document. Thus, given two documents in vectorial representation, and , it is possible to calculate the cosine of the angle between these two vectors as follows:

9
paper corpusSignostxt176 - : El LSA (del inglés Latent Semantic Analysis) es un tipo de análisis computacional que permite determinar y cuantificar la similitud semántica entre piezas textuales -sean palabras, documentos o palabras y documentos- de un corpus de textos pertenecientes a un mismo dominio de conocimiento. Para ello, el sistema computacional del LSA sigue un algoritmo matemático que tiene como centro a la técnica de factorización lineal conocida como descomposición de valores singulares (SVD, sigla del inglés Singular Value Decomposition), a partir de la cual se genera una representación vectorial del corpus o espacio semántico en cuya conformación y posterior utilización reconocemos dos supuestos lingüísticos acerca del significado: (1 ) el significado es contextualmente dependiente y (2) en el uso contextual hay relaciones de similitud semántica que están latentes.

Evaluando al candidato vectorial:


1) palabras: 7 (*)
4) textuales: 5 (*)
5) valores: 5
6) similitud: 5 (*)
7) clasificación: 5 (*)
8) manning: 4
9) vectores: 4 (*)
10) corpus: 4 (*)
11) variables: 4 (*)
12) léxico-semántica: 4
13) artículos: 4
15) ciencias: 4
16) schütze: 4
17) computacional: 4 (*)
18) análisis: 4
19) comparar: 4
20) semántica: 4 (*)

vectorial
Lengua: spa
Frec: 50
Docs: 12
Nombre propio: / 50 = 0%
Coocurrencias con glosario: 9
Puntaje: 10.086 = (9 + (1+6.24792751344359) / (1+5.6724253419715)));
Candidato aceptado

Referencias bibliográficas encontradas sobre cada término

(Que existan referencias dedicadas a un término es también indicio de terminologicidad.)
vectorial
: Betancourt, G. (2005). Las máquinas de soporte vectorial (SVMs). Scientia et Technica, 11(27), 67-72.
: Zazo, A., Figuerola, C., Alonso, J.L. & Gómez, R. (2002). Recuperación de información utilizando el modelo vectorial [en línea]. Disponible en: [86]http://tejo.usal.es/inftec/2002/DP-TOIA-IT-2002-006.pdf