Termout.org logo/LING


Update: February 24, 2023 The new version of Termout.org is now online, so this web site is now obsolete and will soon be dismantled.

Lista de candidatos sometidos a examen:
1) normalización (*)
(*) Términos presentes en el nuestro glosario de lingüística

1) Candidate: normalización


Is in goldstandard

1
paper corpusSignosTxtLongLines320 - : En el caso de los neologismos, el procedimiento es similar al utilizado originalmente para la extracción de neología en lengua general a partir de archivos de prensa (Nazar & Vidal, 2008). Para la extensión temporal de este corpus, el neologismo ideal está definido en la Ecuación 8 y su representación en la [48]Figura 8. El procedimiento de normalización y cálculo de similitud es el mismo que en el caso de los arcaísmos .

2
paper corpusSignosTxtLongLines405 - : Otra alternativa de normalización a la ‘frecuencia relativa’ y la ‘normalización de frecuencias por millón de palabras’ es el ‘índice normalizado de dispersión’ (Ham, 1979 ), aplicado a la normalización de frecuencias del Corpus del Español Mexicano Contemporáneo (CEMC). Este ofrece una medida que da cuenta de la frecuencia de un vocablo, su dispersión entre géneros y el tamaño relativo de cada uno de ellos. Se calcula a partir de la ‘frecuencia corregida’ (Korrigierte Frequenz (KF)), propuesta original de Jan Lanke, según reporta Ham (1979), que sirve para subsanar diferencias ocasionadas por ponderaciones de ciertos tipos documentales frente a otros, dentro de un corpus. El ‘índice normalizado de dispersión’ (C[i]) considera el tamaño relativo del género en el que aparece el vocablo (r[j]) y un índice de dispersión de este entre géneros (S[i]). La fórmula descrita por Ham (1979) es la siguiente:

3
paper corpusSignosTxtLongLines405 - : El cálculo de las medias móviles atenúa las diferencias entre cortes temporales y dibuja una tendencia, pero de ninguna manera normaliza las frecuencias registradas para cada uno de los cortes temporales. Por ello, en este punto es necesario otro paso adicional para este método de normalización de frecuencias: recuperar un valor que refleje el número máximo de documentos posibles que hay en el corpus, para este mismo periodo de tiempo, tomando en cuenta los mismos cortes temporales que se han considerado para el análisis de la unidad léxica ‘país’ .

4
paper corpusSignosTxtLongLines405 - : Este procedimiento es una alternativa diferente de normalización de frecuencias, respecto a los trabajos existentes, en la que está implícita una comparación entre la aparición de otro hecho lingüístico: otra unidad léxica regular y altamente frecuente en el corpus, y no una normalización de frecuencias basada en el tamaño del léxico recogido en él .

5
paper corpusSignosTxtLongLines405 - : En este punto de la normalización de frecuencias es necesario, primero, darle un valor a las ocurrencias cuantificadas respecto al tamaño de las muestras para cada corte temporal y, luego, una alternativa de representación de los datos que subsane estas diferencias . Los pasos seguidos en la normalización de frecuencias son los mismos que en el ejemplo de ‘país’, a saber, primero, calcular las medias móviles de ‘agora’ y ‘ahora’, para los siglos representados. Veamos, en el Gráfico 8, cómo se suavizan las líneas de tendencia después de este procedimiento.

6
paper corpusSignosTxtLongLines405 - : El proceso de normalización de frecuencias que aquí se propone, tal cual se ha descrito, no pretende manipular los datos para sustituir la realidad lingüística del español, sino que es una alternativa que permite la comparación de hechos lingüísticos que se encuentran representados desproporcionadamente en los corpus académicos .

7
paper corpusSignosTxtLongLines405 - : Los pasos propuestos para esta normalización de frecuencias son los siguientes, en este orden: primero, considerar la aparición de cualquier fenómeno lingüístico que se estudie en la base de datos por documento (D ). Después, es preciso calcular las medias móviles para los periodos de tiempo estudiados (ma[D]), con ello lo que se estudiaría es una tendencia de uso. Luego, se calcula el valor logarítmico natural de estas medias móviles (ln ma[D]), para darle al fenómeno estudiado un valor comparable independientemente del alto o bajo número de documentos que haya en cada periodo. En este punto es indispensable repetir este mismo procedimiento para las ocurrencias de la forma léxica más frecuente en ambos corpus, a saber, la preposición “de”; con ello obtendremos el número virtual de documentos por periodo de tiempo estudiado (N). Del que, luego, calcularemos las medias móviles y su valor logarítmico natural (ln ma[N]).

Evaluando al candidato normalización:


1) frecuencias: 10 (*)
2) corpus: 6 (*)
4) móviles: 5
5) medias: 5
6) procedimiento: 4
7) alternativa: 4
8) dispersión: 4 (*)
12) tendencia: 3
13) léxica: 3 (*)
14) cortes: 3
15) documentos: 3

normalización
Lengua: spa
Frec: 53
Docs: 18
Nombre propio: / 53 = 0%
Coocurrencias con glosario: 4
Puntaje: 4.988 = (4 + (1+5.6724253419715) / (1+5.75488750216347)));
Candidato aceptado

Referencias bibliográficas encontradas sobre cada término

(Que existan referencias dedicadas a un término es también indicio de terminologicidad.)
normalización
: Ayala, P., Domínguez, E., Martel, F., Montelongo, J., Morales, D., Socorro, O. J. & Suárez, E. (2000). Manual de normalización de documentos administrativos. Las Palmas: Universidad de Las Palmas de Gran Canaria.
: Molina Salinas, C. & Sierra Martínez, G. (2015). Hacia una normalización de la frecuencia de los corpus CREA y CORDE. Revista Signos. Estudios de Lingüística, 48(89), 307-331.