Termout.org logo/LING


Update: February 24, 2023 The new version of Termout.org is now online, so this web site is now obsolete and will soon be dismantled.

Lista de candidatos sometidos a examen:
1) fórmula (*)
(*) Términos presentes en el nuestro glosario de lingüística

1) Candidate: fórmula


Is in goldstandard

1
paper corpusSignosTxtLongLines131 - : El trabajo que se ha realizado en Australia sobre la secuenciación de género fue inspirado en sus comienzos por Hasan ([68]1977, [69]1984); Halliday y Hasan ([70]1985/1989). Hasan introduce la noción de potencial de estructura genérica para generalizar la gama de posibilidades de secuenciación asociadas con un género en particular. Su análisis de la secuencia en los géneros "escenas de servicio a un cliente" y "cuentos para niños" se reseña a continuación, junto a una clave para interpretar las convenciones de la fórmula:

2
paper corpusSignosTxtLongLines153 - : La última variable en estudio es la variabilidad verbal de los registros del corpus general. Como ya mostramos en el marco teórico, también se trata de una variable cuantificable que se puede medir según las fórmulas a) y b), introducidas en el marco teórico. La primera fórmula arroja una estadística por medio de un rango que varía de 0 a 1, números que representan una baja y una alta variabilidad respectivamente. La segunda fórmula supone una estadística de proporciones que se manifiesta en un porcentaje dado, que corresponde a la cantidad de formas verbales en el total de palabras .

3
paper corpusSignosTxtLongLines158 - : La lectura de la fórmula de Potencial de Estructura Genérica para "service encounter" es la siguiente:

4
paper corpusSignosTxtLongLines159 - : Por otra parte, en estas consignas, se evitó el uso de la fórmula qué quiere decir, ya que hubiera podido conducir a colocar en la respuesta el significado de las palabras con un criterio léxico, es decir, en forma descotextualizada . Por el contrario, la consigna sugiere la cotextualización y la correferencia anafórica, porque, por un lado, se indica con precisión el párrafo en el que aparece En el tercer párrafo… y, por el otro, se usa el verbo referir y no significar. Si se hubiera utilizado este último, hubiera sido más remota la posibilidad de que los lectores inexpertos interpretaran la nominalización como una remisión anafórica.

5
paper corpusSignosTxtLongLines187 - : Este principio invade, poco a poco, los temas de los diferentes mundos sociales convocados por los medios masivos de comunicación, tales como los temas ligados a la seguridad alimenticia o medioambiental, los que al perder lentamente sus comillas, pierden, igualmente, su principio hasta transformarse en el equivalente de “tomar precauciones”, sentido banal y sentido primitivo de los diccionarios de uso. Se asiste, entonces, al descongelamiento de la fórmula, a tal punto que no se sabe ya si la referencia a la precaución es una alusión al principio del mismo nombre:

6
paper corpusSignosTxtLongLines218 - : - A diferencia del complemento circunstancial de modo (Preparó la fórmula como le habían indicado), este tipo de estructuras no tienen función nuclear sino periférica, es decir, no modifican directamente al verbo sino a todo el núcleo oracional . Prueba de ello es que no pueden parafrasearse con la construcción de 'ser’ + relativo' que es la que permite destacar todas las funciones relacionadas con el verbo (*Es como declaró el paleontólogo como el hueso de dinosaurio...; Es como le habían indicado como / que preparó la fórmula). Sin embargo, sí admiten una paráfrasis que explicite la modalidad: “El paleontólogo declaró que el hueso de dinosaurio”... (modalidad intelectual enunciativa).

7
paper corpusSignosTxtLongLines229 - : se creaba un nuevo gráfico de coherencia de la memoria operativa, con un nuevo nodo superordinado (creado desde afuera del modelo computacional). La probabilidad de que una proposición fuera recuperada se computaba mediante la fórmula 1-(1-p)^ndonde n era el número de ciclos de procesamiento en los que la proposición se había mantenido en el retén de la memoria operativa y p, un parámetro libre que corresponde a la probabilidad de que una proposición tiene de ser recuperada, si solo había entrado en solo un (n=1 ) ciclo de procesamiento en la memoria operativa. Así, p es una probabilidad base de recuperación y todas las proposiciones parten en ese nivel una vez que hayan sido procesadas en un ciclo. Con cada nuevo ciclo de procesamiento en el que ingresa una proposición aumenta la posibilidad de recuperación de esta.

8
paper corpusSignosTxtLongLines232 - : (47) La imagen que el enunciado ofrece de sí mismo es la de una superposición de discursos, un “diálogo cristalizado”, según la fórmula de Ducrot (OD, 2004: 126 ).

9
paper corpusSignosTxtLongLines238 - : El término, en este contexto, es el nombre o designación de un concepto en un campo temático particular. Puede tratarse de una palabra del lenguaje general que adopta un sentido especializado, una palabra creada con un sentido especializado, un sintagma o grupo de palabras con un sentido único y especializado, un símbolo, una fórmula química o matemática, un nombre científico en latín o en griego, un acrónimo, una sigla, la denominación o título oficial de un cargo, organismo o entidad administrativa .

10
paper corpusSignosTxtLongLines338 - : Ya en 1932, George Zipf, a partir de las observaciones realizadas por Estoup (Petruszewycz, 1973), describió el comportamiento estadístico de la distribución de las palabras en los textos. Propuso que en un texto cualquiera, existe una relación matemática entre la frecuencia absoluta de cada palabra y el lugar que ocupa en el listado de las palabras usadas en el texto, ordenadas por su frecuencia decreciente. Esto se puede expresar mediante la siguiente fórmula:

11
paper corpusSignosTxtLongLines338 - : La propiedad de invarianza hace que una ley de potencias quede determinada por su exponente, formando las funciones con el mismo exponente una clase de equivalencia. Desde una perspectiva gráfica, la ley de potencias puede interpretarse como una línea aproximadamente recta en un gráfico doblelogarítmico, lo cual queda manifiesto en la siguiente reformulación de la ecuación de la fórmula 1:

12
paper corpusSignosTxtLongLines338 - : casos totales por cada uno de los estratos (revistas, disciplinas y áreas de la ciencia). Una vez conocido el número de unidades muestrales (en nuestro caso, los artículos) de cada estrato (revistas, disciplinas y áreas de las ciencias), se utilizó la siguiente fórmula para determinar el número de artículos a considerar para contar con un corpus representativo:

13
paper corpusSignosTxtLongLines338 - : A diferencia de otros trabajos consultados, en esta investigación no solo calculamos la frecuencia y porcentaje de los Hapax Legomena (1-Legomena), sino que extendimos esta noción también a las palabras que tienen una frecuencia igual a 2 (2-Legomena), a 3 (3-Legomena) y a 4 (4-Legomena). Para la contabilización de los tipos de Legomena (1, 2, 3 y 4), se calculó la frecuencia absoluta de los cuatro tipos de Legomena, junto con su porcentaje de ocurrencia respecto del total de types del corpus correspondiente, utilizando la siguiente fórmula:

14
paper corpusSignosTxtLongLines338 - : Para proporcionar otra métrica general para el análisis de los corpus, se calculó además la variabilidad de los textos en términos de las palabras distintas y las palabras totales que contienen, utilizando la clásica fórmula del Type-Token Ratio (TTR):

15
paper corpusSignosTxtLongLines356 - : Para este análisis, se construyó un índice que da cuenta del porcentaje de errores por palabras escritas, según la siguiente fórmula:

16
paper corpusSignosTxtLongLines363 - : a) Tesis 1 [10:57-11:21]: La eneRgía nucLeaR nos pRopoRciona [ahoRa] eLectRicidad BaRata (D4); rebatido por D1 y D2, con falacias "ad hominem" (D1 tilda a D4 de tramposo) y "de división" (D2 afirma que todos los usuarios subvencionan la energía nuclear, para termina aceptando que solo subvencionan parte de ella: los residuos). La contraargumentación de D4 utiliza la falacia "del equívoco" (D4 dice: "los residuos están financiados en la tarifa," ¡como si la tarifa no la pagaran los usuarios!), y, posteriormente, encuentra una fórmula mas convincente para concluir la polémica: la de que los usuarios pagan una parte ínfima de ella (2 cms . de euro por kw/h), que es como no pagar nada.

17
paper corpusSignosTxtLongLines377 - : 3. Fórmula: artefacto que se construye preferentemente a partir de tres modalidades: la matemática, la verbal y la tipográfica . La fórmula permite establecer relaciones entre propiedades matemáticas o asignar valores en una asociación simbólica. Ella incluye una cadena de caracteres, organizados a partir de una sintaxis y con base en uno o varios alfabetos. Esta representación puede incluir números romanos o árabes, letras griegas o latinas (en mayúsculas o minúsculas), operadores (funciones) y signos de puntuación. La tipográfica se revela –entre otros- por medio del uso de cursivas, negritas y mayúsculas.

18
paper corpusSignosTxtLongLines377 - : exto, si eliminamos este manual del subcorpus, el porcentaje de la frecuencia de ocurrencia de la Fórmula desciende al 30,3%; a pesar de ello, ella mantiene su papel predominante dentro de la muestra de textos de discurso académico de la Economía, lo que la convierte en el artefacto multimodal fundamental en la construcción y transmisión del conocimiento especializado de esta disciplina. En particular, es posible señalar que la Fórmula es un artefacto que tanto en su naturaleza, pero también en el modo de emplearse, puede mostrarse como muy didáctica como parte de manuales especializados tanto en el apoyo a la enseñanza de conceptos como en la transmisión del modus operandi en que se elaboran razonamientos simbólico matemáticos en el discurso de la Economía . En este sentido, su función en los manuales permitiría a los aprendices acercarse al discurso matemático y comprender cómo se construyen los significados por medio de este artefacto fundamental en la disciplina. Esta orquestación parti

19
paper corpusSignosTxtLongLines377 - : Una hipótesis interesante a indagar a partir de estos datos tiene relación con la vinculación que establecen estos artefactos con la disciplina y el género discursivo en el que aparecen. El hecho de que la Fórmula, el Gráfico, la Tabla y el Complejo Estadístico aparezcan con frecuencias importantes en todos los manuales estudiados supone que estos artefactos son característicos en la construcción, transmisión y enseñanza del conocimiento especializado de la Economía . Mientras que la ocurrencia escasa y alternada de los artefactos Esquema, Ilustración e Ícono sugiere elecciones que tienen más relación con las características propias del género Manual. Así el Esquema respondería a exigencias vinculadas con el propósito pedagógico de este género, al presentar conceptos y procesos, poniendo particular énfasis en los aspectos destacados; mientras que la Ilustración y el Ícono podrían responder a criterios relacionados con los participantes (hacer más interactiva y accesible la lectura,

20
paper corpusSignosTxtLongLines40 - : Citamos, a poco, que la «guerra de sexos» entre los Reyes, de acuerdo al texto de Posse, constituye la base del actual Occidente. Esta guerra remite a la concepción de poder expuesta por Focault: «El poder no es tanto una propiedad como una estrategia....» (Deleuze, 1987, 51). Nosotros entendemos, de acuerdo a Deleuze, que al poder se le debe considerar como un vector de la relación susceptible de ser capturado. Luego el poder se ejerce, no es: «El privilegio adquirido o conservado de la clase dominante sino el efecto de conjunto de sus posiciones estratégicas...» (Deleuze, 1987, 51). Fórmula que la novela de Posse expone en el punto del relato donde se origina la lucha entre Isabel y La Beltraneja por ocupar el trono: «La Beltraneja tiembla y estalla ...Yo seré la Reina, yo, yo... (e Isabel)...Yo seré la reina...» ([37]Posse, 1987, 18). Esta concepción del poder, recogida por Posse, es la que va a permitir a Los Perros del Paraíso «ficcionalizar la historia a partir de un análisis funcional

21
paper corpusSignosTxtLongLines401 - : Siguiendo la lógica de la realización (Halliday & Matthiessen, 2004), la estructura funcional de la cláusula como representación es realizada a través del sistema de transitividad. Entendemos que la transitividad es un tipo de relación no binaria que se da cuando un elemento se vincula con otro y este último con un tercero. La fórmula que representa esta relación es la que se presenta en la Figura 6, a continuación .

22
paper corpusSignosTxtLongLines405 - : Una alternativa que subsana las limitaciones de un análisis como este, es calcular la ‘frecuencia relativa’, método descrito por Muller (1973) y generalmente aceptado para el tratamiento de los datos de corpus lingüísticos de gran tamaño. La frecuencia relativa de un fenómeno lingüístico ( f[i]) se obtiene calculando el cociente de la frecuencia absoluta de este hecho en la muestra (n[i]) y el tamaño de esta (N), procedimiento que permite reasignarle a un número de ocurrencias un valor en relación con el tamaño de la partición o del mismo corpus. La fórmula utilizada para calcular la frecuencia relativa es la siguiente:

23
paper corpusSignosTxtLongLines405 - : Otra alternativa de normalización a la ‘frecuencia relativa’ y la ‘normalización de frecuencias por millón de palabras’ es el ‘índice normalizado de dispersión’ (Ham, 1979), aplicado a la normalización de frecuencias del Corpus del Español Mexicano Contemporáneo (CEMC). Este ofrece una medida que da cuenta de la frecuencia de un vocablo, su dispersión entre géneros y el tamaño relativo de cada uno de ellos. Se calcula a partir de la ‘frecuencia corregida’ (Korrigierte Frequenz (KF)), propuesta original de Jan Lanke, según reporta Ham (1979), que sirve para subsanar diferencias ocasionadas por ponderaciones de ciertos tipos documentales frente a otros, dentro de un corpus. El ‘índice normalizado de dispersión’ (C[i]) considera el tamaño relativo del género en el que aparece el vocablo (r[j]) y un índice de dispersión de este entre géneros (S[i]). La fórmula descrita por Ham (1979) es la siguiente:

24
paper corpusSignosTxtLongLines405 - : A partir de esto, se resta al valor del fenómeno que interese estudiar el valor de ‘de’, con la intención de obtener una serie de valores menores a cero que representan la frecuencia normalizada (fn). La fórmula que representaría esta serie de procedimientos es la siguiente:

25
paper corpusSignosTxtLongLines405 - : Adicionalmente a esto, se podrían representar los valores con cualquier otro método que resulte conveniente para un más fácil entendimiento de los datos, nosotros proponemos esta simple fórmula para la representación de los valores positivos (vp), pero pudiera seguirse cualquier otro procedimiento:

26
paper corpusSignosTxtLongLines415 - : El algoritmo que se utiliza aquí para detectar errores no es nuevo (véase Sinclair, 1991). Por un lado, se analiza la frecuencia en el corpus de cada una de las palabras utilizadas en el texto y, por otra parte, de cada bigrama. Además se calcula el número de veces que cada combinación de dos palabras aparecería en el corpus si estas se dieran de manera aleatoria; es decir, se estima la probabilidad del par teniendo en cuenta la frecuencia de cada una de las dos palabras, por separado, en el corpus, tal y como refleja la fórmula siguiente, donde P es la probabilidad ;(a) y (b) representan, respectivamente, a la palabra 1 y a la palabra 2; T es el número total de palabras que componen el corpus (cien millones) y F, la frecuencia. Conviene tener en cuenta que, como veremos a continuación, la escala de la probabilidad empleada no es la de 0 a 1.

27
paper corpusSignosTxtLongLines415 - : Volviendo al algoritmo, tras aplicar la fórmula anterior, se analiza si el par de palabras aparece en el corpus más (o menos) veces de lo que sería esperable según su probabilidad –es decir, se calcula el umbral (U)– mediante esta fórmula: U = F(ab ) / P(ab).

28
paper corpusSignosTxtLongLines415 - : Con estos datos podemos calcular el rendimiento de ambos sistemas de recuperación de información (Manning, Raghavan & Schütze, 2008). La precisión (P) indica el porcentaje de documentos recuperados que son relevantes; es decir, la proporción de entidades propuestas correctamente por el sistema de reconocimiento –en nuestro caso, el porcentaje de errores señalados que realmente lo son–, y se calcula con la siguiente fórmula: P = errores detectados / (errores detectados + falsos positivos ).

29
paper corpusSignosTxtLongLines415 - : En segundo lugar, la cobertura (C) muestra el porcentaje de documentos relevantes que son recuperados; o sea, la proporción de entidades existentes que el sistema de reconocimiento recupera correctamente –en nuestro caso, el porcentaje de errores cometidos que son detectados–, y se calcula aplicando esta fórmula: C = errores detectados / (errores detectados + falsos negativos ). Y estas dos medidas se combinan en una sola, que es la media armónica entre la precisión y la cobertura (F[1]).

30
paper corpusSignosTxtLongLines447 - : [67]^[7] La fórmula empleada con SPSS para el cálculo de los valores fue la siguiente: MIXED gesto BY edad WITH informante /CRITERIA=CIN(95 ) MXITER(100) MXSTEP(10) SCORING(1) SINGULAR(0.000000000001) HCONVERGE(0, ABSOLUTE) LCONVERGE(0, ABSOLUTE) PCONVERGE(0.000001, ABSOLUTE) /FIXED= age| SSTYPE(3) /METHOD=REML /PRINT=DESCRIPTIVES G SOLUTION TESTCOV / RANDOM INTERCEPT I SUBJECT (subject) COVTYPE(CV) /EMMEANS = TABLES(age) COMPARE ADJ(LSD).

31
paper corpusSignosTxtLongLines478 - : La magnitud de la diferencia se señala con el coeficiente del tamaño del efecto d de Cohen, calculado manualmente para cada variable de distribución aproximadamente normal (cuya diferencia resultó significativa), según la fórmula indicada por ^[68]Leech, Barrett y Morgan (2005), y ^[69]Hedges (1981) para grupos de tamaños disímiles. Para obtener la magnitud de la diferencia en las pruebas no paramétricas U, primero se calculó el coeficiente de correlación según la fórmula de ^[70]Cohen (1988): r = Z / N^1/2, y luego, se procedió a obtener el coeficiente de la familia d, para cada una de las 8 variables no normales, de acuerdo con la fórmula de ^[71]Friedman (1968 ).

32
paper corpusSignosTxtLongLines479 - : El estudio cuantitativo consiste en un análisis de la correlación de Pearson entre los valores de similitud obtenidos a partir de cada perspectiva, teniendo en cuenta cada una de las diferentes formalizaciones de estructura argumental en corpus. El coeficiente de correlación de Pearson mide el grado de relación lineal entre dos variables aleatorias, dos perspectivas sobre la similitud verbal en nuestro caso. La fórmula para calcular el coeficiente de correlación de Pearson (también llamado 𝜚) se muestra en la ecuación 2, donde X e Y son las dos variables comparadas, el numerador corresponde a la covarianza de las dos variables y el denominador corresponde a la desviación típica de cada una de las variables .

33
paper corpusSignosTxtLongLines558 - : Ahora bien, mediante la aplicación de la prueba de T de Student se corroboró que no existían diferencias estadísticamente significativas entre los grupos en el número de palabras y cláusulas (nº palabras; valor p=0,684 y nº de cláusulas; valor p= 0,595). Pese a ello, se consideró inadecuada la comparación de las desviaciones como cantidades absolutas. Así, se estableció un índice de desviación gramatical (IDG), considerando la cantidad de desviaciones por cláusula que se observaban en cada uno de los textos. Este índice fue calculado en base a la siguiente fórmula: IDG= ∑desviaciones ∑cláusulas×100 .

34
paper corpusSignosTxtLongLines587 - : El análisis de género permitió corroborar lo encontrado en ^[149]Viera (2017) de que las ponencias de este corpus son un macro-género que se estructura en macro-etapas estables: a) apertura, b) introducción, c) desarrollo, d) conclusión y, e) cierre. Estas etapas se organizan secuencialmente en el orden presentado y son de carácter obligatorio para ambas disciplinas, con excepción del ‘cierre’ que, probablemente por motivos de tiempo no siempre está presente. Esta macro-estructura se traduce en la siguiente fórmula estructural: {Apertura ^ Introducción ^ Desarrollo ^ Conclusión ^ (Cierre )}. En esta fórmula, el símbolo “^” representa el orden secuencial favorecido y las llaves “{“de comienzo y cierre manifiestan los elementos que forman parte de la estructura general del género mientras que los paréntesis marcan elementos opcionales (^[150]Eggins & Alcántara, 2002). En lo que concierne a las fases que integran cada macro-etapa, la siguiente es una fórmula que se desprende del

35
paper corpusSignosTxtLongLines591 - : * 23. Dentro de los estudios de pragmática, la Teoría de la Cortesía de P. Brown y S. Levinson (1987) proporciona algunos criterios útiles para afrontar el estudio de la censura como reacción a una amenaza. Estos autores proponen una fórmula que calcularía el peso de un mensaje como amenaza a la imagen social de un interlocutor (face-threateningacts [FTAs]). En esta fórmula se tienen en cuenta tres variables sociológicas: (… ). Variemos ahora la ecuación para aproximarnos a una mejor descripción de la amenaza que constituye un mensaje para una ideología. (Portolés, J., “Evitar la censura: análisis pragmático”)

Evaluando al candidato fórmula:


1) palabras: 16 (*)
3) frecuencia: 13 (*)
4) corpus: 12 (*)
5) análisis: 8
7) errores: 8
9) probabilidad: 7 (*)
12) valores: 6
16) detectados: 5
19) coeficiente: 5 (*)
20) calcula: 5

fórmula
Lengua: spa
Frec: 135
Docs: 65
Nombre propio: / 135 = 0%
Coocurrencias con glosario: 5
Puntaje: 5.918 = (5 + (1+6.4262647547021) / (1+7.08746284125034)));
Candidato aceptado

Referencias bibliográficas encontradas sobre cada término

(Que existan referencias dedicadas a un término es también indicio de terminologicidad.)
fórmula
: El Índice de Palabras de Contenido es un índice porcentual que determina cuántas palabras de contenido tiene un texto. Conceptualmente equivale a la noción de densidad léxica propuesta por Williamson (2009). Para su cálculo, se utilizó la siguiente fórmula:
: Venegas, R. & Silva, J. (2005). Informe técnico "El Manchador de textos" y la Fórmula IDIT. En G. Parodi (Comp.), Informe técnico del proyecto Fondecyt 1020/786. Valparaíso: Pontificia Universidad Católica de Valparaíso.