Termout.org logo/LING


Update: February 24, 2023 The new version of Termout.org is now online, so this web site is now obsolete and will soon be dismantled.

Lista de candidatos sometidos a examen:
1) estadística (*)
(*) Términos presentes en el nuestro glosario de lingüística

1) Candidate: estadística


Is in goldstandard

1
paper corpusSignosTxtLongLines13 - : Además, observados los desvíos de la independencia de cada una de las celdas, los datos indican que el rendimiento cognitivo mejora en tercer año aun cuando la significación estadística se determinó en los siguientes casos: en 5 inferencias léxicas, en 3 inferencias causales, en 1 inferencia de conocimiento de mundo, en 1 inferencia macroestructural de fragmento, en 1 inferencia contrastiva y en 2 copias literales . En todos estos casos, la prueba Chi cuadrado revela la existencia de una relación de dependencia entre las variables estudiadas.^[32]6

2
paper corpusSignosTxtLongLines13 - : Además, observados los desvíos de la independencia de cada una de las celdas, los datos indican que el rendimiento cognitivo mejora en el nivel socioeducativo medio alto aun cuando la significación estadística se determinó en los siguientes casos: 1 sujetivización, 1 relación de inclusión hiperonímica, 5 inferencias léxicas, 3 inferencias causales, 1 inferencia de conocimiento de mundo, 1 inferencia contrastiva, 1 inferencia macroestructural . La prueba Chi cuadrado también revela la existencia de una relación de dependencia entre las variables estudiadas^[33]7.

3
paper corpusSignosTxtLongLines153 - : Después de los estudios en fonética y fonología, las investigaciones estadísticas en nuestra lengua se desarrollaron en torno al tema de la disponibilidad léxica ([39]Valencia & Echeverría, 1999). Como ya se señaló, sin embargo, la lingüística estadística, actualmente, debe circunscribirse a los estudios en lingüística corpus, englobando bajo ese rótulo dos grandes líneas de investigación: una de corte más computacional y otra, con propósitos más lingüísticos ([40]Moreno, 1998 ). Ahora bien, ambas orientaciones han utilizado medios estadísticos, pero con objetivos distintos.

4
paper corpusSignosTxtLongLines153 - : En la ejecución del punto (a) debe ponerse atención a la elección de una estadística adecuada. Esta etapa es, según García ([55]2004a, [56]2004c), la más riesgosa. El investigador tiene que determinar qué tipo de variables va a ocupar (cuantitativas o categóricas) y establecer qué tipo de estadística es la adecuada para dichas variables, según la pregunta que se busca responder . Si el lingüista pasa por alto los puntos anteriores, los resultados de su investigación son simplemente aberrantes. El punto (b) es el estadio netamente estadístico.

5
paper corpusSignosTxtLongLines153 - : La última variable en estudio es la variabilidad verbal de los registros del corpus general. Como ya mostramos en el marco teórico, también se trata de una variable cuantificable que se puede medir según las fórmulas a) y b), introducidas en el marco teórico. La primera fórmula arroja una estadística por medio de un rango que varía de 0 a 1, números que representan una baja y una alta variabilidad respectivamente. La segunda fórmula supone una estadística de proporciones que se manifiesta en un porcentaje dado, que corresponde a la cantidad de formas verbales en el total de palabras .

6
paper corpusSignosTxtLongLines181 - : La contrastación estadística de estas relaciones nos permite confirmar la idea anterior. Así, al comparar la SLS entre las variables textuales (palabras clave-resumen, palabras clave-contenido y resumen-contenido), utilizando la prueba U de Mann-Whitney y considerando un 5% de error, podemos establecer que en ciencias biológicas existe diferencia estadística entre las tres relaciones, es decir, que la SLS entre palabras clave y contenido es menor que la relación de SLS entre palabras clave y resumen . A su vez ambas relaciones son menores que la SLS existente entre el resumen y el contenido. En ciencias sociales la prueba estadística también mostró diferencias entre las tres relaciones de variables. Así, la SLS entre palabras clave-resumen es menor que la SLS entre palabras clave-contenido, y ambas son menores que la SLS existente entre el resumen y el contenido de los artículos investigados.

7
paper corpusSignosTxtLongLines204 - : Con estos resultados, se puede señalar que existe evidencia estadística de la relación entre una dimensión latente —considerada el “factor”— concebida como comprensión oral y otra, considerada un “criterio”, que es la producción escrita . Además, al menos en este estudio, a esta relación contribuyen principalmente las variables ironía y situación retórica.

8
paper corpusSignosTxtLongLines221 - : Esto muestra que la hermenéutica no ofrece respuestas a todos los aspectos del significado, pues para identificar las unidades de significado monosémicas que encontramos en textos, aplicamos la perspectiva sincrónica. Solo la lingüística de corpus ha desarrollado una metodología para hacer esto. Sin esta metodología (con parámetros de significatividad estadística y relevancia semántica) no es posible determinar si una frase es una unidad de significado o no . El significado en la perspectiva sincrónica puede ser entendido como diferencia, siguiendo los pasos de Ferdinand de Saussure (1983). En cambio, desde el punto de vista hermenéutico, la unidad de significado es algo distinto, es el objeto hacia el cual dirigimos nuestra investigación hermenéutica, es lo que está siendo interpretado como una unidad y no lo que la distingue de otras unidades de significado. En otras palabras, el significado en la perspectiva hermenéutica no es la diferencia que distingue un signo de otro, sino que, como

9
paper corpusSignosTxtLongLines243 - : b) Frecuencia absoluta de instanciación de las configuraciones lexicogramaticales (variable cuantitativa): medida de estadística descriptiva cuyo valor es un número que representa la cantidad de veces que una configuración es instanciada en el marco de un registro en particular . El etiquetador de corpus que emplearemos entrega directamente los resultados de las búsquedas por frecuencia.

10
paper corpusSignosTxtLongLines244 - : Aplicada la prueba estadística para corroborar nuestra tercera hipótesis, el coeficiente de correlación corresponde a 0,14 . Esto equivale a una relación positiva muy débil entre las dos variables, por lo que nuestra hipótesis ha sido corroborada solo parcialmente.

11
paper corpusSignosTxtLongLines338 - : En este trabajo hemos revisado críticamente las aplicaciones de la Ley de Zipf, y hemos propuesto dos índices en estadística léxica para la descripción de artículos de investigación en español: el índice de palabras de contenido y la distribución porcentual de los Legomena . Del trabajo realizado, se pueden extraer las siguientes conclusiones.

12
paper corpusSignosTxtLongLines390 - : La Tabla 3 muestra los principales hallazgos de la comparación estadística realizada para cada una de las funciones de los TA verbales. Los resultados indican que se han obtenido diferencias estadísticamente significativas entre los grupos A y B en 3 tipos de funciones: 1 .° los TA de acuerdo (t= 0.005, p <0.01); 2.° los TA de seguimiento (t= 0.003, p <0.01); y 3.° los TA de conclusión (t= 0.006, p <0.01).

13
paper corpusSignosTxtLongLines390 - : En el Grupo A, solamente 41 TA, el 20%, se realizaron de modo voluntario por el oyente. 109 TA (el 53%) fueron requeridos, 23 TA (el 11%) resultaron exigidos pragmáticamente y 33 TA (el 16%) se emitieron obligados por la interacción. Nuestros resultados en el Grupo B muestran que 271 TA (el 65%) fueron, de algún modo, requeridos por la IO, mientras que, en 149 ocasiones (el 35%) el oyente emitió sus TA de manera voluntaria. Cuando desglosamos los TA requeridos, hallamos que la mayoría fueron requeridos pragmáticamente, en concreto, 200 casos (el 47,7%). Por otro lado, fueron exigidos pragmáticamente en 39 casos (el 9%) y obligados por la interacción en 32 casos (el 7,7%). A continuación, en la Tabla 5 ofrecemos los datos más significativos relativos a la comparación estadística llevada a cabo:

14
paper corpusSignosTxtLongLines390 - : Estos datos muestran que hemos obtenido diferencias estadísticamente significativas en la producción de los dos tipos de apoyos más frecuentes de las dos series, esto es, en los apoyos voluntarios (t= 0 .000, p< 0.01) y los apoyos requeridos pragmáticamente (t= 0.001, p< 0.01). El menor número registrado en las dos series para los otros dos tipos impide obtener una significación estadística.

15
paper corpusSignosTxtLongLines402 - : Las frecuencias, los promedios, desviaciones típicas y medianas han sido calculadas con la ayuda del programa de análisis estadístico de IBM SPSS versión 21.0. (2012). Mediante la aplicación de la prueba estadística de Kolmogorov-Smirnov hemos podido establecer que la variable dependiente, es decir, la cantidad de palabras inglesas, no estaba normalmente distribuida a través de la muestra analizada . Por esta razón y para determinar si hay diferencias estadísticas significantes, hemos utilizado pruebas estadísticas no paramétricas. Así y para determinar la significancia de la diferencias entre dos grupos independientes utilizamos la prueba estadística de la U de Mann-Whitney, y para el análisis de tres o más grupos la prueba estadística de Kruskal-Wallis. Por último y para comprobar si existen relaciones entre las variables investigadas, hemos usado el coeficiente de correlación de Spearman (r[S]).

16
paper corpusSignosTxtLongLines405 - : Los corpus CORDE y CREA recopilan en conjunto más de 200 millones de palabras desde el origen del español hasta la época actual. Por un lado, el CREA es un ‘corpus monitor’ que abarca los últimos 25 años más próximos a nuestro tiempo, en tanto el CORDE recopila documentos desde los orígenes del español hasta los límites temporales del CREA, año 1975. Ambos corpus constituyen ‘muestras primordiales’ (Kupietz, Belica, Keibe & Witt, 2010) del español en sus distintas etapas históricas, esto debido a que no se ajustan a la población estadística de la lengua que se supone representan .

17
paper corpusSignosTxtLongLines425 - : Para analizar las asociaciones entre los 54 textos y las categorías al interior de cada dimensión, se utilizaron técnicas de la estadística descriptiva multivariada, a saber: para el nivel textual, se aplicó Análisis de Correspondencias Múltiples (Benzécri, 1976 ; Lebart, Morineau & Piron, 1995), y para los niveles lexicogramatical y morfo-ortográfico, Análisis Factorial Múltiple Intratabla (Bécue-Bertaut & Pagès, 2000).

18
paper corpusSignosTxtLongLines443 - : [39][3] En estadística el concepto decil se refiere a cada uno de los 9 valores que dividen un grupo de datos clasificados con una relación de orden en diez partes iguales .

19
paper corpusSignosTxtLongLines448 - : trabajo seguimos las sugerencias e indicaciones de Moreno Fernández (1990), López Morales (1994) y Hernández Campoy y Almeida (2005). El análisis estadístico atendió a dos niveles de observación: a) en términos descriptivos, según las frecuencias absolutas y los porcentajes de frecuencia de cada rectificador y b) en términos interpretativos o inferenciales, con base en la comparación entre las medias o tendencias centrales de los marcadores más frecuentes, esto es, de aquellos con más de 25 ocurrencias. El paquete estadístico al que hemos recurrido para la estadística inferencial es el SPSS (Statistical Package for the Social Sciences ), versión 15.0 para Windows, específicamente, la prueba Análisis de varianza ANOVA. En atención a que la distribución de los datos, en algunos casos, pudiera ser anormal, se complementará dicho análisis con su análogo de tipo no paramétrico, esto es, Anova de Kruskal Wallis. En ambos casos, el grado de significación se definirá en el 5%, según el cua

20
paper corpusSignosTxtLongLines448 - : En esta sección, se exponen los resultados de nuestro estudio con respecto a la relación de la frecuencia de empleo de los marcadores de reformulación explicativa con las tres variables extralingüísticas consideradas en el análisis: sexo, edad y grupo socioeconómico de los sujetos de la muestra. Como ya indicamos, las pruebas de estadística inferencial se aplicarán a los marcadores con 25 o más ocurrencias, esto es, ‘o sea’, ‘onda’ y ‘digamos’ con función explicativa .

21
paper corpusSignosTxtLongLines463 - : ^10Informamos este caso ya que, si bien no llega a obtener significatividad estadística p<,05, está en el margen del valor y, dada la amplitud del desvío estándar para los ítems coordinados, creemos que, de todos modos, vale la pena tener en cuenta este dato: nominalmente la diferencia en los tiempos de lectura resulta considerable .

22
paper corpusSignosTxtLongLines516 - : Se utilizó la prueba ANOVA para determinar diferencias estadísticamente significativas entre las variables de la muestra: por tipo de establecimientos (según estratificación administrativa aplicada en Chile ) particulares, particulares-subvencionados y municipales, género y nivel en estudio. El universo esperado de elementos lingüísticos correspondió al total de la muestra (no esperándose un máximo determinado), es decir, por estructuras conectivas, la cual era analizada en función de sus medias, a la que se le estimaba el nivel de significancia. Los datos fueron analizados por la prueba ANOVA con el software SPSS, versión 21. Los resultados válidos son los que aparecen estadísticamente significativos; tras pasar por la prueba estadística, se analizaron y discutieron.

23
paper corpusSignosTxtLongLines518 - : En este trabajo se analizan algunas dimensiones de la fluidez verbal en una muestra de 50 entrevistas clínicas realizadas con personas diagnosticadas con Esquizofrenia crónica y primer episodio, desde la perspectiva de la lingüística clínica aplicada a la psiquiatría. Nos proponemos determinar si existen diferencias en las dimensiones de fluidez verbal estudiadas entre ambos grupos de pacientes. De esta forma, para evaluar si constituye un marcador de déficit lingüístico primario, pretendemos verificar la relación entre la fluidez verbal y la etapa de evolución la enfermedad. El análisis de los datos, en primer lugar, demuestra que es posible observar el deterioro temprano de la fluidez verbal en personas con primer episodio de Esquizofrenia. En el segundo caso, la etapa clínica variable de la enfermedad presenta una mayor significación estadística, por lo tanto, es posible considerar que el deterioro de la fluidez verbal es un marcador primario del déficit pragmalingüístico para la

24
paper corpusSignosTxtLongLines543 - : Contrariamente, el perfil de relaciones características de la conversación en pacientes cognitivamente sanos fue más preciso. Podemos decir que las relaciones retóricas más formuladas por esta población son: Concesión, Causa involuntaria, Solución, Resultado involuntario, Interpretación, Lista y Circunstancia (95% de significación estadística). Con un nivel de significación más laxo, podrían incluirse las relaciones de Resumen, Fondo, Resultado voluntario, Elaboración y Evidencia (90% de significación estadística). Particularmente, dos relaciones fueron estadísticamente significativas independientemente del número de relaciones de nuestra muestra: Solución y Causa involuntaria .

25
paper corpusSignosTxtLongLines553 - : ^2Según los datos del Instituto Nacional de Estadística para 2017 (accesibles en https://bit .ly/2PZUm2U), aunque se observa una disminución en el número de inmigrantes desde 2008, pero a partir de 2013 las cifras vuelven a crecer, produciéndose un notable aumento en 2017 (174 231 personas).

Evaluando al candidato estadística:


4) variables: 10 (*)
5) palabras: 10 (*)
6) análisis: 9
9) significación: 8
12) hemos: 7
13) inferencia: 6 (*)
14) determinar: 6
15) corpus: 6 (*)
16) verbal: 6 (*)
18) significado: 6 (*)
20) fluidez: 5 (*)

estadística
Lengua: spa
Frec: 192
Docs: 86
Nombre propio: 1 / 192 = 0%
Coocurrencias con glosario: 7
Puntaje: 7.852 = (7 + (1+6.32192809488736) / (1+7.59245703726808)));
Candidato aceptado

Referencias bibliográficas encontradas sobre cada término

(Que existan referencias dedicadas a un término es también indicio de terminologicidad.)
estadística
: Coolican, H. (1994). Métodos de Investigación y Estadística en Psicología. México: Manual Moderno.
: Esta ley empírica, formulada usando estadística matemática, se refiere al hecho de que muchos tipos de datos estudiados tanto en textos, como en física y ciencias sociales pueden ser descritos por una distribución de Zipf (Gelbukh & Sidorov, 2001).
: Izquierdo, J. (1998). El declive de los grandes números: Mandelbrot y la estadística social. Empiria. Revista de Metodología de Ciencias Sociales, 1, 51-84.
: La integración de la lingüística con la estadística, entonces, requiere de tres procesos ([53]García, [54]2004a):
: Moore, D. S. (1998). Estadística aplicada básica. Barcelona: Antoni Bosch.
: Muller, Ch. (1973). Estadística lingüística. Madrid: Gredos.
: Pagano, R. (2011). Estadística para las ciencias del comportamiento. México: Cengage Learning.
: Rojo, G. (2017). Sobre la configuración estadística de los corpus textuales. Lingüística, 33, 121-138.
: Sabaj, O. (2004). Especificidad, especialización y variabilidad verbal: Una aproximación computacional en estadística léxica. Revista Signos, 37(56), 75-89.
: Suárez, M. (2001). Interaprendizaje de Estadística Básica. Ecuador: Editoral Fausto Ibarra.