Termout.org logo/LING


Update: February 24, 2023 The new version of Termout.org is now online, so this web site is now obsolete and will soon be dismantled.

Lista de candidatos sometidos a examen:
1) corde (*)
(*) Términos presentes en el nuestro glosario de lingüística

1) Candidate: corde


Is in goldstandard

1
paper corpusSignosTxtLongLines186 - : Dados los fines del presente estudio, el análisis gramatical del español en la comunicación entre expertos y no expertos, se ha considerado que el diseño del Corpus Diacrónico del Español (CORDE) de la RAE podía servirnos como una primera aproximación a los géneros especializados considerados. La distribución genérica de este corpus permite analizar los rasgos gramaticales seleccionados por conjuntos de textos agrupados en géneros. Para que los resultados colinden con el español más actual, se han seleccionado textos producidos en el lustro comprendido entre 1970-1975, excepto para el género directivo, en que se ha tenido que ampliar la franja temporal para poder tener acceso a un documento incluido en el género Ordenamientos y Códigos Legales del CORDE; otra restricción ha sido la de limitar los textos a los escritos del español peninsular. Por lo tanto, el subcorpus digital del CORDE estudiado reúne las características que se presentan en la siguiente Tabla 2:

2
paper corpusSignosTxtLongLines186 - : A continuación se presentan los documentos del CORDE obtenidos a partir de las especificaciones anteriores, que constituyen los textos de los que se han extraído los datos:

3
paper corpusSignosTxtLongLines186 - : Estos son los textos que proporciona el CORDE después de la aplicación de los criterios escogidos; en cada género el número de textos varía y, por ello, el número total de palabras de cada grupo es distinto. No obstante, se considera que el contraste entre el conjunto de documentos ofrecido por el Banco de Datos de la RAE puede ilustrar algunas tendencias de uso de la lengua en cada uno de los géneros especializados considerados. Las dos páginas capturadas del corpus CORDE consultado que se muestran a continuación ejemplifican la forma como han sido obtenidos los datos que analizamos en el apartado que sigue:

4
paper corpusSignosTxtLongLines405 - : 1.2. CORDE y CREA: Diseño y representatividad^[25]1

5
paper corpusSignosTxtLongLines405 - : El CORDE, por otra parte, es un conjunto muy grande de textos completos que perduraron hasta nuestros días a pesar de las vicisitudes del tiempo, conservación y disponibilidad . Este corpus recoge un 74% de documentos históricos del español peninsular y solo un 26% para el resto de las zonas dialectales propuestas. Esta distribución documental refleja la historia compartida entre España y sus colonias, así como por los problemas que representó en su momento la difusión del español, sin dejar de considerar factores como la producción de manuscritos y su preservación.

6
paper corpusSignosTxtLongLines405 - : Si centráramos nuestra atención exclusivamente en los datos que remiten al juego infantil veríamos que la frecuencia de la palabra ‘rayuela’, para estos últimos 200 años considerados en el CORDE, es regular, lo que nos permitiría concluir, desde una perspectiva cuantitativa, que ‘rayuela’ es una palabra de uso estable en la lengua, información que se corrobora cualitativamente en el Diccionario de la Real Academia Española (en sus diferentes ediciones ), al observar que el lema ‘rayuela’ nunca ha tenido alguna marca cronológica de obsolescencia o neologicidad^[28]4.

7
paper corpusSignosTxtLongLines405 - : No obstante esta generalidad, existe, desde el punto de vista cuantitativo, un momento histórico en el corpus en que la frecuencia de la palabra sale de una tendencia regular: el año 1963, en el que dicha unidad léxica aparece 36 veces o el 41% del total de ocurrencias registradas en el CORDE entre los años 1817 y 1971, 36 ocurrencias que remiten a un autor y a un mismo documento: Julio Cortázar y su conocidísima novela Rayuela . Este ejemplo ilustra por qué se desaconseja este método de cuantificación para este corpus y otros en general. El problema que subyace a un análisis como este es que la temática o el estilo de ciertos autores podrían condicionar la aparición de algunas formas lingüísticas o giros y la ausencia de otros. Por tanto, se corre el riesgo de que las conclusiones que se pudieran derivar de un análisis similar describan un comportamiento del fenómeno estudiado ajeno a la realidad de la lengua.

8
paper corpusSignosTxtLongLines405 - : Como se verá, calcular la frecuencia relativa de las palabras, para el caso del CORDE y el CREA, no es un método conveniente, ya que esta alternativa de normalización de frecuencias funciona parcialmente para la palabra ‘país’, pero no resuelve el caso de ‘rayuela’, en el que la temática y la extensión de la novela de Julio Cortázar siguen sesgando los resultados en el decenio representado . En el Gráfico 2 se representan ambas frecuencias relativas de aparición de ambas formas léxicas en el CORDE para el decenio analizado y se puede dar cuenta de esto.

9
paper corpusSignosTxtLongLines405 - : En este caso, se encuentran disponibles en línea^[31]7 cuatro listas de frecuencias de las unidades léxicas recogidas en el CREA, a saber: ‘1.000 formas más frecuentes’, ‘5.000 formas más frecuentes’, ‘10.000 formas más frecuentes’ y ‘Lista total de frecuencias’. La información que aportan estas listas indica que la preposición ‘de’ es la forma más frecuente del español en el CREA. Entonces, considerando que la palabra más frecuente del CREA es la preposición ‘de’ y asumiendo que también podría serlo para el CORDE, el siguiente paso sería plantear un método de comparación efectiva entre esta palabra y la unidad léxica estudiada (en este caso: ‘país’ ).

10
paper corpusSignosTxtLongLines405 - : 5 El presente trabajo se centra exclusivamente en los ejemplos recogidos en el CORDE y el CREA y se descartan otros corpus disponibles como el CDH, el CORPES XXI o el Corpus del Español de Mark Davies, primero, porque el CDH es un corpus con orientación lexicográfica que no sirve como referencia para otros niveles de la lengua, por ello se descarta ; el CORPES XXI, tal y como se define, es una versión provisional en la que no figuran todavía transcripciones de textos orales y en el que se registra solo una pequeña parte de los documentos que lo conformarán, mismos que día con día se va actualizando (RAE, 2013), razón por la cual se ha planteado retomar la normalización de frecuencias para este corpus en trabajos posteriores; y por último, se descarta el Corpus del Español de Mark Davies de este estudio, ya que este corpus cuenta con un método de normalización de frecuencias por millón.

11
paper corpusSignosTxtLongLines589 - : Además, por lo que respecta al caso del español, el fenómeno ha tenido continuidad en todas las épocas, pues ‘más mejor’ y ‘más peor’ se registran desde antiguo (^[42]García de Diego, 1970; ^[43]Romero Cambrón, 1998), tal y como muestran los siguientes ejemplos procedentes de textos lingüísticamente fiables, es decir, testimonios originales, sin problemas de grafía, datación ni reconstrucción editorial (^[44]Rodríguez Molina & Octavio de Toledo y Huerta, 2017, para el caso de los textos medievales) y albergados en el CORDE (RAE):

Evaluando al candidato corde:


1) corpus: 12 (*)
2) textos: 10 (*)
4) frecuencias: 6 (*)
6) crea: 5
7) método: 4
9) documentos: 4
10) rayuela: 4
12) normalización: 3 (*)
14) frecuencia: 3 (*)
16) análisis: 3
17) frecuentes: 3
18) tenido: 3

corde
Lengua: spa
Frec: 56
Docs: 10
Nombre propio: / 56 = 0%
Coocurrencias con glosario: 5
Puntaje: 6.014 = (5 + (1+5.93073733756289) / (1+5.83289001416474)));
Candidato aceptado

Referencias bibliográficas encontradas sobre cada término

(Que existan referencias dedicadas a un término es también indicio de terminologicidad.)
corde
: Molina Salinas, C. & Sierra Martínez, G. (2015). Hacia una normalización de la frecuencia de los corpus CREA y CORDE. Revista Signos. Estudios de Lingüística, 48(89), 307-331.
: Real Academia Española. Banco de datos CORDE. Corpus diacrónico del español. Madrid: RAE [en línea]. Disponible en: [107]www.rae.es
: Rodríguez Molina, J. & Octavio de Toledo y Huerta, Á. (2017). La imprescindible distinción entre texto y testimonio: El CORDE y los criterios de fiabilidad lingüística. Scriptum Digital, 6, 5-68.