temout/ling

/LING

Update: February 24, 2023 The new version of Termout.org is now online, so this web site is now obsolete and will soon be dismantled.

Lista de candidatos sometidos a examen:
1) concordancias (*)
(*) Términos presentes en el nuestro glosario de lingüística

1
paper CH_corpusRLAtxt32 - : Dentro de esta panorámica, aunque comparativamente de modo tardío, los estudiosos del español se han venido incorporando al campo de la LC en los términos actuales y han empleado las técnicas de recolección y construcción en cuestión. Un ejemplo interesante de acceso en línea y de modo gratuito lo constituye el trabajo que, en esta perspectiva, la Real Academia Española de la Lengua ha venido desarrollando. Ello se ha materializado en un sitio web con una interfaz de consulta de concordancias con dos corpus disponibles en línea: el Corpus de Referencia del Español Actual (CREA ), que alcanza cerca de 140 millones de formas y el Corpus Diacrónico del Español (CORDE), que consta de 180 millones de formas. También cabe destacar que la RAE a través de su Departamento de Lingüística Computacional se encuentra implementando herramientas de análisis lingüístico que se espera estén disponibles en línea en un futuro próximo.

2
paper CH_corpusRLAtxt233 - : Las [84]Figuras 2 y 3 muestran otro ejemplo de la utilidad de las concordancias para el análisis contrastivo de la comunicación especializada en su doble vertiente: el uso en contexto del patrón verbo SER + como en el subcorpus médico divulgativo (58 ocurrencias ) y en el subcorpus médico especializado (8 ocurrencias). Para realizar la búsqueda se han empleado las denominadas CQL (Corpus Query Language), un lenguaje de búsqueda de corpus basado en algunos códigos especiales de interrogación. La plataforma Sketch Engine permite utilizar este lenguaje para buscar patrones léxicos o gramaticales complejos o para usar criterios de búsqueda difícilmente utilizables con la interfaz estándar del programa de concordancia^[85]^10. Así pues, buscando el verbo ser ([tag="VS.*"]) seguido por la palabra como ([word="como"]) se pueden obtener concordancias interesantes.

3
paper CH_corpusRLAtxt184 - : ^10El CREA (Corpus de Referencia del Español Actual, de la Real Academia Española, con sultado el 6 de julio de 2016) arroja concordancias con a y de, indistintamente: "Carlos Arce que es asiduo a esta sección y vive en Porto Alegre ..."; "... esta vez no pone el apellido pero es cliente asiduo de la sección..."

4
paper CH_corpusRLAtxt158 - : Para extraer la base empírica objeto de estudio, es decir, los eventos de manera de desplazamiento en alemán y sus traducciones al español, se extrajeron las concordancias^[72]36 de los 86 verbos alemanes de manera de desplazamiento (por ejemplo: [lem = " .*klettern"]^[73]37) alineadas con sus respectivas traducciones y se guardó cada una de las búsquedas en un documento de texto para una posterior exploración. Finalmente, se analizaron las concordancias y se establecieron conclusiones en cuanto a las técnicas de traducción de la manera de desplazamiento del alemán al español observadas en el corpus paralelo (Molés-Cases, 2015).

5
paper CH_corpusRLAtxt208 - : El AntConc, como programa de concordancias, es una plataforma de usos múltiples para desarrollar investigación en lingüística de corpus y realizar actividades para el aprendizaje de una lengua a partir de los datos . Posee las siguientes siete herramientas:

6
paper CH_corpusRLAtxt208 - : - Concordancias (Concordance Tool): Muestra resultados de búsqueda en el formato "palabras claves en contexto" o KWIC por sus siglas en inglés . Le permite al investigador ver las palabras y frases comúnmente usadas en el corpus.

7
paper CH_corpusRLAtxt208 - : - Concordancias en barra (Concordance Plot): Muestra los resultados de búsqueda trazados como "códigos de barra", permitiendo identificar la posición o lugar donde se ubican los resultados en el texto .

8
paper CH_corpusRLAtxt208 - : Programa de Concordancias: AntConc

9
paper CH_corpusSignostxt549 - : 2) Con Sketch Engine, se generaron word sketches para los lemas ‘signo’, ‘síntoma’, ‘indicio’, ‘señal’, ‘dolor’, ‘disfunción’, ‘fiebre’, ‘picor’, ‘disnea’ y ‘tos’. De estos word sketches se seleccionaron los patrones subject_of para verbos cuyo sujeto era uno de estos lemas, y object_of para los que llevan dichos lemas como complemento directo. Se consultaron las concordancias asociadas y se constató que, en muchos casos, cuando el verbo aparece después de un sintagma nominal, el sujeto tiene el macrorrol semántico de Agente, aunque en español también resulta habitual encontrar sujetos pospuestos al verbo o incluso complementos directos antepuestos al verbo en subordinadas de relativo: ‘…los síntomas que el médico advierte en su relación con el enfermo’ . En el patrón verbs with ‘síntoma’ as subject, algunos verbos como ‘soler’ o ‘poder’ proporcionaron resultados adicionales.

10
paper CH_corpusSignostxt506 - : Como muestra el artículo, una primera norma está asociada al significado de ‘fabricar y poner en circulación una moneda’. El patrón se especifica mediante los tipos GOBERNANTE/ESTADO y MONEDA. Una segunda norma se asocia al sentido de ‘crear una palabra’ e incorpora los tipos semánticos HUMANO y PALABRA/EXPRESIÓN. Las siguientes concordancias ilustran ambas normas:

11
paper CH_corpusSignostxt522 - : La extracción de muestras aleatorias de concordancias por cada verbo fue abordada ya en el apartado dedicado al análisis manual. La extracción aleatoria de concordancias a partir de corpus de tamaño tan grande como los utilizados requiere de un proceso de indización, que en nuestro caso se realizó utilizando el software Jaguar (http://www .tecling.com/jaguar). El indexador de este programa permite extraer concordancias de cualquier verbo del esTenTen de forma instantánea, lo que sería imposible con los extractores de concordancias habituales, que no son capaces de procesar tanta información.

12
paper CH_corpusSignostxt522 - : A partir de las concordancias de un verbo i, el algoritmo aplica Syntaxnet, cuyo demostrador en línea se ha instalado también en nuestro repositorio para facilitar la descripción de cada paso del análisis ([93]http://www .tecling.com/syntaxnet). A modo ilustrativo, la [94]Tabla 3 muestra el resultado del análisis sintáctico de dependencias expresado por Syntaxnet para una de las concordancias que habíamos utilizado como ejemplo en la [95]Tabla 2; el análisis se expresa en el formato CONLL (^[96]Buchholz & Marsi, 2006). La [97]Figura 3 muestra el resultado del mismo análisis por el parser DepPattern (^[98]Gamallo & González, 2012) a modo de grafo dirigido.

13
paper CH_corpusSignostxt522 - : El último paso del análisis consiste por tanto en el ordenamiento por frecuencia decreciente de los patrones creados, que se presentan asociados a una muestra aleatoria de 10 de sus contextos de aparición. Los contextos presentan los argumentos coloreados en coincidencia con los colores elegidos en la representación del patrón, tal como se muestra en la [107]Figura 5. Las concordancias que aparecen en la figura corresponden al patrón 1 de ‘asustar’: ‘[[Humano]] asustar a [[Humano]]’ .

14
paper CH_corpusSignostxt522 - : Para el análisis de los patrones se utilizó el análisis manual de los verbos como ‘gold standard’, estableciendo una serie de reglas de conversión ya que existen diferencias estructurales entre ambos resultados. Hay casos en que el patrón humano y el automático son idénticos, como en el caso del patrón 4 de ‘llenar’: ‘[[Humano]] llenar [[Documento]]’. No obstante, existen otros casos en que el análisis automático todavía no alcanza el grado de generalización y concreción del análisis manual, como en el siguiente caso: ‘[[Human | Eventuality]] llenar [[Building | Location]] {de | con [[Physical Object]]}��; por ejemplo, porque el analizador de dependencias no siempre detecta el complemento de régimen (que está ausente en muchas de las concordancias analizadas porque es un argumento opcional la mayoría de veces ), o porque no advierte las alternancias semánticas. Por ese motivo, se aceptan como válidos todos los patrones en los que el análisis sintáctico-semántico se ha real

15
paper CH_corpusSignostxt338 - : Donde Tk corresponde al número total de tokens del corpus, y PV a la frecuencia total de las palabras vacías en el mismo corpus. Para su conteo, se utilizó el software de concordancias Antcon (Anthony, 2010) y se consideraron como palabras vacías las siguientes categorías gramaticales: los artículos definidos e indefinidos, las preposiciones, las conjunciones, las disyunciones y los nexos (el listado de las formas consideradas como palabras vacías en esta investigación se presenta en el Anexo ).

16
paper CH_corpusSignostxt380 - : Si se analizan las concordancias del pronombre ‘nosotros’ en nominativo, se detecta que en los comentarios de los no emigrantes existe una tendencia hacia un mayor uso de verbos transitivos: 49% frente al 36% de los comentarios de los emigrantes . De por sí, los verbos transitivos poseen mayor capacidad resolutiva, definiendo acciones sobre objetos/sujetos concretos. Pero además, entre los usados por los no emigrantes predominan verbos de procesos materiales mientras que los emigrantes aluden más a procesos relacionales y mentales (Halliday, 1994). Así las cosas, si los primeros ‘eligen’, ‘aprenden’, ‘respetan’, ‘cambian’, ‘aplastan’, ‘pierden’, ‘ganan’, ‘compran’ y ‘venden’, los segundos ‘se enteran de’, ‘ven’, ‘disputan’, y ‘escuchan’.

17
paper CH_corpusSignostxt165 - : Cook detecta que los científicos establecen tres categorías entre los participantes en el debate (cada grupo es además altamente estereotipado): los científicos, el público y los oponentes (incluida la prensa como un bloque). El exclusivo grupo de los científicos está compuesto solo por aquellos que pertenecen a la comunidad científica y, en esta calidad, solo pueden estar favor de los OGM. El público es considerado de modo homogéneo, como pasivo, emocional y fácilmente influenciable por los grupos opositores (ONG, prensa, políticos). El análisis de concordancias muestra que el rol sintáctico predominante del público es el de objeto . Cuando cumple función de sujeto, lo hace solamente junto a verbos de emoción.

18
paper CH_corpusSignostxt597 - : En CHET, se ha buscado de manera computarizada concordancias que contengan los siguientes verbos modales centrales: can, could, may, might, shall, should, will, would y must . Una vez obtenidos los ejemplos, se ha procedido a un análisis manual de evaluación del contexto para determinar el significado exacto de cada modal, para poder así aislar aquellos que pueden ser categorizados como modales dinámicos. Con ello, se pretende determinar el uso específico de estos verbos en la prosa científico-técnica de la época y mostrar los usos de este tipo de modalidad en este registro científico.

19
paper CH_corpusSignostxt186 - : Del mismo modo, el auxiliar haber que presenta unas concordancias caracterizadoras del género didáctico: hay que distinguir, hay que tener en cuenta, hay que destacar, hay que citar, con verbos que apuntan al discernir del acto de enseñar y aprender . En cambio, no se emplean las construcciones con este verbo auxiliar en los otros dos géneros, el género divulgativo y el género directivo (solo se registra un caso en un documento divulgativo y ninguno en el documento directivo).

20
paper CL_LiteraturayLingüísticatxt320 - : Como se puede observar en la [33]tabla 2, la mayor parte de los errores cometidos correspondió a errores de concordancia, pero hay que tener en cuenta que este tipo de error se debe a concordancias diferentes, tanto a nivel del sintagma (ejemplo: determinante-artículo o nombre-adjetivo) como al de oración, como es el caso de la concordancia entre el sujeto y el verbo . Además se aprecia un alto porcentaje de errores en la selección del tiempo verbal (16%). Si se observa el porcentaje total de errores en verbos, este asciende a 27,33%. También se muestran como relevantes los problemas en preposiciones

21
paper CL_LiteraturayLingüísticatxt211 - : se insertan las estrategias de aprendizaje; actitudes del profesor y estudiantes, la diversidad cultural, entre otros. Además, asícomo lo señala Cook (1998), los despliegues de concordancias de un corpus en términos de frecuencias léxicas o rango muestran habla producida, pero ignora otro aspecto igualmente importante como es la percepción de habla y su interpretación, aspectos ahora atendidos por la pragmática . Dichos despliegues de concordancias, muy útiles por cierto, no dan cuenta de otros aspectos tan verdaderos del uso de la lengua como son la eventual infrecuencia de un ítem en particular, pero su potencial utilidad o pertinencia pedagógica; o la frecuencia de un ítem y su estrechez de rangos contextúa les. Por ejemplo, expresiones como go Dutch, q ue a pa rece sólo dos veces en BNC; andlam a Dutchman, queaparece sólo una vez; o Dutch courage, Dutch cap que no aparecen ni una vez, constituyen un grupo de expresiones que por su naturaleza semántica, además de la relación con el

22
paper CO_FormayFuncióntxt79 - : En cuanto a la lengua wayuunaiki, Mänsen y Captain (2000, p. 797) indican que los sustantivos reciben marca de género con el artículo definido singular: -kai (masculino) singular y -kat (no masculino singular). Con el artículo definido -kana no se hace distinción de género; Mänsen y Captain (2000) señalan que "estos rasgos de género y número concuerdan con el sustantivo y los demás elementos relacionados con él" (p. 798). De igual modo, en el sistema de pronombres el wayuunaiki distingue el género únicamente en la tercera persona singular: nia 'el' ∫ia 'ella'. Los demás pronombres no distinguen el género pero pueden recibir artículo definido singular (masculino o no masculino) para aclararlo o enfatizarlo (p. 798). El sistema establece concordancias con los adjetivos demostrativos, que distinguen grados de cercanía y diferencian formas para el masculino singular: t∫i, t∫ira, t∫isa ('cercanos' ) y t∫ia ('remoto'); formas para el no masculino singular: ti, tira, tisa ('cercanos') y t

23
paper CO_FormayFuncióntxt185 - : El objetivo fundamental que se perseguía con la búsqueda de concordancias en la Biblia era poder asegurar que hubiera consistencia léxica y semántica en las formas traducidas, es decir, que un mismo término del original hebreo, griego o latino se tradujera en todos los casos de la misma manera . Hoy día este ejercicio de consistencia léxica en la traducción se sigue llevando a cabo y, gracias al advenimiento del computador, esta verificación de concordancias se realiza de manera casi inmediata.

24
paper CO_FormayFuncióntxt255 - : Obtuvimos 303 concordancias de la palabra amor, distribuidas de la siguiente manera en los 14 textos:

25
paper CO_Lenguajetxt190 - : Se desea encontrar las variables que influyen en la chance de que un caso de concordancia tenga el tipo de error (𝑌=𝑐), para 𝑐= 1,2,3,4. Recuérdese que los tipos de error se definieron como: error de género (𝑐= 1); error de -e- epentética (𝑐= 2); error de plural (𝑐= 3); error mixto (𝑐= 4). Se espera que exista más chance de error con tipos de errores con concordancias que contengan: (i ) artículos indefinidos, determinantes y adjetivos; (ii) concordancias a larga distancia (la chance de error crece con: distancia larga / sin subordinada > distancia entre enunciados / con subordinada); (iii) -e- epentética; (iv) concordancias de más de dos términos; (v) controlador animado; (vi) TYPE infrecuente; (vii) similitud baja (alta distancia) entre las raíces léxicas del español y el italiano; (viii) similitud media (media distancia) entre las terminaciones del español y el italiano; (ix) cantidad media / alta de errores acumulados; (x) controlador infrecuente y/o no familiar; (xi) cont

26
paper CO_Íkalatxt83 - : En la [37]figura 3 se muestran los porcentajes correspondientes a los resultados de discordancias y concordancias según el uso catafórico y anafórico del pronombre átono con respecto al CI. El uso catafórico es mayor que el anafórico, pero nótese que el porcentaje de las discordancias en relación con el uso catafórico es bastante alto (96,10%), mientras que las concordancias solo alcanzan el 3,89%, hecho que podría explicarse porque este es el uso predominante en español .

27
paper CO_Íkalatxt175 - : De las 38 concordancias restantes, las que no se refieren al significado prototípico, la mayoría (89,4%) hace alusión a la falta de inteligencia,[38]^8 como se ejemplifica en (10):

28
paper PE_Lexistxt95 - : No obstante, hay algunos detalles que merece la pena destacar. Están en relación con lo comentado acerca de los criterios de edición. En primer lugar, como efectivamente se ha adelantado, se anotan voces demasiado comunes, al menos para un investigador o lector habitual de teatro del Siglo de Oro. Algunos ejemplos son ninfa (v. 145), dar el orden (v. 421), acero (v. 585) o grueso (v. 1884). Además de esto, hay un exceso de concordancias, es decir, ejemplos de la palabra anotada en otras piezas de Calderón . Es cierto que en ocasiones sí son muy útiles pues ejemplifican el uso específico de una palabra, un sentido o una circunstancia concreta en la obra de este autor, como sucede en el verso 13, en que se explica que en sus obras la idolatría y el paganismo suelen tener su centro en lugares elevados; no obstante, en la mayoría de los casos, estos ejemplos no aportan gran cosa ya que solo ilustran usos comunes de la voz en el Seiscientos.

29
paper UY_ALFALtxt50 - : Se observa en líneas generales la tendencia predecible: mayor frecuencia de proclisis cuanto mayor es la continuidad del referente a lo largo del fragmento. Aun así, hay un dato discordante: los referentes con concordancia en las dos cláusulas inmediatamente anteriores tienen un porcentaje de proclisis bastante inferior a los que solo concuerdan en la cláusula anterior, con lo que no resulta una escala perfecta. Ello se debe, muy probablemente, a la relativa escasez de ítems en las diversas casillas. Si, en lugar de proponer cuatro grados distintos en esta variable textual, se hubieran distinguido simplemente los casos sin concordancias previas y los demás, resultaría patente la diferencia entre unos y otros: aquellos obtienen poco más de un 50% de proclisis, mientras que los referentes con concordancia en tres o más cláusulas anteriores optan sin excepción por esta variante . Dos de estos últimos casos se muestran en los ejemplos (21) y (22).

30
paper UY_ALFALtxt24 - : Una vez que el corpus está listo para ser explotado y que los aspectos previos del trabajo han quedado bien definidos y establecidos, el siguiente paso consistirá en elegir un programa de explotación de corpus textuales (o programa o software de concordancias) para poder efectuar, en primera instancia, una extracción terminológica preliminar . Son muchos los programas de este tipo disponibles en el mercado, tanto en forma de software libre como de programas comerciales pero destacaremos aquí la posibilidad de usar MonoConc, AntConc o WordSmith Tools (WST) en cualquiera de sus versiones si bien, obviamente, cuanto más actualizadas, más perfeccionadas. MonoConc y AntConc son especialmente atractivos por poseer una interfaz de usuario fácil y cómoda (user-friendly), y por ser capaces de realizar con total eficacia las tareas consideradas fundamentales en cualquier software de concordancias (generar listas de frecuencia, analizar concordancias, co-ocurrencias, etc.) Sin embargo, ni MonoConc ni

31
paper VE_Letrastxt36 - : Las concordancias son listas exhaustivas y pormenorizadas de todas las palabras de una obra, o, con menor frecuencia, de un autor, con indicación expresa del lugar en que aparecen o, en la versión más corriente, relación detallada de esas palabras insertadas en el contexto en el que figuran (Campos y Pérez, 2003: 56 ).

32
paper VE_Núcleotxt32 - : Para identificar y clasificar las CNI y de las CI mediante concordancias fue necesario complementar la búsqueda automatizada con una revisión manual en los textos puesto que los programas difícilmente recuperan casos como el uso de referencias -autor, este/esta, investigador, pedagogo, educador, él/ella (ejemplo 15)- o la presencia del autor citado en la desinencia verbal (ejemplo 16):

Evaluando al candidato concordancias:

1) análisis: 15
2) corpus: 13 (*)
3) verbos: 12 (*)
5) verbo: 9 (*)
7) error: 9 (*)
11) búsqueda: 7
12) singular: 7 (*)
13) palabras: 7 (*)
14) patrón: 7 (*)
16) masculino: 6
18) errores: 6

concordancias
Lengua: spa
Frec: 202
Docs: 79
Nombre propio: 3 / 202 = 1%
Coocurrencias con glosario: 7
Puntaje: 7.880 = (7 + (1+6.62935662007961) / (1+7.66533591718518)));
Candidato aceptado

Referencias bibliográficas encontradas sobre cada término

(Que existan referencias dedicadas a un término es también indicio de terminologicidad.)

concordancias

: Cobo, Bernabé. [1653] 1956 Historia del Nuevo Mundo. Notas y concordancias por Luis A. Pardo y Carlos A. Galimberti. Cuzco: Publicaciones Pardo-Galimberti, tomo IV.
: Figura 5 Análisis de concordancias en la obra de Wagner, utilizando AntConc ^[84](Anthony, 2014)
: Manus, P., & Manus, R. (comps.) (1979). Textos y concordancias de palabras en urarina. Instituto Lingüístico de Verano.

/LING

1) Candidate: concordancias

Evaluando al candidato concordancias:

Referencias bibliográficas encontradas sobre cada término