Termout.org logo/LING


Update: February 24, 2023 The new version of Termout.org is now online, so this web site is now obsolete and will soon be dismantled.

Lista de candidatos sometidos a examen:
1) token (*)
(*) Términos presentes en el nuestro glosario de lingüística

1) Candidate: token


Is in goldstandard

1
paper CO_ColombianAppliedLinguisticsJournaltxt152 - : Most adapted Anglicisms appeared only once in the corpus: básquetbol(basketball), esmog (smog), broder(brother), flíper(flipper),andpenalty (penalty). However, a few adapted units had a higher token frequency: ránking (ranking, 16 ), pendrive (pen drive, 15), reggaetón (reggaeton, 5), biodiésel (biodiesel, 4), and esnórquel (snorkel, 4). It is interesting to note that the word pendriveis massively used in Chilean Spanish to refer to 'USB drive,' 'USB flash drive,' 'flash drive,' 'flash disk,' 'memory stick,' or 'data traveler,' which are usedin English, but the Anglicized forms'pen drive'or 'pendrive' do not appear in regular English dictionaries (Cambridge Dictionary, 2013; The Free Dictionary, 2013; Merrriam Webster's Dictionary, 2013; WordReference, 2013), although internet definitions can be found for this portable datastorage device.

2
paper CO_ColombianAppliedLinguisticsJournaltxt264 - : The compliment response strategies include accepting (consisting of four subcategories: appreciation token, agreeing utterance, compliment return, and acceptance formula), mitigating (consisting of two sub-strategies: deflecting or qualifying comment, reassurance or repetition request ), and rejecting (disagreeing utterance and no response). Each of the responses was coded into one of these categories, and the frequencies of responses within each main category were then obtained. The frequencies of these strategies are presented in [100]Table 2 and [101]Table 3.

3
paper CO_Lenguajetxt155 - : Otra de las características del corpus DICEELE es que posee un etiquetado morfosintáctico (PoS-tagging) efectuado con el etiquetador de FreeLing. Este consiste en la asignación de una etiqueta que contiene información acerca de la categoría gramatical, las flexiones, las conjugaciones, etc., de cada palabra del texto. Para ser más exactos, inicialmente, el PoS-tagging divide el texto en unidades de análisis llamadas tokens. En este sentido, algunos autores como ^[110]Baker, Hardie y McEnery (2006) definen los tokens como “una sola unidad lingüística, la mayoría de las veces una palabra, aunque dependiendo del sistema de codificación utilizado, una sola palabra se puede dividir en más de un token, por ejemplo, he’s (he + ‘s )” (p. 159)^[111]^13; además de las palabras, también se incluyen, en muchos sistemas, los signos de puntuación (^[112]Brezina, 2018). Otros autores consideran, por su parte, que dentro de la frecuencia de tokens también se incluyen secuencias de unidades multipalabr

4
paper UY_ALFALtxt80 - : Na pesquisa da construcionalização e da mudança construcional de nossos objetos de pesquisa, assumimos, como [94]Traugott (2012) a seguinte perspectiva de abordagem construcional, que capta quatro níveis distintos de esquematicidade, dos quais três constituem types, ou tipos de construção com diferentes níveis de abstração, e um concerne ao uso efetivo, como token, conforme a [95]Figura 2:

5
paper UY_ALFALtxt211 - : Nossa análise, a priori, seria de natureza qualitativa, por haver poucos dados. No entanto, deixar de lado o papel da frequência na gramática poderia não revelar tendências, generalizações, configurações gramaticais. Seguindo ^[135]Fox (2007), consideramos, também, que a gramática é modulada pela frequência, mas falar de frequência de fatores aplicados a poucos dados, poderia gerar leituras errôneas. Embora a coleta da forma do mais-que-perfeito tenha sido exaustiva (são 3.654 dados), exploramos aqui uma das funções apenas, que conta com uma amostra de 36 dados desse corpus. Optamos por considerar tais dados via análise de token/type, na acepção de ^[136]Bybee (2007): frequência de um item - token e frequência de uma categoria - type, por isso todos os fatores são contabilizados, para que se detectem contextos mais/menos propícios à resistência do mais-que-perfeito conjuntivo .

6
paper corpusRLAtxt37 - : Como se observa en la Figura 5, la herramienta dispone de hasta 10 secuencias de búsqueda, siendo posible organizar la secuencia hasta en 6 unidades (o tokens). Por secuencia se entiende aquí el rasgo lingüístico a ser buscado, por ejemplo: nominalización. En tanto que por token se entiende la unidad que permite conformar (por sí misma o junto a otros tokens ) el rasgo para la búsqueda en El Manchador. Ahora bien tales unidades pueden corresponder a distintos niveles de abstracción en la búsqueda (desde unidades más simples o superficiales a unidades más complejas o profundas de la lengua). Los niveles más importantes de búsqueda en El Manchador de Textos son:

7
paper corpusRLAtxt68 - : ^[64]12 La dicotomía type (tipo) y token (caso) distingue entre clases de cosas (types) e "instancias" o casos (tokens) de estas clases (Tanesini, 2007:164 ).Como se desprende de lo expuesto, no se discutirá el estatus perifrástico de la construcción. En este punto se asumen los criterios y las conclusiones de Olbertz (1998).

8
paper corpusRLAtxt208 - : ^8Según Baker, Hardie y McEnery (2006), la palabra token se define como: "Una unidad lingüística, a menudo una palabra ..." (p. 161). Original en inglés: A single linguistic unit, most often a word.

9
paper corpusRLAtxt4 - : 5.1. Token frequency: For the purposes of this study, all word-medial <-bC-> and <-pC->combinations were calculated . In these corpora, the labial consonant clusters included the following series of graphemes -bb- (hobby 'hobby'), -bc- (subcomisión 'sub-commission'), -bd- (abdomen 'abdomen'), -bg- (subgénero 'sub-genre'), -bm- (submarino 'submarine'), -bn- (abnegación 'abnegation'), -bs- (absolutamente 'absolutely'), -bt- (obtener 'to obtain'), -bv- (obviamente 'obviously'), -pc- (excepción 'exception'), -pt- (óptico 'optic'), and -ps- (lapsus 'lapse, mistake'). The total number of tokens for [..C[LABIAL]$C..] were tabulated individually, as well as added together to provide the total number of syllables in the text with labial stops in word-medial coda position.

10
paper corpusRLAtxt4 - : 6.1. Token frequency results: The token frequency of the /-LABIALC-/ word-medially in Spanish is extraordinarily low . In the analysis of approximately 6,800,000 words spoken in Spanish, the /-pC-/ and /-bC-/ occurs just 13,230 times.

11
paper corpusRLAtxt46 - : Como se ha dicho, el tipo de neologismo con la mayor token frequency (Vallès, 2002: 144 ) o frecuencia de uso fue el préstamo, con y sin adaptación, con cerca de un 30% de las apariciones; la gran mayoría de ellos correspondió a la categoría nombre, representada por sobre el 70%. Esto posiblemente se deba a que en la variedad del español de Chile se incorporan con relativa facilidad los préstamos del inglés, en parte porque los hablantes sienten que añaden una marca de prestigio social al habla cuando emplean anglicismos y en parte también porque determinadas invenciones y creaciones nuevas carecen aún de denominación en español.

12
paper corpusRLAtxt209 - : Para ello, todos los documentos de ODE pasan por cuatro fases consecutivas de codificación: tokenización, normalización, lematización y etiquetado (^[78]Vaamonde, 2015). En la primera fase se genera automáticamente un elemento tok para cada forma ortográfica (token) del corpus. Obsérvese que la forma original del manuscrito (agrauio, escreuiendo, etc.) es el contenido del elemento . Ese contenido se irá relacionando con los valores de distintos atributos que se añaden en el interior de la etiqueta de apertura (). El primer atributo (id) asigna un número a cada token, que permite identificarlo como único dentro del corpus:

13
paper corpusRLAtxt209 - : Todos estos procesos se realizan automáticamente, pero pueden revisarse de forma manual en la plantilla que TEITOK proporciona para cada token:

14
paper corpusSignostxt276 - : Total type frequency: 23 Total token frequency: 66

15
paper corpusSignostxt276 - : Total type frequency: 23 Total token frequency: 41

16
paper corpusSignostxt276 - : Total type frequency: 3 Total token frequency: 3

17
paper corpusSignostxt276 - : Total type frequency: 10 Total token frequency: 37

18
paper corpusSignostxt566 - : Como se puede observar, la secuencia narrativa se ve interrumpida en las intervenciones 203 y 205 en los que el posicionamiento de C se introduce a través de la reproducción en estilo directo de sus pensamientos. De hecho, el cambio de narración a la valoración personal y subjetiva de la situación lo marca la interjección ‘coño’, que, en términos de ^[121]Heritage (2011) podría se podría considerarse como un change of state token, es decir, la hablante muestra a través de este elemento que se ha producido un cambio a nivel epistémico: antes de este acontecimiento no pensaba que Mario se sintiera atraído por ella ni que hubiera ligado ; es justo en ese momento donde, a través de las pruebas circunstanciales expuestas, se da cuenta de que quizás está interesado. Estas dos ideas están acompañadas por ‘¿no?’, marcador que delimita su final. El uso de el marcador del discurso no solo tiene un valor demarcativo y delimitador del discurso directo, sino que también cumple con diversas func

Evaluando al candidato token:


4) unidades: 6
5) drive: 5
6) frequência: 5
7) dados: 4
9) búsqueda: 4
10) corpus: 3 (*)
11) dictionary: 3 (*)
12) distintos: 3
14) labial: 3 (*)
15) elemento: 3
16) unidad: 3
18) secuencia: 3 (*)
19) flash: 3

token
Lengua: spa
Frec: 190
Docs: 71
Nombre propio: / 190 = 0%
Coocurrencias con glosario: 4
Puntaje: 4.771 = (4 + (1+5.61470984411521) / (1+7.57742882803575)));
Candidato aceptado

Referencias bibliográficas encontradas sobre cada término

(Que existan referencias dedicadas a un término es también indicio de terminologicidad.)
token
: Ao revisarmos o front matter ou textos anteriores das três obras analisadas, encontramos que só DRAE (2001) posiciona–se a respeito do que ele considera type e token, embora não explique os critérios levados em conta para sua escolha. Assim, este dicionário só deixa explícito que,
: Conrad, M., Carreiras, M., & Jacobs, A. M. (2008). Contrasting effects of token and type syllable frequency in lexical decision. Language and Cognitive Processes, 23(2), 296-326.
: Moskowich, I. & Crespo, B. (2014). Stance in present scientific writing, indeed. Evidence from the Coruña Corpus of English scientific writing. TOKEN. A Journal of English Linguistics, 3, 91-113.
: Reershemius, G. (2001) Token Code switching and langauge alternation in a narrative discourtse: A functional - pragmatic approach. International journal of bilingualism 5: 175-194.
: Stivers, T. (2008). Stance, alignment, and affiliation during storytelling: When nodding is a token of affiliation. Research on Language & Social Interaction, 41(1), 31-57. [193]https://doi.org/10.1080/08351810701691123