Termout.org logo/LING


Update: February 24, 2023 The new version of Termout.org is now online, so this web site is now obsolete and will soon be dismantled.

Lista de candidatos sometidos a examen:
1) etiquetado (*)
(*) Términos presentes en el nuestro glosario de lingüística

1) Candidate: etiquetado


Is in goldstandard

1
paper corpusSignosTxtLongLines281 - : Para que el procesamiento morfológico sea posible, cada lema debe ser previamente etiquetado. Se denomina 'etiquetado', POS tagging (del inglés, part-of-speech tagging, etiquetado de partes del habla) o simplemente tagging al procedimiento de asignar a cada una de las unidades léxicas presentes el conjunto de sus categorías gramaticales posibles (Jurafsky & Martin, 2000 ). El problema es que las palabras tomadas en forma aislada son ambiguas respecto de su categoría. Si se considera el siguiente ejemplo: 'Yo bajo con el hombre bajo a tocar el bajo bajo la escalera'. La palabra 'bajo' puede pertenecer, dependiendo del conjunto de etiquetas que se manejen, a un mínimo de cuatro categorías diferentes: verbo, adjetivo, nombre y preposición. El analizador morfológico devolverá toda ellas para cada una de las apariciones de la forma 'bajo' en la oración. Afortunadamente, la categoría de la mayoría de las palabras no es ambigua respecto de su contexto. Para un humano es relativamente simple

2
paper corpusSignosTxtLongLines281 - : El objetivo de un etiquetador es el de asignar a cada palabra la categoría más 'apropiada' dentro de un contexto . Por supuesto, la calidad de éste dependerá del grado de precisión ('granularidad') del etiquetado, del contexto considerado y de la información de que se disponga para considerar apropiada una etiqueta o secuencia de etiquetas. A veces, los etiquetadores no resuelven totalmente el problema de la ambigüedad gramatical y se limitan a eliminar las opciones imposibles o menos probables. Este es el caso de los denominados 'desambiguadores reduccionistas'.

3
paper corpusSignosTxtLongLines281 - : Existen tres grandes tipos de etiquetadores o métodos de etiquetado: los basados en reglas, los estadísticos o probabilísticas y los híbridos basados en transformaciones . Los 'etiquetadores basados en reglas' utilizan conocimiento lingüístico (knowledge-driven taggers), generalmente expresado en forma de reglas o restricciones para establecer las combinaciones de etiquetas aceptables o prohibidas. Las reglas se escriben manualmente, responden a criterios lingüísticos y se representan en forma explícita. Los primeros sistemas de etiquetado basado en reglas constaban de dos etapas. La primera etapa contenía un diccionario que asignaba a cada palabra una lista de todas las etiquetas posibles para esa palabra y la segunda etapa constaba de una lista de reglas de desambiguación escritas a mano para lograr que a cada palabra se le asigne una sola etiqueta. Se trata de sistemas de muy alta precisión, por ejemplo, el ENGTWOL de Karlsson (Voutilainen, 1995, cit. en Jurafsky & Martin, 2000) que

4
paper corpusSignosTxtLongLines281 - : Los 'etiquetadores estadísticos' se basan en la evidencia empírica obtenida de corpus lingüísticos voluminosos (data-driven taggers). El costo es por ello mucho menor aunque también es menor su grado de precisión, superior en cualquier caso al 97%, suficiente en algunas aplicaciones. Los sistemas son independientes de la lengua y fácilmente adaptables a otras lenguas y dominios. El problema de estos sistemas reside en el aprendizaje del modelo estadístico utilizado. En este sentido es notable, y creciente, el uso de técnicas de aprendizaje automático. Se han utilizado técnicas de aprendizaje supervisado partiendo de corpus etiquetados manualmente y técnicas de aprendizaje no supervisado en las que no es precisa (o está limitada) esa intervención manual. Un algoritmo clásico utilizado para el etiquetado estadístico es el de los Modelos Ocultos de Markov (del inglés, Hidden Markov Models, HMM ). Este enfoque se caracteriza por asumir que la probabilidad de una cadena de símbolos puede ser

5
paper corpusSignosTxtLongLines340 - : Para el etiquetado del corpus de entrenamiento elaborado a mano, se tomó como base el etiquetador probabilístico Freeling 2.0 (que se encuentra disponible en la web en su versión demo). El etiquetado de la entrada de los alumnos se realiza con la técnica de N-gramas, más precisamente tri-gramas; es decir, por cada palabra de la oración ingresada el etiquetador revisa los dos contextos precedentes a la unidad a etiquetar y elige la etiqueta más probable . Luego busca en el corpus la misma palabra, revisa el contexto y ‘memoriza’ la palabra con su contexto y etiqueta asociada.

6
paper corpusSignosTxtLongLines518 - : interjueces puede desglosarse como sigue: pausas extensas, 85,7%; turnos de habla con volumen muy débil, 100%; titubeos, 71,4%; falsos inicios, 85,7% y tartamudeos, 85,7% y el promedio en el cociente de concordancia fue de un 85,7%. En virtud de la validez y fiabilidad de los criterios evaluados coincidieron en el etiquetado de ausencia o presencia de los indicadores de FV: pausas extensas, turnos de habla con volumen débil^[84]^12: titubeos, falsos inicios^[85]^13, y tartamudeos que se definen y ejemplifican en la [86]Tabla 2 . 249.9

7
paper corpusSignosTxtLongLines543 - : a) Enunciados de un solo span. Si un turno estaba constituido por una SDU, tales unidades no se consideraban para el etiquetado de relaciones:

8
paper corpusSignosTxtLongLines544 - : Los resultados del etiquetado muestran que, efectivamente, el lenguaje figurado puede funcionar como un recurso de compensación, cuando las personas informantes no saben cómo responder en su turno de habla, pero sí que son conscientes de cuál es la estructura de la conversación y que deben emitir un enunciado para mantenerla . En este trabajo, se ha detectado que hay dos formas de lenguaje figurado que cumplen más habitualmente esta función. El primer caso que encontramos es el de los extensores, que frecuentemente se emplean como relleno. En el caso del Ejemplo 1, que mostramos a continuación, la informante I23 está relatando cómo le detectaron una enfermedad a su hija y empieza a enumerar los síntomas. Sin embargo, llega un punto en el que no sabe continuar y recurre al extensor “con esas cosas”.

9
paper corpusSignosTxtLongLines555 - : La nueva representación para el problema de etiquetado múltiple, que se propone en este trabajo, llamado bin-rfl, se basa en una representación del modelo de Bernoulli multivariado que se pondera usando el término frecuencia de una etiqueta y se calcula como en la Ecuación número 3:

10
paper corpusSignosTxtLongLines587 - : s organizadores multimodales y visuales en las presentaciones PowerPoint, como lo son los títulos escritos, vídeos, imágenes y audios y cuyo uso ha sido reportado en investigaciones de las CAs como un elemento diferenciante de etapas (^[105]Rowley-Jolivet & Carter-Thomas, 2005; ^[106]Hood, 2017). Para reducir el error impuesto por la subjetividad en el etiquetado se implementó una revisión dual y discusión entre las investigadoras. Se mantuvieron los etiquetados en los que se llegaba al acuerdo. El proceso de etiquetado sigue a ^[107]Eggins y Slade (1997) y ^[108]Taboada (2004):

Evaluando al candidato etiquetado:


3) reglas: 6
4) aprendizaje: 4
6) corpus: 4 (*)
7) habla: 4 (*)
9) etiquetas: 3 (*)
10) basados: 3
11) precisión: 3 (*)
12) tagging: 3 (*)
13) técnicas: 3
14) contexto: 3

etiquetado
Lengua: spa
Frec: 76
Docs: 33
Nombre propio: / 76 = 0%
Coocurrencias con glosario: 5
Puntaje: 5.854 = (5 + (1+5.20945336562895) / (1+6.2667865406949)));
Candidato aceptado

No se encontraron referencias bibliográficas sociadas al/ alos término(s)

(Que existan referencias dedicadas a un término es también indicio de terminologicidad.)