Termout.org logo/LING


Update: February 24, 2023 The new version of Termout.org is now online, so this web site is now obsolete and will soon be dismantled.

Lista de candidatos sometidos a examen:
1) clasificación (*)
(*) Términos presentes en el nuestro glosario de lingüística

1) Candidate: clasificación


Is in goldstandard

1
paper corpusSignosTxtLongLines108 - : En Clasificación de términos, la labor consiste en decidir qué subcategoría del centro es la más adecuada para incluir el vocablo dado . De esta manera, frente a las categorías

2
paper corpusSignosTxtLongLines111 - : En el ejemplo (26), el verbo "establece" que según está clasificación corresponde a un ergativo puro (inacusativo inherente para Masullo ([52]1999b ) combinado con un argumento inanimado como "ley" dota a esta construcción de un alto grado de ergatividad ya que la causa del proceso no se especifica en ningún otro fragmento del texto.

3
paper corpusSignosTxtLongLines132 - : Los datos aportados en esta investigación, centrada en una clasificación multiniveles con atención a cuestiones lingüísticas, funcionales y situacionales han permitido, entre otros:

4
paper corpusSignosTxtLongLines140 - : (3) "Un cargador deberá completar, firmar y entregar este documento al transitario siempre que se trate de un transporte de mercaderías peligrosas. Este documento proporciona información detallada, incluyendo información referente a la clasificación de las mercaderías peligrosas de acuerdo a las normas relativas al transporte de las mismas" (Estructura y operaciones de transporte aéreo, terrestre e intermodal: 143 ).

5
paper corpusSignosTxtLongLines144 - : Llegamos al punto que nos interesa: formalmente hablando, Diario para un cuento posee tanto rasgos autobiográficos como ficcionales y ninguno de ambos pactos puede ser sellado debido a la presencia irrefutable del otro. Es decir, el texto mismo no nos permite resolver el problema. Se podrá pensar que el problema no es problema en la medida en que no se lo vea como tal. ¿Acaso no es toda la obra cortaziana un texto híbrido, inclasificable y lleno de salpicaduras? Sin embargo, una cosa es un texto híbrido, que no posee género preciso o que está por sobre una clasificación, y otra cosa muy distinta es la ambigüedad . La vuelta al día en ochenta mundos es un texto híbrido, Último round es un texto híbrido, pero ninguno de los dos resultan ambiguos. Simplemente no podemos pensar que Julio Cortázar, queriendo escribir un texto autobiográfico no haya sido capaz de redondear esa "autobiografidad" (por decirlo de alguna manera). En la medida en que un "escritor profesional"^2 como Cortázar

6
paper corpusSignosTxtLongLines150 - : En suma, se puede decir que cuando se trata de niveles diferentes de producción-interpretación del discurso, cada uno de estos aporta un principio de clasificación que le es propio: el nivel situacional que permite reunir textos en torno a características del ámbito de comunicación ; el nivel de las restricciones discursivas que debe ser considerado como el conjunto de procedimientos exigidos por las instrucciones situacionales para especificar la organización discursiva; el nivel de la configuración textual cuyas ocurrencias formales son demasiado volátiles para tipificar definitivamente un texto, pero que constituyen sus indicios. Cada uno de estos principios de clasificación es legítimo y puede ser útil según el objetivo de análisis que uno se proponga seguir. La posición aquí defendida es que una definición de los géneros del discurso pasa por la articulación entre estos tres niveles y por la puesta en correlación (y no en implicación sucesiva) de los elementos que cada uno de estos n

7
paper corpusSignosTxtLongLines150 - : Queda una última cuestión, aquella de las "tipologías". Si es posible establecer clasificaciones según los niveles y los criterios que se acaban de definir, es posible establecer tipologías. Pero ¿cuál es la utilidad de construir tipologías?, ¿por quién y para quién son establecidas? Estas preguntas merecen ser planteadas puesto que se encuentran en el centro de todo análisis de los discursos: toda clasificación presupone la existencia de categorías, pero en materia de discurso las categorías no tienen (no deberían tener ) fundamento ontológico; solamente, un valor operacional para dar cuenta de otra cosa más que de sí mismas. Se podría decir categorías lingüísticas, pero estas se apoyan al menos en un imaginario de sistematicidad que les da un carácter estable. Si una tipología debe ser estable, conviene preguntarse: a) si clasifica discursos (y en qué sentido de este término) o textos; b) si está destinada a dar cuenta de un fenómeno socio-comunicativo empírico —y, en este cas

8
paper corpusSignosTxtLongLines156 - : Halliday (1978, 1985), desde una perspectiva sociocomunicativa, distingue entre las funciones ideacional, interpersonal y textual del lenguaje. En el marco de esta clasificación, el estudio del metadiscurso corresponde a las últimas dos funciones, tal como se refleja en las propuestas –no muy diferentes entre sí– de autores como Vande (1985 ), Crismore et al. (1993) y Hyland (1999a, 2000).

9
paper corpusSignosTxtLongLines173 - : Ahora bien, la clasificación de inferencias que utilizaremos en esta investigación considera -al menos- tres fuentes de información:

10
paper corpusSignosTxtLongLines186 - : ^[39]2 Al Banco de Datos del Español se accede desde la página web de la Academia: [40]http://www.rae.es. Está dividido en dos grandes conjuntos documentales: el CREA (Corpus de Referencia del Español Actual), que contiene ejemplos de los últimos 25 años del idioma, y el CORDE (Corpus Diacrónico del Español), que abarca ejemplos desde los orígenes del español hasta el límite cronológico con el CREA. El criterio de clasificación de los textos en cada corpus varía: en el CREA la distribución de los textos se ha hecho por grandes áreas temáticas (hiper-campos ); en cambio, en el CORDE la distribución de los textos es genérica. Este último corpus se divide en dos grandes grupos: 1) ficción, compuesto por textos en verso y prosa, a su vez subdivididos en lírica, épica y dramática¸ y 2) no ficción, donde aparece prosa estructurada en didáctica, científica, de sociedad, de prensa y publicidad, religiosa, histórico-documental y jurídica.

11
paper corpusSignosTxtLongLines198 - : Etapa 2. Clasificación de las funciones de los marcadores de reformulación:

12
paper corpusSignosTxtLongLines205 - : adquirir cualquier modo de organización discursiva, no obstante, por su finalidad, predomina la organización argumentativa. No posee una estructura prototípica que lo distinga de otros tipos de discurso. Asimismo, la clasificación en tipos dependerá de diversos criterios como: tema, características de la comunidad donde circula y el dispositivo que utiliza para su difusión .

13
paper corpusSignosTxtLongLines207 - : Sin embargo, al igual que Nunan (1999), Hedge (2000), Lynch y Mendelshon (2002) y Flowerdew y Miller (2005) coinciden en que la clasificación principal de la comprensión auditiva es unidireccional (one-way listening ) y bidireccional (two-way listening). Esta clasificación, se deriva de la identificación de dos grandes funciones del lenguaje propuestas por Brown y Yule (1983). Por una parte, está la comprensión auditiva bidireccional o recíproca que se asocia a la función interpersonal del lenguaje. En este caso, el propósito principal del discurso o del texto es establecer relaciones sociales. Este tipo de comprensión auditiva también se conoce como listening-and-speaking porque involucra diálogo y discusión entre a lo menos dos hablantes/oyentes.

14
paper corpusSignosTxtLongLines209 - : Como se dijo, los tipos de textos en este corpus aparecen claramente concentrados en torno a dos prototipos. Ellos revelan dos puntos del continuum de discursos, pero no dos puntos extremos. Tanto el M como el TD están orientados hacia el eje de mayor especialización, con una clara oscilación hacia el punto medio de difusión didáctica, mas no de manera radical. La GD que representa el punto extremo de la gradiente, en el eje supuesto como de mayor preocupación educativa, solo muestra una aparición muy reducida. Ahora bien, con el fin de hacer más transparentes nuestros tipos de textos y de que se comprenda mejor nuestro punto de clasificación, a continuación, entregamos una breve definición operativa de cada uno de ellos:

15
paper corpusSignosTxtLongLines213 - : Cabe señalar, que la conexión entre estos métodos y los estudios lingüísticos se encuentra en la elección de un criterio particular de clasificación, esto es, los lexemas de contenido semántico compartidos entre los textos de cada una de las áreas . De este modo, utilizamos una categoría lingüística de la semántica léxica para identificar las características propias del discurso de cada una de las disciplinas, plasmadas en la materialidad discursiva. Aquí, se halla subyacente un supuesto que cruza toda esta investigación. En términos más explícitos, suponemos que podemos diferenciar significativamente discursos académicos, a través de la ocurrencia sistemática y particular de un conjunto más bien pequeño de lexemas de contenido semántico compartido. En otras palabras, pensamos que es posible diferenciar los textos, a partir de la idea de que en los textos se encuentran palabras comunes, pero que su uso particular (y la información que ellas aportan) es distinta para cada grupo de te

16
paper corpusSignosTxtLongLines213 - : Si bien una clasificación de textos se puede realizar manualmente, tarea que en lingüística se efectúa fundamentalmente en base a criterios multiniveles (lingüísticos, textuales, pragmáticos y funcionales) y que se conoce como tipologización textual (Ciapuscio, 1994, 2000; Parodi, 2005), también es deseable alcanzar un nivel de automatización de estos procedimientos. Esta tarea, desde una aproximación del procesamiento automático del lenguaje, es conocida como clasificación automática de documentos, donde el estándar es construir y usar las llamadas “máquinas de aprendizaje supervisado. El proceso de crear una clasificación automática de textos consiste en descubrir variables que sean útiles en la discriminación de los textos que pertenecen a clases pre-existentes distintas . En particular, los clasificadores (programas que ejecutan algoritmos de clasificación) son entrenados en un grupo de documentos, previamente clasificados y etiquetados acorde a algún criterio particular (tema, ma

17
paper corpusSignosTxtLongLines213 - : En síntesis, la clasificación automática de documentos puede concebirse como un proceso de “aprendizaje matemático-estadístico”, durante el cual un algoritmo implementado computacionalmente capta las características que distinguen cada categoría o clase de documentos de las demás, es decir, aquellas que deben poseer los documentos para pertenecer a esa categoría . Estas características no tienen porqué indicar de forma absoluta e inequívoca la pertenencia a una clase o categoría, sino que más bien lo hacen en función de una escala o graduación. De esta forma, por ejemplo, documentos que posean una cierta característica tendrán un factor de posibilidades de pertenecer a determinada clase, de modo que la acumulación de dichas características arrojará un resultado que consiste en un coeficiente asociado a cada una de las clases ya conocidas. Este coeficiente lo que expresa en realidad es el grado de confianza o certeza de que el documento en cuestión pertenezca a la clase asociada al coef

18
paper corpusSignosTxtLongLines213 - : Las técnicas empleadas para la clasificación de documentos, como ya mencionamos, son originarias de los métodos clásicos de recuperación de información, es por ello que antes de describir las técnicas a utilizar en esta investigación, presentamos brevemente el modelo vectorial, ya que, sin duda, es la base conceptual para las técnicas de clasificación actuales (Figuerola et al ., 2000; Manning & Schütze, 2003). El modelo vectorial fue definido inicialmente por Salton (1968) y es ampliamente usado en operaciones de recuperación de información, así como también en operaciones de categorización automática, filtrado de información, etc. (Zazo et al., 2002; Manning & Schütze, 2003).

19
paper corpusSignosTxtLongLines213 - : Ahora bien, dado que en nuestro caso nos interesa describir el Corpus PUCV-2006 e identificar las similitudes y diferencias entre las disciplinas consideradas en este corpus, compararemos dos métodos de clasificación supervisada, basados en el modelo vectorial: el Bayes Ingenuo (Multinomial Naïve Bayes ) y la Máquina de Soporte de Vectores (Support Vector Machine), con el fin de conocer cuál de ellas es más eficiente en la clasificación de los textos.

20
paper corpusSignosTxtLongLines213 - : De modo más particular, el clasificador bayesiano ingenuo se utiliza cuando se quiere clasificar un ejemplo descrito por un conjunto de atributos (ai's) en un conjunto finito de clases (V). Esto es clasificar un nuevo ejemplo de acuerdo con el valor más probable dado los valores de sus atributos. Así, si se aplica la Ecuación 7 al proceso de la clasificación, se obtendrá la Ecuación 8:

21
paper corpusSignosTxtLongLines213 - : Figura 3. Traspaso de rasgos en el que se simplifica la tarea de clasificación (Christianini & Shaw-Taylor, 2002: 28 ).

22
paper corpusSignosTxtLongLines213 - : Como se mencionó más arriba, los métodos de clasificación a comparar en este estudio son: Bayes Ingenuo (BI ) y Máquina de Soporte de Vectores (MVS). Ambos métodos requieren, en primera instancia, normalizar los datos de la matriz (esto es, la frecuencia en la que los 2.729 lexemas compartidos aparecen en cada uno de los 222 textos) como requisito para la construcción de los espacios vectoriales correspondientes. En general, y como mencionáramos anteriormente, existen más de 200 sistemas de cálculo de pesos para normalizar los datos. En este caso particular seguimos el modelo de Salton (1968), denominado TFC, donde:

23
paper corpusSignosTxtLongLines213 - : Por último se debe destacar que para los cálculos realizados en ambos métodos se utilizó el programa Statistica. Este programa permite llevar a cabo análisis, administración y visualiza-ción de datos. Además, permite llevar a cabo procedimientos de minería de datos e incluye una amplia selección de técnicas de modelamiento, agrupamiento, exploración y clasificación (para mayor información ver [26]http://www .statsoft.com/products/products.htm).

24
paper corpusSignosTxtLongLines213 - : Como se puede observar, en esta fase, los textos académicos correspondientes a Química son clasificados correctamente en un 100% de los casos. Los textos de Ingeniería en Construcción son clasificados correctamente en un 91,67%, errando la clasificación en solo 2 textos. Para el caso de Trabajo Social, el método en esta fase alcanza una clasificación correspondiente al 83,3% de los textos académicos, clasificando erróneamente 9 textos: 6 (11,11% ) los ubica en Psicología y 3 (5,56%) en Ingeniería en Construcción. Por último, para Psicología, el método presenta un resultado que alcanza al 58,33% de los textos, adjudicando a todas las otras disciplinas porcentajes variables de textos, destacándose Química, área en la que ubica erróneamente el 25% de los textos. Por último, el porcentaje de clasificación correcta para esta etapa considerando el número de aciertos dividido el total de textos de la fase (22+22+45+42/172) alcanza a un 77,33%.

25
paper corpusSignosTxtLongLines213 - : Como es posible observar, el método BI mantiene, como en todas las etapas anteriores, una correcta clasificación de todos los textos académicos del área de Química. En el área de Ingeniería el porcentaje de clasificación baja respecto de la etapa de entrenamiento, pero mejora notablemente en comparación con la etapa de prueba (26,7% más de textos correctamente clasificados). En cuanto al área de Trabajo Social en esta etapa, se presenta un porcentaje de clasificación muy similar al obtenido en las dos etapas anteriores. En el área de Psicología, también el porcentaje de clasificación es muy similar al obtenido en las otras etapas, aunque levemente mejor que en la etapa de entrenamiento (casi un 1%) y levemente peor que en la etapa de prueba (casi un 2%). Cabe señalar que el área de Psicología es la más débil en términos de la clasificación de textos académicos, utilizando el método BI. Por último, en esta etapa el porcentaje de clasificación general corresponde a 74,54% . Este porce

26
paper corpusSignosTxtLongLines218 - : El concepto de metadiscurso ha sido desarrollado por varios analistas del discurso y se han propuesto diversas clasificaciones de recursos metadiscursivos^4. En este trabajo tomo como base la clasificación propuesta por Hyland (1999) quien distingue dos clases de metadiscurso: el textual y el interpersonal .

27
paper corpusSignosTxtLongLines220 - : En cuanto a los estudios referidos a la interacción entre pares en distintos niveles educativos, es frecuente la incertidumbre acerca de la efectividad de esta práctica para la construcción de conocimientos (Tudge, 1986; Vizzio & Rinaudo, 1997). A partir de la clasificación de tipos de interacción propuesta por Mercer (1997), Vázquez y Kowszyk (2004) muestran la tendencia predominante en grupos de escuela primaria a la “conversación acumulativa”, en la que “los hablantes construyen [conocimientos] positivamente pero no críticamente sobre lo que ha dicho el otro” (Mercer, 1997: 116 ). Esta forma de intercambio no conduce a un progreso cognitivo pues el conocimiento común es el resultado de procedimientos sumatorios, acumulativos y acríticos. En cambio, la forma que Mercer designa como “conversación exploratoria”, deseable ya que un grupo colaborativo construye críticamente significados, no siempre se da espontáneamente entre los grupos estudiados.

28
paper corpusSignosTxtLongLines234 - : Hasta aquí algunos ejemplos que indican que las diferencias en la clasificación pueden ser descritas a través de las cuatro variables de conectividad que se han señalado: la categoría (N o S ), la dirección de la interpretación (→,←) la posición o locus y el ante-/postcedente.

29
paper corpusSignosTxtLongLines234 - : Hacer comprensibles las diferencias en la clasificación es una cosa, pero ¿cómo resolver el problema de justificar qué clasificación es la más apropiada ? Una respuesta a esta pregunta puede encontrarse en las gramáticas tradicionales, en especial en las clasificaciones de las oraciones complejas^[30]4. Existen tres criterios que son particularmente importantes en estas gramáticas:

30
paper corpusSignosTxtLongLines234 - : (15) Tres criterios tradicionales de clasificación para oraciones complejas:

31
paper corpusSignosTxtLongLines234 - : Los tres criterios de clasificación representan una buena base para el procedimiento de cómo tratar relaciones discursivas ambiguas cuando analizamos el discurso. Si se ha establecido que una secuencia de segmentos puede tener más de una clasificación, debido a la distinta valoración de la categoría de los segmentos (N o S) o a la dirección de la interpretación o de la posición o locus o del ante-/postcedente, entonces el proceso que a continuación se expone se puede seguir basando en el esquema en (15 ). Los criterios pueden verse como una clasificación sustentada en el principio de “informatividad” destacada o “riqueza de conectividad”.

32
paper corpusSignosTxtLongLines234 - : El primer criterio de clasificación, esto es, primero coordinación y después subordinación, puede leerse como sigue: la coordinación generalmente da menos conectividad que la subordinación . Después de todo, en subordinación no es exactamente “ordenación”, sino también una unión de segmentos en el que se indica su importancia comparativa.

33
paper corpusSignosTxtLongLines234 - : El segundo criterio de clasificación es: primero abnominal y después adverbial . También indica que la adición a un elemento nominal (“El hombre que está andando allí”) parece proveer menos información que la inserción de un elemento adverbial de tiempo, lugar, causa, etc. “El hombre está andando allí porque está buscando a alguien”.

34
paper corpusSignosTxtLongLines234 - : El tercer criterio de clasificación: primero orientado al contenido, después orientado a la comunicación, también sugiere que una relación discursiva en la que el hablante y/o escritor se entrevea, da más información sobre el significado de un texto que una relación basada en el contenido .

35
paper corpusSignosTxtLongLines236 - : En relación con los tiempos de respuesta extremadamente altos que se registraron en este estudio tanto para palabras como no palabras, una explicación posible puede encontrarse en la técnica experimental empleada, esto es, en la tarea de decisión léxica utilizada en el experimento. Como se sabe, la decisión léxica enfrenta a los sujetos a una tarea de clasificación que les exige decidir si el estímulo auditivo, es decir, la palabra blanco, es o no es una palabra . El supuesto en que se basa es que los participantes deben consultar su léxico mental para decidir si el estímulo se encuentra o no en su lexicón. Una crítica que frecuentemente se hace a este método es que la situación de prueba que involucra puede introducir procesos adicionales en términos de estrategias utilizadas por los sujetos para aumentar la precisión de sus respuestas, lo que supone aumento en la demanda de recursos e interferencia en los procesos de reconocimiento léxico (Balota & Chumbley, 1984). Las latencias de

36
paper corpusSignosTxtLongLines243 - : En este nivel, la realización puede ser clasificada como más lexicalizada o más gramaticalizada y como más o menos congruente. El primer criterio de clasificación opera sobre la naturaleza de la unidad gramatical que está realizando alguna de las funciones, por ejemplo, en español, la función de núcleo modal (de la estructura interpersonal de la cláusula) se realiza en una unidad altamente gramaticalizada: los morfemas flexivos del verbo . El segundo criterio se funda en establecer si la categoría o clase gramatical es o no la que aparece en la protolengua, esto es, la que aparece en la primera fase del proceso de adquisición de una lengua. Si la categoría gramatical que está realizando alguna de las funciones es la empleada en la protolengua, clasificamos la realización como “congruente”; en cambio, si se trata de otra configuración, decimos que la realización es metafórica, más precisamente, una metáfora gramatical.

37
paper corpusSignosTxtLongLines263 - : Según Lo Cascio (1998), el aspecto de valoración de los argumentos está vinculado al análisis y clasificación de los tipos de argumentación, su contenido y su relación con el éxito argumentativo, esto es, a su capacidad de persuasión, manipulación o incumplimiento de la ética argumentativa . Es el ángulo en que están en juego, principalmente, la cultura y los universos ideológicos de los protagonistas. En consecuencia, según este autor, el procedimiento de valoración se compone de dos fases: una, que concierne a la calidad del razonamiento y, por lo tanto, a la validez de los argumentos o de las reglas generales adoptadas para justificar el paso de una serie de datos a las conclusiones, tesis y opiniones propuestas, coherencia de la estructura, etc.; y otra, que corresponde a la calidad del comportamiento, las condiciones externas de conducta, es decir, la capacidad de juzgar cómo un acto argumentativo se desarrolla desde el punto de vista de la coherencia de los protagonistas, de la

38
paper corpusSignosTxtLongLines267 - : Bermúdez (2005a) critica este tipo de propuestas, pues presentan el inconveniente propio de todo sistema de clasificación basado en categorías rígidas: no logran capturar la complejidad de los estados de cosas reales y su relación con los participantes, complejidad que un significado como el de la evidencialidad intenta justamente expresar . Este autor argumenta convincentemente que los subdominios de la evidencialidad no se describen de manera adecuada como clases cerradas, ya que los límites que hay entre ellas son difusos en la realidad. Tal es su opinión, por ejemplo, con respecto a la oposición información personal / información transmitida:

39
paper corpusSignosTxtLongLines268 - : En definitiva, para acercarnos ya a la clasificación de los hechos, podemos advertir que existen manifestaciones de lo metalingüístico en los tres niveles fundamentales del lenguaje: universal, histórico e individual . Hay hechos metalingüísticos universales (por ejemplo, la posibilidad de que el lenguaje sea objeto del lenguaje, como en el caso del uso metalingüístico del lenguaje primario), o hechos universales por lo que comportan de cognitivos, como la etimología popular o la metáfora (en ambos casos se trata de la modificación consciente de signos lingüísticos); hay hechos de metalengua (hechos condicionadas 'en' y 'desde' los idiomas, alojados en el léxico, como unidades simples o como fraseología, o en la gramática, ya sea oracional o supraoracional); y hay, finalmente, hechos de metahabla, o más exactamente, hechos metadiscursivos, en las ironías, en los ecos (diversos hechos reflexivos, sintagmáticos o paradigmáticos), o en los contenidos de discursos en los que se 'habla sobre' e

40
paper corpusSignosTxtLongLines269 - : En consecuencia, podemos esperar que, en una muestra más grande, cada adverbio de grado ocurra con una gama más amplia de verbos que en Servidumbre Humana: un adverbio, 'profundamente', apoya esta expectativa; las marcas(√) en la columna 'profundamente' de la [61]Tabla 11 indican que 'profundamente' ocurre con el verbo marcado en cualquiera de las muestras de 1,8 millones de palabras de la revista Time o en LOB; y, además, juntas estas dos muestras incluyen verbos que no aparecen en Servidumbre Humana. Es, pues, razonable concluir que, dentro de ciertas cláusulas, 'profundamente' entra en colocación con una clase de verbos y no solo con verbos individuales. Para darle sentido de la cobertura sistémica de los subtipos de 'emotivo', clasifiqué todos los verbos y adjetivos de emoción que aparecieron en Servidumbre Humana, revista Time y LOB en términos de una clasificación tentativa de todos los tipos de emoción, como se observa en la [62]Tabla 12:

41
paper corpusSignosTxtLongLines269 - : Esta clasificación preliminar consiste en 7 subtipos de emoción . Resulta interesante comprobar que 'profundamente' co-ocurre con verbos de todos estos tipos, esto es, tiene una cobertura sistémica completa. Por ejemplo: 'emoción' (sentir/conmover + profundamente); 'gusto' (amar/desaprobar +profundamente); 'miedo' (temer + profundamente) 'felicidad' (lamentar + profundamente); 'enojo' (enrabiar + profundamente); 'gratitud' (agradecido [adjetivo como Atributo]+ profundamente); 'orgullo' (alagar + profundamente). Sin embargo hay ciertos vacíos dentro de los siete tipos: 'miedo' y 'felicidad' solo están representados en sus versiones negativas.

42
paper corpusSignosTxtLongLines280 - : La EHF se plasma en una rúbrica que, al igual que todas las rúbricas utilizadas en evaluación, consta de un ítem y sus respectivos descriptores a los cuales se les asigna un determinado puntaje. En el caso particular de esta investigación, a los ítems se les denominó 'tipo de respuesta', siendo 'respuesta' el producto entregado por el participante, es decir, la composición narrativa misma. Las respuestas (o composiciones) fueron evaluadas de acuerdo a la siguiente clasificación: Insatisfactoria (1 ), Insuficiente (2), Desequilibrada (3), Suficiente (4), Idónea (5) y Excelente (6). Los números en paréntesis indican el puntaje asignado a cada respuesta (ver Anexo 4).

43
paper corpusSignosTxtLongLines281 - : Un importante prerrequisito para la adecuada descripción de los errores y la generación de respuestas útiles en CALL es una apropiada clasificación de los errores. El uso de una clasificación de errores tiene las siguientes ventajas:

44
paper corpusSignosTxtLongLines282 - : En cuanto a las categorías de análisis se consideraron la clasificación de procedimientos de reformulación en virtud de los participantes del intercambio: 'Autorreformulación' y 'Reformulación externa' (Gülich & Kotschi, 1987, 1997) y según el tipo de procedimiento: 'Procedimientos de verbalización', 'Procedimientos de tratamiento' o 'Procedimientos de evaluación' (Gülich & Kotschi, 1987, 1997 ; Ciapuscio, 1997).

45
paper corpusSignosTxtLongLines285 - : En cuanto a las categorías de análisis se consideraron la clasificación de procedimientos de reformulación en virtud de los participantes del intercambio: 'Autorreformulación' y 'Reformulación externa' (Gülich & Kotschi, 1987, 1997) y según el tipo de procedimiento: 'Procedimientos de verbalización', 'Procedimientos de tratamiento' o 'Procedimientos de evaluación' (Gülich & Kotschi, 1987, 1997 ; Ciapuscio, 1997).

46
paper corpusSignosTxtLongLines331 - : Este trabajo pretende dar respuesta a dichas necesidades. En particular, se presenta un estudio de corpus, basado en una muestra amplia y variada de verbos del español, con el fin de obtener evidencia empírica de su comportamiento morfosintáctico en contextos de uso reales. Más concretamente, los objetivos básicos del estudio son dos: por un lado, verificar que se dan diferentes restricciones de coaparición verbo + construcción gramatical en función de la categoría aspectual del verbo; y por otro lado, describir el modo de estructuración interna de dichas categorías. Así, el presente estudio nos permitirá obtener una clasificación de los modos de acción del verbo probada empíricamente y, de manera relacionada, una nueva metodología para la identificación de rasgos semánticos .

47
paper corpusSignosTxtLongLines352 - : Monti, C. (2004). La definición y la clasificación en el discurso pedagógico de la matemática: Dificultades y propuestas . En P. Vallejos Llobet (Comp.), El discurso científico pedagógico: Aspectos de la textualización del “saber enseñado” (pp. 77-111). Bahía Blanca: Editorial de la Universidad Nacional del Sur.

48
paper corpusSignosTxtLongLines355 - : Dentro de la Lingüística, las clasificaciones comenzaron a hacerse desde una perspectiva formalista, de modo que en los estudios (Hyland, 1999; Thompson, 2001; Mayor Serrano, 2006; Petrić, 2007; Okamura, 2008; Samraj, 2008) se partía de la distinción establecida en 1990 por Swales entre citas integrales (aparecen en el cuerpo del texto) y no integrales (aparecen entre paréntesis o en nota al pie). En estos estudios no se reparaba tanto en las razones que encuentra el escritor para citar una fuente como en la función retórica que cumple la cita dentro del texto. Thompson (2001) es el primero en desgajar la clasificación de Swales (1990) en diferentes funciones retóricas de citas que afectan de modo distinto al escrito y que tienden a clasificarse en las distintas secciones del texto académico en función de su retórica, es decir, habrá ocasiones en las cuales, debido al tono requerido por la sección, se emplearán funciones expositivas sobre el conocimiento referido de otros autores, mientras

49
paper corpusSignosTxtLongLines366 - : * El patrón 1, monoléxico, selecciona conceptos de animales en la forma denominativa. Estas denominaciones reflejan criterios de clasificación propios de las taxonomías biológicas: la estructura interna (organismo ), la especie (ostra), la característica externa (bivalvo) o interna (molusco), el hábitat común (poboación), etc. Es un patrón poco productivo a la hora de formar términos pero muy frecuente en contexto, debido a su carácter monoléxico. Su frecuencia de ocurrencia es mayor en el corpus de biología (34,5% del total de ocurrencias) que en el de economía (26,6%) o derecho (1 ,2%).

50
paper corpusSignosTxtLongLines374 - : La tarea de clasificación automática de textos se basa en construir y usar las llamadas máquinas de aprendizaje supervisado. El proceso de crear una clasificación automática de textos consiste en descubrir variables que sean útiles en la discriminación de los textos que pertenecen a clases pre-existentes distintas (Sebastiani, 2002 ). Las principales contribuciones para el tema que nos ocupa son las estrategias de clasificación automática basadas en diferentes algoritmos de categorización. Con el fin de analizar las ventajas y desventajas de los algoritmos de categorización usados para esta tarea, mencionaremos algunos que han sido ampliamente probados por estudiosos del tema en diferentes contextos, como es el caso de los clasificadores con técnicas de Naive Bayes (Kononenko, 1991; Venegas, 2007; Zhang, Xue, Yu & Zha, 2009), máquinas de soporte vectorial (SVM) (Zhi-Hong, Tang, Yang, Zhang, Wu & Yang, 2002; Gunn, 2003) y árboles de decisión (Zhang, Dong & Ramamohanarao, 2000; Aitkenhead,

51
paper corpusSignosTxtLongLines374 - : El método de clasificación probabilístico de Naive Bayes es uno de los métodos más utilizados . Algunas referencias representativas son las de Venegas (2007), quien emplea clasificación bayesiana. Venegas (2007) propone un sistema de clasificación de textos, en concreto para obtener una clasificación entre textos que leen los alumnos de cuatro carreras universitarias de la Pontificia Universidad Católica de Valparaíso, Chile. Las cuatro clases son Química Industrial, Ingeniería en Construcción, Trabajo Social y Piscología. El corpus contiene un total de 216 documentos repartidos de forma no uniforme entre las clases. Primero, hacen un procesamiento de los textos, eliminando las palabras cerradas (stopwords); ya que el texto está listo, cada documento perteneciente a este corpus es analizado por GRIAL, el cual es un sistema que se encarga de la búsqueda de sustantivos, verbos y adjetivos, estos son tomados como las palabras clave más relevantes de cada documento.

52
paper corpusSignosTxtLongLines374 - : Con la finalidad de alcanzar los objetivos que se plantearon en este trabajo, se llevó a cabo una implementación modular que permite una evaluación más precisa del sistema; el sistema de clasificación propuesto para este trabajo consta de cuatro etapas claramente segmentadas: el pre-procesamiento de los documentos, la etapa de entrenamiento del clasificador, la alimentación de datos en nuestra ontología y por último la clasificación de los documentos .

53
paper corpusSignosTxtLongLines374 - : - Por su parte, la tarea de clasificación aplica el modelo sobre un conjunto de datos de prueba, de los cuales el sistema desconoce su categoría . En general, se comparan los resultados obtenidos con un gold standard (evaluación de un experto) para conocer el desempeño de dicho sistema de clasificación, los resultados obtenidos son reportados con las medidas de evaluación de precisión, recall y F-score.

54
paper corpusSignosTxtLongLines374 - : En el primer nivel de clasificación, suponemos que entre los documentos considerados pueden existir textos del ámbito general y de hipoacusia, definiéndose así dos primeras clases (general vs . hipoacusia). A su vez, los textos que pertenecen a la clase hipoacusia pueden dividirse en textos sobre hipoacusia no genética (ambiental) o hipoacusia genética (segundo nivel de clasificación), y estos últimos subdividirse a su vez en hipoacusia sindrómica y no sindrómica (tercer nivel de clasificación).

55
paper corpusSignosTxtLongLines374 - : Establecido el corpus de trabajo, se seleccionó el algoritmo de aprendizaje con el cual se realizan los experimentos, y se utilizó el algoritmo propuesto por Ronquillo (Ronquillo, Pérez de Celis, Sierra, da Cunha & Torres-Moreno, 2011), que se basa en la clasificación de n-gramas de letras. En concreto, este algoritmo, mediante el uso de una ventana móvil de n letras, con n = 1, · · ·, 11, crea un modelo de lenguaje sobre el corpus analizado. De este modo se producen dos modelos de lenguaje (LM): uno, LM[A,] sobre el subcorpus A, y el otro LM[B] sobre el subcorpus B. Paralelamente se construyó un modelo de lenguaje, LM[X], generado por una oración desconocida X. Para clasificar X se calcula la distancia (valor absoluto de la clasificación) LM[X] | (LM[A]:LM[B] ) y se elige la categoría (A o B) más cercana a X. El hecho de usar n-gramas de letras en vez de n-gramas de palabras es útil en casos en los que el corpus no es muy amplio, como ocurre en nuestro trabajo. Se realizaron tres

56
paper corpusSignosTxtLongLines374 - : experimentos de clasificación en los tres niveles de la taxonomía: I ) General vs. Hipoacusia II) Hipoacusia no genética vs. Hipoacusia genética III) Hipoacusia sindrómica vs. Hipoacusia no sindrómica. Para estas pruebas distribuimos los corpus; asignamos al corpus de aprendizaje el 90% de textos y al corpus de prueba 10%, en cada uno de los tres niveles.

57
paper corpusSignosTxtLongLines374 - : Los métodos de clasificación se dividen en dos grupos: aquellos que son métodos supervisados, como es el caso del algoritmo de n-gramas, el cual necesita un conjunto de entrenamiento para crear el modelo del lenguaje que usará el algoritmo para su clasificación, y el segundo grupo es aquel donde no se genera el conjunto de entrenamiento, como es el uso de la ontología, y en este es a través de los datos que tiene la ontología que trata de clasificar los documentos (Dragu, Elkhoury, Miyazaki, Morelli & Tada, 2010 ).

58
paper corpusSignosTxtLongLines374 - : En el [36]Gráfico 2 se muestra la comparación con los distintos métodos de clasificación, utilizados durante este trabajo de investigación, para el tercer nivel de categorización correspondiente a hipoacusia sindrómica e hipoacusia no sindrómica, donde se puede ver el desempeño final de cada uno de los algoritmos . Como se puede observar en la gráfica, el peor resultado lo obtuvo el algoritmo baseline con un 40.6% de asertividad en la clasificación; en cuanto al algoritmo basado en n-grama de letras, tiene una asertividad del 68.1%, y el algoritmo basado en funciones supera al algoritmo de n-gramas con un 79% de efectividad.

59
paper corpusSignosTxtLongLines384 - : La clasificación automática de textos ha estado ligada históricamente al desarrollo de Máquinas de Aprendizaje, una línea de la Inteligencia Artificial y la Inteligencia Computacional que se basa en el desarrollo de algoritmos que ‘aprenden’ o reconocen patrones recurrentes en cada clase a partir de un gran volumen textos de entrada, previamente clasificados por humanos .

60
paper corpusSignosTxtLongLines384 - : La clasificación de textos tiene entre sus particularidades una alta dimensionalidad y desbalance entre categorías, lo que la distingue y la hace ser más complicada que la de otro tipo de datos, como por ejemplo imágenes . Por esta razón, es un problema abierto de gran desarrollo en las Ciencias de la Informática. De hecho, en las últimas dos décadas, el manejo automático de documentos electrónicos se ha transformado en el mayor campo de investigación en esta área de la ciencia. Es precisamente dentro de este escenario, el de grandes volúmenes de información digital vinculada a la Inteligencia Artificial, en el que se inserta este trabajo que tiene como objetivo proponer un algoritmo alternativo a los ya existentes, basado en grafos de palabras, para la clasificación de textos digitales.

61
paper corpusSignosTxtLongLines384 - : Antes de comenzar el proceso de clasificación, una serie de procesos de ‘limpieza’ son aplicados a las representaciones G y h . Esta limpieza se traduce en el colapso de ciertos nodos, antes distintos, en uno solo. Una aproximación similar a la planteada por Choudhary y Bhattacharyya (2003) pero más tolerante a la diversidad de términos. El primero de estos procesos es llevar distintas variantes de una misma palabra a su raíz, esto para reducir la variabilidad del lenguaje producto de, por ejemplo, la conjugación verbal. Para realizar lo anterior, se utilizó el corpus de la Real Academia de la Lengua Española (2013), compuesto por más de 7 mil palabras junto a su frecuencia de uso. En primer lugar, este corpus se dividió en dos partes de acuerdo a la frecuencia: palabras muy utilizadas y menos utilizadas. El primer grupo, compuesto por cerca de 50 palabras, se les consideró inútiles para la clasificación de sentimiento, debido a su gran frecuencia de aparición. Se excluyeron de esta lista

62
paper corpusSignosTxtLongLines384 - : Cuando se observa la precisión y la cobertura de cada categoría (gráfica media inferior), se evidencia que la clasificación automática de textos no es una tarea fácil, más aún en Twitter donde las particularidades en el uso del lenguaje son significativas (Manley, 2012 ; Bryden et al., 2013). Sin embargo, para la clasificación de tweets positivos (línea verde), la precisión y la cobertura son, por lo general, altas y estables, seguidas por la categoría neutral (línea azul) y más abajo la categoría negativa (línea roja). A pesar de estas diferencias, el desempeño global^[27]2 del clasificador (Micro F1, gráfica inferior), obtenido como la media armónica entre la precisión y la cobertura,

63
paper corpusSignosTxtLongLines384 - : Uno de los aspectos a destacar del método propuesto es que se inserta en la línea de algoritmos de la inteligencia artificial basada en una computación descentralizada. Esta aproximación es la que Turing (1992) como uno de los paradigmas para el desarrollo de máquinas inteligentes que emulan el comportamiento de los procesos cognitivos en seres vivos. En el algoritmo propuesto operan mecanismos tipo abajo-arriba (bottom-up) para la clasificación siendo esta dependiente de detalles de bajo nivel tales como las relaciones entre palabras. De esta forma la clasificación no es un fenómeno que se ‘enseña’ a alto nivel sino que emerge de la abstracción topológica de la gramática que significa la red de palabras . Por esta razón, el algoritmo que se propone en este trabajo tiene la potencialidad de operar en distintos contextos (temas, idiomas, etc.). Además, debido a que la representación matricial del grafo es una abstracción relacional para cualquier tipo de entidades, el algoritmo puede ser im

64
paper corpusSignosTxtLongLines385 - : En este estudio, se ha optado por el método de incluir todas las variables independientes juntas. Sin embargo, no es hasta que se clasifican nuevos casos que se puede evaluar realmente la capacidad discriminante de las funciones. Para ello, se pueden añadir nuevos casos conocidos, y comprobar si quedan bien clasificados según las funciones discriminantes, o bien se puede utilizar el método de clasificación dejando uno fuera (validación cruzada), que consiste en eliminar casos uno a uno del modelo y clasificarlos según las funciones discriminantes resultantes del resto de casos (Tabachnick & Fidell, 2001 ). En este trabajo hemos utilizado ambos modelos, como se verá a continuación.

65
paper corpusSignosTxtLongLines386 - : Las dimensiones se refieren a los criterios de descripción, clasificación y explicación de la modificación de la lengua objeto de estudio (LO) presentes en el corpus de aprendientes (Corder, 1967; Granger, 2004; Díaz-Negrillo & Domínguez, 2006). En este sentido, la inclusión de las dimensiones en una taxonomía de error corresponde a: (1) Criterio de Clasificación lingüística: nivel lingüístico en el que se encuentra el error (léxico, categoría gramatical) y (2) Taxonomía de modificación de la LO: se refiere a las alteraciones o desviaciones observadas en los errores tales como ‘la omisión’, ‘la adición’, ‘la sustitución’ y ‘el orden’ . La combinación de estas dos dimensiones permite la construcción de una taxonomía que da cuenta tanto del error en un nivel lingüístico, como de su respectiva categorización en el tipo de error cometido por el aprendiente.

66
paper corpusSignosTxtLongLines390 - : Al tenor de lo indicado, en este artículo denominaremos a las señales del oyente ‘turnos de apoyo’, concepto acuñado por Cestero (2000a) y que definimos como las vocalizaciones léxicas y no léxicas emitidas por el oyente durante la interacción oral, cuya función primordial es mostrar seguimiento en el acto comunicativo y participación activa en la comunicación (Cestero, 2000a, 2000b). En segundo lugar, la clasificación que hemos seguido en esta investigación ha sido la propuesta por Cestero (2000a), la cual califica a los TA siguiendo tres criterios bien diferenciados: la función de los TA, la complejidad o estructura lingüística de los TA y la influencia del contexto en la producción de los TA . Cada uno de estos criterios será debidamente explicado durante la exposición de los resultados obtenidos.

67
paper corpusSignosTxtLongLines390 - : En la clasificación de Cestero (2000a) los apoyos conversacionales se distribuían en ocho diferentes funciones: acuerdo, entendimiento, seguimiento, conclusión, recapitulación, conocimiento, reafirmación y apoyos combinados . Los apoyos de acuerdo, como su nombre indica, expresan el acuerdo con el contenido del mensaje en marcha, bien sobre hechos, pensamientos, propósitos, sentimientos, comportamientos y juicios emitidos. La función de los apoyos de entendimiento del oyente es transmitir al hablante la comprensión del enunciado en marcha, sea de una explicación dada, o bien la dentificación de objetos, lugares o hechos mencionados. Los apoyos de seguimiento realizan un seguimiento del mensaje que se está emitiendo y suelen carecer de significado. Mediante los apoyos de conclusión el oyente intenta finalizar el enunciado en marcha o una parte de él, realizando un intercambio cooperativo. A través de los apoyos de recapitulación el oyente resume el enunciado emitido en el turno de habla. En

68
paper corpusSignosTxtLongLines392 - : Una similar clasificación de los modelos de lectura es abordada por Vélez (2006), quien identifica tres teorías en los relatos autobiográficos de estudiantes universitarios: la lectura como conjunto de habilidades, la lectura como un proceso interactivo y la lectura como proceso transaccional . La teoría que explica la lectura como ‘conjunto de habilidades’ concibe la lectura como un fenómeno observable en que el lector decodifica para extraer el significado que está en el texto y presenta un modelo secuencial y jerárquico de habilidades lectoras que se deben enseñar de manera gradual y acumulativa. Por su parte, el ‘enfoque interactivo’ propone un modelo sistémico de la lectura como procesamiento de la información. La información que ingresa debe ser procesada por los esquemas del sujeto. La lectura se considera un proceso activo, en que la mente procesa símbolos. Finalmente, el ‘enfoque transaccional’ concibe una representación cíclica de la lectura, en que no pueden separarse, le

69
paper corpusSignosTxtLongLines398 - : Aijmer (2009) categoriza los ejemplos de seem de acuerdo con su organización sintáctica, en los que puede estar acompañado por experimentadores o no. Esto se observa en el ejemplo ‘She seems to have solved the puzzle’ y en ‘It seems that it won’t rain today’. La enorme variación sintáctica de esta forma verbal ha sido descrita por Johansson (2007), quien agrupa los ejemplos de seem en (a) seem copulativo (seem + adjective), (b) seem con complemento clausal (seem that), y (c) verbo catenativo (seem to + infinitive). Volviendo a la clasificación de Aijmer (2009), esta es mucho más detallada (los ejemplos que se citan a continuación son de la misma fuente): (a ) seem + that-clause (It seems that it is raining), (b) seem + as if (like) (It seems as if it is raining), (c) seem + like noun phrase (It seems like a fool ), (d) seem + infinitive (It seems to be raining), (e) seem + adjective (participle) (He seems agitated ), (f ) seem + adjective + that-clause (It seems possible that it will be

70
paper corpusSignosTxtLongLines402 - : Según la clasificación de ocupaciones laborales por rangos establecida por la OIT (Organización Internacional del trabajo, ver Hoffmann & Scott, 2011), las 157 ofertas que contenían por lo menos un anglicismo o habían sido redactadas parcialmente o totalmente en inglés han quedado distribuidas de la siguiente manera: 121 ofertas (77,1% ) para cargos de rango alto, 25 ofertas (15,9%) para cargos de rango intermedio y 11 (7,0%) rango bajo.

71
paper corpusSignosTxtLongLines412 - : En síntesis, para acceder al reconocimiento y clasificación de las metáforas simples y sus redes, tomaré como base los enfoques semántico-cognitivo y lingüístico-gramatical, conjuntamente con el análisis del contexto, que es una propuesta analítica motivada por el AID (Bolívar, 2007 ). Siguiendo esta misma orientación de análisis combinado, interpretaré los resultados considerando tres niveles equiparables a las metafunciones de la cláusula (Halliday, 1994), a saber: a) el de la realidad que se construye metafóricamente en el discurso cuando el emisor habla de un tópico en particular relacionado con ‘socialismo’; b) el nivel interactivo (AID de Bolívar, 2007), que es la relación que establece el emisor con sus interlocutores a partir de las redes de metáforas asociadas con la palabra socialismo y; c) un nivel textual, que describe cómo se organiza la información en las redes de metáforas cuando el término central de comparación es ‘socialismo’.

72
paper corpusSignosTxtLongLines427 - : 1.1. En busca de un principio articulador para la clasificación de géneros: El macrogénero

73
paper corpusSignosTxtLongLines438 - : El estudio de los gráficos ha sido ampliamente abordado desde diversas perspectivas, considerando su desarrollo y evolución en distintas disciplinas y áreas del conocimiento (Tufte, 1990, 1997, 2001; Wilkinson, 2005). Uno de los primeros y más completos estudios sobre el gráfico como sistema semiótico es el de Bertin (1983), en el cual se describen detalladamente todos los elementos que lo componen. Entre estos elementos, se describe las variables visuales de tamaño, valor, granularidad, color, orientación, forma y las dos dimensiones espaciales (x,y), en las cuales se proyectan estas variables. Bertin (1983) propone, además, una clasificación dentro de las dimensiones espaciales, a partir de la cual se distinguen cuatro grupos de configuraciones: diagramas, redes, mapas y símbolos . Estas configuraciones pueden ordenarse de acuerdo a la disposición de los elementos en el plano o a partir de una construcción estándar que puede ser rectilínea, circular, ortogonal o polar. Estos grupos de

74
paper corpusSignosTxtLongLines448 - : La clasificación de los reformuladores propuesta por los mencionados autores incluye los siguientes subtipos: explicativos, rectificativos, de distanciamiento y recapitulativos . Según su función específica, los reformuladores explicativos presentan el miembro del discurso que introducen como una reformulación que aclara o explica lo que se ha querido decir en otro miembro anterior que pudiera ser poco comprensible, por ejemplo, ‘o sea’, ‘es decir’, ‘esto es’ y ‘a saber’ (Martín Zorraquino & Portolés, 1999). Por su parte, Garcés (2003, 2011) destaca que la reformulación es un “procedimiento de organización del discurso que permite al hablante volver sobre un segmento anterior para reinterpretarlo y presentarlo de manera distinta” (Garcés, 2011: 90), el que responde a cinco motivaciones de los hablantes: explicar, recapitular, reconsiderar, distanciarse o corregir (Garcés, 2003). Aplicando los supuestos de la lingüística textual de Gülich y Kotschi (1983, 1995) y Rossari (199

75
paper corpusSignosTxtLongLines449 - : Los tres tipos principales de procesos se distribuyen de la siguiente manera: la experiencia externa: procesos materiales (suceder y actuar); la experiencia interna: procesos mentales (sentir y pensar); y la clasificación e identificación: procesos relacionales (ser, estar y tener ).

76
paper corpusSignosTxtLongLines456 - : De manera paralela a la ausencia de uniformidad conceptual, han abundado las propuestas de clasificaciones o taxonomías de estas estrategias (^[64]Rubin, 1981; ^[65]Oxford, 1990, ^[66]2011; ^[67]Chamot & O’Malley, 1994; ^[68]Franco, Pino & Rodríguez, 2012). De entre todas ellas, la que ha ejercido mayor impacto hasta la fecha es, sin duda, la proporcionada por Oxford (1990), que ya en su día fue reconocida como “quizás la clasificación de estrategias de aprendizaje más exhaustiva” (^[69]Ellis, 1994: 539 ); no en vano, también procede de esta taxonomía elaborada por ^[70]Oxford (1990) a la que nos acabamos de referir el Strategy Inventory for Language Learning (en adelante, SILL) (en español, el Inventario de Estrategias para el Aprendizaje de una Lengua), empleado en este estudio y que constituye el instrumento que más repetidamente se ha utilizado para evaluar la frecuencia percibida de uso de estrategias (^[71]Dörnyei, 2005; ^[72]Rose, 2012).

77
paper corpusSignosTxtLongLines456 - : Conforme a esta clasificación, las estrategias de aprendizaje de una lengua se dividen inicialmente en seis grupos: las ‘estrategias de memoria’, destinadas a facilitar el almacenamiento y la recuperación de información ; las ‘estrategias cognitivas’, que contribuyen a entender y producir la lengua; las ‘estrategias metacognitivas’, orientadas a planificar y controlar el aprendizaje; las ‘estrategias de compensación’, con las que se intenta superar las lagunas y limitaciones de nuestra competencia en la lengua; las ‘estrategias afectivas’, que ayudan a controlar y regular las emociones; y las ‘estrategias sociales’, que contribuyen al aprendizaje gracias a la interacción social. Más recientemente, ^[73]Oxford (2011) reformuló su clasificación original y elaboró un modelo que incluye estrategias relativas a las tres dimensiones principales del aprendizaje de una L2, a saber, la cognitiva, la afectiva y la sociocultural-interactiva. Según este modelo (^[74]Oxford, 2011: 14), la

78
paper corpusSignosTxtLongLines456 - : ^4Coincidimos con el criterio al respecto expresado por ^[398]Griffiths (2013: 44) cuando afirma: “Otra de las dificultades implícitas a la clasificación es la de que, en la práctica, es a menudo imposible clasificar una estrategia en concreto en uno u otro grupo de forma exclusiva” .

79
paper corpusSignosTxtLongLines465 - : El ‛tipo de formato’ (relato digital, video de Powtoon, Scribe, etc.) y la ‛interacción directa/indirecta con el espectador’ constituyeron los criterios principales empleados para la clasificación de los textos, identificando así tres tipos principales de TIDs en el corpus, a los que se les han asignado los siguientes códigos (^[94]Lampert & Ervin-Tripp, 1993): texto de identidad personal (TIP ), texto de identidad impersonal (TIIMP), y texto de identidad híbrido (TIH). A estos se les ha añadido códigos identificativos del formato (POW para Powtoon, etc.), así como las iniciales de cada estudiante, por ejemplo: TIIMP-POW-NP.

80
paper corpusSignosTxtLongLines475 - : Los adjetivos formados por composición patrimonial detectados en nuestro estudio fueron 103, un 6,5% del total. Con el fin de ordenar las ocurrencias, decidimos organizarlas de acuerdo con la categoría gramatical de los lexemas que las forman, tal y como muestra la [97]Tabla 8. Para ello, nos basamos en la clasificación dada por ^[98]Casado Velarde (2015) y separando los que no tenían cabida dentro de la misma, que suponen un 8,3% del total, y entre los que no encontramos ninguna pauta digna de ser reseñada .

81
paper corpusSignosTxtLongLines478 - : presenciales. A nivel categorial, las mujeres participantes presentan una tendencia probabilística no aleatoria a considerar con mayor utilidad las escalas de clasificación y de elaboración, es decir, a aquellas acciones destinadas a discriminar, seleccionar y clasificar o categorizar la información, de manera que sea más simple, rápido y organizado llevar a cabo las posteriores estructuraciones y representaciones, así como también integrar las distintas partes de la información, elaborar o reelaborar la información a nivel semántico complejo .

82
paper corpusSignosTxtLongLines495 - : La tradición de los estudios sobre feedback a la escritura proviene de investigaciones en segundas lenguas. Desde un inicio, un lugar destacado lo ocupan los comentarios de tipo correctivo, los cuales se centran principalmente en que el aprendiz-escritor mejore su uso del nuevo código (^[61]Ellis, 2009, ^[62]2010; ^[63]Ferris, 2010; ^[64]Bitchener & Ferris, 2012). Al respecto, ^[65]Ellis (2009) sistematiza una clasificación de seis tipos de feedback o CE a los errores lingüísticos presentes en los textos: correctivo directo, indirecto y metalingüístico ; feedback correctivo focalizado en un tipo error y no focalizado; reformulación y uso de feedback electrónico. Basándonos en esta propuesta y en la exploración preliminar de los datos, nos propusimos tres categorías para analizar los comentarios correctivos de los profesores guías de tesis: CE correctivos directos, CE metalingüísticos directos y CE metalingüísticos indirectos.

83
paper corpusSignosTxtLongLines495 - : iva. Desde el punto de vista del tipo de ayuda que provee el comentario, ^[70]Duijnhouwer (2010) diferencia entre feedback sobre el progreso del escritor en relación a una tarea anterior, feedback con provisión de estrategias de mejora, y preguntas que promueven la reflexión y autonomía del escritor. Considera también un conjunto de categorías y sus correspondientes subcategorías de clasificación, entre las que incluye: objeto del CE, signo (retroalimentación positiva o negativa ), tono, uso de explicaciones, especificidad del comentario, tipos de preguntas, entre otras. Cabe señalar que ^[71]Duijnhouwer (2010) es probablemente quien más explícita los procedimientos metodológicos empleados para definir y luego aplicar los criterios de análisis. Al respecto, la experiencia obtenida de la exploración de las tipologías existentes nos indica que su aplicación no siempre es tarea sencilla, pues la interacción dialógica entre CE y el texto del estudiante conlleva a que en algunos casos sea necesa

84
paper corpusSignosTxtLongLines506 - : clasificación en la bibliografía es diversa, para establecer contrastivamente cuál es el comportamiento de los tipos complejos y cuál el de los tipos unificados y pseudo-tipos complejos en relación con las variables de copredicación y ambigüedad . El corpus utilizado fue el Spanish Web Corpus (esTenTen), disponible en el Sketch Engine (para una presentación general del Sketch Engine, véase ^[74]Kilgarriff, Baisa, Bušta, Jakubíček, Kovář, Michelfeit, Rychlý & Suchomel, 2014; para una presentación del esTenten, véase ^[75]Kilgarriff & Renau, 2013), que cuenta con aproximadamente diez mil millones de palabras. En primer lugar, se tomó una muestra al azar de 100 concordancias. Siguiendo los lineamientos de ^[76]Berri (2014) se clasificaron los contextos según presentaran uno u otro sentido, fueran ambiguos o mostraran copredicación.

85
paper corpusSignosTxtLongLines508 - : 3. los rasgos propuestos, por su naturaleza estrictamente lingüística, pueden cruzar categorías de palabras que denotan entidades de distinta naturaleza ontológica, lo que confirma que la clasificación léxica es independiente del mundo: así, el nombre ‘algodón’ y el verbo ‘andar’ comparten el rasgo [+homogéneo] y, por eso, son compatibles con el cuantificador ‘mucho’ (‘mucho algodón’ ; ‘andar mucho’), aunque aluden a entidades ontológicamente distintas: el nombre a un objeto y el verbo a un evento. Los rasgos subléxicos cruzan no solo las clases léxicas sino también las categorías gramaticales: los rasgos [±homogéneo], [±evento], [±propiedad], [±dinámico], [±extenso], [±lugar] y [±duración] discriminan nombres, verbos, adverbios, adjetivos y preposiciones. En suma, permiten establecer paradigmas léxicos cuyos miembros comparten su comportamiento gramatical, sin atender al tipo de entidades del mundo a las que aluden -a diferencia de los rasgos que conforman los c

86
paper corpusSignosTxtLongLines509 - : En la EA se especifican los argumentos que participan y el modo en que se realizan sintácticamente. De acuerdo con este criterio, los argumentos pueden ser verdaderos (Arg), que son los que se realizan sintácticamente; por defecto (D-Arg), que son aquellos que participan lógicamente en la expresión de la EQ pero que no siempre se realizan sintácticamente; a la sombra (S-Arg), que están semánticamente incorporados al ítem léxico; y adjuntos verdaderos, que son argumentos opcionales, no ligados a la estructura lógica del ítem léxico^[55]^1. Esta clasificación de los argumentos es unidimensional y se refiere a la expresión en la sintaxis . En ^[56]Jezek y Pustejovsky (2017) se propone una EA dinámica, que incorpora otras propiedades relevantes de los argumentos que contribuyen a explicaciones con mayor granularidad: además de la expresión en la sintaxis (‘expresado, encubierto’ y ‘opcional’), se propone el tipo semántico y el rol semántico. En el presente trabajo consideraremos el modo

87
paper corpusSignosTxtLongLines509 - : Los resultados del trabajo permiten afirmar que el carácter abstracto de un sentido temporal se expresa en información de las distintas estructuras que conforman la ES del ítem léxico. La gradación se observa al considerar las configuraciones de los sentidos generados. En cuanto a la EA, el carácter abstracto se observa en el tipo de argumento y su valor. Respecto de la EQ, resulta relevante el valor del QF, específicamente en lo que hace a los tipos ontológicos, que se subsumen en el tipo eventualidad. En cuanto a la EE, para el carácter abstracto resulta relevante el tipo de evento, ya que los nombres que se resemantizan como Estado se encuentran ontológicamente más cercanos a los nombres de tercer orden. Por otra parte, el análisis permite incorporar en la explicación y clasificación de lo abstracto criterios relativos a la interfaz semántica-morfología (^[111]Adelstein & Straccia, 2017) y semántica-sintaxis, esto es, otros criterios además del sintáctico .

88
paper corpusSignosTxtLongLines510 - : [2]vol.52 número100 [3]Nombres temporales: Hacia una clasificación según grados de abstracción [4]Formación de nombres en mapudungún: Productividad, genuinidad y planificación [5] índice de autores [6]índice de materia [7]búsqueda de artículos [8]Home Page [9]lista alfabética de revistas

89
paper corpusSignosTxtLongLines511 - : Para identificar y describir los procedimientos de creación nominal en mapudungún, utilizamos como base el modelo de clasificación de neologismos propuesto por ^[48]Cabré (2006), el que adaptamos según los recursos de formación constatados en nuestro corpus, tal como se expone en la [49]Tabla 2:

90
paper corpusSignosTxtLongLines513 - : En el estudio de la neología como campo de conocimiento que se ocupa de las palabras nuevas, es decir, creadas en un período determinado en una lengua concreta, los conceptos más utilizados para diferenciar unos tipos de neologismos de otros de acuerdo con su función comunicativa son los de ‘neología denominativa’ y ‘neología estilística’. Varios autores, como ^[26]Guilbert (1975), ^[27]Cabré (1989), ^[28]Sablayrolles (1993) y ^[29]Guerrero Ramos (1995), han hecho referencia a estos dos conceptos y en la mayoría de los casos los han relacionado entre sí en forma de categorías explícitamente opuestas, es decir, como una dicotomía de la función neológica. Ahora bien, aunque estos dos conceptos han sido ampliamente utilizados en la literatura, podemos afirmar que, desde un punto de vista teórico, la clasificación de los neologismos en denominativos y estilísticos no se sustenta: las funciones de los neologismos no se inscriben en un único eje en que los neologismos prototípicamente r

91
paper corpusSignosTxtLongLines514 - : La diversidad de significados que se refleja en la clasificación conceptual de los nombres rotuladores permite destacar dos aspectos: por un lado, la amplia variedad de opciones disponibles para conceptualizar y etiquetar fragmentos textuales en los artículos de investigación de las ciencias agrarias, lo cual confirma el potencial de los nombres rotuladores para realizar simultáneamente los procedimientos de encapsulación y rotulación . Por otro lado, puede constatarse que, en los artículos de investigación analizados, los nombres se emplean para rotular actos lingüísticos, eventos, acciones, proposiciones, conceptos, ideas, situaciones y nociones asociadas al proceso de investigación.

92
paper corpusSignosTxtLongLines515 - : La clasificación de los casos se lleva a cabo a partir de las siguientes variables de estudio:

93
paper corpusSignosTxtLongLines516 - : cuenta de una clasificación sobre la base de las relaciones sintáctico-semánticas que estos enlaces representan, sin omitir plantear la ambigüedad semántica y el valor polisémico de alguno de ellos. El fenómeno de los marcadores discursivos entraña las dimensiones sintácticas y semánticas de la lengua en cuanto se despliegan como recursos propios de la semiotización del texto. En ese contexto, ^[101]Pottier (1993: 7) destaca que “la sintaxis y el léxico han sido tratados con amplitud desde hace mucho tiempo, sin que el vínculo imprescindible con la semántica haya quedado establecido de manera suficiente. Por ello, propone una clasificación de naturaleza lógico-semántica que materializa en un modelo semántico de continuo, proponiendo un esquema denominado trimorfo, el cual se ajusta a la lógica del uso de enlaces textuales distribuidos dentro de los tres momentos relevantes en el proceso evolutivo de un acto discursivo: apertura, seguimiento y cierre, ofreciendo una visión prospectiva

94
paper corpusSignosTxtLongLines520 - : En lo que respecta a la clasificación semántico-discursiva del fenómeno en estudio, los hallazgos descriptivos apuntan a que es posible agrupar los casos en los que se usa ‘su’ en cinco ejes temáticos generales: 1 ) bebidas y licores, 2) alimentos, 3) utensilios domésticos o posesiones importantes, 4) actividades, procesos y eventos y 5) seres humanos. Mientras que los grupos 1 al 4 presentan un bajo nivel de animacidad, el grupo 5 es altamente animado. No obstante, este último presenta ciertos rasgos que permiten proponer un proceso de metaforización en el que estas realidades son concebidas como objetos o alimentos.

95
paper corpusSignosTxtLongLines537 - : Los estudios sobre los estilos de habla en relación con la identidad de género surgieron a finales del siglo XX y fue, de hecho, Deborah Tannen quien distinguió el estilo de habla masculino y femenino por primera vez, bautizándolos como generolectos (^[49]Tannen, 1990). Sin embargo, se trata de una clasificación de los estilos de habla normotípicos que solo refleja el habla heteronormativa y presupone que estos van ligados al sexo del hablante (^[50]Stokoe & Smithson, 2001 ). Este trabajo sigue las ideas propuestas por ^[51]Gal (1995) y ^[52]Cameron (1998), quienes piensan que el estilo de habla masculina y femenina no tienen por qué estar relacionados con el sexo biológico del hablante. De hecho, estos estilos de habla surgen a partir de los estereotipos y las normas culturales que la sociedad occidental ha fomentado en torno a la noción de masculinidad y feminidad heteronormativa. En esta línea, ^[53]Ochs (1992) afirma que la identidad de género es una categoría dinámica que construimos

96
paper corpusSignosTxtLongLines543 - : Preliminarmente y ateniéndonos a los hallazgos de futuros avances, podemos decir que algunas de estas relaciones guardan congruencia con las habilidades preservadas por los sujetos con DAT. Por ejemplo, de las relaciones de índole multinuclear incluidas en la clasificación de Mann y Thompson, la Unión, es la relación que menos especificaciones semánticas requiere para llevarse a cabo ; basta que entre una y otra unidad exista una temática compartida. Otra relación dentro de esta misma subcategoría, como la Lista, tampoco sugiere mayores sujeciones semánticas, sin embargo, su dificultad radica en las múltiples unidades nucleares que requiere su conformación.

97
paper corpusSignosTxtLongLines543 - : ^3La clasificación se encuentra disponible en la página oficial de la RST: http://www .sfu.ca/rst/

98
paper corpusSignosTxtLongLines548 - : Posteriormente, ^[46]Lacuesta y Bustos (1999) establecieron una clasificación semántica de las diferentes palabras formadas con el sufijo -ismo, tomando como punto de partida los postulados presentados anteriormente (^[47]Cabré & Rigau, 1986; ^[48]Lang, 1992; ^[49]Beniers, 1992). Esta clasificación constituye un aporte a la comprensión del sufijo -ismo, a su contribución semántica cuando aparece acompañado de diversos tipos de radicales y a su relación con distintas áreas de conocimiento. A continuación se explican las cuatro acepciones que comprenden dicha clasificación:

99
paper corpusSignosTxtLongLines552 - : b. La clasificación del FC acompañado de LNV se hizo de la siguiente manera: FC verbal sin componente no verbal (FC sin LNV ), FC verbal acompañado de LNV (FC con LNV) como en el ejemplo (1); y FC puramente no verbal (FCNV) como en el ejemplo (2). Los gestos sin función correctiva o expresiva dentro del FC no se codificaron como LNV.

100
paper corpusSignosTxtLongLines555 - : La asignación de una o más categorías predefinidas a los textos en lenguaje natural, basados en su contenido, es un componente importante y necesario en muchas tareas al interior de las organizaciones. Esta tarea se realiza comúnmente a través de la clasificación automática de textos, esto es, clasificando documentos dentro de un conjunto de categorías predefinidas por medio de un modelo y método computacional . La representación de los textos para propósitos de clasificación automática ha sido tradicionalmente llevada a cabo usando un modelo de espacio vectorial debido a su simplicidad y buen rendimiento. Por otro lado, la clasificación automática de textos por multi-etiquetados ha sido típicamente abordada utilizando métodos de clasificación de etiqueta simple, lo que implica transformar el problema estudiado para aplicar técnicas binarias o adaptar algoritmos binarios para que funcionen con múltiples etiquetas. En este artículo el objetivo es evaluar un factor de ponderación de las pa

101
paper corpusSignosTxtLongLines555 - : labras de los textos en el modelo booleano para representación de texto en clasificación multi-etiqueta, usando una combinación de dos enfoques: transformación de problema y adaptación de modelo . Este factor de ponderación y la combinación de enfoques en la clasifiación automática fue puesto a prueba con cuatro diferentes conjuntos de datos textuales utilizados en la literatura especializada y comparado con técnicas alternativas por medio de tres medidas de evaluación. Los resultados presentan mejoras superiores al 10% en el rendimiento de los clasificadores, atribuidas a nuestra propuesta, en todos los casos analizados.

102
paper corpusSignosTxtLongLines555 - : Tradicionalmente, la clasificación (o categorización) de textos se ha definido como la asignación de un valor Booleano (verdadero o falso) a cada par 〈d [j ],c [i ]〉 ∈ D × C, donde D es el dominio de los documentos (corpus) y C = {[c1],…,c [|c| ]} es el conjunto de etiquetas (clases ) predeterminadas. Si un documento está categorizado solo bajo una etiqueta (categorías no sobrepuestas) o bajo múltiples etiquetas a la vez (categorías sobrepuestas), se le llama un ‘problema de una etiqueta’ o un ‘problema multi-etiqueta’ respectivamente (^[39]Sebastiani, 2002). El caso más estudiado para resolver problemas de clasificación de texto es el de ‘una etiqueta’ y el enfoque principal es el llamado de Clasificación Binaria (Binary classification, BC), donde un documento es clasificado, ya sea a la categoría c [i ]o a su complemento

103
paper corpusSignosTxtLongLines555 - : La clasificación de multi-etiqueta es un problema importante para la aplicación real, como se puede observar en muchos dominios, como por ejemplo genómica funcional, categorización de textos, minería de música y clasificación de imágenes, por nombrar algunos . En ^[41]Alfaro y Allende (2011) se presenta una representación de texto modificada para un problema de multi-etiqueta llamado tf-rfl. Su rendimiento fue comparado aplicándola en el conjunto de datos conocido como Reuters-21578 y se concluyó que existe una mejora estadísticamente significativa comparado con enfoques alternativos, considerando solo la medida de desempeño Hamming Loss.

104
paper corpusSignosTxtLongLines555 - : La clasificación automática con varias etiquetas es un tema importante en la recuperación de la información y el aprendizaje automático . La representación y clasificación de textos se han tratado tradicionalmente usando tf-idf debido a su simplicidad y buen desempeño.

105
paper corpusSignosTxtLongLines555 - : Venegas, R. (2019). Clasificación automatizada de macromovidas discursivas en el género tesis: Escritura académica y aprendizaje de máquinas . En C. Zapata & B. Manríquez (Coords.), Tecnologías del lenguaje Humano: Aplicaciones desde la lingüística computacional y de corpus. Medellín: Editorial de la Universidad de Medellín. [ [130]Links ]

106
paper corpusSignosTxtLongLines562 - : Los primeros usos de caracterización y clasificación, antecedentes directos de los empleos comparativos y aproximadores ([166]Figura 1), y que dan lugar a usos atenuantes, aparecen considerablemente más tarde en el ^[167]CDH, a partir de finales de los ochenta en Latinoamérica, a menudo en el contexto de corrientes culturales juveniles o de adultos jóvenes:

107
paper corpusSignosTxtLongLines563 - : La bibliografía sobre el comportamiento de esta partícula en el español de Chile todavía es escasa (^[28]Rojas, Rubio, San Martín & Guerrero, 2012; ^[29]San Martín & Guerrero, 2016; ^[30]San Martín et al., 2016; ^[31]San Martín, 2017, ^[32]San Martín, en prensa). Sin embargo, en ella se ha propuesto una clasificación de las funciones que ‘onda’ presenta en el español oral chileno, a saber: reformulador explicativo, operador de concreción, operador enunciativo con valor continuativo o aproximativo e introductor de discurso directo (^[33]San Martín et al ., 2016).

108
paper corpusSignosTxtLongLines563 - : Para determinar los valores que desempeña la partícula ‘onda’ hemos tomado como referencia la categorización de funciones propuesta por ^[102]San Martín et al. (2016). Una primera exploración al corpus nos ha permitido notar que el valor de operador de concreción corresponde, en efecto, a un uso ejemplificador de la partícula y que el valor continuativo o aproximativo corresponde a dos usos diferentes, aunque relacionados. El primero se vincula a un uso retardador y el segundo da cuenta de un uso aproximador, que aporta imprecisión a lo que se dice a continuación. Además, esta exploración nos ha permitido observar que ‘onda’ puede desempeñar otras dos funciones no contempladas en la categorización previa: aproximación numérica o temporal y focalización. Así, hemos realizado el análisis de nuestro trabajo sobre la base de una clasificación que contempla siete funciones para ‘onda’: aproximación, aproximación numérica o temporal, retardación, introducción de discurso directo

109
paper corpusSignosTxtLongLines565 - : La construcción objeto de este estudio está formada a partir del pronombre demostrativo ‘eso’ y el verbo ‘decir’ y presenta también variante con la conjunción disyuntiva (‘eso dicen’ / ‘o eso dicen’). Según nuestro conocimiento, esta construcción no se analizado en profundidad hasta ahora. No se encuentra registrada en el amplio trabajo de ^[78]Fernández (2002), en el que se recogen las diferentes construcciones con el verbo ‘decir’, que, a su vez, remite a los principales diccionarios y obras fraseológicas consultadas por la mencionada autora^[79]^4. Siguiendo la clasificación utilizada por ^[80]Fernández (2002), consideramos adecuado ubicar ‘[o] eso dicen’ entre las “fórmulas fijas” que:

110
paper corpusSignosTxtLongLines565 - : * claro eso dicen (CORPRES XXI; rtve.es: No es un día cualquiera. Forgesmérides. Año y criterio de clasificación: 2002, Medio de difusión: Internet . Tipología: Otros)

111
paper corpusSignosTxtLongLines565 - : (19) luego encantados de que los oyentes puedan participar y puedan intervenir en el programa // para preguntar aquellas cuestiones que deseen a César Vidal / pero nos podríamos acercar // antes de entrar en la película // eeh / que de hecho va a acaparar casi todos los Óscar / eso dicen las predicciones // al señor Tolkien / y podíamos decir que es un británico // típico (CORPES XXI: CORALES: De la noche al día, 1/2, 15/02/02, Radio Nacional. Año y criterio de clasificación: 2002, Medio de difusión: Otros_corpus . Tipología: Tertulia. 2002)

112
paper corpusSignosTxtLongLines584 - : Menéndez, S. M. (2013). La clasificación de los verbos en español: El principio de gradualidad . Un enfoque sistémico-funcional. En L. Funes (Ed.), XVIII Actas del Congreso de la Asociación Internacional de Hispanistas (pp. 253-269). Buenos Aires: Facultad de Filosofía y Letras. [ [112]Links ]

113
paper corpusSignosTxtLongLines6 - : Hemos seleccionado y establecido una clasificación con el total de poemas de Desolación que, de alguna manera, reflejan el sentimiento religioso de nuestra poetisa:

114
paper corpusSignosTxtLongLines74 - : Ya en el siglo pasado, Alexander Bain, en su obra fundamental English Composition and Rhetoric de 1866, basaba la clasificación de las formas del discurso en las facultades de la mente. De acuerdo con Bain, la mente está dividida en tres facultades: el entendimiento, la voluntad y los sentimientos. Los objetivos (informar, entretener, persuadir) de cualquier discurso corresponden a estas tres facultades. Las formas del discurso son los tipos de texto que se relacionan con las facultades de la mente, los objetivos del discurso y las leyes del pensamiento. Así, mientras la descripción, la narración y la exposición se relacionan con la facultad del entendimiento, la persuasión se relaciona con la voluntad y la poesía con los sentimientos y las pasiones ([70]D'Angelo 1987). Es importante mencionar la clasificación de Bain narración, descripción, exposición y argumentación porque, si bien se puede considerar obsoleta, es la que prevalece actualmente en la mayoría de los programas de estudio

115
paper corpusSignosTxtLongLines89 - : Esta clasificación está avalada por la teoría de la Hipótesis minimalista (McKoon y Ratcliff, 1986, 1992) y supone una alternativa al procesamiento de inferencias asumida desde el punto de vista constructivista de años precedentes . De acuerdo con esta hipótesis, las únicas inferencias que se codifican de forma automática durante la lectura son aquellas que resultan absolutamente necesarias para establecer una coherencia local en las afirmaciones descritas en el texto. También serían automáticas las que se realizan cuando ya existe una información que esta fácilmente disponible, ya provengan de afirmaciones explícitas del texto o de los conocimientos generales del lector. Se contempla también en esta teoría que las inferencias codificadas automáticamente proporcionan la representación básica de la información textual sobre la que se construirán posteriormente otras inferencias más intencionadas y dirigidas a metas. Un tipo de clasificación en esta dirección ha sido propuesta por McKoon

116
paper corpusSignosTxtLongLines97 - : Durante las últimas dos décadas hemos visto aparecer en nuestro país textos originales, disímiles y en algunos casos desconcertantes, surgidos desde campos como el científico y el literario. Poseen ellos caracteres heterogéneos y son sus contextos de formación espacios culturales, como el periodismo, la etnoliteratura, la literatura etnocultural, la poesía experimental, etc. En este artículo daremos cuenta del surgimiento de un tipo textual original bastante desconocido para los circuitos académico - literarios y que representan un desafío desde el punto de vista de su clasificación y análisis, lo cual nos permite pensar en el desarrollo de una mutación discursiva en un sector específico de la ciencia social chilena, esto es, el de la antropología experimental de orientación más postmodernista .

Evaluando al candidato clasificación:


1) textos: 51 (*)
2) corpus: 26 (*)
4) texto: 22 (*)
9) discurso: 17 (*)
10) funciones: 17 (*)
11) categorías: 16
16) palabras: 15 (*)
17) criterios: 15 (*)
18) automática: 15

clasificación
Lengua: spa
Frec: 693
Docs: 189
Nombre propio: 5 / 693 = 0%
Coocurrencias con glosario: 7
Frec. en corpus ref. en spa: 134
Puntaje: 7.825 = (7 + (1+7.60733031374961) / (1+9.43879185257826)));
Rechazado: muy disperso; muy común;

Referencias bibliográficas encontradas sobre cada término

(Que existan referencias dedicadas a un término es también indicio de terminologicidad.)
clasificación
: La clasificación según la forma del input responde a la tipología propuesta por Dominique Macaire y Wolfram Hosch, recogida por Ch. Cuadrado, Y. Díaz y M. Martín (1999) (E4-MET).
: 4. Segmentación del evento en episodios y clasificación de los mismos según propuesta de Núñez y Oyanedel (2006).
: Acosta, V., Ramírez, G. & Hernández, S. (2013). Identificación y clasificación de alumnado con Trastorno Específico del Lenguaje (TEL). Revista de Logopedia, Foniatría y Audiología, 33, 157-164. Doi: 10.1016/j.rlfa.2013.07.006.
: Albertuz, F. (2007). Sintaxis, semántica y clases de verbos: Clasificación verbal en el proyecto ADESSE. En P. Cano López (Coord.), Actas del VI Congreso de Lingüística General (pp. 2015-2030). Madrid: Arco Libros.
: Alexopoulou, A. (2006). Los criterios descriptivo y etiológico en la clasificación de los errores del hablante no nativo: Una nueva perspectiva. Porta Linguarum, 5, 17-35.
: Ato, M., López, J. J. & Benavente, A. (2013). Un sistema de clasificación de los diseños de investigación en psicología. Anales de Psicología, 29(3), 1038-1059.
: Bordignon, F. , Peri, J., Tolosa, G., Villa, D. & Paoletti, L. (2004). Experimentos en clasificación automática de noticias en español utilizando el modelo bayesiano [en línea]. Disponible en: [30]http://www.unlu.edu.ar/~tyr/TYR-publica/paper-unlu-bayes-2004.doc
: Borreguero Zuloaga, M. (2018). Los encapsuladores anafóricos: Una propuesta de clasificación. Caplletra, 64, 179-203.
: Cabré, M. T. (2006). La clasificación de neologismos: Una tarea compleja. Alfa, 50(2), 229-250.
: Calvi, M. V. (2010). Los géneros discursivos en la lengua del turismo: Una propuesta de clasificación, Ibérica, 19, 9-32.
: Complementa la estrategia empleando el método de máxima entropía (Berger, Della Pietra & Della Pietra, 1996) para calcular las relaciones entre las palabras clave y las clases, que son dos: radiología y genética. El F-score obtenido en la clasificación es del 79.7%.
: Dentro de la clasificación de Casado Velarde sustantivo + i + adjetivo 9 6,6% ‘Para ello buscará una victoria que sería histórica para el conjunto franjirrojo.’ El Norte de Castilla 11/4/2012
: En cuanto a los tipos de adecuación, hemos optado por ofrecer la clasificación de Coseriu (1992) que distingue entre tres tipos de adecuación:
: En esta tercera fase se consideran la capacidad de clasificación general y la evaluación en términos de exhaustividad y precisión de ambos métodos, en relación a todos los textos pertenecientes al Corpus Académico PUCV-2006.
: Figura 1 Clasificación diagnóstica bidimensional del criterio ^[85]Mesulam et al. (2014).^[86]^3
: Figura 1 Propuesta de clasificación de textos formulada por ^[59]Gregory y Carroll (1978).
: Fresneda, D. & Mendoza, E. (2005). Trastorno Específico del Lenguaje: Concepto, clasificaciones y criterios de clasificación. Revista de Neurología, 41, 51-56.
: Fuera de la clasificación de Casado Velarde Otros 6 8,3% ‘Turchínov ha respondido así a la exigencia del grupo parlamentario de aprobar una amnistía para los participantes en las protestas (…), de mayoría rusohablante’ El Norte de Castilla 10/4/2014
: Fábregas, A. (2010). Los nombres de evento: Clasificación y propiedades en español. Pragmalingüística, 18, 54-73.
: Guerrero, V., López, C., Faba, C., Reyes, M., Zapico, F. & Moya, F. (2003). Clasificación de términos mediante el algoritmo de Kohonen [en línea]. Disponible en: [44]http://scimago.ugr.es/file.php?file=/1/Documents/JOTRI-03.pdf
: La hipótesis de la que partimos es que habrá muchas similitudes entre el género conversación coloquial y wasap y que, por consiguiente, será oportuno replantear la clasificación de ^[70]Gregory y Carroll (1978).
: Los casos de elipsis serán tratados en trabajos futuros y, para los marcadores discursivos, se tomó la clasificación que presentan Zorraquino y Portolés (1999).
: Los rasgos se solapan y entrecruzan, y generan un conjunto muy amplio de tipos léxicos (^[43]Romero, 2017 para una propuesta de clasificación de nombres por sus rasgos sub-léxicos.)
: López Samaniego, A. (2015). Etiquetas discursivas, hiperónimos y encapsuladores: Una propuesta de clasificación de las relaciones de cohesión referencial. Revista de Filología Hispánica, 31(2), 435-462.
: Mendiluce Cabrera, G. & Hernández Bartolomé, A. (2005). La matización asertiva en el artículo biomédico: Una propuesta de clasificación para los estudios contrastivos inglés-español. Ibérica, 10, 63-90.
: Menéndez, S. M. (2013). La clasificación de los verbos en español: El principio de gradualidad. Un enfoque sistémico-funcional. En Actas del VII Congreso de la Asociación Internacional de Hispanistas. Buenos Aires: Facultad de Filosofía y Letras .
: Para categorizar las definiciones y operacionalizar las variables se adoptó una clasificación usual de las definiciones ([65]Copi, 1978). Los ejemplos siguientes corresponden a definiciones del término sustantivo producidas por niños de 2º grado, obtenidas con este experimento^[66]7:
: Para esta clasificación inicial, se tomó como base la propuesta en la ontología SNOMED CT (2013) y se adaptó a partir de consultas con expertos del dominio. De este modo, fue posible un primer ordenamiento de los NEND, que permitió la posterior elaboración de las tablas LG.
: Para la identificación de estas funciones tomé como punto de partida la clasificación de Hyland (1999), que divide el metadiscurso en dos grandes categorías: la textual y la interpersonal.
: Para llevar a cabo dicha construcción son necesarias estrategias que apunten a seleccionar y relacionar las ideas principales. El modelo de comprensión presentado por [45]van Dijk y Kintsch (1983) indica la siguiente clasificación de macroestrategias:
: Posteriormente, se midió la efectividad de las operaciones de clasificación de cada uno de los métodos, utilizando las medidas clásicas de exhaustividad y precisión (Figuerola et al., 2000). Para realizar esto último se utilizan las Ecuaciones 11 y 12:
: Resources Association, Portorož, Eslovenia (pp. 1485-1492).Nazar, R. & Arriagada, P. (2017). POL: un nuevo sistema para la detección y clasificación de nombres propios. Procesamiento del Lenguaje Natural, 58, 13-20.
: Rojo Mejuto, N. (2015). Hacia una clasificación de las colocaciones léxicas por niveles de aprendizaje. Tesis de magíster, Universidad de Salamanca, Salamanca, España.
: Romero, J. (2015). Propuesta de clasificación de algunos nombres complejos en el Lexicón Generativo. Journal of foreign studies, 65(3), 53-69.
: Sánchez, M. (1995). Clasificación y análisis de préstamos del inglés en la prensa de España y México. Lewiston, NY: Mellen Press.
: Tabla 1 Clasificación actualizada de las relaciones retóricas propuestas por ^[131]Mann y Thompson (1988).
: Toribio-Díaz, M. E. & Morera-Guitart, J. (2008). Clasificación clínica y biomolecular de las demencias frontotemporales. Rev Neurol, 47, 588-98.
: Venegas, R. (2007). Clasificación de textos académicos en función de su contenido léxico-semántico. Revista Signos. Estudios de Lingüística, 40(63), 239-271.
: Vázquez, G., Fernández, A. & Martí, M. A. (2000). Clasificación verbal: Alternancias de diátesis. Lleida: Edicions de la Universitat de Lleida.
: ^[35]Biber, Johansson, Leech, Conrad y Finegan (1999) utilizan también una clasificación similar, si bien usan una nomenclatura diferente. En este caso, se usan los términos ‘modalidad intrínseca’ y ‘modalidad extrínseca’, que se especifican así: