Termout.org logo/LING


Update: February 24, 2023 The new version of Termout.org is now online, so this web site is now obsolete and will soon be dismantled.

Lista de candidatos sometidos a examen:
1) entrada (*)
(*) Términos presentes en el nuestro glosario de lingüística

1) Candidate: entrada


Is in goldstandard

1
paper corpusSignosTxtLongLines108 - : El Menú de entrada ofrece tres módulos que el usuario puede seleccionar: Introducción, Diagnóstico y Tareas .

2
paper corpusSignosTxtLongLines108 - : La tercera entrada del Menú: Tareas, lleva a nueve ambientes de trabajo interactivo en que el sujeto puede realizar diversas actividades que involucran léxico español . El usuario elige la tarea y el centro de interés en que quiere trabajar. Las tareas ofrecidas son:

3
paper corpusSignosTxtLongLines13 - : El [34]cuadro de doble entrada que se presenta a continuación muestra: a ) en sentido vertical, la tendencia general, expresada en porcentajes, de respuestas correctas por prueba (Bosques, Dolor, Salud); b) en sentido horizontal, la tendencia general en porcentajes de respuestas correctas por colegio.

4
paper corpusSignosTxtLongLines142 - : Otra equivalencia se establece entre el conocimiento específico del libretista ante ciertas características de sus personajes, como edad, sexo o vestimenta, y los valores típicos e interrelaciones que se manifiestan en un script, y, que pertenecen, por cierto, a un saber compartido. En consecuencia, en el script de visita al médico, como condición de entrada, esto es, dominio macroestructural que articula un script completo, el estado cognitivo del paciente debe corresponder a uno en que el participante esté enfermo y que es el Médico el que sana, no la Secretaria . Sin embargo, los "huecos" a los que aludía Schank ([43]1987), a veces permanecen vacíos, por lo que es necesario "adivinar" la información contenida, gracias a la variable "pie forzado" que permite inferir el valor ausente por medio de los elementos que interactúan. En el ejemplo de visita al médico, aunque no se nombre "Dinero" (D), se infiere que el Paciente debe tenerlo o, en su defecto, poseer una hora para que lo pueda

5
paper corpusSignosTxtLongLines213 - : Ahora bien, la característica más relevante de la MVS es el uso de las funciones kernel (por ejemplo, lineal, polinominal, función de base radial, sigmoidal) para extender las aplicaciones de la determinación de separación óptima a casos no lineales (Christianini & Shaw-Taylor, 2002). Esto se hace traspasando los datos desde el espacio de entrada X a un amplio espacio de características X mediante una función O, y resolviendo el problema de aprendizaje lineal en X(0: X—>X ). La función real O no necesita ser conocida, es suficiente tener una función kernel k que calcule el producto interno en el espacio de características: k(x, y)=(x) ∙<£>&) (Christianini & Shaw-Taylor, 2002; Bautista, Guzmán & Figueroa, 2004). Una ilustración de esto último, es la que se presenta en la Figura 3.

6
paper corpusSignosTxtLongLines228 - : En resumen, algunos sistemas tutoriales inteligentes para lenguas extranjeras han evidenciado el valor de la incorporación de analizadores sintácticos sofsticados para procesar los enunciados de entrada de los estudiantes de lengua extranjera y proporcionarles un feedback adecuado a los tipos de errores que se observan . Sin embargo, las estrategias utilizadas por estos sistemas han adoptado formas poco naturales de corregir los errores como la de “los informes de corrección” o “feedback metalingüístico” (Criswell et al., 1991; Levin & Evans, 1995; Nagata, 1995, 1997a, 1997b; Sams, 1995). No están claras las teorías lingüísticas de tratamiento de los errores que sustentan dichos sistemas. En lo particular, lo más relevante que arrojan dichas investigaciones es que, hasta ahora, la mayoría de los investigadores han seleccionado e implementado en sus STI para LE estrategias de feedback que no están fundamentadas en evidencias empíricas previas sobre la efectividad de ellas para apoyar el pr

7
paper corpusSignosTxtLongLines243 - : c) Probabilidad de instanciación (variable cuantitativa): medida de estadística descriptiva que permite predecir cuán probable es que, dadas las mismas condiciones, un suceso pueda volver a ocurrir. Dado que trabajamos sobre la base de una representación sistémica, en la cual el término de un sistema puede ser la condición de entrada a otro sistema menor, el cálculo de la probabilidad utilizado es el de probabilidades condicionadas . Las probabilidades condicionadas permiten calcular la probabilidad de ocurrencia en el marco de una condición o contexto mayor, por ejemplo, el cálculo de la probabilidad de ocurrencia del imperativo está condicionado al contexto mayor representado por el grado alto de la obligación. El cálculo de la probabilidad se desarrolla sobre el de frecuencia absoluta y se presenta en términos porcentuales. Para determinar si la variación entre las probabilidades de ocurrencia es estadísticamente significativa se utiliza la comparación de proporciones Z (normal

8
paper corpusSignosTxtLongLines256 - : El módulo de generación de acción lleva a cabo la correspondiente acción de búsqueda. Para mantener la coherencia dialógica, este módulo recibe la información entregada por el analizador de la entrada del usuario y registra la respuesta que el usuario provee después de realizar la acción. El analizador de entrada procesa la respuesta del usuario y el generador de respuesta produce una salida que confirma o refuta la acción realizada (por ejemplo: '¿Encontraste lo que estabas buscando ?').

9
paper corpusSignosTxtLongLines262 - : Entrada: La secuencia denominativa, SD

10
paper corpusSignosTxtLongLines262 - : Entrada: La lista de los elementos agrupados, elementos

11
paper corpusSignosTxtLongLines277 - : En este contexto, la noción de 'Sujeto-Tema' (Fawcett, 1999) también parece muy pertinente para el caso del castellano. El Sujeto-Tema es un sub-tipo particular de tema en las cláusulas de muchas lenguas (como el inglés y el castellano), es aquello de lo que trata la cláusula en tanto elemento gramatical que concuerda con la flexión del verbo. En efecto, el elemento que ocupa la posición de Sujeto es importante desde el punto de vista temático. En el caso del castellano, explicitar o no el Sujeto son dos opciones, dentro del potencial de la forma, cuya condición de entrada en la red semántica es el Sujeto . El Sujeto-Tema se superpone con el Tema cuando está en posición inicial, pero cuando el Sujeto-Tema no ocupa la posición inicial existe otro elemento que también se considera Tema.

12
paper corpusSignosTxtLongLines281 - : 2. Se etiqueta la entrada usando un etiquetador que aplica la técnica de 'n-gramas' (en este parser en particular se utiliza un sistema de 3-gramas que consiste en la revisión del contexto de dos etiquetas precedentes ).

13
paper corpusSignosTxtLongLines321 - : Enseguida, cada consulta es utilizada para recopilar fragmentos de texto asociados a dicha consulta. A los fragmentos recuperados se les aplica el patrón que les dio origen, con el fin de detectar un posible par hipónimo/hiperónimo con el cual se crea una entrada en el catálogo. Por ejemplo, retomando el extracto del [37]Cuadro 1, la entrada en el catálogo corresponde a ‘lince ibérico - felino´ .

14
paper corpusSignosTxtLongLines340 - : A estos sistemas se les denomina ‘inteligentes’ atendiendo a la capacidad que ellos tienen para analizar gramaticalmente una entrada en lenguaje natural y luego producir un mensaje o enunciado en lenguaje natural correspondiente a una estrategia de feedback correctivo adecuado para el error focalizado del estudiante (Ferreira, Moore & Mellish, 2007 ). Para ello, se debe implementar técnicas de Procesamiento de Lenguaje Natural (PLN) que se basan en teorías gramaticales para procesar la entrada del estudiante con el objeto de generar una estrategia de feedback. Las técnicas de PLN han permitido a los sistemas computacionales manejar algunas estrategias de feedback más sofisticadas como las claves metalingüísticas y los ‘informes de errores’ basados en un análisis, identificación y jerarquización del error presentado en la respuesta del estudiante.

15
paper corpusSignosTxtLongLines340 - : Para el etiquetado del corpus de entrenamiento elaborado a mano, se tomó como base el etiquetador probabilístico Freeling 2.0 (que se encuentra disponible en la web en su versión demo). El etiquetado de la entrada de los alumnos se realiza con la técnica de N-gramas, más precisamente tri-gramas; es decir, por cada palabra de la oración ingresada el etiquetador revisa los dos contextos precedentes a la unidad a etiquetar y elige la etiqueta más probable . Luego busca en el corpus la misma palabra, revisa el contexto y ‘memoriza’ la palabra con su contexto y etiqueta asociada.

16
paper corpusSignosTxtLongLines340 - : En la [41]Figura 7 se precisan las distintas etapas del procesamiento sintáctico de la entrada “*no salió la fin de semana” realizada por el analizador automático ELE-TUTOR correspondiente al ejercicio de futuro en el cual el estudiante debe completar el enunciado “Alejandro sale de clases a las 10 de la noche, así que … .“*no salió la fin de semana” (ver ejercicio en [42]Figura 5).

17
paper corpusSignosTxtLongLines340 - : Figura 7. Modelo del parser ELE-TUTOR mostrando el procesamiento de la entrada de un alumno: “no salió la fin de semana” .

18
paper corpusSignosTxtLongLines349 - : Fauconnier y Turner (1998) proponen un proceso de establecimiento de sentidos situados como redes de integración conceptual (blending), una operación cognitiva general de base analógica, de selección de correspondencias entre espacios de entrada (inputs), y con desarrollo y obtención de nuevas estructuras de sentidos a partir de la mezcla (blend), que "can have effect in cognition, leading us to modify the initial inputs and to change our view of the corresponding situations". La selección de las características que conformarán los espacios de entrada siempre es estratégica y direccionada hacia el objetivo de la mezcla, por parte de quien enuncia: esto es importante para entender cómo los discursos metafóricos orientan la comprensión de las situaciones, enfocándose en ciertos aspectos -y dejando de lado otros- de los dominios, configurando "saliencias",y por tanto, creando los sentidos requeridos en el acto (on-line ).

19
paper corpusSignosTxtLongLines349 - : En el caso de la metáfora de la madriguera, los espacios de entrada y el sistema de correspondencias privilegian las categorías experienciales que se resaltan en la [34]Figura 1:

20
paper corpusSignosTxtLongLines349 - : Nótese que los espacios definidos corresponden a ciertas "saliencias" de los dominios, pero no a su totalidad, por lo cual la situación enunciativa deja por fuera posibles características de ambos dominios, especialmente sus objetivos y metas (espacio[1]: denuncia, insurgencia; espacio[2]: supervivencia). Asimismo, las categorías componen una red interna en los espacios, articulada a su vez externamente con el entramado discursivo general, de tal modo que los énfasis en ellas son los que moldean la comprensión de la situación. El mecanismo analógico crea una interconexión entre los sistemas, un espacio de intersección conceptual o espacio genérico (generic space, Fauconnier & Turner, 1998) que contiene lo que ambos espacios de entrada comparten en el desarrollo de la red de integración conceptual ([35]Figura 2):

21
paper corpusSignosTxtLongLines349 - : La mezcla, integración, fusión o amalgama^[36]7 (blend) completa el esquema con un espacio proyectado desde los espacios de entrada, cuyo contenido es una selección de algunos de sus elementos y la aparición de una nueva estructura de sentido (emergent structure ). Todos los elementos de la integración están cohesionados con las estructuras de los espacios de entrada, y el nuevo sentido es generado a través de un razonamiento inferencial ([37]Figura 3):

22
paper corpusSignosTxtLongLines349 - : En la [39]Figura 4 se propone abrir la analogía contenida en la metáfora y atender primero a la información restringida a uno de los espacios de entrada: el de la presa . El paso de los datos a la pretensión se sostiene sobre la garantía (principio general o norma tácita formal) según la cual el destino de las presas es la caza; a su vez,tal garantía se respalda en un apoyo (mundo sustancial) de carácter definitorio, que corresponde al dominio conceptual del significado de PRESA: "animal que puede ser cazado por otro animal o por el hombre" (RAE, 2011). En la [40]Figura 5 se hace lo propio con la información del segundo espacio de entrada: el de los guerrilleros:

23
paper corpusSignosTxtLongLines375 - : Cabe destacar la escasez de ontologías semánticas multilingües construidas de forma semiautomática para garantizar un equilibrio entre la cantidad y la calidad del conocimiento. Además, la adecuación de una ontología depende estrechamente de la aplicación específica para la que se desarrolle. A este respecto, el propósito de nuestra ontología terminológica es su aplicación en sistemas que requieran la comprensión del lenguaje natural, cuyo objetivo es la ‘interpretación’ de un texto de entrada: es decir, convertir el input en una representación formal no ambigua que exprese el contenido semántico del texto con el fin de poder realizar posteriores tareas en diversas aplicaciones del procesamiento del lenguaje natural (PLN ), tales como los sistemas de resumen automático o las interfaces persona-máquina basadas en el diálogo (Ovchinnikova, 2012). Desde los inicios de nuestro proyecto (Periñán-Pascual & Arcas-Túnez, 2004, 2005), el cual se enmarca en los campos de la lingüística, la

24
paper corpusSignosTxtLongLines376 - : En segundo lugar, Rodríguez cita como argumento de autoridad al Diccionario de la Real Academia Española (1869), con el objetivo de censurar el uso de un determinado provincialismo y recomendar su sustitución por un equivalente de uso registrado en dicho repertorio. Lo anterior se refleja fielmente en el comentario que el autor hace de 'coscacho'. En esta entrada, Rodríguez presenta como conclusión implícita que se trata de un uso censurable en el sentido de "golpe que se dá en la cabeza, que no saca sangre i duele" (Rodríguez, 1979 [1875]: 123 ). El dato es que, para nombrar este concepto, el Diccionario de la Real Academia Española registra el equivalente 'coscorrón'. Junto con esto, agrega el dato de que el uso de 'coscacho' significando 'coscorrón' es exclusivo de Chile y Bolivia, o sea, es un provincialismo. La conclusión implícita se reafirma cuando dice "¿Por qué lo llamamos nosotros 'coscacho'? Averígüelo Vargas!" (Rodríguez, 1979 [1875]: 123), frase con la cual deja el uso

25
paper corpusSignosTxtLongLines376 - : En primer lugar, Rodríguez señala que ciertos usos considerados como provincialismos, no son tales si es que ellos se encuentran registrados en el Diccionario de la Real Academia Española (1869) sin la marca de provincial. Tal es el caso de la entrada 'Pancho', en donde Rodríguez concluye que este hipocorístico no merece ser calificado de provincialismo (es aceptable, por lo tanto), de acuerdo con el dato de que "viene […] sin la nota de provincial en el Diccionario de la Academia" (Rodríguez, 1979 [1875]: 345 ). Además de este dato, Rodríguez afirma que Salvá ha declarado que 'Pancho' es un provincialismo de origen cubano, pero esta fuente pierde relevancia frente a la autoridad idiomática del Diccionario académico.

26
paper corpusSignosTxtLongLines376 - : En tercer lugar, Rodríguez tolera la existencia de provincialismos en la lengua estándar nacional si estos aluden a un referente o concepto para cuya denominación la lengua castellana no posee ningún equivalente exacto. Lo anterior se refleja claramente en la entrada de 'pirca', préstamo que "en quichua i araucano significa 'pared'" (Rodríguez, 1979 [1875]: 378 ). En Chile, 'pirca' se utiliza para aludir a la pared que se construye poniendo piedras brutas unas sobre otras, sin unirlas con nada o haciéndolo con barro, y que generalmente tienen un metro o metro y medio de altura. El dato que sirve a Rodríguez para concluir que es un uso aceptable consiste en que existe una laguna denominativa en la lengua castellana con respecto a este referente, ya que para llamar a este tipo específico de pared no existe otro equivalente exacto. Consecuentemente, un provincialismo que satisfaga dicho vacío, como 'pirca', será considerado por el autor como una 'voz útil', pues su adición al caudal léxico

27
paper corpusSignosTxtLongLines384 - : La Figura 1 muestra un esquema del proceso automático de clasificación de un texto. Como se aprecia, la representación del documento, que no es otra cosa que una estructuración particular de este, es la entrada que recibe el clasificador definido formalmente como una función binaria del tipo φ: DxC → {0,1} . En esta función, D corresponde al conjunto de documentos y C al conjunto de categorías, de forma que si la función φ=1 el documento (texto) pertenece a la categoría, mientras que si φ=0, no pertenece (Sebastiani, 2002).

28
paper corpusSignosTxtLongLines389 - : En este trabajo, se consideran especialmente dos factores: la cantidad de documentos en la entrada y el tipo de resumen que se genera a la salida: extractivo o abstractivo .

29
paper corpusSignosTxtLongLines397 - : Con todo, Principia Rhetorica cumple con la tarea de abandonar el reduccionismo de una retórica centrada en la persuasividad o anclada en la visión esteticista de las figuras. La aspiración de Meyer (2013), de hecho, es bastante amplia, pues el enfoque problematológico le sirve para integrar dimensiones más allá de los límites disciplinares de la política, el derecho y la literatura; integralidad que se posibilita por la reflexión centrada en la negociación de la distancia entre ethos, pathos y logos, en las instituciones oratorias contemporáneas. Si bien su especificidad y densidad teórica no permiten verlo como un libro de fácil lectura, este Tratado constituye la puerta de entrada más clara, aplicada e integral al enfoque problematológico de Meyer (2013), una alternativa interesante para pensar la realidad social a través de preguntas que la problematizan, en vez de analizarla por medio de respuestas acabadas que la presentan como si ya estuviera resuelta .

30
paper corpusSignosTxtLongLines399 - : El contraste que existe entre el método que proponemos en este artículo y los enfoques antes mencionados, es el siguiente: no adoptamos un enfoque estadístico porque no trabajamos con corpus de textos, en donde se presta especial atención al procesamiento de frecuencias de palabras, sino que trabajamos con un diccionario explicativo, de forma que aprovechamos diversas ventajas que se pueden obtener de estos repositorios, como el hecho de que la información tiene una estructura homogénea (en la macroestructura encontramos una ordenación de los materiales léxicos que se definen, también llamados ‘entradas’, y en el plano de la microestructura, una disposición constante de los elementos informativos que acompañan a cada entrada, la manera en que se representan y el orden en que aparecen ), y la existencia de una relación léxica, que podemos identificar, entre la entrada y la base de la colocación.

31
paper corpusSignosTxtLongLines420 - : En el caso del Diccionario 1 ([34]Figura 1), se trata de una obra monolingüe cuya entrada analizada únicamente incluye la definición del término a la vez que se hace referencia a una combinación léxica relacionada (fully annealed aluminium ) integrada en la misma línea de la definición. No obstante, el número de entradas totales a disposición del usuario es amplio.

32
paper corpusSignosTxtLongLines420 - : Figura 1. Diccionario 1: Engineering Network Dictionary. Entrada: anneal .

33
paper corpusSignosTxtLongLines420 - : En la entrada analizada del Diccionario (glosario monolingüe) 2 ([35]Figura 2) se incluyen secciones claramente diferenciadas: una categorización del término según su letra inicial, el término en sí, su descripción (definición ) y la fecha de creación de la entrada. Resulta útil la inclusión de la fecha de incorporación de la entrada para ser conscientes de la actualidad y por tanto vigencia de la información en un área tan cambiante como la tecnológica. Cabe mencionar como dato desfavorable la presencia de un error ortográfico en el propio término consultado (anealing* en vez de annealing), resultando curioso, además la poca funcionalidad del modo de búsqueda, que no permite introducir directamente el término a consultar sino que hace necesario buscarlo entre el resto de palabras con la misma inicial.

34
paper corpusSignosTxtLongLines420 - : Figura 2. Diccionario 2: Engineering Terms Glossary. Entrada: an(n )ealing.

35
paper corpusSignosTxtLongLines420 - : Figura 3. Diccionario 3: Engineeringdictionary.org. Entrada: anneal .

36
paper corpusSignosTxtLongLines420 - : Figura 4. Diccionario 4: Glossary of Engineering Terms. Entrada: anneal .

37
paper corpusSignosTxtLongLines420 - : Figura 5. Diccionario 5: Sapiensman Technical Spanish-English Vocabulary. Entrada: anneal .

38
paper corpusSignosTxtLongLines420 - : Figura 6. Diccionario 6: Science and Technology Dictionary. Entrada: anneal .

39
paper corpusSignosTxtLongLines420 - : ¿consideras útil, en una entrada de diccionario científico-técnico, la inclusión/especificación de(l):

40
paper corpusSignosTxtLongLines459 - : n análisis de errores. A estos sistemas se les denomina ‘inteligentes’ atendiendo a la capacidad que ellos tienen para analizar gramaticalmente una entrada en lenguaje natural y luego producir un mensaje o enunciado en lenguaje natural correspondiente a una estrategia de feedback correctivo adecuado para el error focalizado del estudiante (^[40]Ferreira, 2007 ; ^[41]Ferreira, Moore & Mellish, 2007). Para ello, se basan en teorías gramaticales para procesar la entrada del estudiante con el objeto de reconocer y analizar los errores que se presentan. A continuación nos referiremos brevemente al STI ELE-Tutora.

41
paper corpusSignosTxtLongLines459 - : Es necesario advertir que la acción de complementar el listado de formas del español, a través del procesamiento de distintos textos en el script construido, requiere mucha precaución. Hay que tener gran cuidado en que los textos de entrada estén correctamente escritos, ya que si alguno de ellos incluyera errores ortográficos, estos se traspasarían al listado de palabras correctas, lo que iría en desmedro del funcionamiento posterior del corrector ortográfico. En el caso específico del presente trabajo, como textos de entrada para complementar el listado de palabras correctas del español obtenido de las tres fuentes originales, se utilizaron varias obras en nuestra lengua que se pueden descargar desde el sitio web del Proyecto Gutenberg ([55]http://www .gutenberg.org/browse/languages/es). Si bien hubo que revisar que los textos no estuvieran escritos en variantes antiguas del español, el proyecto ofrece una garantía -no absoluta, en todo caso- de que los textos están bien escritos y no se

42
paper corpusSignosTxtLongLines459 - : El trabajo se realizó en un equipo con Linux, pero el código final opera sin problemas en Windows. La entrada que utiliza el corrector ortográfico, empleando la terminología de Python, es una cadena de texto . Dicha cadena se procesa de dos formas, según se ve en la [57]Figura 1: palabra a palabra (punto 1) y como una cadena en busca de patrones de error complejos (punto 8).

43
paper corpusSignosTxtLongLines459 - : El listado de palabras correctas se construyó como un archivo de texto plano, en el cual las palabras están separadas por un salto de línea y tienen un espacio en blanco antes de cada una de ellas. El corrector, tomando este archivo como entrada de la información requerida, realiza una búsqueda para cotejar si la palabra se encuentra o no en el listado (el archivo en que se almacenan se llama ‘listado_palabras_original’): si está en el listado la considera escrita correctamente, en caso contrario pasa a la etapa de búsqueda de errores, como se verá más adelante . El espacio en blanco y el salto de línea son una forma arbitraria de marcar el inicio y el final de cada palabra, con el fin de evitar que haya falsas coincidencias; si no existieran estos límites y, por ejemplo, se procesara la forma verbal mal escrita ‘beo (veo)’, el corrector arrojaría una coincidencia, entre otras, con las palabras ‘beodo’ o ‘beorí’ y consideraría a ‘beo’ como escrita correctamente.

44
paper corpusSignosTxtLongLines459 - : La función en que se basa el cotejo de las palabras de entrada con los patrones de error es la siguiente:

45
paper corpusSignosTxtLongLines459 - : En el punto 8 de la [65]Figura 1, se toma nuevamente el mismo texto de entrada, pero esta vez no se analiza palabra a palabra, sino que se revisa toda la cadena en busca de patrones de error complejos (punto 9) que necesitan de contexto para poder identificarlos. Por ejemplo, consideremos la siguiente oración como texto de entrada:

46
paper corpusSignosTxtLongLines459 - : Entrada:

47
paper corpusSignosTxtLongLines468 - : Una vez que hemos renunciado a la multiplicación de entradas léxicas, dos son las soluciones que encontramos en la bibliografía de los años 90 del pasado siglo hasta aquí: la primera (que vamos a denominar a partir de ahora Hipótesis Lexicista a los efectos de nuestro estudio experimental ) pasa por concebir unas entradas léxicas lo suficientemente complejas como para dar cuenta de todas las posibilidades sintácticas que presentan; la segunda (que denominaremos Hipótesis Sintactista) toma el camino contrario y consiste en reducir al mínimo la entrada léxica, de tal modo que su valor dependa de la estructura en la que se inserte.

48
paper corpusSignosTxtLongLines503 - : El nombre ‘altura’, en el sintagma determinante, debe ser analizado aquí, pues la base adjetiva puede ser clasificada como subsectiva o como intersectiva. El uso del adjetivo ‘alto’ como subsectivo es relativo al nombre que está modificando. Por ejemplo, que una persona sea ‘alta’ puede depender del subconjunto en el cual el ser ‘alto’ sea evaluado. Sería posible afirmar algo como ‘Él es alto para jugador de fútbol, pero bajo para jugador de básquetbol’ (autogenerado), ejemplo que permite mostrar que en este uso el adjetivo es relativo. Sin embargo, el adjetivo ‘alto’ tiene otro significado menos usado, a partir del cual podemos definir que se forma ‘altura. Ese significado puede ser encontrado en el Diccionario de la Lengua Española (DLE), en la entrada: ‘alto1 . 1. levantado, elevado sobre la tierra’. Es posible considerar, entonces, que el nombre fue derivado a partir del uso intersectivo. La altura de un objeto x es una distancia determinada a partir de un punto tom

49
paper corpusSignosTxtLongLines504 - : El problema con este análisis consiste en que, si Proc no se proyecta en la sintaxis, de forma que podemos ignorar el rasgo [+Proc] de la entrada léxica, entonces la asociación con el evento previo habría de ser puramente conceptual, en cuyo caso se esperaría que la inferencia de proceso previo de casos como ‘ensordecimiento’ fuese cancelable, contra lo que (31b ) muestra. En otras palabras, la noción de proceso previo no puede explicarse como una asociación conceptual legitimada por la entrada léxica, sino que depende de un nodo activo en la sintaxis. Por otra parte, el mismo funcionamiento del Principio del Superconjunto impediría esta alternativa, al menos para verbos deadjetivales, ya que, por Minimícese la Subinserción, la estructura [SEstado [SPred]] será lexicalizada preferentemente por la nominalización deadjetival (v.g. ‘oscuridad’), que de modo más exacto materializa los rasgos ensamblados en la sintaxis.

50
paper corpusSignosTxtLongLines507 - : Como se puede observar un verbo como rendre (‘rendir’) va a tener doble entrada según los tipos de objetos que exija (N0=Humano, N1=No Humano: ‘Max se rindió a mi opinión’ ; N0=Humano, N1=Humano: ‘El cabo se rindió al enemigo’).

51
paper corpusSignosTxtLongLines507 - : Los verbos soportes que se tuvieron en cuenta fueron ‘hacer’, ‘tener’ y ‘estar’. En cuanto a los argumentos seleccionados por el predicado, se consideró dos posibles, la zona anatómica en donde se realiza el estudio (+Zona Anat) y el paciente a quien se le realiza el estudio (+Pac). Con respecto al primero, este solo es seleccionado en aquellos casos en que el estudio tenía un carácter más general, es decir, se podía realizar en diferentes zonas corporales (‘radiografía de tórax/de fémur’), mientras que aquellos que lo saturan desde la propia entrada léxica, por razones obvias, lo rechazan:

52
paper corpusSignosTxtLongLines508 - : Este trabajo se ocupa de la recategorización léxica que experimentan algunos nombres individuales cuando se interpretan como colectivos en determinados contextos; el proceso se vincula a la existencia de un rasgo sub-léxico en la definición del nombre individual, potencialmente capacitado para ser coaccionado y desencadenar un cambio de tipo semántico en el nombre. El artículo defiende, pues, una definición flexible y permeable para las unidades léxicas y para las clases en que se agrupan en función de su significado, y una concepción del cambio regular y productiva, ligada al contexto, y restringida por la propia potencialidad de la palabra. La hipótesis se inserta en el modelo del Lexicón Generativo (Pustejovsky & Batiukova, 2018), según el cual la entrada de las palabras en el lexicón mental es un conjunto infraespecificado de rasgos o fragmentos de contenido, distribuidos de forma jerárquica y muy estructurada, y capacitados para especificarse en los distintos contextos . El modelo

53
paper corpusSignosTxtLongLines508 - : El nuevo concepto de clase léxica, dinámico y flexible, gira en torno a la identificación de rasgos de contenido en palabras, de idéntica o distinta categoría gramatical, que comparten comportamientos sintácticos o morfológicos. Y, lo que es más interesante, permite la entrada y salida esporádica de los miembros, cuando el contexto los incita a comportarse como miembros de otra clase: p .ej., los nombres no contables que se vuelven contables (‘algodón’ > ‘tres algodones’) o los nombres de evento que se recategorizan como objeto (‘la entrada es a las diez’ > ‘he revendido mi entrada’). Este nuevo enfoque permite visualizar una red de relaciones entre palabras de distintas categorías gramaticales, por un lado, palabras de distintas clases léxicas, por otro, y contextos en los que las palabras pueden coaparecer, de manera automática o tras una negociación del significado, en sintonía con las tendencias actuales en la investigación lingüística, que pivotan en buena medida sobre e

54
paper corpusSignosTxtLongLines509 - : Cabe aclarar que el estudio de sentidos neológicos resulta aquí una opción metodológica para detectar sentidos abstractos que presentan entre sí escasa distancia semántica, de modo de describir con mayor granularidad las diferencias entre subclases. No se trata, entonces, de un análisis de las propiedades neológicas, sino de un análisis de configuraciones semánticas generadas en contextos en el que los sentidos neológicos pueden exhibir leves variaciones en el grado de abstracción. El Lexicón Generativo propone, para cada entrada léxica, una única ES infraespecificada con distintos niveles de representación . Estos niveles resultan de utilidad para describir las particularidades de los sentidos generados y así, luego, proponer generalizaciones respecto de los niveles más relevantes de expresión de lo abstracto. De allí también la opción metodológica del análisis contrastivo entre estructuras semánticas de los diferentes sentidos generados, que corresponden a distintas configuraciones

55
paper corpusSignosTxtLongLines520 - : Con respecto al uso aproximativo, testimoniado tanto en las principales obras sobre chilenismos como en otras de habla hispana e incluso románica (^[53]Corominas, 1983), ^[54]Román (1901-1918), citando a Santa Teresa, s. XVI, en la 6ª acepción de la entrada ‘su’ señala:

56
paper corpusSignosTxtLongLines53 - : Posteriormente, y ligado al mismo tema, luego de la interrupción de dos años de la correspondencia,se percibe la continuación del diálogo a modo de una polémica implícita^[38]14, el tema sigue siendo el mismo pero el discurso atenúa la voz del otro, y desea instalarse más tendiente a un monólogo aparente, a simular independencia del discurso ajeno, hasta que irrumpe la palabra con escapatoria y abre la entrada al otro y al deseo de que refute sus afirmaciones nuevamente:

57
paper corpusSignosTxtLongLines543 - : El [142]Gráfico 1 muestra la frecuencia de relaciones entre ambas poblaciones. De entrada, sobresale una relación que predominó en el discurso de los sujetos sanos y los enfermos: la Elaboración . Tal relación es cuantitativamente superior al resto de relaciones, si bien la población sana la formuló en mayor medida (26,0% sobre 23,4%) (véase ejemplo 10). La segunda relación más formulada por ambas poblaciones fue la Reformulación (9,3%, sanos y 8,6%, con DTA) (véase ejemplo 11). A partir de estas dos relaciones, las frecuencias en la formulación de una y otra población discrepan, pues mientras las poblaciones sanas optan por la Evidencia (6,8%) en su conversación (véase ejemplo 8), los que presentan demencia registraron la relación de Justificación (7,6%) (véase ejemplo 12). En un cuarto puesto, la Concesión (5,8) y el Fondo (5,5%) fueron las más producidas por los pacientes sanos y con demencia, respectivamente.

58
paper corpusSignosTxtLongLines555 - : Los cambios en la representación de entrada a los clasificadores automáticos pueden emplear conocimientos sobre el problema, una etiqueta en particular o la categoría a la que pertenece el documento . La representación bin-rfl puede ser desarrollada para resolver un problema particular directamente, sin complejas transformaciones de problemas. En este trabajo, hemos presentado el bin-rfl como una nueva representación de texto para el enfoque de clasificación multi-etiqueta. Esta representación permite discriminar los términos que mejor describen una categoría, en contraste con otras categorías, aprovechando así las características del dominio de documentos que conforman el corpus. Esta propuesta se evaluó utilizando dos diferentes clasificadores lineales en cuatro conjuntos de textos diferentes, que corresponden a artículos científicos médicos, documentos periodísticos, informes de diagnósticos médicos y mensajes de correo electrónico. Se realiza una comparación con bin-idf y se utilizan

59
paper corpusSignosTxtLongLines557 - : Finalmente, se incluye un adverbio en ‘-mente’, la voz ‘deportivamente’ (‘con deportividad’). Su inclusión puede parecer sorprendente, pues tiene un significado predictible y se emplea únicamente con el uso prototípico de adverbio de modo característico de los adverbios deajetivales en ‘-mente’. Sin embargo, tal vez su inclusión pueda quedar justificada debido al hecho de que se emplea con frecuencia en el sentido figurado de ‘aceptando de buen grado una situación adversa’, y no únicamente referido a los deportes; sin embargo, esta acepción ya está en el adjetivo de base, aunque este sentido no se indica ni en la entrada del adjetivo ni en la entrada del adverbio -aunque sí se ha definido en la entrada del sustantivo-:

60
paper corpusSignosTxtLongLines557 - : En tercer lugar, en cuanto a los criterios semánticos, la selección de entradas que se incorporan en la última edición del DLE parece que pone de manifiesto que las voces del listado cumplen en todas las ocasiones con lo que la bibliografía especializada suele llamar necesidad denominativa. Aunque dicho concepto sea altamente subjetivo, en este caso concreto se observa que un número importante de neologismos que tienen entrada en el diccionario son voces pertenecientes a áreas temáticas científicas tales como la medicina, la bioquímica o la arquitectura, que han perdido su valor terminológico especializado al incorporarse en la lengua general, tal como se observa en la Tabla 5, sin entrar a valorar si otras palabras deberían llevar marcas diatécnicas, como fair play (deportes) o sharía (religión), por ejemplo:

Evaluando al candidato entrada:


2) diccionario: 17 (*)
3) palabras: 15 (*)
5) rodríguez: 11
8) espacios: 9
9) contexto: 9
11) léxica: 9 (*)
12) sentidos: 8
14) texto: 8 (*)
16) error: 7 (*)
18) listado: 7
20) textos: 7 (*)

entrada
Lengua: spa
Frec: 249
Docs: 98
Nombre propio: 9 / 249 = 3%
Coocurrencias con glosario: 6
Frec. en corpus ref. en spa: 248
Puntaje: 6.865 = (6 + (1+6.75488750216347) / (1+7.96578428466209)));
Rechazado: muy común;

Referencias bibliográficas encontradas sobre cada término

(Que existan referencias dedicadas a un término es también indicio de terminologicidad.)
entrada
: 6. No obstante, atendiendo a esta propuesta, la palabra perdería protagonismo como base para el reconocimiento léxico, pues serían los morfemas las unidades en las que se apoya el procesamiento, al contar estos con su propia representación de entrada (Varo et al., 2009).
: Adelstein, A. (2006). Semántica especializada y modelización de la entrada léxica de los nombres relacionales. Revista de la Sociedad Argentina de Lingüística, 1, 71-94.