Termout.org logo/LING


Update: February 24, 2023 The new version of Termout.org is now online, so this web site is now obsolete and will soon be dismantled.

Lista de candidatos sometidos a examen:
1) corpora (*)
(*) Términos presentes en el nuestro glosario de lingüística

1) Candidate: corpora


Is in goldstandard

1
paper corpusSignosTxtLongLines140 - : El presente trabajo pretende ser un aporte en dicha dirección. Este estudio es parte de una investigación mayor, en la que, siguiendo la metodología de la lingüística de corpus, se aplicó un análisis estadístico multivariado ([28]Biber, 1986, [29]1988) sobre 65 rasgos lingüísticos (ver anexo 1) en tres corpora correspondientes a tres registros: Técnico-Científico (CTC ), Literario (CLL) y Entrevista Oral (CEO), pertenecientes al corpus PUCV-2003. Producto de este análisis cuantitativo, se configuraron 5 dimensiones, denominadas Foco Contextual e Interactivo, Foco Narrativo, Foco Compromiso, Foco Modalizador y Foco Informativo ([30]Parodi, 2004). Estas dimensiones deben ser entendidas como interpretaciones funcionales de patrones de co-ocurrencia de rasgos lingüísticos. Posteriormente, se determinó estadísticamente un puntaje para cada registro (CTC, CLL y CEO) en relación con cada dimensión. Así, sobre la base del puntaje que cada uno de ellos alcanzó con respecto a cada dimensión, se co

2
paper corpusSignosTxtLongLines153 - : corpus (CEO) se utilizan más verbos por palabras que en los otros corpora, pero que tienden a ser los mismos verbos, es decir, no hay mayor variabilidad verbal . Un último aspecto interesante respecto a la Tabla 5 es el siguiente. En el subcorpus CTC el porcentaje de verbos por número total de palabras es comparativamente el más bajo. Esto permite inferir que en ese registro los verbos tienen menor importancia, comparativamente hablando, que otras categorías gramaticales principales (como los sustantivos o los adjetivos). El caso contrario se puede decir del CLL y el CEO que, a la luz de los datos, son corpora con una mayor tendencia verbal, aunque no necesariamente, como ya dijimos en el caso del CEO, con una gran variabilidad verbal.

3
paper corpusSignosTxtLongLines194 - : • Tercero, en este estudio nos hemos enfocado en la primera estrategia de feedback correctivo que un profesor proporciona después del error del estudiante. Nos interesa estudiar ahora cómo los profesores de lengua extranjera combinan estrategias de feedback, y si ellos tienden a utilizar secuencias de estrategias de manera particular. Por ejemplo, si una estrategia del Grupo 2 como la elicitación o la solicitud de clarificación no activa el conocimiento previo, ¿los profesores deberían proveer luego una estrategia del Grupo 1 que corrija directamente o proporcione la respuesta? ¿Existen técnicas de andamiaje (scaffolding) para ciertos tipos de errores o combinación de estrategias que funcionan de este modo? Para estudiar tales secuencias es necesario un corpus más grande de los aquí utilizados, y la recolección y análisis de tales corpora es una labor intensa y ardua .

4
paper corpusSignosTxtLongLines240 - : Posteriormente, en el año 2007, sus actividades tomaron un nuevo rumbo al publicar, esta vez como editor, obras que reúnen trabajos relacionados con sus nuevos intereses, tales como Working with Spanish corpora publicado en Londres, “Lingüística de corpus y discursos especializados: Puntos de mira”, publicado en Valparaíso y Lingüística de Corpus, en revisión en España . Estas publicaciones reúnen artículos de autores chilenos y extranjeros que gustosamente han aceptado colaborar con él con escritos inéditos y que a su vez le han extendido invitaciones para colaborar con artículos en libros editados por ellos, como por ejemplo Genre in a changing world. Writing across the currículo editado por Bazerman, Bonini y Figueiredo, y Discourse, of course editado en Ámsterdam por Renkema.

5
paper corpusSignosTxtLongLines326 - : Una de las proyecciones, que desde estos antecedentes se vislumbra, es una línea de trabajo e investigación que dice relación con un programa que proponemos se denomine ‘Leer A través de las Disciplinas’ (LAD). Este programa podría articularse a través de corpus electrónicos que contengan textos ejemplares pertenecientes a géneros identificados a través de un grupo de disciplinas y a través de un conjunto de guías metodológicas para el desarrollo de estrategias de comprensión de textos escritos, en español como lengua materna o en inglés como lengua extranjera o –en algunos casos– en ambas al mismo tiempo. Junto a lo anterior, un componente de este programa podría organizarse a partir de lo que hoy se entiende como corpus de aprendientes (learner corpora) y la idea de un “aprendizaje guiado por el corpus” (Data-driven learning: DDL ); desde el cual los alumnos interactúan con los corpus y actúan como investigadores a través de los mismos. Dejamos así abierta una serie de posibi

6
paper corpusSignosTxtLongLines328 - : Los datos de la investigación provienen de cuatro corpora de lengua oral: el Habla Popular de la República Mexicana (H .P.R.M.)^[24]1, el Habla Popular de la Ciudad de México (H.P.C.M.)^[25]2, el Habla de la Ciudad de México (H.C.M.)^[26]3 y el Habla Universitaria (H.U.)^[27]4.

7
paper corpusSignosTxtLongLines328 - : El proceso que se siguió para la obtención de datos consistió en buscar todas las frases nominales de objeto directo con referente humano en los cuatro corpora, excepto los objetos del verbo ‘haber’ y ‘tener’, pues el primero nunca se rige con la preposición ‘a’ y el segundo, muy rara vez^[28]5 (Leonnetti, 2003 ); por lo tanto, tales acusativos no resultan pertinentes para este análisis, ya que el aspecto abordado en el trabajo es la alternancia entre la presencia y ausencia de la preposición ‘a’. Posteriormente, se clasificaron los objetos directos con referente humano en dos grandes grupos: 1) con preposición (628 ejemplos) y 2) sin preposición (215 ejemplos).

8
paper corpusSignosTxtLongLines397 - : El primer capítulo revisa sintéticamente las definiciones precedentes sobre retórica, desde el mundo antiguo hasta el siglo XX. En esta revisión se demuestra el mayor énfasis puesto en el orador, el auditorio o el lenguaje/estilo en las diferentes visiones teóricas, lo cual hace que no den cuenta de la retórica como unidad. El recuento desemboca y respalda la definición integral que propone Meyer (2013). La hipótesis, que queda pendiente por probar en análisis empíricos extendidos y con corpora auténticos, es que si el objeto de estudio es la distancia, los componentes del triángulo retórico pueden analizarse en pie de igualdad .

9
paper corpusSignosTxtLongLines417 - : The first two studies explore the phenomenon of immigration from the perspective of Critical Discourse Analysis and Visual Grammar. Therefore, both studies make use of both linguistic features (headline, written text, collocations and emphatic expressions, use of the passive voice, verbs) and visual features (background, image size, frames, body position, facial expression or colours) present in multimodal texts (combining verbal and non-verbal modes) on immigration. The first study (Martínez Lirola, 2008) includes two texts on immigration published in a local newspaper of the province of Alicante, while the second (Crespo Fernández & Martínez Lirola, 2012) is based on a corpus of eight multimodal texts about immigration as well. We believe that the collected corpora are limited in terms of size and, in this regard, Crespo Fernández and Martínez Lirola (2012: 30) state that:

10
paper corpusSignosTxtLongLines436 - : Luego de la construcción de los corpora siguiendo estos criterios, los investigadores principales revisaron la selección para descartar la aparición de falsos negativos o positivos. Posteriormente a este proceso, se realizaron los ajustes necesarios hasta concluir en los corpora revisados, los cuales se componen de la siguiente forma:

11
paper corpusSignosTxtLongLines436 - : El primer contraste a investigar es el peso relativo del corpus de artículos sobre lectura y escritura en educación superior en relación con la producción total de la revista de cada país. Según se ve en la [42]Tabla 1, los resultados muestran que la incidencia del interés por la lectura y la escritura en educación superior en las revistas investigadas ronda el 8% y oscila entre el 3,8 y el 12,6%, con mayor peso en el corpus colombiano y menor en el corpus brasileño. Al tratarse de revistas no dedicadas exclusivamente a la temática, esta incidencia relativamente baja no es sorprendente. La distribución de los corpora puede también analizarse desde un punto de vista histórico, como se ve en el [43]Gráfico 1 a continuación:

12
paper corpusSignosTxtLongLines436 - : Para analizar las dinámicas de intercambio locales y regionales de los países considerados, es útil dar cuenta del grado relativo de endogamia y exogamia de los corpora, es decir, en qué medida los autores tienen un origen institucional en el mismo país de las revistas en las que publican:

13
paper corpusSignosTxtLongLines436 - : El [46]Gráfico 3 complejiza el panorama previo. Puede apreciarse que el corpus brasileño, a pesar de su endogamia nacional ([47]Gráfico 2), muestra aquí la menor endogamia institucional de todos los corpora: el 80% de los autores no pertenecen a la misma institución que la revista en la que publican ; este dato no es sorprendente ya que constituye un criterio explícito de evaluación de la calidad de las publicaciones científicas en el país. El corpus chileno, por su parte, se ubica muy cerca, con un 78,3% de los autores. En el otro extremo de la escala, algo más de la mitad de los autores que publican en el corpus colombiano pertenecen a la misma institución que la revista en la que publican; Argentina se coloca en una posición intermedia entre Colombia y el resto de los países, con casi uno de cada tres autores de la misma institución que la revista correspondiente.

14
paper corpusSignosTxtLongLines436 - : Los países que integran los corpora se especializan en los tipos de artículos que publican:

15
paper corpusSignosTxtLongLines454 - : Of particular interest is a salutation frequently used in the fora by men. In both corpora by men, we habitually find a salutation generally used in Peninsular Spanish when entering a place physically: Buenas [good] . Here there is ellipsis of the second part of the salutation ‘good morning’ or ‘good evening’, as in Example 7:

16
paper corpusSignosTxtLongLines455 - : The ABWSD was implemented in two versions employing (i) associative memories type max (ABWSD[max]) and (ii) associative memories type min ABWSD[min]). In addition, to have a baseline the simplified-Lesk algorithm was implemented. These three methods were tested over the Senseval-2 and Semcor corpora under the following conditions: 1 ) with and without using stemming pre-processing in order to assess the robustness of both methods with respect to word inflections, 2) using a context window of one sentence and 3) without using an alternative strategy to choose a sense when it is not capable of assigning one.

17
paper corpusSignosTxtLongLines455 - : [135]Table 6 shows that ABWSD[min] is just better than the Gloss-centered algorithm with a 57.28 over 56.45, respectively. The Semcor corpus was used for this comparison. In ^[136]Ramakrishnan et al., (2004) they reported several experimental results under different conditions, but the only result to which the ABWSD could be compared was the one without ‘full content expansion’, without stemming, one-sentence context window, and using the hypernyms instead of the gloss description. It is noteworthy that, due to the Gloss-centered uses a most frequent sense strategy for those cases when it is not able to provide an answer. The ABWSD was adjusted to use the same strategy. However, this adjustment is only for comparison purposes, since if a system uses “sense frequency information that is only obtainable from sense-annotated corpora, it is essentially a supervised system” (^[137]Wang & Hirst, 2014: 534 ).

18
paper corpusSignosTxtLongLines459 - : El Análisis de Errores, basado en los procedimientos del Corpus de aprendices (CLC, del inglés Computer Learner Corpora) y en el Análisis de Errores asistido por Computador (CEA, del inglés Computer aided Error Analysis) en lo que se refiere a Corpora de Aprendientes de ELE en Formato Electrónico, ha evidenciado que los errores de mayor frecuencia y recurrencia corresponden a los errores ortográficos (^[31]Ferreira, 2014a ; ^[32]Ferreira, Elejalde & Vine, 2014). Los estudios se han sustentado en el corpus CAELE (^[33]Ferreira, 2015) constituido por una colección de 418 textos de aprendientes de ELE, almacenados y procesados en formato digital. Estos textos han sido recolectados durante intervenciones lingüísticas entre los años 2014 y 2015 con el objeto de describir la interlengua de los aprendices e identificar los errores lingüísticos más frecuentes y recurrentes según el nivel de competencia (proficiency, en inglés, es decir la capacidad que una persona demuestra en el uso de una lengua

19
paper corpusSignosTxtLongLines474 - : Below ([43]Table 4) are some of the data obtained from the questionnaire and from the two corpora: Corpus 1 (before the intervention ) and corpus 2 (after the intervention). A considerable improvement can be observed after the didactic intervention (which confirms our hypothesis 4): The number of students who identified themselves increased (from 76.7% to 96.7%), as did those who greeted with the formula Estimado ‘Dear’ (from 13.33% to 23.3%).

20
paper corpusSignosTxtLongLines515 - : The study presents an analysis of the concordant and non-concordant usage of the existential verb haber (there is/are) in two corpora of language learners: CAES and CORANE . The data is compared with that obtained from a previous study on the pluralization of haber by native Spanish speakers based on CORPES. The purposes are to know how learners experience a phenomenon in variation, and to contribute to the systematization of content regarding standards, usage and geolectal variation in SFL/SSL, so we also propose a way of dealing with the verb haber, aimed at SFL/SSL professionals. The results show that concordant usage among learners is minority compared to non-concordant use, although it is high compared to its use among native Spanish speakers.

21
paper corpusSignosTxtLongLines539 - : Corpas Pastor, G. & Seghiri, M. (2009). Virtual corpora as documentation resources: Translating travel insurance documents (English-Spanish ). En A. Beeby, P. Rodríguez Inés & P. Sánchez-Gijón (Eds.),Corpus Use and Translating (pp. 75-107). Ámsterdam/Philadelphia: John Benjamins. [ [119]Links ]

22
paper corpusSignosTxtLongLines563 - : In Chilean Spanish, in addition to its use as a noun, onda also fulfills functions of a discourse particle. It has been determined that this element can act as an explanatory reformulator, concretion operator, operator with a continuous or approximative value and introducer of direct speech (San Martín, Rojas & Guerrero, 2016). The aims of this study are, first, to reconsider and deepen this categorization of functions and, second, to determine whether there are uses of onda that can be related to a pragmatic mitigating value, based on the hypothesis that this value could arise from its uses as an approximator and explanatory reformulator. To achieve these aims, we have worked with two corpora of analysis: an oral one (24 sociolinguistic interviews collected in Proyecto Fondecyt 11110211 ) and a written one (Corpus del español, subcorpus Web/Dialects of Chilean Spanish). The main results indicate that onda, as a discourse particle, can be presented in the discourse fulfilling the functions

23
paper corpusSignosTxtLongLines582 - : En cuanto al proceso, este resulta el recurso menos usado en el corpus P-R, mientras que en el corpus En se acerca al uso de la cláusula proyectada. De la misma manera, el grupo nominal es la realización menos frecuente en el corpus En, pero el corpus P-R sigue de cerca al adjunto. Entonces, las diferencias principales entre los dos corpora conciernen básicamente dos categorías: el proceso y el grupo nominal .

24
paper corpusSignosTxtLongLines599 - : The corpora were uploaded to the METOOL online tool ([102]http://metool .idm.upv.es/), designed at the Research Institute for Information and Language Processing at the University of Wolverhampton (UK) with the aim of identifying and tagging rhetorical devices in discourse . The three corpora were tagged with METOOL for metadiscourse devices by a group of annotators using a pre-established list of such devices compiled for this purpose and based on ^[103]Hyland (2005) and ^[104]Mur-Dueñas (2011). The working definition for boosters used by the annotators was the one by ^[105]Mur-Dueñas (2011), emphasising the fact that they are devices that focus on transmitting certainty and conventions and could be the indication of pragmatic conventions in specific academic writing.

25
paper corpusSignosTxtLongLines599 - : A similar number of verb boosters was used in each corpus: 16 in Engineering, 14 in Medicine and 15 in Linguistics (see [117]Table 5). Fourteen of the verbs identified were overlapping items in the three corpora: ‘show’, ‘determine’, ‘demonstrate’, ‘prove’, ‘hold’, ‘stress’, ‘establish’, ‘highlight’, ‘conclude’, ‘reveal’, ‘confirm’, ‘know’, ‘emphasise’ and ‘underscore’ . It can be argued, therefore, that these verbs tend to perform boosting functions regardless of the field, at least as far as Engineering, Medicine and Linguistics are concerned. Only one verb, ‘indicate’ was found in Engineering and Linguistics, but not in Medicine, and ‘assert’ was used exclusively as a booster in Engineering. In this sense, the variations found for the three fields are notably small.

26
paper corpusSignosTxtLongLines599 - : Another significant finding is the three most frequent verb boosters, which were found to be the same in the three corpora: ‘show’, ‘determine’ and ‘demonstrate’ . This pattern is in line with the previous finding of the high number of overlapping verb boosters in the three corpora. In addition, if a mean frequency of verb boosters is calculated for each corpus , the following values are given: 0.090 for Engineering, 0.061 for Medicine and 0.101 for Linguistics. This was used to identify the verb boosters with a significant normalised frequency, that is, a frequency above the mean value (highlighted in bold in [118]Table 4). There are five verbs like that in the Engineering corpus (‘show’, ‘determine’, ‘demonstrate’, ‘prove’ and ‘hold’) and four verbs in the Medicine and Linguistics corpora (‘show’, ‘determine’, ‘demonstrate’ and ‘establish’). As can be seen, a few different verbs appear on these two lists: ‘prove’ and ‘hold’ in Engineering and ‘establ

Evaluando al candidato corpora:


1) corpus: 31 (*)
2) verb: 8 (*)
3) análisis: 7
6) boosters: 6
7) verbs: 6 (*)
8) discourse: 6 (*)
10) errores: 6
11) abwsd: 6
12) engineering: 6
13) autores: 5
14) foco: 5 (*)
15) medicine: 5
16) publican: 5

corpora
Lengua: spa
Frec: 224
Docs: 90
Nombre propio: 1 / 224 = 0%
Coocurrencias con glosario: 5
Puntaje: 5.872 = (5 + (1+6.68650052718322) / (1+7.81378119121704)));
Candidato aceptado

Referencias bibliográficas encontradas sobre cada término

(Que existan referencias dedicadas a un término es también indicio de terminologicidad.)
corpora
: Aijmer, K. (Ed.) (2009). Corpora and language teaching. Ámsterdam: John Benjamins.
: Baker, P. (1997). Using corpora in discourse analysis. Londres: British Library Cataloguing in Publication Data.
: Baker, P. (2006). Using corpora in Discourse Analysis. London and New York: Continuum.
: Behrens, H. (2008). Corpora in language acquisition research. Ámsterdam: John Benjamins.
: Biber, D. & Conrad, S. (1999). Lexical bundles in conversation and academic prose. En H. Hasselgard & S. Oksefjell (Eds.), Out of corpora: Studies in honor of Stig Johansson (pp. 181–189). Amsterdam: Rodopi.
: Biber, D. & Tracy-Ventura, N. (2007). Dimensions of register variation in Spanish. En G. Parodi (Ed.), Working with Spanish corpora (en prensa). London: Continuum.
: Biber, D. (1993). Using register-diversified corpora for general language studies. Computational Linguistics, 19, 243-258.
: Biber, D. (1994). Using register-diversified corpora for general language studies. En S. Armstrong (Ed.), Using large corpora (pp. 180-201). Cambridge, Massachusetts: MIT Press.
: Biber, D., Davies, M., Jones, J. K. & Tracy-Ventura, N. (2008). Spoken and written register variation in Spanish: A multi-dimensional analysis. Corpora, 1(1), 1-37. [195]https://doi.org/10.3366/cor.2006.1.1.1
: Bowker, L. & Pearson, J. (2002). Working with specialized language. A practical guide to using corpora. London: Routledge.
: Bravo, D. (2005). Categorías, tipologías y aplicaciones: hacia una redefinición de la cortesía comunicativa. En D. Bravo (Ed.), Estudios de la (des)cortesía en español. Categorías conceptuales y aplicaciones a corpora orales y escritos. (pp. 21-52). Buenos Aires: Dunken.
: C-ORAL-ROM = Cresti, E. & Moneglia, M. (Eds.) (2005). C-ORAL-ROM: Integrated reference corpora for spoken Romance languages. Multimedia edition; tools of analysis; standard linguistic measures for validation in HTL. CD-ROM. Ámsterdam/Filadelfia: Jhon Benjamins.
: Church, K., & Mercer, R. (1993). Introduction to the special issue on computational linguistics. Using large corpora. Computational Linguistics, 9(1), 124.
: Corpas Pastor, G. & Seghiri, M. (2007a). Specialized corpora for translators: A quantitative method to determine representativeness. Translation Journal, 11(3) [en línea]. Disponible en: [116]http://translationjournal.net/journal/41corpus.htm
: Coulthard, M. (1994). On the use of corpora in the analysis of forensic texts. Forensic Linguistics. The International Journal of Speech Language and the Law, 1(1), 27-43.
: Dipper, S., Götze, M. & Skopeteas, S. (2007). Information Structure in Cross-Linguistic Corpora: Annotation Guidelines for Phonolog y, Morpholog y, Syntax, Semantics and Information Structure. ISIS Working Papers of the SFB Universitätsverlag Potsdam.
: Díaz-Negrillo, A. & Domínguez, J. F. (2006). Error tagging systems for learner corpora. Revista Española de Lingüística Aplicada, 19, 83-102.
: Ferré, G. (2010). Timing relationships between speech and co-verbal gestures in spontaneous French. En Proceedings of Language Resources and Evaluation, Workshop on Multimodal Corpora, pp. 86-91.
: Flowerdew, L. (2004). The argument for using English specialized corpora to understand academic and professional language. En U. Connor & T. Upton (Eds.), Discourse in the professions. Perspectives from corpus linguistics (pp. 11-33). Amsterdam: Benjamins.
: Granger, S. (2002). A bird’s-eye view of learner corpus research. En S. Granger, J. Hungand & S. Petch-Tyson (Eds.), Computer learner corpora, second language acquisition and foreign language teaching (pp. 3-33). Philadelphia: John Benjamins.
: Granger, S. (2003). Error-tagged Learner Corpora and CALL: A promising synergy. CALICO Journal, 20(3), 465-480.
: Granger, S. (2009). The contribution of learner corpora to second language acquisition and foreign language teaching. En K. Aijmer (Ed.), Corpora and Language Teaching (pp. 33-13). Philadelphia: John Benjamins.
: Gries, S. T. (2008). Dispersions and adjusted frequencies in corpora. International Journal of Corpus Linguistics, 13(4), 403-437.
: Hearts, M. (1992). Automatic acquisition of hyponyms from large text corpora. En Proceedings of Conference COLING. Nantes: Association for Computational Linguistics.
: Hunston, S. (2002). Corpora in Applied Linguistics. Cambridge: Cambridge University Press.
: Ide, N., Erjavec, T. & Tufis, D. (2001). Automatic sense tagging using parallel corpora. In Proceedings of the Sixth Natural Language Processing Pacific Rim Symposium -NLPRS (pp. 83-90).
: Johansson, S. (2007). The English Verb Seem and Its Correspondences in Norwegian. What Seems to Be the Problem? En S. Johansson (Ed.), Seeing Through Multilingual Corpora: on the Use of Corpora in Contrastive Studies (pp. 117-138). Ámsterdam: John Benjamins.
: Kim, J. & Moldovan, D. (1993). Acquisition of semantic patterns for Information Extraction from Corpora. Proceedings of the 9^th IEEE Conference on AI for Applications, 171-176.
: Leech, G. (1992). Corpora and theories of linguistic performance. En J. Svartvik (Ed.), Trends in Linguistics Studies and Monographs Directions in Corpus Linguistics (pp.105-122). Nueva York: Mouton de Gruyter.
: Leech, G., McEnery, A. M. & Wynne, M. (1997). Further levels of annotation. En R. Garside, G. Leech & A. McEnery (Eds.), Corpus Annotation: Linguistic Information from Computer Text Corpora (pp. 85-101). Londres: Longman.
: Lorés-Sanz, R. (2011a). The study of authorial voice: Using a Spanish-English corpus to explore linguistic transference. Corpora 6(1), 1-24.
: McGee, I. D. (2006). Lexical Intuitions and Collocation Patterns in Corpora. Cardiff: Cardiff University.
: Moreno, A. (2008). The importance of comparable corpora in cross-cultural studies. En U. Connor, E. Nagelhout & W. Rozycki (Eds.), Contrastive rhetoric. Reaching to intercultural rhetoric (pp. 25-41). Ámsterdam: John Benjamins .
: Once the corpora had been tagged, they were queried for verb booster tags using the same online tool. In the last stage of this study, the concordances obtained were examined manually in order to analyse the co-text of boosters and evaluate their pragmatic functions.
: Parodi, G. (Ed.) (2007). Working with Spanish corpora. London: Continuum.
: Parodi, G. (Ed.). (2007b). Working with Spanish corpora. London: Continuum (Researchin Corpus and Discourse) Valparaíso: Ediciones Universitarias de Valparaíso.
: Partington, A. & Morley, J. (2002). From frequency to ideology: Investigating word and cluster/bundle frequency in political debate. Ponencia presentada en Teaching & Language Corpora (TALC, 2002) en The University Residential Centre, Bertinoro, Italy.
: Partington, A. (1998). Patterns and Meanings: Using Corpora for English Language Research and Teaching. Amsterdam: John Benjamins.
: Peacock, M. (2006). A cross-disciplinary comparison of boosting in research articles. Corpora, 1(1), 61-84.
: Philip, G. (2010). Metaphorical keyness in specialised corpora. In M. Bondi & M. Scott (Eds.), Keyness in Texts (pp. 185-203). Amsterdam: John Benjamins.
: Pinto, D. (2008). On Clustering and Evaluation of Narrow Domain Short-Text Corpora. Unpublished doctoral dissertation, Universidad Politécnica de Valencia, Valencia, Spain.
: Reppen, R., Fitzmaurice, S. M. & Biber, D. (2002). Using corpora to explore linguistic variation. Á msterdam: John Benjamins.
: Robles Garrote, P (2016). Aportaciones de la Lingüística de Corpus al estudio de la conferencia como género académico de divulgación científica. CHIMERA: Romance Corpora and Linguistic Studies, 3, 1-21.
: Sinclair, J. (2005). Corpus and text-basic principles. En M. Wynne (Ed.), Developing Linguistic Corpora: A Guide to Good Practice (pp. 1-16). Oxford: Oxbow Books.
: Sinclair, J. (Ed.) (2004). How to use corpora in language teaching. Amsterdam: Benjamins.
: Thompson, J. P. & Tribble, C. (2001). Looking at citations: Using corpora in English for Academic Purposes. Language, Learning & Techonology, 5(3), 91-105.
: Tono, Y. (2003). Learner corpora: Design, development and applications. En D. Archer, P. Rayson, A. Wilson & T. McEnery (Eds.), Proceedings of the Corpus Linguistics 2003 Conference (pp. 800-809). Lancaster (UK): University Centre for Computer Corpus Research on Language.
: Venegas, R. (2007). Using Latent Semantic Analysis in a Spanish research article corpus. En G. Parodi (Ed.), Working with Spanish corpora (pp. 195- 216). London: Continuum.
: Williams, G. (2002). In search of representativity in specialised corpora: Categorisation through collocation. International Journal of Corpus Linguistics, 7, 43–64.
: Zannettin, F. (2012). Translation-driven corpora. Corpus resources for descriptive and applied translation studies. Manchester/Kinderhook (NY): St. Jerome Publishing.