
Lingüística de corpus y Procesamiento del Lenguaje Natural
- Listado de corpus lingüísticos de español e inglés.
- Revista CHIMERA: Lingüística de corpus en lenguas romances.
- Introducción al trabajo con corpus (del libro Introducción al análisis de estructuras lingüísticas en corpus : aproximación semántica).
- Recursos para cursos
- Corpus de Shakespeare (zip)
- Corpus de Galdós (zip)
- Corpus de Inaugural Addresses (zip)
- Corpus de Cervantes (zip)
- Stop List Español (txt)
- Stop list de inglés (txt)
- Página de Stanford con enlaces de interés
- Herramientas para CL
- Masaryk University’s NLP Centre
- Bibliografía básica recopilada por Heather Froehlich
- Bibliografía básica sobre lingüística de corpus
- Alcántara Plá, M. (2007). Introducción al análisis de estructuras lingüísticas en corpus : aproximación semántica, Ediciones UAM, Madrid (ISBN 978-84-8344-069-8).
- Baker, P., Hardie, A., & McEnery, T. (2006). A glossary of corpus linguistics. Edinburgh: Edinburgh University Press.
- Biber, Douglas; Conrad, Susan; Reppen, Randi (1998). Corpus Linguistics. Investigating Language Structure and Use. Cambridge: CUP.
- Bird, S., E. Klein, E. Loper. (2009). Natural Language Processing with Python. O’Reilly.
- Fillmore, Charles (1992). “‟Corpus-linguistics‟ vs. „computer-aided armchair linguistics‟”. In Jan Svartvik, ed., Directions in Corpus Linguistics. Berlin: de Gruyter, 35-60.
- Gries, S. T. (2009). Quantitative corpus linguistics with R. A practical introduction. Oxford: Routledge.
- Halliday, M.A.K. (1991). “Corpus studies and probabilistic grammar.” In Karin Aijmer & Bengt Altenberg, eds., English Corpus Linguistics. London: Longman, 30-43.
- Halliday, M.A.K. (1992). “Language as system and language as instance: the corpus as a theoretical construct.” In Jan Svartvik, ed., Directions in Corpus Linguistics. Berlin: de Gruyter, 61-77.
- Jurafsky, D. & M. James (2008). Speech and Language Processing. Prentice Hall (Online draft of the 3d edition)
- Kennedy, Graeme (1998). An Introduction to Corpus Linguistics. London & New York: Longman.
- Lüdeling, A., & Kytö, M. (Eds). (2008). Corpus Linguistics. An International Handbook (Volumes 1&2). Berlin – New York: Mouton de Gruyer.
- Manning, Ch. (1999). Foundations of Statistical Natural Language Processing. MIT Press.
- McEnery, Tony; Wilson, Andrew (2001). Corpus Linguistics. Edinburgh: EUP.
- McEnery, T., & Hardie, A. (2011). Corpus linguistics: Method, theory and practice. Cambridge: Cambridge University Press.
- Meyer, Charles F. (2002). English Corpus Linguistics. An Introduction. Cambridge: CUP.
- Oakes, Michael P. (1998). Statistics for Corpus Linguistics. Edinburgh: EUP.
- O’Keeffe, A., & McCarthy, M. (2010). The Routledge handbook of corpus linguistics. Oxford: Routledge.
- Parodi, G. (2008). Lingüística de corpus: Una introducción al ámbito. Revista de Lingüística Teórica y Aplicada, 46(1), 93-119.
- Partington, Alan (1998). Patterns and Meanings. Using Corpora for Language Research and Teaching. Amsterdam: Benjamins.
- Rojo, G. (2008). Lingüística de corpus y lingüística del español. In XV Congreso de la ALFAL (Asociación de Lingüística y Filología de América Latina). Montevideo, Uruguay, 18-21 de agosto de 2009.
- Sinclair, John (1991). Corpus, Concordance, Collocation. Oxford: OUP.
- Tognini-Bonelli, Elena (2001). Corpus Linguistics at Work. Amsterdam: Benjamins.
- Walsh, M. Introduction to Cultural Analytics & Python
- Wynne, M. (Ed.). (2005). Developing linguistic corpora: A guide to good practice. Oxford: Oxbow Books.
- Revistas especializadas en lingüística de corpus
- Corpus Linguistics and Linguistic Theory (2005- ). Berlin – New York: Mouton De Gruyter.
- CHIMERA: Internation Journal of Romance Corpora and Linguistic Studies. (2014-). Madrid: UAM ediciones.
- International Journal of Corpus Linguistics (1996- ). Amsterdam: John Benjamins.
- Language Resources and Evaluation (2005- ). Dordrecht: Springer
- Revistas especializadas de lingüística computacional
- Asociaciones
- Listas de correo
- Aplicaciones y programación de PLN/Corpus
- NLTK-Toolkit
- R y RStudio
- XML Copy Editor: Editor de XML
- Open Refine
- Morpho
- DMP-Tool
- Antconc: Concordancias y listas de frecuencias
- FOMA: Gramáticas de estados finitos
- MALLET: a Java-based package for statistical natural language processing, document classification, clustering, topic modeling, information extraction, and other machine learning applications to text.
- Creación de corpus y etiquetado
- BootCaT: Recopilación de páginas de Internet
- WebCorp: Recopilación de páginas de Internet
- UAM Corpus Tool: Etiquetado de corpus
- ELAN: Etiquetado y alineamiento de corpus orales/multimodales
- Online Regex Tester: Para probar expresiones regulares
- Para programar online
- Google CoLaboratory (Python online)
- Kaggle (Machine Learning Online)
- Formación para uso de herramientas
No estamos solos, sabemos lo que queremos…
- R Ladies: Una organización mundial comprometida con aumentar la diversidad entre el colectivo programador. Lo hacen con R y, en el caso de Madrid, con una visión muy lingüística.
- Lingwärs: Grupo de aprendizaje de Procesamiento de Lenguaje Natural. En este caso, se centran más en NLTK y Python. Están en el Medialab Prado.