Inne korpusy i technologia językowa
Duży, dobrze zrównoważony i różnorodny, powszechnie dostępny korpus to dziś wizytówka języka, a także kultury kraju czy narodu. Takie korpusy często nazywają się narodowe, tak jak biblioteki, teatry czy muzea narodowe, co ma podkreślać ich ważną rolę dla kultury danego kraju. Swoje korpusy referencyjne mają wszystkie języki europejskie. Polszczyzna ma niestety korpus nieaktualny. Poniżej zamieszczamy odnośniki do najważniejeszych korpusów i programów technologii językowej. Wiele z nich powstało w ramach europejskiego konsorcjum CLARIN „Common Language Resources and Technology Infrastructure”:
- Narodowy Korpus Języka Polskiego – podstawowy do dziś korpus referencyjny polszczyzny, zawiera teksty tylko do roku 2011
- Korpus monitorujący MoncoPL
- Korpus Polsko-Angielski Paralela
- Korpus Polsko-Niemiecki i Niemiecko-Polski UW i JGU
- Korpus Polsko-Rosyjski UW
- Korpus polszczyny XVII i I polowy XVIII wieku Korba
- British National Corpus
- Český Narodní Korpus
- Korpus Das deutsche Wortschatz
- Nacijonal’nyj korpus russkogo jazyka
- Korpus równoległy Intecorp w ramach Czeskiego Korpusu Narodowego z dużym udziałem tekstów polskich
- ChronoPress – korpus prasy lat 1945-1965