W ramach projektu „Cyfrowa infrastruktura badawcza dla humanistyki i nauk o sztuce” (Dariah.lab) prowadzonego przez konsorcjum naukowe DARIAH-PL Zespół Inżynierii Lingwistycznej Instytutu Podstaw Informatyki PAN oraz Instytut Języka Polskiego PAN prowadzą wspólnie prace nad uzupełnieniem danych korpusowych współczesnej polszczyzny. Budujemy Korpus Dekady 2011-2020 oraz lat następnych. Powstały w wyniku poprzednich grantów naukowych Narodowy Korpus Języka Polskiego zawiera teksty do roku 2010. Udostępnienie nowszych danych korpusowych traktujemy jak obowiązek wobec językoznawców, badaczy piśmiennictwa i kultury polskiej, twórców, redaktorów, studentów i uczniów.
(Pisząc: uczniów, studentów itp., mamy na myśli oczywiście także uczennice, studentki i w ogóle kobiety. Także w strukturze korpusu zadbamy o proporcje płci).