Predstavljen projekt Bosanskohercegovački nacionalni korpus – II faza

Predstavljen projekt Bosanskohercegovački nacionalni korpus – II faza

U ponedjeljak, 29. decembra 2025. godine, u Institutu za jezik je predstavljen projekt Bosanskohercegovački nacionalni korpus – II faza. Projekt se u Institutu vodi kao trajni, ali s obzirom na to da je potrebno svake godine obezbijediti sredstva za njegovu realizaciju, to se on provodi po fazama. Prošle godine korpus je zasnovan i uneseno je preko 600.000 novinskih tekstova te se trenutno korpus sastoji od gotovo 250 miliona riječi. Ove godine planiran je unos književnoumjetničkih tekstova, u cilju postizanja žanrovske raznovrsnosti koja doprinosi relevantnosti korpusa. Srazmjerno dobijenim sredstvima, ove se godine očekuje unos 500.000 novih riječi. Važno je napomenuti da će se metapodaci o tekstovima unositi tako da će biti moguće pretraživati samo određene vrste tekstova, bilo po žanru, godini izlaženja, autoru ili sl. Korpus se može koristiti tako što se od Instituta zatraži pristup, zbog toga što je svrha korpusa isključivo naučnoistraživačka. Voditeljica druge faze projekta je dr. sc. Zenaida Karavdić, koja je i predstavila projekt, stalni saradnik je prof. dr. Vedad Smailagić s Filozofskog fakulteta u Sarajevu, koji je i pokrenuo projekt prošle godine, a kao povremeni saradnici angažovani su studenti koji obrađuju tekstove i šalju ih na Univerzitet u Heidelbergu, koji nam pruža usluge održavanja korpusa. Prilikom prezentacije date su informacije o elektronskim korpusima općenito, zatim o postojećim korpusima za bosanski jezik, predstavljena su dosadašnja istraživanja i ciljevi i plan rada za ovu godinu, metodologija te članovi tima, a zatim su praktično prikazani primjeri pretraživanja korpusa. Ove godine projekt finansira Federalno ministarstvo obrazovanja i nauke, na čemu im se iskreno zahvaljujemo.