
Na Filozofskom fakultetu Sveučilišta u Mostaru, u sklopu projekta AKIDSUZG (Akademski život i kulturno-identitetski dosezi Sveučilišta u Zagrebu 1874.–1918.), financiranog iz programa Next Generation EU, održano je pozvano predavanje uglednog znanstvenika prof. dr. sc. Damira Borasa, rektora emeritusa i profesora emeritusa Sveučilišta u Zagrebu te vice-dekana Klase i Europske akademije znanosti i umjetnosti u Salzburgu.
Predavanje pod nazivom „Dosezi umjetne inteligencije u obradi starije hrvatske rječničke baštine – s osvrtom na prepoznavanje osobnih imena, prezimena i toponima“, održano je u petak, 29. svibnja 2026. godine.
Profesor Boras predstavio je rezultate istraživanja u kojemu se uspoređivala učinkovitost i potpunost ručne obrade s obradom uz pomoć umjetne inteligencije, na primjeru digitaliziranog drugog sveska Rječnika hrvatskoga ili srpskoga jezika Hrvatske akademije znanosti i umjetnosti (1884.–1886.), koji obuhvaća natuknice od „Četa” do „Đavlji”. Rječnik je monumentalno djelo u 23 sveska (ukupno 21.684 stranice), na kojemu se radilo gotovo 110 godina (1867.–1976.).
U istraživanju je identificirano oko 90.000 leksičkih jedinica pisanih velikim slovom, od čega je oko 40.000 mogućih podudaranja s imenima i prezimenima. Za automatiziranu obradu korišten je Microsoft Copilot, a rezultati su uspoređeni s ručnom analizom potpomognutom višedesetljetno razvijanim lingvističkim alatima i bazama podataka — uključujući Rječničku bazu hrvatskoga književnog jezika (57.789 riječi, 1,3 milijuna oblika) te Leksičku flektivnu bazu hrvatskih osobnih imena i prezimena (s više od 97.000 unosa).
Ključni rezultati pokazuju da je točnost prepoznavanja uz pomoć umjetne inteligencije procijenjena na oko 85%, uz znatno kraće vrijeme obrade (oko 150 minuta, naspram pet radnih dana ručne provjere). Umjetna inteligencija pokazala se posebno učinkovitom u prepoznavanju standardiziranih oblika, dok su arhaični, dijalektalni i morfološki nepravilni oblici i dalje zahtijevali stručnu ljudsku provjeru. Identificirana su 1.081 različita toponim, a prepoznata su i rijetka povijesna mjesta poput Dunaja (arhaično za Dunav), Stambola (Istanbul) i Vrhbosne (srednjovjekovni naziv za Sarajevo).
Profesor Boras je naglasio da je kombinacija automatiziranih metoda i stručne lingvističke prosudbe najpouzdaniji pristup u obradi povijesnih jezičnih korpusa te da ovakva istraživanja otvaraju nove mogućnosti za digitalnu humanistiku i povijesnu lingvistiku.