Az írott szöveg felismerését egy mesterséges intelligencián alapuló algoritmus végzi, amelyet először be kellett tanítani, hogy a különböző kézírásokat felismerje. Ehhez a központ szakemberei Kiss József, a Hét című hetilap szerkesztőjének szakmai és személyes levelezését (kézírását) használták. A programban felhasznált kéziratok a Petőfi Irodalmi Múzeumban (PIM) találhatók, a tanulásra felhasznált szavak száma körülbelül 75 ezer. Közel 300 levél, borítékok, és egyéb – eredeti kézírást tartalmazó – anyagok kerültek feltöltésre a programba. A feltöltött dokumentumok megtekinthetők itt.
Az alkalmazás a feltöltött minták alapján épített fel egy modellt, amellyel képes arra, hogy egy általa ismeretlen, még nem látott kézírásképet is értelmezzen. A program jelenleg 90%-os pontossággal működik, de ez változni fog, hiszen minél többféle anyagon tanul, minél több anyag kerül feltöltésre az adatbázisába, annál jobban fog teljesíteni a különböző szövegeken.
Részletesebb leírást a programról itt találhat.
Ha szeretné kipróbálni a Transkribus programot, azt itt teheti meg.