Google Research prikazuje novi način korišćenja veštačke inteligencije za čitanje rukopisa, što bi moglo radikalno da promeni način na koji mašine pretvaraju ono što pišemo na papiru u digitalni tekst.
Ovo bi mogao biti ključni alat za dešifrovanje i prebacivanje rukopisa iz proteklih vekova u digitalnu formu
Sistem pod nazivom InkSight transformiše fotografije rukom pisanih reči u digitalni tekst koristeći veštačku inteligenciju, bez potrebe za dodatnim uređajima.
Ideja je da se zameni ponekad nepouzdano optičko prepoznavanje karaktera (OCR) AI-em koji može da oponaša način na koji ljudi zapravo uče da čitaju, konkretno tako što prepisuje postojeći tekst da bi naučio kako izgledaju i šta znače cele reči. Zbog toga su istraživači obučili AI da prepoznaje i oponaša ljudski rukopis.
“Digitalno vođenje beležaka postaje sve popularnije, jer pruža trajni, lako uređiv i indeksabilan način čuvanja beležaka u vektorskom formatu, poznatom kao digitalni ink,” objašnjavaju istraživači u svom radu. “Ipak, postoji značajan jaz između ovog načina beleženja i tradicionalnog pisanja na papiru, prakse koja je još uvek omiljena kod većine ljudi.” Njihov pristup kombinuje veštine čitanja i pisanja, omogućavajući obuku modela bez velikih količina uparenih primera, koje je teško pribaviti. Koliko je nama poznato, ovo je prvi rad koji efikasno derenderuje rukopisni tekst sa proizvoljnih fotografija sa različitim vizuelnim karakteristikama i pozadinama.”
InkSight je više od alternative OCR-u. Obezbeđuje preciznije rezultate u nepovoljnim uslovima, kao što su fotografije u lošim svetlosnim uslovima, delimično pokriven tekst ili zbunjujuća pozadina, gde OCR često nije pouzdan. Istraživači su otkrili da su ljudi mogli da pročitaju 87% tekstova koje je generisao InkSight. Dve trećine tih tekstova bile su toliko precizne da ljudi nisu mogli da ih razlikuju od stvarnog rukopisa.
Ako volite da pišete rukom, InkSight ima brojne potencijalne prednosti. Zamislite da pišete rukom u papirnoj beležnici, a zatim pokazujete beleške kameri kako bi se odmah pretražile i organizovale u kontekstu sa prethodnim beleškama na fizičkim stranicama. Ako vam je rukopis naročito neuredan, InkSight bi mogao da pomogne da se vaši zapisi pretvore u kucani tekst koji i dalje tačno prikazuje ono što ste napisali.
Na širem planu, ovo bi mogao biti ključni alat za dešifrovanje i prebacivanje rukopisa iz proteklih vekova u digitalnu formu. Čak i kada je tekst na jeziku koji nema veliki digitalni korpus, InkSight bi mogao pomoći u očuvanju rukopisa i obezbeđivanju izvora za obuku na tim jezicima.
Google nije jedini koji razvija AI alate za prepoznavanje rukopisa. Na primer, Amazonov novi Kindle Scribe unapređuje mogućnost e-čitača da pretvara rukom pisane beleške u čitljiv tekst. Takođe, Goodnotes, aplikacija za digitalne beleške, koristi tehnologiju Goodnotes Smart Ink kako bi rukopis pretvorio u kucani tekst i omogućio uređivanje beleški kao da su kucane, uključujući poravnavanje, kopiranje, lepljenje i logičko ređanje teksta.
Izvor: Techradar