Direktor Microsoft AI divizije, Mustafa Suleyman, smatra da je sav sadržaj koji se nalazi na web sajtovima „freeware“, pa stoga može da se koristi za kopiranje i kreiranje novih sadržaja. On je naveo da postoji i druga kategorija sadržaja za koju je eksplicitno navedeno da ne sme da se kopira, indeksira i pretražuje. Sve ostalo, po njegovim rečima, može da se upotrebi za treniranje AI modela.
Ovakav kontroverzan stav podstiče nekoliko pitanja. Prvo je moralne prirode – da li je u redu koristiti nečiji tuđi trud da bi se kreirao novi sadržej? Ako jeste, da li OK profitirati od tuđeg rada? Takođe, kako su vlasnici sadžaja na web-u mogli da eksplicitno zabrane njegovu upotrebu za treniranje AI modela, ako je taj sadržaj nastao pre AI-a? Da li su Microsoft i njegovi partneri, prvenstveno OpenAI, vodili računa da ne koriste sadržaj za koji je eksplicitno navedeno da sme da se upotrebljava i indeksira samo za pretragu?…
Generativni AI je jedna od najvažnijih tehnoloških tema ove godine, naročito način kako se AI modeli treniraju. Postoje mišljenja da treniranje sa podacima koje su kreirali drugi korisnici, bez njihovog znanja i odobrenja, predstavlja jednu vrstu krađe. Potpuno su različite situacije kada kompanija dobije odobrenje da upotrebi neku bazu za tu svrhu, ili kada plati za to. Ali Suleyman smatra da to nije neophodno, već da Microsoft ima pravo da to radi s kojim god podacima poželi bez ikakvog odobrenja – samo zato što se taj sadržaj nalazi na Internetu. Čini nam se da će se sa ovakvim stavom, Microsoft suočiti sa mnogobrojnim tužbama od strane vlasnika sadržaja…
Izvor: Windows Central
Tagovi: AI, besplatna upotreba podataka, krađa podataka, Microsoft, treniranje ai modela