Root NationJaunumiIT laikrakstsTāpat kā filmās: Google jaunā fotoattēlu apstrādes AI padara to mērogošanu un uzlabošanu par realitāti

Tāpat kā filmās: Google jaunā fotoattēlu apstrādes AI padara to mērogošanu un uzlabošanu par realitāti

-

Droši vien esi redzējis fantāzijas filmas vai TV šovus, kur galvenais varonis lūdz palielināt attēlu un uzlabot rezultātu – parādīt seju, vai numurzīmi, vai kādu citu būtisku detaļu. Google jaunākās mākslīgā intelekta (AI) sistēmas, kuru pamatā ir t.s difūzijas modeļi, spēj izpildīt šo triku.

Tas ir sarežģīts process, kas jāapgūst, jo būtībā tiek pievienotas detaļas attēlam, ko kamera sākotnēji neuztvēra, izmantojot īpaši gudrus minējumus, kuru pamatā ir citi līdzīgi attēli.

google

Uzņēmums Google šo paņēmienu sauc par dabisko attēla sintēzi un šajā konkrētajā scenārijā par īpaši augstu attēla izšķirtspēju. Jūs sākat ar mazu, pikseļu fotoattēlu un beidzat ar kaut ko asu, skaidru un dabisku. Tas var nebūt oriģināls, taču tas ir pietiekami tuvu, lai cilvēka acīs izskatītos īsts.

Google ir ieviesusi divus jaunus AI rīkus šim darbam. Pirmo sauc par SR3 jeb Super-Resolution, izmantojot atkārtotu precizēšanu, un tas darbojas, pievienojot attēlam troksni un pēc tam to noņemot. Izmantojot virkni varbūtības aprēķinu, kuru pamatā ir liela attēlu datubāze un dažas mašīnmācīšanās iespējas, SR3 var iedomāties, kā izskatās īpaši augstas izšķirtspējas zemas izšķirtspējas pikseļu attēla versija.

Otrs rīks ir CDM jeb kaskādes difūzijas modeļi. Google tos apraksta kā "cauruļvadus", pa kuriem difūzijas modeļus, tostarp SR3, var novirzīt augstas kvalitātes attēla palielināšanai. Tas ņem uzlabojumu modeļus un padara tos lielākos attēlos.

google

Izmantojot dažādus uzlabošanas modeļus dažādās izšķirtspējās, CDM pieeja spēj pārspēt alternatīvas attēla palielināšanas metodes, norāda Google. Jaunais AI dzinējs tika pārbaudīts ImageNet, milzīgā apmācību attēlu datu bāzē, ko parasti izmanto vizuālo objektu atpazīšanas pētījumos.

SR3 un CDM gala rezultāti ir iespaidīgi. Standarta testā, kurā piedalījās 50 brīvprātīgie, SR3 ģenerētie cilvēku seju attēli aptuveni 50% gadījumu tika sajaukti ar īstām fotogrāfijām, un, ņemot vērā, ka ideālajam algoritmam vajadzētu sasniegt 50%, tas ir iespaidīgi. Ir vērts atkārtot, ka šie uzlabotie attēli precīzi neatbilst oriģināliem, tie ir rūpīgi aprēķinātas simulācijas, kuru pamatā ir varbūtības matemātika.

google

Google sola daudz vairāk no saviem jaunajiem AI dzinējiem un saistītajām tehnoloģijām – ne tikai seju un citu dabas objektu attēlu palielināšanas ziņā, bet arī citās varbūtības modelēšanas jomās.

Lasi arī:

Pierakstīties
Paziņot par
viesis

0 komentāri
Iegultās atsauksmes
Skatīt visus komentārus