Kratak odgovor: Umjetna inteligencija nadograđuje model tako da ga trenira na uparenim slikama niske i visoke rezolucije, a zatim ga koristi za predviđanje uvjerljivih dodatnih piksela tijekom nadogradnje. Ako je model vidio slične teksture ili lica tijekom treniranja, može dodati uvjerljive detalje; ako ne, može "halucinirati" artefakte poput aureola, voštane kože ili treperenja u videu.
Ključne zaključke:
Predviđanje : Model generira uvjerljive detalje, a ne zajamčenu rekonstrukciju stvarnosti.
Izbor modela : CNN-ovi su obično stabilniji; GAN-ovi mogu izgledati oštrije, ali riskiraju izmišljanje značajki.
Provjera artefakata : Pazite na aureole, ponavljajuće teksture, „gotovo slova“ i plastična lica.
Stabilnost videa : Koristite vremenske metode ili ćete vidjeti treperenje i pomicanje od kadra do kadra.
Korištenje s visokim ulozima : Ako je točnost važna, otkrijte obradu i tretirajte rezultate kao ilustrativne.

Vjerojatno ste to već vidjeli: sitna, hrskava slika pretvara se u nešto dovoljno oštro za ispis, streaming ili ubacivanje u prezentaciju bez trzaja. Osjeća se kao varanje. I - na najbolji način - nekako i jest 😅
Dakle, kako funkcionira AI Upscaling svodi se na nešto specifičnije od „računalo poboljšava detalje“ (valovita ruka) i bliže je „modelu koji predviđa vjerojatnu strukturu visoke rezolucije na temelju obrazaca koje je naučio iz mnogo primjera“ ( Duboko učenje za superrezoluciju slike: Istraživanje ). Taj korak predviđanja je cijela igra - i zato AI upscaling može izgledati zapanjujuće... ili malo plastično... ili kao da je vašoj mački naraslo nekoliko dodatnih brkova.
Članci koje biste možda željeli pročitati nakon ovog:
🔗 Kako umjetna inteligencija funkcionira
Naučite osnove modela, podataka i zaključivanja u umjetnoj inteligenciji.
🔗 Kako umjetna inteligencija uči
Pogledajte kako podaci o obuci i povratne informacije poboljšavaju performanse modela tijekom vremena.
🔗 Kako umjetna inteligencija otkriva anomalije
Razumjeti osnovne uzorke i kako umjetna inteligencija brzo označava neobično ponašanje.
🔗 Kako umjetna inteligencija predviđa trendove
Istražite metode predviđanja koje uočavaju signale i predviđaju buduću potražnju.
Kako funkcionira nadogradnja umjetne inteligencije: osnovna ideja, svakodnevnim riječima 🧩
Povećanje razlučivosti znači povećanje rezolucije: više piksela, veća slika. Tradicionalno povećanje razlučivosti (poput bikubičnog) u osnovi rasteže piksele i izglađuje prijelaze ( bikubična interpolacija ). U redu je, ali ne može izmisliti nove detalje - samo interpolira.
Umjetna inteligencija pokušava nešto smjelije (tj. "superrezoluciju" u svijetu istraživanja) ( Duboko učenje za superrezoluciju slika: Istraživanje ):
-
Gleda ulaz niske rezolucije
-
Prepoznaje uzorke (rubove, teksture, crte lica, poteze teksta, tkanje tkanine…)
-
bi trebala izgledati verzija veće rezolucije
-
Generira dodatne podatke piksela koji odgovaraju tim uzorcima
Ne „savršeno vratiti stvarnost“, već više „napraviti vrlo uvjerljivu pretpostavku“ ( Slika superrezolucije korištenjem dubokih konvolucijskih mreža (SRCNN) ). Ako vam to zvuči pomalo sumnjivo, niste u krivu - ali to je i razlog zašto tako dobro funkcionira 😄
I da, to znači da je povećanje skale pomoću umjetne inteligencije u osnovi kontrolirana halucinacija... ali na produktivan način koji poštuje piksele.
Što čini dobru verziju AI nadogradnje? ✅🛠️
Ako ocjenjujete AI nadogradnju skale (ili unaprijed postavljenu postavku), evo što je obično najvažnije:
-
Obnavljanje detalja bez prekuhavanja.
Dobro skaliranje dodaje hrskavost i strukturu, a ne hrskavi šum ili lažne pore. -
Disciplina na rubovima
Čiste linije ostaju čiste. Loši modeli uzrokuju klimanje rubova ili stvaranje aureola. -
Realizam teksture
Kosa ne bi trebala postati potez kistom. Cigla ne bi trebala postati pečat s ponavljajućim uzorkom. -
Rukovanje šumom i kompresijom
Mnoge svakodnevne slike su JPEG formatirane do krajnjih granica. Dobar upscaler ne pojačava tu štetu ( Real-ESRGAN ). -
Svijest o licu i tekstu
Lica i tekst su najlakša mjesta za uočavanje grešaka. Dobri modeli s njima postupaju nježno (ili imaju specijalizirane načine rada). -
Konzistentnost u svim kadrovima (za video)
Ako detalji trepere iz kadra u kadar, oči će vam vrištati. Povećanje rezolucije videa živi ili umire ovisno o vremenskoj stabilnosti ( BasicVSR (CVPR 2021) ). -
Kontrole koje imaju smisla
Želite klizače koji odgovaraju stvarnim rezultatima: uklanjanje šuma, deblur, uklanjanje artefakata, zadržavanje zrnatosti, izoštravanje… praktične stvari.
Tiho pravilo koje vrijedi: "najbolje" povećanje rezolucije često je ono koje jedva primijetite. Izgleda kao da ste od početka imali bolju kameru 📷✨
Tablica usporedbe: popularne opcije skaliranja umjetne inteligencije (i za što su dobre) 📊🙂
U nastavku slijedi praktična usporedba. Cijene su namjerno nejasne jer se alati razlikuju ovisno o licenci, paketima, računalnim troškovima i svim tim zabavnim stvarima.
| Alat / Pristup | Najbolje za | Cijena | Zašto funkcionira (otprilike) |
|---|---|---|---|
| Topazovi uređaji za nadogradnju slike za stolna računala ( Topaz Photo , Topaz Video ) | Fotografije, videozapisi, jednostavan tijek rada | Plaćeno | Snažni opći modeli + puno podešavanja, uglavnom "samo rade".. |
| Značajke tipa Adobe “Super Resolution” ( Adobe Enhance > Super Resolution ) | Fotografi koji su već u tom ekosustavu | Pretplata | Detaljna rekonstrukcija, obično konzervativna (manje dramatična) |
| Real-ESRGAN / ESRGAN varijante ( Real-ESRGAN , ESRGAN ) | Uradi sam, programeri, serijski poslovi | Besplatno (ali vremenski skupo) | Odlično za detalje teksture, može biti ljuto na licima ako niste oprezni |
| Načini skaliranja temeljeni na difuziji ( SR3 ) | Kreativni rad, stilizirani rezultati | Mješovito | Može stvoriti prekrasne detalje - također može izmisliti gluposti, tako da... da |
| Poboljšivači kvalitete igara (u stilu DLSS/FSR) ( NVIDIA DLSS , AMD FSR 2 ) | Igranje i renderiranje u stvarnom vremenu | U paketu | Koristi podatke o kretanju i naučene prethodne vrijednosti - glatka pobjeda u performansama 🕹️ |
| Usluge nadogradnje u oblaku | Praktičnost, brze pobjede | Plaćanje po korištenju | Brzo + skalabilno, ali žrtvujete kontrolu, a ponekad i suptilnost |
| AI nadogradnje usmjerene na video ( BasicVSR , Topaz Video ) | Stari snimci, anime, arhiva | Plaćeno | Vremenski trikovi za smanjenje treperenja + specijalizirani video modeli |
| Povećanje rezolucije za "pametni" telefon/galeriju | Ležerna upotreba | Uključeno | Lagani modeli podešeni za ugodan rezultat, a ne za savršenstvo (i dalje praktični) |
Priznanje o neobičnosti formatiranja: "Plaćeno" puno radi u toj tablici. Ali shvaćate ideju 😅
Velika tajna: modeli uče mapiranje od niske do visoke rezolucije 🧠➡️🖼️
U srži većine nadogradnji umjetne inteligencije nalazi se nadzirano učenje ( Slika superrezolucije korištenjem dubokih konvolucijskih mreža (SRCNN) ):
-
Započnite sa slikama visoke rezolucije („istina“)
-
Smanji njihovu rezoluciju na verzije niske rezolucije („ulaz“)
-
Trenirajte model za rekonstrukciju originalne visoke rezolucije iz niske rezolucije
Tijekom vremena, model uči korelacije poput:
-
„Ova vrsta zamućenja oko oka obično pripada trepavicama.“
-
„Ovaj skup piksela često označava serifni tekst“
-
„Ovaj rubni gradijent izgleda kao linija krova, a ne kao slučajna buka.“
Ne radi se o pamćenju određenih slika (u jednostavnom smislu), već o učenju statističke strukture ( Duboko učenje za superrezoluciju slika: Istraživanje ). Zamislite to kao učenje gramatike tekstura i rubova. Ne gramatika poezije, više kao... IKEA gramatika priručnika 🪑📦 (nespretna metafora, ali dovoljno blizu).
Osnovne stvari: što se događa tijekom zaključivanja (kada povećavate skalu) ⚙️✨
Kada ubacite sliku u AI upscaler, obično postoji cjevovod poput ovog:
-
Prethodna obrada
-
Pretvori prostor boja (ponekad)
-
Normaliziraj vrijednosti piksela
-
Podijeli sliku na dijelove ako je velika (provjera stvarnosti u VRAM-u 😭) ( Real-ESRGAN repozitorij (opcije pločica) )
-
-
Ekstrakcija značajki
-
Rani slojevi detektiraju rubove, kutove, gradijente
-
Dublji slojevi otkrivaju obrasce: teksture, oblike, komponente lica
-
-
Rekonstrukcija
-
Model generira kartu značajki veće rezolucije
-
Zatim to pretvara u stvarni pikselni izlaz
-
-
Naknadna obrada
-
Opcionalno oštrenje
-
Opcionalno uklanjanje šuma
-
Opcionalno suzbijanje artefakata (zvonjenje, oreoli, blokovitost)
-
Jedan suptilni detalj: mnogi alati povećavaju veličinu pločica, a zatim stapaju spojeve. Izvrsni alati skrivaju granice pločica. Mehi alati ostavljaju slabe tragove mreže ako zaškiljite. I da, zaškiljit ćete, jer ljudi vole pregledavati sitne nesavršenosti pri zumiranju od 300% poput malih gremlina 🧌
Glavne obitelji modela koje se koriste za nadogradnju umjetne inteligencije (i zašto se osjećaju drugačije) 🤖📚
1) Superrezolucija temeljena na CNN-u (klasični radni konj)
Konvolucijske neuronske mreže izvrsne su za lokalne uzorke: rubove, teksture, male strukture ( Slika superrezolucije korištenjem dubokih konvolucijskih mreža (SRCNN) ).
-
Prednosti: donekle brz, stabilan, manje iznenađenja
-
Nedostaci: može izgledati malo "obrađeno" ako se previše pritisne
2) Povećanje skale temeljeno na GAN-u (u stilu ESRGAN-a) 🎭
GAN-ovi (generativne suparničke mreže) obučavaju generator da proizvodi slike visoke rezolucije koje diskriminator ne može razlikovati od stvarnih ( generativne suparničke mreže ).
-
Prednosti: jasni detalji, impresivna tekstura
-
Nedostaci: mogu izmisliti detalje kojih nije bilo - ponekad pogrešno, ponekad neobično ( SRGAN , ESRGAN )
GAN vam može dati onu oštrinu koja oduzima dah. Također može dati vašem portretu dodatnu obrvu. Zato… odaberite svoje bitke 😬
3) Povećanje skale temeljeno na difuziji (kreativni džoker) 🌫️➡️🖼️
Difuzijski modeli postupno uklanjaju šum i mogu se voditi za izradu detalja visoke rezolucije ( SR3 ).
-
Prednosti: može biti nevjerojatno dobar u uvjerljivim detaljima, posebno za kreativni rad
-
Nedostaci: može se udaljiti od izvornog identiteta/strukture ako su postavke agresivne ( SR3 )
Ovdje se „upscaling“ počinje stapati s „reimaginingom“. Ponekad je to upravo ono što želite. Ponekad nije.
4) Povećanje rezolucije videa s vremenskom konzistentnošću 🎞️
Povećanje skale videa često dodaje logiku svjesnu pokreta:
-
Koristi susjedne okvire za stabilizaciju detalja ( BasicVSR (CVPR 2021) )
-
Pokušava izbjeći treperenje i puzajuće artefakte
-
Često kombinira superrezoluciju s uklanjanjem šuma i raspletanjem ( Topaz Video )
Ako je povećanje skale slike kao restauracija jedne slike, povećanje skale videa je kao restauracija flipbooka bez promjene oblika nosa lika na svakoj stranici. Što je... teže nego što zvuči.
Zašto AI povećanje skale ponekad izgleda lažno (i kako to uočiti) 👀🚩
Umjetna inteligencija povećava skalu na prepoznatljive načine. Nakon što naučite obrasce, vidjet ćete ih posvuda, kao da kupite novi automobil i odjednom primijetite taj model na svakoj ulici 😵💫
Uobičajene poruke:
-
Depilacija lica voskom (previše uklanjanja šuma + zaglađivanja)
-
Preoštreni oreoli oko rubova (klasično područje "prekoračenja") ( bikubična interpolacija )
-
Ponavljane teksture (zidovi od opeke postaju uzorci kopiranja i lijepljenja)
-
Hrskavi mikrokontrast koji vrišti "algoritam"
-
Iskrivljavanje teksta gdje slova postaju gotovo slova (najgora vrsta)
-
Pomak detalja gdje se male značajke suptilno mijenjaju, posebno u difuzijskim tijekovima rada ( SR3 )
Nezgodno: ponekad ti artefakti izgledaju "bolje" na prvi pogled. Vaš mozak voli oštrinu. Ali nakon trenutka, osjeća se... čudno.
Dobra taktika je zumirati i provjeriti izgleda li prirodno pri normalnoj udaljenosti gledanja. Ako izgleda dobro samo pri zumu od 400%, to nije pobjeda, to je hobi 😅
Kako funkcionira nadogradnja umjetne inteligencije: strana obuke, bez matematičke glavobolje 📉🙂
Treniranje modela superrezolucije obično uključuje:
-
Spareni skupovi podataka (ulaz niske rezolucije, cilj visoke rezolucije) ( Slika superrezolucije korištenjem dubokih konvolucijskih mreža (SRCNN) )
-
Funkcije gubitka koje kažnjavaju pogrešne rekonstrukcije ( SRGAN )
Tipične vrste gubitaka:
-
Gubitak piksela (L1/L2)
Potiče točnost. Može dati malo mekane rezultate. -
Perceptivni gubitak
Uspoređuje dublje značajke (poput „ izgleda slično“) umjesto točnih piksela ( Perceptivni gubici (Johnson i sur., 2016.) ). -
Nesuparnički gubitak (GAN)
Potiče realizam, ponekad na štetu doslovne točnosti ( SRGAN , Generativne suparničke mreže ).
Stalno se vodi natezanje konopa:
-
Učinite ga vjernim originalu
vs. -
Učinite to vizualno ugodnim
Različiti alati zauzimaju različita mjesta na tom spektru. I možda ćete preferirati jedan ovisno o tome restaurirate li obiteljske fotografije ili pripremate poster gdje je "lijep izgled" važniji od forenzičke točnosti.
Praktični tijekovi rada: fotografije, stari skenovi, anime i video 📸🧾🎥
Fotografije (portreti, pejzaži, fotografije proizvoda)
Najbolja praksa je obično:
-
Prvo blago uklanjanje šuma (ako je potrebno)
-
Luksuzno s konzervativnim postavkama
-
Dodajte zrnastu teksturu ako vam se čini da je previše glatka (da, stvarno)
Žitarice su kao sol. Previše ih pokvari večeru, ali ništa ne može biti malo bljutavo 🍟
Stari skenovi i jako komprimirane slike
Ovo je teže jer model može tretirati blokove kompresije kao "teksturu".
Pokušajte:
-
Uklanjanje ili deblokiranje artefakata
-
Zatim nadogradnja
-
Zatim lagano oštrenje (ne previše... znam, svi to kažu, ali ipak)
Anime i linijska umjetnost
Prednosti linijske umjetnosti su:
-
Modeli koji održavaju čiste rubove
-
Smanjena halucinacija teksture
. Povećanje skale u animeu često izgleda sjajno jer su oblici jednostavniji i dosljedniji. (Sretno.)
Video
Video dodaje dodatne korake:
-
Uklanjanje šuma
-
Deinterlace (za određene izvore)
-
Luksuzna
-
Vremensko zaglađivanje ili stabilizacija ( BasicVSR (CVPR 2021) )
-
Opcionalno ponovno uvođenje zrna za koheziju
Ako preskočite vremensku konzistentnost, dobit ćete to svjetlucavo treperenje detalja. Kad ga jednom primijetite, ne možete ga ne vidjeti. Poput škripave stolice u tihoj sobi 😖
Odabir postavki bez previše nagađanja (mali varalica) 🎛️😵💫
Evo jednog pristojnog početnog načina razmišljanja:
-
Ako lica izgledaju plastično,
smanjite šum, smanjite izoštravanje i isprobajte model ili način rada koji čuva lica. -
Ako teksture izgledaju preintenzivno,
smanjite klizače za "poboljšanje detalja" ili "obnavljanje detalja", a zatim dodajte suptilnu zrnatost. -
Ako rubovi svijetle,
smanjite oštrinu, provjerite opcije suzbijanja aureole. -
Ako slika izgleda previše "AI",
budite konzervativniji. Ponekad je najbolji potez jednostavno... manje.
Također: nemojte povećavati skalu na 8x samo zato što možete. Čisto 2x ili 4x je često idealna vrijednost. Nakon toga, tražite od modela da piše fanfiction o vašim pikselima 📖😂
Etika, autentičnost i neugodno pitanje "istine" 🧭😬
Povećanje skale umjetnom inteligencijom briše granicu:
-
Restauracija podrazumijeva vraćanje onoga što je bilo tamo
-
Poboljšanje podrazumijeva dodavanje onoga što nije bilo
S osobnim fotografijama obično je u redu (i lijepo). S novinarstvom, pravnim dokazima, medicinskim snimanjem ili bilo čime gdje je vjernost važna... morate biti oprezni ( OSAC/NIST: Standardni vodič za upravljanje forenzičkim digitalnim slikama , SWGDE smjernice za forenzičku analizu slika ).
Jednostavno pravilo:
-
Ako su ulozi visoki, tretirajte povećanje skale umjetne inteligencije kao ilustraciju , a ne kao konačno rješenje.
Također, otkrivanje je važno u profesionalnim kontekstima. Ne zato što je umjetna inteligencija zlo, već zato što publika zaslužuje znati jesu li detalji rekonstruirani ili snimljeni. To je jednostavno... pristojno.
Završne bilješke i kratki sažetak 🧡✅
Dakle, kako funkcionira AI Upscaling je sljedeći: modeli uče kako se detalji visoke rezolucije odnose na uzorke niske rezolucije, a zatim predviđaju uvjerljive dodatne piksele tijekom povećanja rezolucije ( Duboko učenje za superrezoluciju slike: Istraživanje ). Ovisno o obitelji modela (CNN, GAN, difuzija, video-temporalno), to predviđanje može biti konzervativno i vjerno... ili smjelo i ponekad neuravnoteženo 😅
Kratki sažetak
-
Tradicionalno povećanje skale rasteže piksele ( bikubična interpolacija )
-
Umjetna inteligencija povećava razlučivost predviđa nedostajuće detalje pomoću naučenih obrazaca ( Superrezolucija slike korištenjem dubokih konvolucijskih mreža (SRCNN) )
-
Izvrsni rezultati dolaze s pravim modelom + ograničenjem
-
Pazite na aureole, voštana lica, ponavljajuće teksture i treperenje u videu ( BasicVSR (CVPR 2021) )
-
Povećanje skale je često „vjerojatna rekonstrukcija“, a ne savršena istina ( SRGAN , ESRGAN )
Ako želiš, reci mi što povećavaš na više (lica, stare fotografije, videozapise, anime, skeniranje teksta) i predložit ću strategiju postavki koja nastoji izbjeći uobičajene zamke "AI izgleda" 🎯🙂
Često postavljana pitanja
Povećanje skale umjetne inteligencije i kako ono funkcionira
Povećanje razlučivosti pomoću umjetne inteligencije (često nazivano "superrezolucija") povećava rezoluciju slike predviđanjem nedostajućih detalja visoke rezolucije iz uzoraka naučenih tijekom treninga. Umjesto jednostavnog rastezanja piksela poput bikubične interpolacije, model proučava rubove, teksture, lica i poteze slične tekstu, a zatim generira nove podatke piksela koji se slažu s tim naučenim uzorcima. To je manje "vraćanje stvarnosti", a više "pravljenje uvjerljive pretpostavke" koja se čita kao prirodna.
AI povećanje veličine u odnosu na bikubičnu ili tradicionalnu promjenu veličine
Tradicionalne metode skaliranja (poput bikubičnog) uglavnom interpoliraju između postojećih piksela, izglađujući prijelaze bez stvaranja pravih novih detalja. AI skaliranje ima za cilj rekonstruirati uvjerljivu strukturu prepoznavanjem vizualnih znakova i predviđanjem kako će izgledati verzije tih znakova visoke rezolucije. Zato se rezultati umjetne inteligencije mogu činiti dramatično oštrijima, a također i zato mogu uvesti artefakte ili "izmisliti" detalje koji nisu bili prisutni u izvoru.
Zašto lica mogu izgledati voštano ili previše glatko
Voštana lica obično nastaju agresivnim uklanjanjem šuma i zaglađivanjem uparenim s izoštravanjem koje uklanja prirodnu teksturu kože. Mnogi alati tretiraju šum i finu teksturu na sličan način, pa "čišćenje" slike može izbrisati pore i suptilne detalje. Uobičajeni pristup je smanjenje šuma i izoštravanja, korištenje načina očuvanja lica ako je dostupan, a zatim ponovno uvođenje malo zrnatosti kako bi rezultat djelovao manje plastično i više fotografski.
Uobičajeni artefakti povećanja umjetne inteligencije na koje treba obratiti pozornost
Tipični znakovi uključuju oreole oko rubova, ponavljajuće uzorke tekstura (poput cigli za kopiranje i lijepljenje), hrskavi mikrokontrast i tekst koji se pretvara u „gotovo slova“. U tijekovima rada temeljenim na difuziji također možete vidjeti pomicanje detalja gdje se male značajke suptilno mijenjaju. Za video, treperenje i puzanje detalja po kadrovima su veliki znakovi upozorenja. Ako izgleda dobro samo pri ekstremnom zumiranju, postavke su vjerojatno preagresivne.
Kako se GAN, CNN i difuzijski upscaleri obično razlikuju u rezultatima
Superrezolucija temeljena na CNN-u obično je stabilnija i predvidljivija, ali može izgledati "obrađeno" ako se previše forsira. Opcije temeljene na GAN-u (u stilu ESRGAN-a) često proizvode snažniju teksturu i percipiranu oštrinu, ali mogu halucinirati netočne detalje, posebno na licima. Povećanje skale temeljeno na difuziji može generirati prekrasne, uvjerljive detalje, no može odstupiti od izvorne strukture ako su postavke smjernica ili jačine prejake.
Praktična strategija postavki za izbjegavanje izgleda "previše umjetne inteligencije"
Započnite konzervativno: povećajte skalu 2× ili 4× prije nego što posegnete za ekstremnim faktorima. Ako lica izgledaju plastično, smanjite šum i izoštravanje te isprobajte način rada koji je svjestan lica. Ako teksture postanu preintenzivne, smanjite poboljšanje detalja i nakon toga razmislite o dodavanju suptilne zrnatosti. Ako rubovi sjaje, smanjite izoštravanje i provjerite suzbijanje aureole ili artefakata. U mnogim cjevovodima, „manje“ pobjeđuje jer čuva uvjerljiv realizam.
Obrada starih skeniranih slika ili slika s velikim JPEG komprimiranjem prije povećanja razmjera
Komprimirane slike su nezgodne jer modeli mogu tretirati blokovske artefakte kao stvarnu teksturu i pojačati ih. Uobičajeni tijek rada je prvo uklanjanje ili deblokiranje artefakata, zatim povećanje skale, a zatim lagano izoštravanje samo ako je potrebno. Kod skeniranja, nježno čišćenje može pomoći modelu da se usredotoči na stvarnu strukturu, a ne na oštećenje. Cilj je smanjiti „lažne teksturne znakove“ kako osoba koja vrši povećanje skale ne bi bila prisiljena donositi samouvjerene zaključke na temelju šumnih ulaza.
Zašto je povećanje skale videa teže od povećanja skale fotografija
Povećavanje rezolucije videa mora biti dosljedno u svim kadrovima, ne samo dobro na jednoj statičkoj slici. Ako detalji trepere iz kadra u kadar, rezultat brzo postaje ometajući. Pristupi usmjereni na video koriste vremenske informacije iz susjednih kadrova kako bi stabilizirali rekonstrukciju i izbjegli svjetlucave artefakte. Mnogi tijekovi rada također uključuju uklanjanje šuma, raspletanje za određene izvore i opcionalno ponovno uvođenje zrnatosti kako bi cijeli slijed djelovao kohezivno, a ne umjetno oštro.
Kada povećanje skale umjetne inteligencije nije prikladno ili je rizično oslanjati se na njega
Povećanje skale umjetnom inteligencijom najbolje je tretirati kao poboljšanje, a ne kao dokaz. U važnim kontekstima poput novinarstva, pravnih dokaza, medicinskog snimanja ili forenzičkog rada, generiranje „vjerodostojnih“ piksela može zavarati jer može dodati detalje koji nisu snimljeni. Sigurnije uokviravanje je koristiti ga ilustrativno i otkriti da je umjetna inteligencija rekonstruirala detalj. Ako je vjernost ključna, sačuvajte originale i dokumentirajte svaki korak obrade i postavku.
Reference
-
arXiv - Duboko učenje za superrezoluciju slika: Istraživanje - arxiv.org
-
arXiv - Superrezolucija slike korištenjem dubokih konvolucijskih mreža (SRCNN) - arxiv.org
-
arXiv - Real-ESRGAN - arxiv.org
-
arXiv - ESRGAN - arxiv.org
-
arXiv - SR3 - arxiv.org
-
NVIDIA razvojni programer - NVIDIA DLSS - developer.nvidia.com
-
AMD GPUOpen - FidelityFX Super Resolution 2 - gpuopen.com
-
Otvoreni pristup Zaklade za računalni vid (CVF) - BasicVSR: Potraga za bitnim komponentama u video superrezoluciji (CVPR 2021) - openaccess.thecvf.com
-
arXiv - Generativne suparničke mreže - arxiv.org
-
arXiv - SRGAN - arxiv.org
-
arXiv - Perceptivni gubici (Johnson i sur., 2016.) - arxiv.org
-
GitHub - Real-ESRGAN repozitorij (opcije pločica) - github.com
-
Wikipedia - Bikubična interpolacija - wikipedia.org
-
Topaz Labs - Topaz Photo - topazlabs.com
-
Topaz Labs - Topaz Video - topazlabs.com
-
Adobe centar za pomoć - Adobe Enhance > Super rezolucija - helpx.adobe.com
-
NIST / OSAC - Standardni vodič za upravljanje forenzičkim digitalnim slikama (verzija 1.0) - nist.gov
-
SWGDE - Smjernice za forenzičku analizu slika - swgde.org