Què són els GAN? Com i per què els heu d’utilitzar!



Aquest article tracta l'explicació detallada de 'Què són els GAN' amb limitacions i reptes que cobreixen el procés de formació i la implementació de casos d'ús.

Les xarxes adversàries generatives o GAN són un enfocament de modelatge generatiu que s’utilitza Aprenentatge profund entrenar el model d’una manera intel·ligent per generar dades mitjançant l’enfocament del submodel. En aquest article, intentarem entendre detalladament 'Què són els GAN'? En aquest article es tracten els temes següents:

Què són els models generatius?

Els models generatius no són res més que aquells models que utilitzen un aproximació. En un model generatiu, hi ha mostres a les dades, és a dir, variables d'entrada X, però no té la variable de sortida Y. Utilitzem només les variables d'entrada per entrenar el model generatiu i reconeix patrons de les variables d'entrada per generar una sortida que es desconeix. i basat únicament en les dades de formació.





En , estem més alineats cap a la creació de models predictius a partir de les variables d’entrada, aquest tipus de modelatge es coneix com a modelatge discriminatiu. En un problema de classificació, el model ha de discriminar a quina classe pertany l’exemple. D’altra banda, s’utilitzen models sense supervisió per crear o generar nous exemples a la distribució d’entrada.

Per definir models generatius en termes propis, podem dir que els models generatius són capaços de generar nous exemples a partir de la mostra que no només són similars a altres exemples, sinó que també no es poden distingir.



L'exemple més comú de model generatiu és un que s’utilitza més sovint com a model discriminatiu. Altres exemples de models generatius inclouen el model de barreja de Gauss i un exemple bastant modern que és General Adversarial Networks. Intentem comprendre Què són els GAN?

Què són les xarxes adversàries generatives?

Les xarxes adversàries generatives o GAN són un model generatiu basat en l’aprenentatge profund que s’utilitza per a l’aprenentatge sense supervisió. Bàsicament és un sistema on competeixen dos Xarxes neuronals competeixen entre ells per crear o generar variacions en les dades.

diferència entre interfície i classe

Va ser descrit per primera vegada en un document el 2014 per Ian Goodfellow i Alec Radford va proposar el 2016 una teoria de models estandarditzada i molt estable que es coneix com DCGAN (Deep Convolutional General Adversarial Networks). La majoria dels GAN actuals que existeixen utilitzen l'arquitectura DCGAN.



L'arquitectura GANs consta de dos sub-models coneguts com a Model de generador i la Model discriminador. Intentem comprendre com funcionen realment els GAN.

Com funciona?

Per entendre com funcionen els GAN, descrivim-los.

  • Generatiu - Vol dir que el model segueix el i és un model generatiu.
  • Adversari - El model es forma en un entorn contrari
  • Xarxa - Per a la formació del model, utilitza les xarxes neuronals com a algorismes d'intel·ligència artificial.

En els GAN, hi ha una xarxa Generator que pren una mostra i genera una mostra de dades i, després, la xarxa Discriminator decideix si les dades es generen o s’extreuen de la mostra real mitjançant un binari. problema amb l'ajut d'una funció sigmoide que dóna la sortida en el rang de 0 a 1.

diagrama de flux - què són gnas - edureka

El model generatiu analitza la distribució de les dades de manera que després de la fase d’entrenament, es maximitza la probabilitat que el discriminador cometi un error. I el Discriminator, en canvi, es basa en un model que estimarà la probabilitat que la mostra provingui de les dades reals i no del generador.

Tot el procés es pot formalitzar en una fórmula matemàtica que es mostra a continuació.

A la fórmula anterior:

G = Generador

D = Discriminador

Pdata (x) = Distribució de dades reals

Pdata (z) = Distribuïdor del generador

x = mostra a partir de dades reals

z = mostra del generador

D (x) = Xarxa de discriminació

G (z) = Xarxa de generadors

Ara ve la part de formació d’un GAN, que es pot dividir en dues parts que es fan de manera seqüencial.

Com entrenar un GAN?

Part 1:

Entreneu el discriminador i congeleu el generador, cosa que significa que el conjunt d'entrenament del generador es converteix en fals i la xarxa només farà el pas directe i no s'aplicarà cap propagació posterior.

Bàsicament, el discriminador està format amb les dades reals i comprova si pot predir-les correctament, i el mateix amb les dades falses per identificar-les com a falses.

Part 2:

Entrena el generador i congela el discriminador. En aquesta fase, obtenim els resultats de la primera fase i els podem utilitzar per millorar-los de l’estat anterior per intentar enganyar millor el discriminador.

Passos per a la formació

  1. Definiu el problema - definir el problema i recopilar dades.
  2. Trieu Architecture Of GAN - Depenent del vostre problema, trieu com ha de ser el vostre GAN.
  3. Entrenar el discriminador sobre dades reals - Entreneu el discriminador amb dades reals per predir-les com a reals n nombre de vegades.
  4. Generar entrades falses per al generador - Generar mostres falses a partir del generador
  5. Entrenar el discriminador sobre dades falses - Capacitar al discriminador per predir les dades generades com a falses.
  6. Generador de trens amb la sortida de discriminador - Després d'obtenir les prediccions del discriminador, formeu el generador per enganyar-lo

Reptes de la xarxa adversària generativa

El concepte de GAN és força fascinant, però hi ha molts entrebancs que poden causar molts obstacles al seu pas. Alguns dels principals reptes als quals s’enfronten els GAN són:

  1. Estabilitat es requereix entre el discriminador i el generador, en cas contrari tota la xarxa cauria. En cas que, si el Discriminator sigui massa potent, el generador no entrenarà del tot. I si la xarxa és massa indulgent, es generaria qualsevol imatge fent que la xarxa sigui inútil.
  2. Els GAN fracassen estrepitosament en determinar el fitxer posicionament dels objectes en termes de quantes vegades s’hauria de produir l’objecte en aquesta ubicació.
  3. La perspectiva tridimensional dificulta els GAN, ja que no és capaç d’entendre perspectiva , sovint donarà una imatge plana per a un objecte tridimensional.
  4. Els GAN tenen problemes per entendre el fitxer objectes globals . No pot diferenciar ni entendre una estructura holística.
  5. Els tipus de GAN més nous són més avançats i s’espera que superin completament aquestes mancances.

Aplicacions generatives de xarxes adversàries

Les següents són algunes aplicacions dels GAN.

què és el mètode que amaga a Java

Predicció del següent fotograma en un vídeo

La predicció d'esdeveniments futurs en un marc de vídeo és possible amb l'ajut de GAN. DVD-GAN o Dual Video Discriminator GAN poden generar 256 × 256 vídeos de fidelitat notable fins a 48 fotogrames de longitud. Es pot utilitzar per a diversos propòsits, inclosa la vigilància, en què podem determinar les activitats en un marc que es distorsiona a causa d’altres factors com la pluja, la pols, el fum, etc.

Generació de text a imatge

GAN atent dirigit per objectes (obj-GAN), realitza la síntesi de text a imatge en dos passos. Generar la disposició semàntica és el pas inicial i després generar la imatge sintetitzant la imatge mitjançant un generador d’imatges desconvolucionals és el pas final.

Es podria utilitzar intensivament per generar imatges comprenent els subtítols, dissenys i perfeccionar detalls sintetitzant les paraules. Hi ha un altre estudi sobre els storyGAN que pot sintetitzar els guions gràfics sencers a partir de simples paràgrafs.

Millora de la resolució d’una imatge

La xarxa controvertida generativa de super resolució o SRGAN és un GAN que pot generar imatges de super resolució a partir d’imatges de baixa resolució amb detalls més fins i amb millor qualitat.

com convertir el doble a int java

Les aplicacions poden ser immenses, imaginem una imatge de més qualitat amb detalls més fins generats a partir d’una imatge de baixa resolució. La quantitat d’ajuda que produiria per identificar detalls en imatges de baixa resolució es pot utilitzar amb fins més amplis, inclosos els de vigilància, documentació, seguretat, patrons de detecció, etc.

Traducció d'imatge a imatge

Pix2Pix GAN és un model dissenyat per a la traducció d'imatges de propòsit general.

Generació d'imatges interactives

Els GAN també es poden utilitzar per generar imatges interactives; el Laboratori d’Informàtica i Intel·ligència Artificial (CSAIL) ha desenvolupat un GAN que pot generar models en 3D amb il·luminació i reflexos realistes habilitats per l’edició de formes i textures.

Més recentment, els investigadors han elaborat un model que pot sintetitzar una cara recreada animada pel moviment d’una persona i preservar l’aspecte de la cara alhora.

Això ens porta al final d’aquest article, on hem après ‘Què són els GAN’? Espero que tingueu clar tot el que us ha estat compartit en aquest tutorial.

Si heu trobat rellevant aquest article sobre 'Què són els GAN', consulteu el document una empresa d'aprenentatge en línia de confiança amb una xarxa de més de 250.000 estudiants satisfets repartits per tot el món.

Som aquí per ajudar-vos en cada pas del vostre viatge i oferir un pla d’estudis dissenyat per a estudiants i professionals que vulguin ser . El curs està dissenyat per donar-vos un avantatge en la programació de Python i formar-vos tant per a conceptes bàsics com avançats de Python juntament amb diversos M'agrada

Si teniu cap pregunta, no dubteu a fer-vos totes les vostres preguntes a la secció de comentaris de 'Què són els GAN' i el nostre equip estarà encantat de respondre-us.