Page 1 of 2 12 LastLast
Results 1 to 15 of 23

Thread: AI e Generazione immagini

  1. #1
    Lieutenant Junior Grade Pic STK's Avatar
    Join Date
    Sep 2004
    Location
    Calabrifornia - Cosangeles
    Posts
    4.095

    Default AI e Generazione immagini

    Che ne pensate di questa tecnologia?
    Per chi non li conoscesse: vi invito a dare un'occhiata a DALL-E, Midjourney, Stable Diffusion, NightCafe, ecc... Basta una ricerca in Google Images.
    Sono applicazioni che convertono un breve testo (prompt) in immagine: due righe facili facili, ottengo immagini pazzesche.
    Per intenderci, queste "opere" le ho fatte io scrivendo due righe di prompt.
    Sono fatte benissimo, per creare (non "cercare on line in un database la foto pi? simile" ma CREARE da zero, perch? sono totalmente inventate dalla AI)

    potete provarne uno qui https://beta.dreamstudio.ai/dream

  2. #2
    Lieutenant Commander Dryden's Avatar
    Join Date
    Oct 2006
    Location
    Lollonia
    Posts
    14.145

    Default

    Ne ho sentito parlare marginalmente in queste settimane ma trovo che sia una dimostrazione pratica di quanto le IA stiano diventando potenti abbastanza da "creare" cose che prima non esistevano, siano esse per diletto o per uso specifico.

    Piccolo esempio: nel mondo degli effetti visivi esiste una pratica che si chiama Rotoscoping, consiste nello scontornare i o il soggetto scelto dal contesto intorno a lui per poi intervenire solo su di esso o su tutto tranne che su quello; negli anni ? una cosa che ? stata fatta e viene ancora fatta principalmente a mano dall'operatore.
    Nell'industry si stanno affacciando i primi algoritmi AI che riescono a farlo in autonomia, non sono ancora precisi abbastanza da risultare efficaci ed i tempi di calcolo sono alti, ma ? chiara la direzione intrapresa quale sia, ed una volta perfezionata porter? all'estinzione dell'operatore addetto a quella pratica.

    Mi domando, i diritti di immagine su ci? che crea una IA, di chi sono? Della compagnia che detiene i server dove gira la IA o tuoi che le hai detto cosa\come comporre?
    Free from Signature

  3. #3
    Lieutenant Commander Galandil's Avatar
    Join Date
    Jan 2005
    Location
    Somewhere
    Posts
    13.423

    Default

    Quote Originally Posted by Dryden View Post
    Mi domando, i diritti di immagine su ci? che crea una IA, di chi sono? Della compagnia che detiene i server dove gira la IA o tuoi che le hai detto cosa\come comporre?
    Indovina un po'?

    Also: nessun diritto conservato dagli autori originali delle immagini con cui la AI ? stata trainata.

  4. #4
    Lieutenant Commander Alkabar's Avatar
    Join Date
    Feb 2004
    Location
    Netherlands.
    Posts
    19.958

    Default

    Alla base di tutto ci sta CLIPS che sostanzialmente e' una rete neurale dove il training e' fatto con testo ed immagini allineati. Siccome sono 400 mlioni di immagini e relativi testi, i vettori che trova sono assai rappresentativi.
    L'altra parte, la diffusione, fa dei bei risultati perche' ottimizza nel mentre che aumenta la scala dell'immagine.
    Sostanzialmente partono da una immagine ci aggiungono rumore bianco additiviamene per predirre ogni passo (precedente!) durante il training. Durante l'applicazione fanno la predizione applicandola a una immagine di puro rumore, usando come punto di partenza il vettore del testo dato da clips, che essendo ben allineato con le immagini, consente di scovare un pattern nel rumore (come quando uno sta li a guardar la forma delle nuvole...)
    Detto cio': sono modelli assai pesanti al momento, in un paio di mesi vedrete che ottimizzano, adesso flettono i muscoli che loro c'hanno le super GPU.
    P.s. Questa E' solo una delle applicazioni di clips. CLIPS l'ha fatto OpenAI ed e' disponibile opensource.

  5. #5
    Lieutenant Commander Dryden's Avatar
    Join Date
    Oct 2006
    Location
    Lollonia
    Posts
    14.145

    Default

    Quello a cui facevo riferimento io in effetti funziona come dici tu e quindi presumo si basi su CLIPS, il tool si chiama Copycat ed ? integrato nel software The Foundry Nuke. Inutile dire che da noi, piccolo studio, non ? utilizzabile in pipeline perch? per analizzare una sequenza da 4 secondi in 4k ci mette una notte intera su RTX 2080Ti....
    Free from Signature

  6. #6
    Lieutenant Commander Alkabar's Avatar
    Join Date
    Feb 2004
    Location
    Netherlands.
    Posts
    19.958

    Default

    Quote Originally Posted by Dryden View Post
    Quello a cui facevo riferimento io in effetti funziona come dici tu e quindi presumo si basi su CLIPS, il tool si chiama Copycat ed ? integrato nel software The Foundry Nuke. Inutile dire che da noi, piccolo studio, non ? utilizzabile in pipeline perch? per analizzare una sequenza da 4 secondi in 4k ci mette una notte intera su RTX 2080Ti....
    Clips e' la parte piu' lightweight del diffusion model, e' la rete neurale che data un immagine, o un testo, ti sputa un vettore che e' allineato bene anche con le visual features/textual features.

    Comunque, sto provando a eliminare l'algoritmo di diffusione introducendo un diverso modo di ottimizzare, al momento i risultati non sono un gran che, ma tipo ho iniziato oggi...

  7. #7
    Lieutenant Commander San Vegeta's Avatar
    Join Date
    Oct 2003
    Location
    Bologna
    Posts
    12.038

    Default

    Quote Originally Posted by Pic STK View Post
    Che ne pensate di questa tecnologia?
    Per chi non li conoscesse: vi invito a dare un'occhiata a DALL-E, Midjourney, Stable Diffusion, NightCafe, ecc... Basta una ricerca in Google Images.
    Sono applicazioni che convertono un breve testo (prompt) in immagine: due righe facili facili, ottengo immagini pazzesche.
    Per intenderci, queste "opere" le ho fatte io scrivendo due righe di prompt.
    Sono fatte benissimo, per creare (non "cercare on line in un database la foto pi? simile" ma CREARE da zero, perch? sono totalmente inventate dalla AI)

    potete provarne uno qui https://beta.dreamstudio.ai/dream
    una mia amica, che ? un'artista, ha "fatto" dei quadri fenomenali usando queste tecniche. Roba che pensavo li avesse pitturati lei
    I rubinetti a casa di Chuck Norris non perdono, vincono.

    In the beginning there was nothing...then Chuck Norris Roundhouse kicked that nothing in the face and said "Get a job". That is the story of the universe.

    Quote Originally Posted by Wolfo View Post
    Concordo e propongo ban temporanei per chi critica la topa , la topa non si critica , dal trombabile in su non si commenta in modo sgradevole.
    la tua ignoranza in materia e' raccapricciante
    -cit. Estrema, 2022

  8. #8
    Lieutenant Commander Alkabar's Avatar
    Join Date
    Feb 2004
    Location
    Netherlands.
    Posts
    19.958

    Default

    Quote Originally Posted by San Vegeta View Post
    una mia amica, che ? un'artista, ha "fatto" dei quadri fenomenali usando queste tecniche. Roba che pensavo li avesse pitturati lei
    Per fortuna al pitturarli davvero non ci siamo ancora, se no un sacco di artisti si troverebbero senza lavoro.

    Ancora, se provate a fare giochi semantici un po' difficili, non gliela fa nemmeno clips a capire cosa generare.

    Tipo ho provato "two samurais fighting with rubber ducks" e sono venute le peggio cose, ma non quello che ho chiesto.

  9. #9
    Lieutenant Commander Alkabar's Avatar
    Join Date
    Feb 2004
    Location
    Netherlands.
    Posts
    19.958

    Default

    Name:  Lol.jpg
Views: 185
Size:  16,0 KB

    Prompt: "an oil portrait of an old chinese man with a long white beard"

    Non me la cavo male pero' dai. A un 100esimo del peso del loro algoritmo. Adesso bisogna togliere un po' di rumore.

    Ce devo pensa su.

    Comunque vi confermo che tutta l'info viene da clips, non dal bordello che fanno dopo.

  10. #10
    Lieutenant Commander Dryden's Avatar
    Join Date
    Oct 2006
    Location
    Lollonia
    Posts
    14.145

    Default

    Unica prova fatta ieri con NightCafe

    Evangelion Berserk

    Name:  MkvujheZxMp8WVroMJOD.jpg
Views: 174
Size:  53,3 KB

    nzomma....
    Free from Signature

  11. #11
    Lieutenant Commander Alkabar's Avatar
    Join Date
    Feb 2004
    Location
    Netherlands.
    Posts
    19.958

    Default

    Quote Originally Posted by Dryden View Post
    Unica prova fatta ieri con NightCafe

    Evangelion Berserk

    Name:  MkvujheZxMp8WVroMJOD.jpg
Views: 174
Size:  53,3 KB

    nzomma....
    Si, ma per quello prima fanno il retrieval di immagini simili per mettere dei limiti sulla generazione (i.e. text prompt + image prompt), se no non ti viene con quelle feature li nemmeno a piangere in greco antico, che le immagini di evangelion non sono cosi' frequenti da consentire una generalizzazione di quel livello.

  12. #12
    Lieutenant Junior Grade Pic STK's Avatar
    Join Date
    Sep 2004
    Location
    Calabrifornia - Cosangeles
    Posts
    4.095

    Default

    lonely cyber camp on pluto

    con dreamstudio ? venuta sta roba
    Name:  3942172362_lonely_cyber_camp_on_pluto.jpg
Views: 159
Size:  15,3 KB

    mentre con nightcaf? questa
    Name:  YxkmMNjuGWF61zd4Wj1D--1--SSL05.jpg
Views: 168
Size:  82,1 KB

  13. #13
    Lieutenant Commander Alkabar's Avatar
    Join Date
    Feb 2004
    Location
    Netherlands.
    Posts
    19.958

    Default

    Una marea di tentativi dopo... Name:  ExampleProWayne.jpg
Views: 125
Size:  19,2 KB

  14. #14
    Lieutenant Commander San Vegeta's Avatar
    Join Date
    Oct 2003
    Location
    Bologna
    Posts
    12.038

    Default

    e se date degli input per dei nudi femminili, cosa esce fuori?
    chiedo perch?, dato che si basa su immagini esistenti, sarei curioso di vedere se tende pi? al nudo artistico o al nudo per mostrare le tette
    I rubinetti a casa di Chuck Norris non perdono, vincono.

    In the beginning there was nothing...then Chuck Norris Roundhouse kicked that nothing in the face and said "Get a job". That is the story of the universe.

    Quote Originally Posted by Wolfo View Post
    Concordo e propongo ban temporanei per chi critica la topa , la topa non si critica , dal trombabile in su non si commenta in modo sgradevole.
    la tua ignoranza in materia e' raccapricciante
    -cit. Estrema, 2022

  15. #15
    Lieutenant Commander Alkabar's Avatar
    Join Date
    Feb 2004
    Location
    Netherlands.
    Posts
    19.958

    Default

    Quote Originally Posted by San Vegeta View Post
    e se date degli input per dei nudi femminili, cosa esce fuori?
    chiedo perch?, dato che si basa su immagini esistenti, sarei curioso di vedere se tende pi? al nudo artistico o al nudo per mostrare le tette
    Qualunque applicazione benigna e maligna di computer vision e' replicabile tramite CLIP. Letteralmente nel bene e nel male.

Page 1 of 2 12 LastLast

Posting Permissions

  • You may not post new threads
  • You may not post replies
  • You may not post attachments
  • You may not edit your posts
  •  
[Output: 110.70 Kb. compressed to 95.72 Kb. by saving 14.98 Kb. (13.53%)]