SimoneBaldelli

Recentemente ho iniziato ad approfondire la generazione di immagini tramite intelligenza artificiale; ho scoperto un tool che può essere utilizzato online e che permette di scegliere tra una infinità di modelli addestrati per ogni tipo di generazione specifica. Il tool in questione si chiama civitai.com

Andando a fare le prime prove, la prima cosa che si deve scegliere è il checkpoint da cui iniziare, dopodiché si possono scegliere i vari Lora da aggiungere. La prima domanda che sorge spontanea è: che differenza c'è tra un checkpoint e un lora?

Parlando di modelli per l'intelligenza artificiale si possono fare una prima distinzione in base alla dimensione del set di dati su cui vengono addestrati, su set generici e molto ampi si creano modelli pre-addestrati, modelli che quindi sono in grado di rispondere ad una vasta gamma di possibili richieste, come è ovvio più vogliamo dare specificità al modello tanto più ampio deve essere il set di dati su cui viene addestrato e di conseguenza tanto più pesante sarà il modello generato. Per ovviare al problema della specificità si possono creare modelli fine-tuned, che sono modelli pre addestrati per un compito specifico. Facendo un esempio legato alla generazione di immagini possiamo avere un modello generale che è in grado di generare persone e panorami e un modello fine-tuned che è in grado di generare efficienteme i dettagli, come ad esempio le mani.

Un lora é esattamente questo: un modello fine-tuned che ha un compito specifico, come in realtà dice il nome stesso Low-Rank Adaptation.

Con un computer da gaming di fascia consumer è possibile addestrare un lora di piccole dimensioni in un tempo che va da mezz'ora ad un'ora.

Per chi non avesse a disposizione l'hardware necessario civitai.com mette a disposizione una interfaccia semplice per l'addestramento dei modelli fine-tuned

Nella sua versione attuale è possibile addestrare modelli per immagini o per video. Come si vede l'interfaccia è molto intuitiva e ben dettagliata.
Io sono partito dalle immagini, ho cercato circa 15 immagini di borghi della Toscana, per ognuno ho trovato una decina di tag che potessero descrivere efficacemente l'immagine e li ho caricati. In 59 minuti ho ottenuto il mio modello, con cui ho potuto iniziare a generare le prime immagini, qui i risultati

Questo è il link al modello che ho generato

https://civitai.com/models/1520930/tuscany

Lora addestrato con Civitai