Alexa+ ora può generare immagini AI: ecco come si confronta con ChatGPT. Probabilmente conoscete Alexa come la voce che imposta i timer, abbassa le luci e riproduce la musica, ma con questa novità sto scoprendo che ha delle potenzialità enormi. Che tu chieda un acquerello di una baita accogliente, un cucciolo fotorealistico o un mockup di design, Alexa+ risponde in pochi secondi, quindi invia l’immagine direttamente al tuo telefono. È sorprendentemente intuitivo, incredibilmente veloce e potenzialmente rivoluzionario per gli utenti di tutti i giorni. Abbiamo messo a confronto le due AI generative con diversi prompt, vediamo insieme come è andata.

Alexa+: facciamo un confronto con ChatGPT
Vi suggerisco un prompt: ” Una mamma robot amichevole, un papà e due bambini robot seduti al tavolo della cucina che mangiano spaghetti, circondati da un arredamento retrò in stile anni ’50, con luci calde e un cane robot sotto il tavolo”.
ChatGPT ha automaticamente scelto un’immagine cartoonesca di una famiglia di robot. Ha centrato quasi tutto tranne il cane robot, optando invece per un cane dall’aspetto realistico. Alexa+ ha presentato un’immagine moderna di una famiglia di robot, anch’essa con un cane “reale”. Ha omesso aspetti del suggerimento come “due bambini robot” e lo stile della cucina.
Vincitore: ChatGPT vince per aver seguito correttamente il suggerimento.

Proviamo a generare un’immagine più realistica
Prompt consigliato: ” Persone che curiosano tra bancarelle colorate di frutta e verdura in un mercato agricolo all’aperto. Una donna tiene in mano un mazzo di girasoli, un uomo assaggia del formaggio e dei bambini mangiano ghiaccioli. Sullo sfondo ci sono food truck e lucine”.
ChatGPT ha ancora una volta colto ogni dettaglio dello spunto, anche se è difficile capire che l’uomo sta assaggiando del formaggio. Alexa+ ha offerto uno sguardo più vario e realistico a un mercato agricolo, anche se non è del tutto ovvio se l’uomo nell’immagine stia assaggiando del formaggio.
Vincitore: Alexa+ vince per un’immagine che cattura meglio l’energia e la diversità di un mercato agricolo.

Come se la cava in una giornata piovosa?
Prompt suggerito: ” Auto in fila fuori da una scuola elementare in una grigia mattina piovosa. Genitori con ombrelli spingono i figli verso l’ingresso. Zaini, stivali da pioggia e pozzanghere tutt’intorno. Vista dal finestrino di un’auto con gocce di pioggia”.
ChatGPT ha creato un’immagine da favola che mette in risalto l’atmosfera di una giornata scolastica piovosa. Gli zaini nelle pozzanghere sono un errore palesemente irrealistico. Alexa+ ha fornito un’immagine fotorealistica che cattura anch’essa l’atmosfera, ma sembra meno una vista da un’auto e non cattura la frenesia richiesta dal suggerimento.
Vincitore: ChatGPT vince per aver seguito il suggerimento e per aver narrato meglio questa immagine.

Proviamo con un cane e un bimbo in un ambiente rilassato
Prompt suggerito: “Un golden retriever seduto accanto a un bambino piccolo su un accogliente tappeto del soggiorno. Il bambino gli offre un cracker e il cane lo prende delicatamente. Giocattoli e un bicchiere con beccuccio sono sparsi in giro. Luce naturale proveniente dalla finestra, soffusa e commovente.”
ChatGPT ha utilizzato un’illuminazione morbida e calda in un’immagine che evoca un’atmosfera commovente, quasi da libro di fiabe, che si adatta perfettamente alla descrizione “morbida e commovente” della richiesta. Alexa+ ha realizzato un’ottima foto, molto naturale e realistica, ma mancano dettagli come il bicchiere con beccuccio e il cane che non prende il cracker. Sebbene possa essere considerata un’immagine migliore, perde a causa di aspetti mancanti del prompt.
Vincitore: ChatGPT vince per la migliore corrispondenza di composizione, ambientazione e dettagli.

Testiamo Alexa+ e ChatGPT sull’immagine di un attraversamento pedonale in una zona trafficata di città
Prompt suggerito: ” Un gruppo eterogeneo di persone attraversa una strada cittadina al mattino presto: una donna con i tacchi e un caffè, un jogger con le cuffie, un papà che spinge un passeggino e un adolescente su uno scooter. Sullo sfondo ci sono semafori, edifici in mattoni e vapore che sale da un tombino. Cielo coperto, realismo quotidiano.”
ChatGPT ha catturato tutti i dettagli del suggerimento, ma ha prodotto un’immagine disordinata e confusa che non sembra reale e che non userei per niente. Alexa+ ha prodotto un’immagine rifinita che evidenzia il suggerimento, ma tralascia diversi dettagli.
Qui c’è stato un pareggio. ChatGPT ha colto ogni dettaglio del suggerimento, ma a costo di una situazione di attraversamento pedonale irrealistica. Alexa+ ha creato un’immagine che cattura meglio l’atmosfera di una città trafficata, ma tralascia dettagli chiave del suggerimento.

Decretiamo il vincitore del test: ChatGPT
Dopo cinque round di test comparativi, una cosa è chiara: ChatGPT potrebbe adottare un approccio più stravagante o da favola, ma riesce sempre a cogliere i dettagli. Tuttavia, sono rimasta piacevolmente sorpresa da Alexa+. Generava immagini raffinate, spesso più realistiche di ChatGPT, e immediatamente condivisibili. Ed era anche più veloce di ChatGPT. Tuttavia, nella maggior parte dei casi, Alexa+ non riusciva a seguire le istruzioni.
Che si tratti di eliminare un bicchiere con beccuccio, di tralasciare personaggi chiave o di sorvolare su un’ambientazione specifica, i dettagli sono importanti, soprattutto quando si creano elementi visivi con uno scopo preciso.
Quindi, sebbene Alexa+ abbia potenziale e una velocità impressionante, è ancora inferiore a ChatGPT quando conta la precisione dei prompt. Il mio consiglio agli utenti è di usare Alexa+ per velocità e realismo, ma di essere pronti a modificare qualsiasi immagine risultante con prompt successivi.