3. Image creation and modification

Introducció a la creació d'imatges amb IA

La generació d’imatges a partir de text utilitzant la IA s’ha convertit en una eina poderosa en tots els camps, però pot resultar especialment interessant en el camp educatiu, permetent als docents il·lustrar conceptes, crear materials visuals personalitzats i estimular la creativitat de l’alumnat. Així, doncs, la IA és capaç i molt hàbil a l’hora de generar imatges, d’una forma similar a la seva capacitat per generar textos, el que ens permet crear imatges totalment noves i amb estils diferents (fotografia, realista, estic còmic, gravat, amb estil cubista, etc.).

En aquest apartat explorarem com crear bons prompts, quins serveis són els més útils, així com les seves limitacions.

Cream bons prompts per generar imatges: Ús de llenguatge clar i concís


Alguns dels Grans Models Lingüístics, com ChatGPT o Copilot ja permeten generar imatges amb els xatbots. El primer pas per generar imatges efectives és saber com elaborar un prompt clar i precís. Un bon prompt ha de definir clarament l'objectiu de la imatge, utilitzant un llenguatge concís i detallat que descrigui els elements clau. Per aconseguir que la IA generi la imatge desitjada, és essencial ser específic. Això inclou la descripció de colors, estils, elements, emocions i qualsevol altre detall visual que pugui influir en el resultat.
Genera una imatge d’un paisatge de muntanya a l’hivern, amb un cel estrellat i una lluna plena reflectida en un llac congelat
CEP Ibsteam. Imatge generada amb DAL.LE (CC BY-NC-SA)
Alguns serveis permeten fixar l’estil (fotografia, hiperrealista, estic còmic, gravat, amb estil cubista, etc.). A les opcions, mentre que altres com ara DALL-E o el xat de Bing no tenen aquestes opcions i ho haurem de ficar dins del prompt.
Exemple de prompts per a la generació d'imatges

Tipus de serveis

Alguns serveis de generació d’imatges ens permeten obtenir bons resultats sense la necessitat d’iniciar sessió, la qual cosa és molt interessant sobretot si hem de fer feina amb el nostre alumnat.

Exploració de serveis on no és necessari iniciar sessió:

PicFinder: A més que no necessita registre, crea les imatges de forma molt ràpida i t’ofereix múltiples opcions d’imatges generades mentre fas scroll (no 2 o 3 com creen els altres serveis), el que resulta molt interessant.
Craiyon: Usa una versió “mini” de DALL-E i tampoc requereix registre ni va amb crèdits, però té dificultats per entendre les ordres en català.

Exploració de serveis on necessàriament s’ha d’iniciar sessió:

Tant el generador d’imatges de Bing (també accessible mitjançant el Copilot de Bing) com ChatGPT usen tecnologia basada en DALL-E 3, pertanyent a OpenAI, el qual es consideraria el millor generador d’imatges del moment.
Ideogram i NightCafe Studio poden ser alternatives interessants per generar imatges, estant la darrera enfocada a crear imatges artístiques.

Aplicacions pràctiques

Il·lustrar històries o contes.
Creació de material visual personalitzat, ja siguin il·lustracions com també mapes, esquemes i diagrames, tant per classe com per a les nostres presentacions, tasques o proves.
Fomentar la creativitat a l’expressió escrita, permetent treballar aquesta expressió per aconseguir millors resultats en la generació d’imatges.
Crear imatges per treballar conflictes en l'aula o per tractar les habilitats socials i emocionals.
Creació de personatges i escenaris per a jocs i per a la gamificació.
Generació de materials adaptats per a estudiants amb dificultats o amb necessitats educatives especials.
Descripció de conceptes abstractes.

Avantatges

L'ús de la intel·ligència artificial per a la generació i modificació d'imatges ofereix avantatges importants en l'educació, com l'estalvi de temps, la personalització dels materials didàctics i la facilitació de la comprensió de conceptes abstractes. A més, fomenta la creativitat, permet l'adaptació a la neurodiversitat de l'alumnat i facilita la creació de recursos visuals atractius, incrementant la motivació dels alumnes. També possibilita l'ús d'eines avançades, com Canva amb llicència PRO per a docents, que milloren la qualitat dels continguts i enriqueixen l'aprenentatge a través de la gamificació i la creació de projectes interactius.

Limitacions

Entre les limitacions actuals, en destaquem tres:

La majoria de serveis de generació d’imatges no són capaços d'incloure text, o si ho fan, no solen ser exactament com l'escrivim nosaltres, sinó que sovint el modifiquen o fins i tot canvien l'idioma. (Recraft seria una opció de servei que permet manipular imatges i ficar-hi text).
Precisió limitada en detalls científics/tècnics. Les IA encara tenen dificultats per generar imatges amb precisió d'objectes complexos com cèl·lules, òrgans, màquines, etc. Un professor de ciències pot utilitzar la IA generativa d’imatges per crear una representació d'una cèl·lula. No obstant això, la imatge generada pot no ser precisa, cosa que pot confondre els alumnes. El mateix passaria, per exemple, si intentéssim reproduir una època històrica concreta, on els detalls poden ser inconsistents i anacrònics.
La majoria utilitzen un sistema de crèdits o tokens que limiten el nombre d'imatges que podem generar, aquests crèdits se solen recarregar passat un temps.

Tutorial de l'eina Lexica

Lexica.art és una plataforma especialitzada en la generació i cerca d'imatges creades mitjançant intel·ligència artificial (IA). Els avantatges inclouen una biblioteca extensa d'imatges generades per IA, la capacitat de personalitzar noves creacions a través de prompts, i una interfície intuïtiva que permet als usuaris inspirar-se o crear les seves pròpies imatges amb facilitat i si usam la versió bàsica, no necessitarem registrar-nos.

Per generar una imatge, en primer lloc li donam el prompt que considerem:

CEP Ibsteam. *Tutorial Lexica passa 1* (CC BY-NC-SA)

Després de fer clic a "search", ens generarà una gran diversitat d'imatges. Aquí en teniu un exemple:

CEP Ibsteam. *Tutorial Lexica passa 2* (CC BY-NC-SA)

Seleccionam la fotografia que més ens agradi i ens la podrem descarregar, la podrem editar o copiar-ne el prompt:

CEP Ibsteam. *Tutorial Lexica passa 3* (CC BY-NC-SA)

Modificació d'imatges amb Canva

La IA ens permet, també, la modificació d’imatges que puguem necessitar per a la nostra tasca docent, ja sigui per fer les nostres presentacions més creatives, per donar suport visual a les indicacions que oferim o per captar l’interès de l’alumnat. En aquest sentit, l’ús de la IA dins de l’aplicació Canva destaca per damunt d’altres aplicacions. Destacar que, pel fet de ser docents, podem accedir a les llicències PRO d’aquesta plataforma.

A continuació, podeu veure les diferents funcionalitats de Canva amb relació a la modificació o edició d'imatges:

Eliminador de fons

Agafam una foto qualsevol a través de l’apartat de l’esquerre “elements”. Podem escriure, exemple, “arròs amb llet”. Seleccionam la foto desitjada, ens dirigim a superior esquerre i posam “editar foto”.

Veim com a la part de l’esquerre se’ns presenta un menú amb l’opció “Eliminador de fons”. Feim clic damunt el botó i automàticament veurem com el fons desapareix.

CEP Ibsteam. *Eliminador de fons 2 Canva* (CC BY-NC-SA)

Goma d'esborrar

Posem per cas que només ens interessa el tassó amb arròs amb llet i volem eliminar la canyella. En aquest cas, feim clic a l’opció “goma d’esborrar” i seleccionam allò que no volem.

CEP Ibsteam. *Goma esborrar Canva* (CC BY-NC-SA)

Automàticament, s'esborra l'objecte seleccionat.

CEP Ibsteam. *Goma esborrar 2 Canva* (CC BY-NC-SA)

Expansió màgica

Si el que volem és expandir una imatge de manera que s'ajusti a les dimensions del requadre on es troba, farem servir la funció "expansió màgica".

Podem elegir la dimensió a la qual volem que s'ajusti la nostra imatge. En el nostre cas, volem que s'ajusti a la pàgina sencera.

CEP Ibsteam. *Expansió màgica 2 Canva* (CC BY-NC-SA)

Automàticament, la imatge s'expandeix a tota la pàgina, quedant de la següent manera:

CEP Ibsteam. *Expansion mágica 3 Canva* (CC BY-NC-SA)

Selecciona text

A continuació, explorarem la funcionalitat "selecciona text". Començarem seleccionant el botó que es mostra a la imatge.

Automàticament, Canva selecciona el text que identifica de la imatge. En aquest cas, el text "RETIREMENT" que podem veure escrit al senyal. Una vegada selecciona el text, et permet editar-lo:

CEP Ibsteam. *Selecciona text 2 Canva* (CC BY-NC-SA)

Captura màgica

A continuació, mostram com utilitzar la funcionalitat "captura màgica". En primer lloc, hem de seleccionar la fotografia sobre la qual volem fer aquesta captura màgica i fer clic a l'opció "edita". Després, hem de fer clic damunt "captura màgica", tal com s'indica a la següent fotografia:

Veurem com Canva identifica els ítems de la fotografia i els captura:

Ara, podrem modificar les dimensions de l'ítem i col·locar-lo al lloc que vulguem de la fotografia:

Edició màgica

A continuació farem servir la funcionalitat de Canva anomenada "edició màgica".

Edició màgica ens permet seleccionar l'ítem de la fotografia que volem canviar. En aquest cas, hem fet clic damunt el senyal i li hem descrit l'edició que volem fer. En aquest cas, li hem demanat que ens el canviï per un cartell lluminós.

CEP Ibsteam. *Edició màgica 2 Canva* (CC BY-NC-SA)

Podeu veure el resultat a la següent fotografia. Tal com es mostra, Canva sempre dona quatre opcions. Si no ens agrada, podem canviar la petició o bé tornar a generar noves imatges.

Edició màgica 3 Canva — CEP Ibsteam. *Edició màgica 2 Canva* (CC BY-NC-SA)

Finalment, podem afegir-hi el text que considerem necessari.

Llicenciat sota la Llicència Creative Commons Reconeixement CompartirIgual 4.0