Omet navegació

3. Creació i modificació d'imatges

Introducció a la creació d'imatges amb IA

La generació d’imatges a partir de text utilitzant la IA s’ha convertit en una eina poderosa en tots els camps, però pot resultar especialment interessant en el camp educatiu, permetent als docents il·lustrar conceptes, crear materials visuals personalitzats i estimular la creativitat de l’alumnat. Així, doncs, la IA és capaç i molt hàbil a l’hora de generar imatges, d’una forma similar a la seva capacitat per generar textos, el que ens permet crear imatges totalment noves i amb estils diferents (fotografia, realista, estic còmic, gravat, amb estil cubista, etc.).

En aquest apartat explorarem com crear bons prompts, les seves avantatges, així com les seves limitacions.

Cream bons prompts per generar imatges: Ús de llenguatge clar i concís

Alguns dels Grans Models Lingüístics, com ChatGPT o Copilot ja permeten generar imatges amb els xatbots. El primer pas per generar imatges efectives és saber com elaborar un prompt clar i precís. Un bon prompt ha de definir clarament l'objectiu de la imatge, utilitzant un llenguatge concís i detallat que descrigui els elements clau. Per aconseguir que la IA generi la imatge desitjada, és essencial ser específic. Això inclou la descripció de colors, estils, elements, emocions i qualsevol altre detall visual que pugui influir en el resultat. 

Genera una imatge d’un paisatge de muntanya a l’hivern, amb un cel estrellat i una lluna plena reflectida en un llac congelat

CEP Ibsteam. Imatge generada amb DAL.LE (CC BY-NC-SA)

Alguns serveis permeten fixar l’estil (fotografia, hiperrealista, estic còmic, gravat, amb estil cubista,  etc.). A les opcions, mentre que altres com ara DALL-E o el xat de Bing no tenen aquestes opcions i ho haurem de ficar dins del prompt.

Exemple de prompts per a la generació d'imatges

Aplicacions pràctiques

  • Il·lustrar històries o contes.
  • Creació de material visual personalitzat, ja siguin il·lustracions com també mapes, esquemes i diagrames, tant per classe com per a les nostres presentacions, tasques o proves.
  • Fomentar la creativitat a l’expressió escrita, permetent treballar aquesta expressió per aconseguir millors resultats en la generació d’imatges.
  • Crear imatges per treballar conflictes en l'aula o per tractar les habilitats socials i emocionals.
  • Creació de personatges i escenaris per a jocs i per a la gamificació.
  • Generació de materials adaptats per a estudiants amb dificultats o amb necessitats educatives especials.
  • Descripció de conceptes abstractes.

Avantatges

L'ús de la intel·ligència artificial per a la generació i modificació d'imatges ofereix avantatges importants en l'educació, com l'estalvi de temps, la personalització dels materials didàctics i la facilitació de la comprensió de conceptes abstractes. A més, fomenta la creativitat, permet l'adaptació a la neurodiversitat de l'alumnat i facilita la creació de recursos visuals atractius, incrementant la motivació dels alumnes. També possibilita l'ús d'eines avançades, com Canva amb llicència PRO per a docents, que milloren la qualitat dels continguts i enriqueixen l'aprenentatge a través de la gamificació i la creació de projectes interactius.

Limitacions

Entre les limitacions actuals, en destaquem tres:

  • La majoria de serveis de generació d’imatges no són capaços d'incloure text, o si ho fan, no solen ser exactament com l'escrivim nosaltres, sinó que sovint el modifiquen o fins i tot canvien l'idioma. (Recraft seria una opció de servei que permet manipular imatges i ficar-hi text).
  • Precisió limitada en detalls científics/tècnics. Les IA encara tenen dificultats per generar imatges amb precisió d'objectes complexos com cèl·lules, òrgans, màquines, etc. Un professor de ciències pot utilitzar la IA generativa d’imatges per crear una representació d'una cèl·lula. No obstant això, la imatge generada pot no ser precisa, cosa que pot confondre els alumnes. El mateix passaria, per exemple, si intentéssim reproduir una època històrica concreta, on els detalls poden ser inconsistents i anacrònics.
  • La majoria utilitzen un sistema de crèdits o tokens que limiten el nombre d'imatges que podem generar, aquests crèdits se solen recarregar passat un temps.

IA generativa d'imatges: tipus de serveis*

A continuació, presentam una llista de serveis d’IA generativa d’imatges, que hem dividit entre aquells que estan expressament dedicats a la creació d’imatges i aquells xatbots que es poden utilitzar per crear imatges i que, per tant, no estan dedicats exclusivament a les imatges.

Webs dedicats a crear imatges

Aquests serveis d’imatges amb IA estan dedicats a la generació d’il·lustracions. La majoria ofereixen opcions addicionals que permeten controlar en major o menor grau el resultat final.

  • Recraft. Generador d’imatges gratuït i sense límits que permet manipular les imatges i afegir text.
  • Stable Diffusion. Stablediffusionweb.com és una interfície en línia que utilitza el model Stable Diffusion XL per generar imatges a partir de text. Ofereix la creació gratuïta d’art amb intel·ligència artificial, processant text, imatges i vídeos. La plataforma destaca per la seva facilitat d’ús, generació ràpida d’imatges d’alta qualitat i enfocament en la privacitat de l’usuari. Permet crear art variat, des de paisatges fantàstics fins a retrats, sense recopilar informació personal.
  • Craiyon. No cal registrar-se ni utilitzar crèdits. És un generador d’imatges amb intel·ligència artificial que permet crear art digital a partir de descripcions textuals. Ofereix 9 imatges gratuïtes per sol·licitud, amb un model propi de generació. Disponible en versió gratuïta amb anuncis i pla de pagament, facilita la creació artística a usuaris sense coneixements tècnics.
  • Generador de imágenes de Bing. Proporciona crèdits que es renoven setmanalment. A més de la web habitual, s’hi pot accedir directament des del xat de Copilot, demanant-li que generi una imatge. Utilitza DALL·E 3.
  • Leonardo.AI. Genera imatges realistes de gran qualitat. Ofereix un cert nombre de tokens que es renoven diàriament.
  • Ideogram. No utilitza crèdits ni tokens, però quan està saturat, cal esperar entre imatge i imatge.
  • NightCafe Studio Permet fer dibuixos orientats especialment a l’art i genera un nombre determinat d’imatges cada mes.
  • Flux Pro AI. Permet generar text a imatge i també imatge a imatge.
  • RedPanda. Amb un nombre limitat de tokens, permet generar unes poques imatges.
  • Clipdrop. És una plataforma d’IA per a l’edició d’imatges que no requereix iniciar sessió. Ofereix eines com emplenat generatiu, eliminació de fons, d’objectes, redimensionament i generació de text a imatge. Permet manipular i crear imatges amb facilitat mitjançant tecnologies d’intel·ligència artificial.
  • Raphael.ai és un generador d’imatges amb intel·ligència artificial que transforma descripcions de text en visuals d’alta qualitat, com escenes fotorrealistes, il·lustracions artístiques o imatges d’estil anime. Utilitza el model FLUX.1-Dev, i destaca per la seva rapidesa, qualitat d’imatge i facilitat d’ús, sense necessitat de coneixements tècnics. No requereix registre i és gratuït.
     

Xatbots que també generen imatges

De cada vegada més, els xatbots conversacionals o grans models de llenguatge incorporen la capacitat de generar imatges. Aquests són els xatbots més comuns que ho permeten:

*Extret de web INTEF Inteligencia Artificial en Educación.

Modificació d'imatges amb Canva

La IA ens permet, també, la modificació d’imatges que puguem necessitar per a la nostra tasca docent, ja sigui per fer les nostres presentacions més creatives, per donar suport visual a les indicacions que oferim o per captar l’interès de l’alumnat. En aquest sentit, l’ús de la IA dins de l’aplicació Canva destaca per damunt d’altres aplicacions. Destacar que, pel fet de ser docents, podem accedir a les llicències PRO d’aquesta plataforma.

A continuació, podeu veure les diferents funcionalitats de Canva amb relació a la modificació o edició d'imatges:

Eliminador de fons

Agafam una foto qualsevol a través de l’apartat de l’esquerre “elements”. Podem escriure, exemple, “arròs amb llet”. Seleccionam la foto desitjada, ens dirigim a superior esquerre i posam “editar foto”.

Eliminador de fons Canva
CEP Ibsteam. Eliminador de fons Canva (CC BY-NC-SA)

Veim com a la part de l’esquerre se’ns presenta un menú amb l’opció “Eliminador de fons”. Feim clic damunt el botó i automàticament veurem com el fons desapareix.

Eliminador de fons 2 Canva
CEP Ibsteam. Eliminador de fons 2 Canva (CC BY-NC-SA)

Goma d'esborrar

Posem per cas que només ens interessa el tassó amb arròs amb llet i volem eliminar la canyella. En aquest cas, feim clic a l’opció “goma d’esborrar” i seleccionam allò que no volem.

Goma esborrar Canva
CEP Ibsteam. Goma esborrar Canva (CC BY-NC-SA)

Automàticament, s'esborra l'objecte seleccionat.

Goma esborrar 2 Canva
CEP Ibsteam. Goma esborrar 2 Canva (CC BY-NC-SA)

Expansió màgica

Si el que volem és expandir una imatge de manera que s'ajusti a les dimensions del requadre on es troba, farem servir la funció "expansió màgica".

Expansió màgica Canva
CEP Ibsteam. Expansió màgica Canva (CC BY-NC-SA)

Podem elegir la dimensió a la qual volem que s'ajusti la nostra imatge. En el nostre cas, volem que s'ajusti a la pàgina sencera.

Expansió màgica 2 Canva
CEP Ibsteam. Expansió màgica 2 Canva (CC BY-NC-SA)

Automàticament, la imatge s'expandeix a tota la pàgina, quedant de la següent manera:

Expansion mágica 3 Canva
CEP Ibsteam. Expansion mágica 3 Canva (CC BY-NC-SA)

Selecciona text

A continuació, explorarem la funcionalitat "selecciona text". Començarem seleccionant el botó que es mostra a la imatge.

Selecciona text Canva
CEP Ibsteam. Selecciona text Canva (CC BY-NC-SA)

Automàticament, Canva selecciona el text que identifica de la imatge. En aquest cas, el text "RETIREMENT" que podem veure escrit al senyal. Una vegada selecciona el text, et permet editar-lo:

Selecciona text 2 Canva
CEP Ibsteam. Selecciona text 2 Canva (CC BY-NC-SA)

Captura màgica

A continuació, mostram com utilitzar la funcionalitat "captura màgica". En primer lloc, hem de seleccionar la fotografia sobre la qual volem fer aquesta captura màgica i fer clic a l'opció "edita". Després, hem de fer clic damunt "captura màgica", tal com s'indica a la següent fotografia: 

Captura màgica Canva
CEP Ibsteam. Captura màgica Canva (CC BY-NC-SA)

Veurem com Canva identifica els ítems de la fotografia i els captura:

Captura màgica 2 Canva
CEP Ibsteam. Captura màgica 2 Canva

Ara, podrem modificar les dimensions de l'ítem i col·locar-lo al lloc que vulguem de la fotografia:

Captura màgica 3 Canva
CEP Ibsteam. Captura màgica 3 Canva

Edició màgica

A continuació farem servir la funcionalitat de Canva anomenada "edició màgica".

Edició màgica Canva
CEP Ibsteam. Edició màgica Canva (CC BY-NC-SA)

Edició màgica ens permet seleccionar l'ítem de la fotografia que volem canviar. En aquest cas, hem fet clic damunt el senyal i li hem descrit l'edició que volem fer. En aquest cas, li hem demanat que ens el canviï per un cartell lluminós. 

Edició màgica 2 Canva
CEP Ibsteam. Edició màgica 2 Canva (CC BY-NC-SA)

Podeu veure el resultat a la següent fotografia. Tal com es mostra, Canva sempre dona quatre opcions. Si no ens agrada, podem canviar la petició o bé tornar a generar noves imatges.

Edició màgica 3 Canva
CEP Ibsteam. Edició màgica 2 Canva (CC BY-NC-SA)

Finalment, podem afegir-hi el text que considerem necessari.

Creado con eXeLearning (Ventana nueva)