1.1 Introducció a la IA Generativa i els diferents models lingüístics (LLM)

Introducció

La intel·ligència artificial (IA) s'ha convertit en una de les tecnologies més revolucionàries del nostre temps, amb una influència que s'estén a gairebé tots els àmbits de la nostra societat. Des de l'atenció mèdica fins a l'agricultura, passant pels transports i l'entreteniment, la IA està present en diverses formes, optimitzant processos, millorant l'eficiència i permetent la innovació a una escala sense precedents, sovint de manera inadvertida i sense que en siguem conscients. No obstant això, el ràpid avanç de la IA també planteja dilemes importants, com les preocupacions ètiques sobre la privacitat i la seguretat, així com preguntes sobre l'impacte en l'ocupació i la desigualtat, els quals és essencial anar afrontant per tal de garantir que aquesta tecnologia es faci servir per al benefici de tota la humanitat.

En l'àmbit educatiu, la IA també sembla que transformarà la manera com ensenyem i aprenem. Des de la personalització de l'aprenentatge fins a l'automatització de tasques administratives, la IA ofereix noves oportunitats per millorar l'eficàcia i l'equitat.

El que està clar és que ens hem de preparar per a la IA, no només pel que fa a les habilitats tècniques directament vinculades al seu ús, com les matemàtiques, l'estadística o la programació, sinó també pel que fa a la promoció d'un pensament crític i reflexiu que permeti a la nostra societat entendre i afrontar els riscs que aquesta tecnologia comporta.

És essencial abordar aquests riscs des de les primeres etapes del sistema educatiu. Sens dubte, els docents serem els primers professionals que haurem d'adaptar-nos a aquest canvi, assumint la responsabilitat de conèixer i comprendre la IA per tal de formar i guiar els ciutadans del futur. La IA està transformant la societat de manera radical, comença un nou paradigma professional i social i el nostre alumnat ha d’estar preparat.

CEP IBSTEAM. *Passes per a una bona integració de la IA en la societat.* (CC BY-SA)

Què és la IA generativa i com funciona

Què és la IA generativa?

La intel·ligència artificial generativa (IA generativa) és una branca de la intel·ligència artificial dissenyada per crear contingut nou i original a partir de dades preexistents. A diferència de la IA discriminativa, que se centra a classificar o analitzar dades existents, la IA generativa té la capacitat de generar dades que no existien prèviament. Aquest contingut pot incloure text, música, imatges, vídeos i altres formes de representació simbòlica del pensament humà.

Com funciona la IA generativa?

La IA generativa es basa en tecnologies que formen part de la família de l'aprenentatge automàtic (AA). Aquestes tecnologies utilitzen algorismes que permeten millorar contínuament i automàticament el rendiment a partir de les dades. Un dels tipus d'aprenentatge automàtic més utilitzats en IA generativa és el de les xarxes neuronals artificials (RNAs), que s'inspiren en el funcionament del cervell humà i les seves connexions sinàptiques.

Hi ha diversos tipus de models de IA generativa:

Transformador generatiu preentrenat (GPT)

Utilitzat en la generació de text, com és el cas de ChatGPT. Aquests models són capaços de captar els matisos del llenguatge i generar textos coherents en funció del context gràcies a la seva formació amb grans quantitats de dades.

Xarxes generatives antagòniques (GANs)

Utilitzades en la generació d'imatges. Aquestes xarxes consten de dos models que competeixen entre si per millorar contínuament la qualitat de les imatges generades.

En general, la IA generativa analitza estadísticament la distribució d'elements (com ara paraules o píxels) en les dades que ha assimilat, identificant i repetint patrons comuns. Tot i això, és important tenir en compte que, malgrat la seva fluïdesa i capacitat de producció, la IA generativa no és capaç de comprendre objectes reals ni les relacions socials que sustenten el llenguatge. Per tant, la precisió del contingut generat no sempre pot ser garantida i sovint requereix la supervisió d'un usuari amb sòlids coneixements sobre el tema.

IA generativa de text o grans models lingüístics (LLM)

Els Grans Models Lingüístics (LLM) són una eina potent i versàtil que està transformant la manera com interactuem amb la tecnologia de processament de llenguatge natural (NLP). El seu ús responsable i informat pot oferir grans beneficis, tant en l'educació com en altres àmbits professionals i acadèmics.

Introducció als Grans Models Lingüístics (LLM)

Els Grans Models Lingüístics (LLM) són una forma avançada d'intel·ligència artificial que utilitza tècniques d'aprenentatge profund (deep learning) per dur a terme diverses tasques de processament del llenguatge natural. Aquestes tasques inclouen la classificació, el resum, la traducció i la generació de textos. Els LLM han revolucionat el camp de la IA generativa, permetent la creació de contingut text de manera coherent i contextual.

Funcionament

Els LLM, com els models GPT (Generative Pretrained Transformer), es basen en xarxes neuronals artificials específiques anomenades transformadors. Aquestes xarxes poden processar seqüències de text en paral·lel, identificant les relacions entre paraules per generar nou contingut basat en el context inicial proporcionat. El procés de funcionament dels LLM inclou diverses fases clau:

Tokenització: Els models lingüístics descomponen el text d'entrada en unitats més petites anomenades tokens. Aquests tokens poden ser caràcters individuals, paraules o fins i tot frases completes, depenent del nivell de granularitat necessari per a la tasca específica. Aquesta descomposició permet al model processar i analitzar el text de manera més eficient, mantenint el context necessari per generar respostes coherents.
Entrenament: Els LLM es formen amb enormes quantitats de dades textuals per ajustar els paràmetres del model. Aquests paràmetres, coneguts com pesos, determinen com el model processa les seves entrades i genera respostes. L'entrenament implica la presentació de grans volums de text al model, perquè aprengui les relacions i patrons dins del llenguatge. Això permet als LLM capturar matisos lingüístics i generar text amb alta precisió.
Generació de text: Un cop entrenat, el model pot generar text nou predient la paraula següent en una frase o text, donat el context inicial. Això permet la creació de respostes coherents i contextualment rellevants en una varietat d'aplicacions, des de xatbots fins a la creació de contingut educatiu i investigatiu. La capacitat de generar text coherent fa que els LLM siguin especialment útils en aplicacions que requereixen comunicació natural amb usuaris humans.

Aplicacions pràctiques

Els LLM utilitzen diverses tecnologies de processament de llenguatge natural per dur a terme les seves tasques. Aquestes tecnologies inclouen:

Classificació de text: Identificació de la categoria o el tema del text, permetent la seva organització i recuperació eficient.
Resum: Creació de resums concisos a partir de documents llargs, facilitant la comprensió ràpida de grans volums d'informació.
Traducció automàtica: Traducció de text d'un idioma a un altre mantenint el context i el significat original, millorant la comunicació multilingüe.
Generació de text: Creació de text nou basat en instruccions específiques proporcionades per l'usuari, conegudes com prompts. Aquesta capacitat és fonamental per a aplicacions com l'escriptura assistida i la creació de contingut automàtic.

Limitacions i Consideracions

Malgrat els seus nombrosos avantatges, els LLM presenten algunes limitacions que cal tenir en compte:

Propagació de biaixos: Els models poden reflectir i amplificar els biaixos presents en les dades d'entrenament, la qual cosa pot conduir a resultats no desitjats o injustos.
Necessitat de supervisió: Les respostes generades pels LLM necessiten ser verificades per garantir la seva precisió i adequació, especialment en contextos educatius on l'exactitud de la informació és crucial.
Desafiaments ètics: L'ús de LLM planteja qüestions ètiques relacionades amb la privacitat, la seguretat i la transparència en l'ús de dades personals i continguts generats.

Serveis de IA generativa de text: Comparativa de xatbots

Avui en dia conviuen diversos serveis de IA generativa de text, i a més contínuament en van sorgint de nous. En aquest enllaç hi pots trobar una breu descripció, així com els principals avantatges i inconvenients, dels més destacats en l'actualitat, com ChatGPT, Copilot, Claude, Perplexity, Gemini, Hugging Face Chat, "Le Chat", "Llama 3", Pi i Phind.

En la mateixa línia podeu trobar el projecte LMArena, que permet als usuaris comparar i avaluar els diferents xatbots.

D’altra banda, consideram important fer-vos un tast sobre l’eina jan.ai, un programa de codi obert que permet executar models de llenguatge de manera local, i l’eina NotebookLM, que permet treballar amb fonts pròpies carregades per l’usuari.

LMArena

LMArena és un projecte concebut pel grup de recerca LMSYS de la UC Berkeley. Aquest lloc web ens permet comparar i avaluar bots impulsats per intel·ligència artificial.

És gratuït i no cal registre.

Hi apareixen tots els LLM, dels més antics fins als més nous que van sortint (actualment n’hi ha 255).

Si cliques a Leaderboard pots veure una classificació dels millors xatbots segons els usuaris, tenint en compte diferents aspectes: text, imatge, visió, etc.

CEP IBSTEAM. *LMArena: Classificació millors xatbots* (CC BY-NC-SA)

Funciona de la manera següent: l'usuari escriu un prompt al qual responen dos d'aquests xatbots i, sense saber quin és quin, tria la millor resposta. Un cop votada la resposta, es revela quin model és.

CEP IBSTEAM. *LMArena: Funcionament* (CC BY-NC-SA)

CEP IBSTEAM. *LMArena: Battle* (CC BY-NC-SA)

Al desplegable on posa Battle, pots seleccionar Side-by-Side i elegir els dos xatbots que vols comparar.

CEP IBSTEAM. *LMArena: Side by Side* (CC BY-NC-SA)

CEP IBSTEAM. *LMArena: Side by Side 2* (CC BY-NC-SA)

jan.ai

Els diferents xatbots esmentats anteriorment es fan servir a través de pàgines web que ens permeten utilitzar-los. Alguns serveis com jan.ai ens permeten instal·lar al nostre propi ordinador el programa amb el qual podrem accedir a les versions lliures dels diferents models de llenguatge, de manera que no necessitam Internet i, a més, es garanteix l'absoluta privacitat de les converses. Hi ha diversos models disponibles com els de Mistral, Llama, OpenHermes, etc. No obstant això, els models de llenguatge d’aquest tipus solen ser de menor qualitat en comparació amb els que es troben a les pàgines web esmentades anteriorment.

NotebookLM

L’eina NotebookLM de Google és una intel·ligència artificial que permet als usuaris crear, resumir i gestionar notes i documents, incloent-hi la generació de resums, guies d’estudi, fer preguntes i pòdcasts a partir de les fonts carregades, garantint precisió i evitant invencions. En la seva versió actual utilitza la intel·ligència artificial de Google Gemini Pro 1.5. És per a majors de 18 anys.

A l’article Aplicaciones docentes de Google NotebookLM pots veure com funciona i al blog IA Educativa hi trobaràs alguns exemples pràctics sobre la seva aplicació.

Llicenciat sota la Llicència Creative Commons Reconeixement CompartirIgual 4.0