Que son los AI Agents?

Que son los AI Agents?

Els Agents d’Intel·ligència Artificial (AI Agents) estan revolucionant la manera com abordem tasques complexes, aprofitant el poder dels grans models de llenguatge (LLM).

En essència, els agents d’IA són sistemes basats LLMs dissenyats per assolir objectius en múltiples passos, aprofitant les eines que li facilitem de manera autònoma segons calgui.

En la seva versió més senzilla un Agent es composa de 3 elements:

  • Un model LLM,  que permet a l’Agent raonar i prendre decisions
  • Un conjunt d’eines que posem a disposició seva per tal d’assolir els objectius
  • Un conjunt d’instruccions, que són explicacions explícites de com volem que es comporti i quins objectius té.

Per exemple, podem definir un agent molt senzill que simplement faci cerques a internet

root_agent = Agent(
    name="basic_search_agent",
    model="gemini-2.5-flash",
    description=(
        "Assistent que pot fer cerques a la web"
    ),
    instruction=(
        "Ets un assistent que li agrada ajudar. Respon a les preguntes dels usuaris mitjançant una Cerca de Google quan calgui.
    ),
    tools=[google_search]
)

I preguntar-li, per exemple,  “quin ha estat el darrer partit del Barça i quin va ser el resultat ?”, l’agent farà una cerca per la web, en processarà els resultats i ens donarà la resposta en llenguatge natural, a més a més, de les referències d’on ha trobat aquesta informació per a què puguem validar la font d’on ha obtingut aquella informació.

Els agents també disposen de capacitats addicionals com:

  • Planificar i reflexionar:  els agents d’IA poden analitzar un problema, dividir-lo en passos i ajustar el seu enfocament en funció de la nova informació.
  • Accés a eines: poden interactuar amb eines i recursos externs, com ara bases de dades, APIs o aplicacions concretes, per recopilar informació i executar accions.
  • Memòria: els agents d’IA poden emmagatzemar i recuperar informació, cosa que els permet aprendre de les experiències passades i prendre decisions més informades.

Components principals d’un agent d’Intel·ligència Artificial (AI Agents)

Exemple d’ús: Agent de gestió de sol·licituds de viatge d’empresa

Objectiu: Decidir si autoritza o no una sol·licitud de viatge per a un empleat.

Eines disponibles:

  • Verificador de polítiques de viatge: Consulta i interpreta les normes de l’empresa (pressupost, destinacions permeses, motius justificats).
  • Visor de l’agenda de l’empresa: Accedeix a l’agenda per veure si la reunió o esdeveniment proposat existeix i és rellevant.
  • Comparador de costos històrics: Revisa viatges similars realitzats pel mateix departament o empresa, comparant costos i justificacions.

Funcionament:

Quan l’agent rep una petició, fa servir el verificador de polítiques per veure si compleix la normativa. Consulta l’agenda per validar l’esdeveniment què motiva el viatge. Finalment, compara el cost proposat amb altres viatges similars ja aprovats o rebutjats. Si algun aspecte no s’ajusta, pot rebutjar la petició o demanar informació addicional, o aprovar-la si tot és correcte.

Si aquest agent es programés de la manera tradicional, s’haurien de codificar totes les excepcions i variacions en polítiques, esdeveniments i supòsits, cosa molt complexa. Un agent flexible pot adaptar-se directament als canvis de normatives i noves situacions.

Exemple d’ús: Agent de gestió de trànsit en una ciutat intel·ligent

Aquest és un altre exemple, totalment fictici,  per a què s’entengui com l’agent s’adaptaria a diferents situacions.

Objectiu: Optimitzar el flux del trànsit urbà en temps real per minimitzar embussos i temps d’espera.

Eines disponibles:

  • Càmeres i sensors de trànsit que proporcionen dades en temps real sobre el volum de vehicles i incidències.
  • Prediccions meteorològiques per anticipar com el temps pot afectar la circulació.
  • Controladors de semàfors i senyals viaris (capacitat per canviar els temps dels semàfors, obrir/tancar carrils, informar conductors, …).

Funcionament adaptatiu:

Suposem que a una hora punta es detecta una acumulació de vehicles en una avinguda. 

L’agent no segueix sempre el mateix patró:

  • Si veu que la causa és un accident a través dels sensors, opta primer per modificar els semàfors o recomanar rutes alternatives als conductors.
  • Si sap que aviat plourà (via les prediccions meteorològiques), incrementa posicions de seguretat, allarga els temps de semàfor en cruïlles conflictives o redueix la velocitat recomanada.
  • Pot alternar i combinar les eines; per exemple, canvia la programació semafòrica mentre monitoritza si la mesura té efecte i, si no funciona prou bé, recorre a les dades meteorològiques o envia avisos als conductors.

L’agent decideix a cada moment quina eina o combinació d’eines és més útil segons el context, podent canviar d’estratègia pel que passa minut a minut.

Com en l’exemple anterior,  això seria molt difícil de programar de manera tradicional, ja que les situacions reals són infinites i canviants, però un agent amb IA pot adaptar-se automàticament combinant recursos segons el que passa en temps real.

Ara que hem detallat l’estructura  interna d’un agent,  cal tenir en compte que podem tenir agents especialitzats en tasques concretes, i que podem crear agents que coordinin subagents per a que col·laborin entre si  per a resoldre problemes complexos de forma més eficient.  És el que anomenem Sistema Multi-Agent (MAS: Multi-Agent System), que explicarem en una altra ocasió.

Els Agents d’IA ja formen part essencial dels sistemes del futur, són col·laboratius, intel·ligents i adaptatius.