Torna al Blog
Agenti AI

Hermes Agent e la Forma del Lavoro AI Persistente

Una lettura tecnica della repository Hermes Agent di Nous Research: memoria, skill, gateway, cron e runtime portabili trasformano l'agente in un ambiente operativo.

Hermes Agent è interessante perché tratta l’agente meno come una finestra chat e più come un runtime. La repository di Nous Research mette insieme CLI, gateway per messaggistica, memoria, skill, registro strumenti, cron, backend terminali e tooling per generare traiettorie di training. Questa combinazione dice qualcosa di importante sulla direzione del software agentico: l’unità utile non è più solo il prompt. È l’ambiente attorno al prompt.

Perché Questa Repository Conta

Il segnale più forte è la persistenza. Hermes può mantenere memoria tra sessioni, cercare conversazioni passate, creare o aggiornare skill dall’esperienza, eseguire attività pianificate e continuare il lavoro da un ambiente cloud invece di dipendere da un singolo laptop. L’agente diventa una superficie operativa durevole, non un assistente usa e getta che dimentica la forma del lavoro appena si chiude la tab.

Per chi sviluppa, questa è la vera lezione della repo. La parte interessante non è una singola feature isolata. È il modo in cui i pezzi sono organizzati per permettere all’agente di accumulare contesto, riusare procedure, raggiungere strumenti e comparire in interfacce diverse senza cambiare il proprio loop centrale.

Il Segnale Tecnico

La documentazione architetturale descrive Hermes attorno a un core condiviso AIAgent, con CLI, gateway, ACP, batch runner, API server e libreria che entrano nello stesso ciclo di esecuzione. È un confine progettuale corretto. Le interfacce possono cambiare, ma risoluzione del modello, assemblaggio del prompt, dispatch degli strumenti, persistenza e callback devono restare coerenti.

Tre scelte emergono con forza:

  • La memoria è limitata e curata, non un vector store infinito incollato di lato. MEMORY.md, USER.md, cronologia SQLite, ricerca FTS5 e provider opzionali costruiscono livelli diversi di richiamo con costi diversi.
  • Le skill sono memoria procedurale. Sono documenti caricati on demand tramite progressive disclosure, e l’agente può crearli o migliorarli dopo lavoro reale. Le lezioni apprese diventano istruzioni operative riusabili.
  • L’esecuzione è portabile. Backend local, Docker, SSH, Singularity, Modal, Daytona e Vercel Sandbox rendono l’ambiente terminale una risorsa configurabile, non un presupposto.

Questo conta perché gli agenti falliscono quando ogni task riparte da zero. Un agente di coding che deve riscoprire ogni giorno convenzioni di progetto, pattern di approvazione, comandi di deploy e rituali di debug non sta imparando. Sta solo ricampionando. La struttura di Hermes punta verso qualcosa di più durevole: un sistema in cui conoscenza, strumenti e ambienti possono sopravvivere a una singola conversazione.

Il passaggio importante è da agente come interfaccia ad agente come runtime: un luogo in cui memoria, strumenti, pianificazione, canali e backend di esecuzione convergono.

Dalla Chat al Loop Operativo

Molti prodotti agentici si presentano ancora come un posto in cui scrivere. Hermes è più ambizioso. Permette allo stesso agente di apparire in una TUI terminale, su piattaforme di messaggistica, in integrazioni per editor, in job pianificati e in workflow batch. Questo cambia il modello di prodotto.

Se un agente può vivere in Telegram, Discord, Slack, WhatsApp, Signal, CLI e in un processo gateway, non è più legato alla forma visiva di una singola app. L’utente può passare lavoro da telefono, interrompere un job, pianificare un controllo ricorrente o lasciare che un task continui dentro un backend remoto. La conversazione diventa il piano di controllo, mentre il lavoro effettivo può avvenire altrove.

È particolarmente importante per infrastruttura e workflow developer. Una VM cloud, un backend Docker o una sandbox serverless possono essere più sicuri e riproducibili rispetto a un agente locale che modifica la stessa macchina su cui l’utente sta lavorando. L’astrazione dei backend nella repo non è solo comodità. È una separazione architetturale tra dove vengono date le istruzioni e dove avvengono gli effetti.

Il Loop di Apprendimento È il Prodotto

Il sistema di skill è il pezzo che rende Hermes diverso da una semplice somma di integrazioni. Le skill non sono solo comandi. Sono conoscenza operativa compressa: come eseguire un workflow, cosa controllare, quali rischi evitare e come verificare il risultato. Poiché Hermes può creare o aggiornare skill dopo attività complesse, l’agente ha un percorso per trasformare esperienza in procedura.

È un pattern utile anche fuori da Hermes. I team che adottano agenti non dovrebbero chiedersi solo “qual è il modello migliore?”. Dovrebbero chiedersi:

  • dove conserva l’agente la conoscenza specifica del progetto?
  • come distingue memoria durevole e cronologia ricercabile?
  • può trasformare workflow riusciti in istruzioni riusabili?
  • quelle istruzioni possono essere revisionate, versionate e rimosse?
  • cosa succede quando l’agente sbaglia e impara la lezione sbagliata?

L’ultima domanda è decisiva. Gli agenti persistenti alzano il soffitto, ma introducono anche manutenzione. La memoria va potata. Le skill vanno revisionate. L’accesso agli strumenti va approvato. L’esecuzione remota va isolata. Un agente che migliora da solo ha comunque bisogno di un confine governato da umani.

Cosa Dovrebbero Osservare gli Sviluppatori

Hermes Agent merita attenzione perché riunisce filoni che spesso vengono discussi separatamente: memoria agentica, orchestrazione strumenti, gateway di messaggistica, automazioni pianificate, MCP, skill, sandbox remote e traiettorie per training. La repository suggerisce che il prossimo stack agentico serio somiglierà meno a un wrapper di chatbot e più a un piccolo sistema operativo per il lavoro AI.

Il takeaway pratico è progettare gli agenti attorno alla continuità. Un agente utile deve sapere quale contesto è durevole, quale è temporaneo, quali procedure sono riusabili, quali strumenti sono pericolosi e quale ambiente deve ricevere gli effetti collaterali. Senza questi confini, la persistenza diventa rumore. Con questi confini, diventa leva.

Per chi costruisce, la domanda non è “ogni progetto dovrebbe usare Hermes?”. È più precisa: quali parti di questo modello runtime servono al tuo agente? Un helper di coding per il weekend può cavarsela con CLI e pochi strumenti. Un assistente di produzione ha bisogno di igiene della memoria, gate di approvazione, lavoro pianificato, routing tra piattaforme e un luogo sicuro dove eseguire.

Glossario Tecnico

Runtime agentico: ambiente operativo attorno a un agente AI, inclusi memoria, strumenti, backend di esecuzione, interfacce, permessi e pianificazione.

Memoria procedurale: conoscenza riusabile su come svolgere attività, spesso codificata come istruzioni, skill, checklist o workflow.

Registro strumenti: catalogo di funzioni invocabili dall’agente, di solito con schema, disponibilità e controlli di errore.

Gateway: processo che collega l’agente a piattaforme di messaggistica esterne mantenendo routing delle sessioni e consegna coerenti.

Backend terminale: ambiente in cui girano comandi shell e operazioni sui file, per esempio macchina locale, Docker, SSH o sandbox cloud.

FTS5: estensione full-text search di SQLite, utile per cercare sessioni salvate senza caricare tutto nel contesto attivo.

Sorgente Originale Approfondisci su GitHub

Quest'articolo ti ha aiutato?

Condividilo con chi vuoi:

Sommario Settimanale

Ricevi una selezione curata delle ultime novità su AI, infrastruttura e ingegneria. Niente rumore, solo contenuti ad alto segnale.