Rock Robot - Accueil

Astuces pour travailler avec l'Agent Hermès

Travailler avec un agent IA, c'est collaborer au quotidien sur ses vrais sujets. Après deux semaines d'usage intensif — communication, documentation, code, organisation — j'ai identifié les quelques réflexes qui transforment un outil gadget en vrai collègue de travail. Voici ce que j'aurais aimé lire au moment où j'ai commencé.

Le déclic : comprendre que la mémoire n'est pas unique

Au début, je faisais comme avec n'importe quel chat : je posais une question, l'agent répondait, je passais à la suivante. Le lendemain, plus rien. Il ne savait plus qui j'étais, ce que je faisais, comment je voulais qu'on m'écrive. Je recommençais à expliquer à chaque session. C'est le piège classique de l'utilisateur qui découvre un agent conversationnel.

Le déclic, c'est quand j'ai compris qu'un agent comme Hermès ne fonctionne pas avec une mémoire, mais avec plusieurs types de mémoire distincts, chacun avec un rôle, une durée de vie et un usage propre. Une fois qu'on intègre cette architecture, on arrête de re-expliquer sa vie à chaque session.

Pour faire simple, Hermès distingue quatre couches :

La mémoire entretenue — celle qui dure, où l'agent stocke les faits stables (qui je suis, mes conventions, mes préférences de format). Elle est figée au début de chaque session pour que l'agent puisse s'y référer immédiatement.
La mémoire épisodique — l'historique complet de toutes nos conversations passées. C'est ce qui permet à l'agent de se souvenir qu'on a parlé d'un sujet la semaine dernière, même si on n'en a pas reparlé depuis.
La mémoire procédurale — les recettes qu'on lui a apprises. Concrètement chez Hermès, ça s'appelle des skills : un skill, c'est un petit dossier avec un SKILL.md qui décrit une procédure pas-à-pas ("comment rédiger un post selon ma charte", "comment configurer un projet", "comment chercher dans ma base de connaissances"). Ces skills ne sont pas chargés à chaque session, mais l'agent sait qu'ils existent et va les consulter quand il en a besoin.
La mémoire de travail — la conversation en cours. Elle est volatile par conception : elle disparaît à la fin de la session.

Comprendre cette séparation, c'est comprendre quoi mettre où. Et ça change tout.

Astuce n°1 — Sois chirurgical sur ce que tu fais "durer"

La mémoire permanente d'un agent, c'est un peu comme un disque dur. Tu n'y mets pas tout. Tu mets ce qui est stable, réutilisable, et que tu veux vraiment qu'il se rappelle dans 3 mois. Une préférence de formatage ("j'écris en français, ton posé, pas de clickbait"), oui. Une anecdote d'hier, non. Le nom de ton client principal, oui. Le détail d'un bug ponctuel, non.

Le piège classique, c'est de tout sauvegarder "au cas où". Et de se retrouver avec un agent qui te ressort 4 000 caractères de contexte au démarrage, dont la moitié est obsolète. C'est pire qu'avant, parce qu'en plus tu paies le coût (en tokens, en latence, en bruit) de tout ce fatras.

La règle que je me suis fixée : chaque fait sauvegardé doit avoir passé le test de la troisième session. Si après trois usages distincts, l'agent avait besoin de cette info, alors oui, ça mérite de durer. Sinon, ça reste dans la conversation.

Et il y a une raison urgente de faire ce tri vite : la mémoire de travail est finie. Quand une session devient longue, l'agent doit "compacter" — résumer les anciens échanges pour faire de la place. Ce compactage est statistique : l'agent ne demande pas toujours confirmation avant de jeter des détails, et tout ce qui n'a pas été explicitement sauvegardé ailleurs (mémoire entretenue, skill, wiki) disparaît. Règle d'or : tout ce qui compte doit être sorti de la conversation avant qu'elle ne devienne trop longue.

Astuce n°2 — Construis une base de connaissances structurée

Au-delà des skills ponctuels, j'utilise un wiki interne ("llm-wiki", style Karpathy) que l'agent peut consulter à la demande. C'est un ensemble de pages Markdown structurées (concepts, entités, comparaisons) qui grandit avec mon usage. Chaque fois que l'agent et moi tombons d'accord sur un fait utile, je l'ajoute au wiki. Chaque fois qu'on débogue un truc, on documente la solution.

Ça décuple sa mémoire : au bout de deux semaines, l'agent a accès à une mémoire curatée et organisée que je n'ai pas eu à ré-expliquer. Il pioche dedans au bon moment, parce que les pages sont bien indexées et bien taguées. C'est, à mon sens, la meilleure pratique pour qu'un agent s'améliore tout seul : pas en lui balançant des faits au hasard, mais en entretenant une base de connaissances vivante.

Concrètement, le llm-wiki est implémenté comme un skill Hermès — il bénéficie donc du même mécanisme de chargement à la demande. C'est la mémoire procédurale de l'agent, rendue éditable par l'utilisateur.

Astuce n°3 — Donne-lui des procédures, pas des règles

La différence est subtile. Une règle, c'est "ne fais jamais ça". Une procédure, c'est "voici comment faire quand tu rencontres ça". Les agents gèrent beaucoup mieux la deuxième forme.

Un fichier de procédure ("voici comment rédiger un post LinkedIn selon la charte Rock Robot : intro incarnée, 3 angles, CTA formation, 3-5 hashtags") sera retrouvé et appliqué mot pour mot. Une consigne vague ("respecte toujours la charte") se dilue au fil des sessions, parce que l'agent n'a pas de référence précise sur laquelle s'aligner.

C'est pour ça que je passe du temps à écrire mes procédures éditoriales sous forme de documents structurés. Ce ne sont pas des règles abstraites, ce sont des recettes que l'agent peut suivre, étape par étape. Et quand la procédure est bien faite, je n'ai plus besoin de la lui rappeler : il l'a en mémoire procédurale, il va la chercher tout seul.

L'effet de bord positif, c'est que ces procédures me servent aussi à moi. Quand je dois déléguer à un humain (un prestataire, un alternant), la procédure est déjà écrite. Le transfert de connaissance est gratuit.

Astuce n°4 — Ne le laisse pas décider tout seul des trucs engageants

Un agent, c'est pratique pour exécuter. Mais pour les décisions qui t'engagent — publier un post, envoyer un mail à un client, modifier un fichier de production, signer un devis — il y a un point où tu dois relire. Pas par défiance, par hygiène professionnelle.

L'agent peut très bien produire un texte parfait selon ta charte. Mais c'est ton nom sur le post, ton image dans la conversation client, ta responsabilité en cas de bug en prod. La validation finale, c'est toi. Toujours.

Concrètement, je fonctionne en mode proposition-relecture-validation :

L'agent propose une solution ou un livrable.
Je relis, je valide tel quel, ou je corrige.
Si je corrige, j'explique pourquoi à l'agent — c'est comme ça qu'il apprend mes standards.

C'est plus long qu'un mode 100% automatique. Mais c'est le seul qui ne te transforme pas en otage de ce que la machine a décidé à ta place. Et au bout de quelques sessions, le taux de "validation directe" monte, parce que l'agent a compris ce que tu voulais.

Astuce n°5 — Accepte que tu ne l'utiliseras jamais à 100%

Au bout de deux semaines, j'estime que j'utilise peut-être 30% de ce qu'un agent comme Hermès sait faire. Et c'est très bien. Le but n'est pas de "tout automatiser". Le but est de dégager du temps sur les tâches répétitives pour le mettre sur ce qui demande ton jugement.

Un agent qui t'économise 2h par semaine sur de la rédaction mécanique, c'est déjà énorme. Un agent qui essaie de tout faire à ta place, c'est une catastrophe industrielle — tu passes plus de temps à corriger qu'à produire.

Le bon équilibre est personnel. Il dépend de ton secteur, de ta tolérance au risque, de ton temps disponible. Le seul mauvais équilibre, c'est celui où tu délègues sans comprendre ce que l'agent fait, et où tu t'aperçois du problème après coup.

Astuce n°6 — Traite-le comme un collègue, pas comme un outil

C'est peut-être le conseil le plus contre-intuitif. Mais après deux semaines, je n'ai plus l'impression d'utiliser un outil. J'ai l'impression de collaborer avec un collègue qui :

a une mémoire imparfaite (il oubliera des trucs, c'est normal)
apprend vite quand on lui explique (mais pas instantanément)
a besoin qu'on lui recadre de temps en temps (il partira en vrille si tu le laisses sans garde-fou)
fait des erreurs avec assurance (il ne lèvera pas la main pour dire "je ne suis pas sûr")

Du coup, je lui parle comme à un collègue : je lui dis quand c'est bien fait, je lui dis quand c'est à refaire, je lui explique pourquoi. Et je n'attends pas de lui qu'il "devine" ce que je veux — je le formule. Comme avec n'importe quel humain qui ne te connaît pas encore.

Les limites que j'ai rencontrées

Pour être honnête, il y a aussi des choses qui ne marchent pas (encore) bien :

Les tâches très techniques pointues : sur des sujets hyperspécialisés (configuration fine d'un LLM sur llama.cpp, debugging d'un protocole réseau obscur), l'agent peut halluciner des solutions qui paraissent plausibles. Il faut relire.
Le contexte long : même si Hermès a un système de mémoire performante, certaines conversations dépassent la fenêtre du modèle. Au-delà, il commence à oublier le début de la conversation en cours. (Astuce n°1 pour la parade.)
Le multi-tâches simultané : si je lui demande de suivre 3 projets en parallèle dans la même session, il va se mélanger. Une session = un fil conducteur. Pour le multi-projet, je sépare les sessions.

Ces limites ne sont pas des défauts rédhibitoires, mais elles imposent de structurer son usage, et de garder en tête que l'agent reste un outil statistique — il peut se tromper avec une assurance qui ne reflète pas sa certitude réelle.

En résumé

Si je devais résumer ces deux semaines en 6 phrases :

Un agent a plusieurs mémoires distinctes — apprends à mettre la bonne info au bon endroit.
Construis une base de connaissances structurée (wiki, fiches) que tu fais grandir avec ton usage — c'est ce qui permet à l'agent de s'améliorer tout seul.
Ne sauvegarde que ce qui a passé le test de la troisième session.
Écris des procédures structurées, pas des règles vagues.
Relis toujours ce qui t'engage.
Accepte de ne pas utiliser 100% de l'outil — et trouve ton équilibre.

Et surtout : tu restes le pilote. L'agent est un multiplicateur de productivité, mais la décision finale — celle qui engage ton nom, ton image, ta responsabilité — reste humaine.

Si tu veux mettre en place ce type de collaboration avec un agent open source sur ta propre stack, on peut en parler. Les sessions de cadrage Rock Robot ne sont pas des formations génériques : on regarde tes outils, tes sujets, et on trouve ensemble le point d'équilibre entre ce que tu délègues et ce que tu gardes sous ta main.

Sources : retours d'expérience personnels sur deux semaines d'usage intensif (juin 2026). Documentation interne Hermès Agent — sections mémoire, FTS5, skills.