Agents IA de domaine : quand l’IA passe du bavardage au bilan comptable et au théorème

L’IA agentique entre dans les métiers où l’erreur coûte cher

La nouvelle frontière de l’intelligence artificielle n’est plus seulement le chatbot généraliste capable de résumer un courriel, coder une fonction ou rédiger une note. Elle se déplace vers des domaines où le travail est structuré par des règles, des preuves, des contrôles et des conséquences réelles : la comptabilité, la fiscalité, l’audit, les mathématiques.

Deux signaux récents résument ce virage. D’un côté, BetaKit rapporte que Ian Crosby, cofondateur de Bench Accounting puis de Teal, revient avec Synthetic, une startup de tenue de livres automatisée qui vient de lever 10 millions de dollars américains. De l’autre, un preprint publié sur arXiv par des chercheurs de Google DeepMind et Google présente l’« AI co-mathematician », un environnement agentique destiné à accompagner des mathématiciens dans la recherche ouverte.

Ces deux cas semblent éloignés : un logiciel de comptabilité pour startups et un assistant de recherche mathématique. Ils racontent pourtant la même histoire : l’IA agentique quitte le terrain confortable du généraliste pour entrer dans des chaînes de travail où il faut raisonner, vérifier, documenter et assumer l’incertitude.

Synthetic : la comptabilité comme banc d’essai de l’autonomie

Selon BetaKit, Synthetic veut offrir aux entreprises logicielles un agent IA qui connecte les comptes bancaires, la paie, les systèmes de facturation et les courriels, puis produit une comptabilité d’exercice prête à être transmise à un fiscaliste. Le communiqué relayé par VentureBeat via Business Wire ajoute un élément important : Synthetic affirme vouloir fonctionner sans teneur de livres ou comptable humain dans la boucle opérationnelle, avec un prix de départ annoncé à 49 dollars par mois.

L’ambition est donc plus radicale qu’un simple copilote. Le site de Synthetic présente le produit comme un agent qui « fait » la tenue de livres de bout en bout, plutôt qu’un outil que l’utilisateur doit apprendre. Ian Crosby le formule avec prudence : il n’est pas certain que ce soit déjà techniquement possible. Cette prudence est en soi révélatrice. Dans un chiffrier, une erreur peut se propager. Dans des livres comptables, elle peut fausser la fiscalité, la trésorerie, les obligations réglementaires ou la confiance des investisseurs.

Le financement de 10 millions de dollars, mené par Khosla Ventures avec la participation d’investisseurs liés à Shopify, Opendoor, Brex et Basis Set Ventures, montre que le pari séduit le capital-risque. Mais il faut distinguer trois niveaux de preuve. BetaKit fournit un reportage indépendant de média spécialisé canadien. Axios Pro Fintech Deals a aussi signalé la levée, ce qui recoupe l’existence de la transaction. En revanche, le communiqué Business Wire reste une annonce d’entreprise : utile pour les détails déclarés par Synthetic, mais pas une validation indépendante de la performance du produit.

Le contexte aide à comprendre pourquoi ce marché attire. Intuit a déjà annoncé en 2025 une équipe d’agents IA dans QuickBooks, dont un « Accounting Agent » pour automatiser la catégorisation, assister la réconciliation et produire des livres plus propres. Thomson Reuters, dans son rapport Future of Professionals 2025, observe que les professionnels du droit, de la fiscalité, de la comptabilité, de l’audit et du risque veulent des assistants IA spécialisés par profession. Deloitte, de son côté, constate dans un sondage auprès de plus de 3 300 professionnels finance et comptabilité que la confiance est le principal frein à l’adoption de l’IA agentique.

Autrement dit, Synthetic n’arrive pas dans un vide. Elle pousse à l’extrême une tendance déjà visible chez les grands éditeurs : transformer les logiciels de comptabilité en agents actifs. La différence est que Synthetic mise d’abord sur un périmètre étroit — startups logiciel, SaaS et IA — plutôt que sur un produit horizontal. C’est probablement la bonne stratégie : en comptabilité, la spécialisation du domaine vaut autant que la puissance du modèle.

L’AI co-mathematician : du chatbot au laboratoire mathématique

Le second signal vient d’arXiv. Le preprint « AI co-mathematician: Accelerating mathematicians with agentic AI », soumis le 7 mai 2026 et révisé le 13 mai 2026, décrit un espace de travail pour mathématiciens fondé sur des agents IA. Il s’agit d’un preprint, donc non évalué par les pairs. Sa valeur est importante comme document technique primaire, mais ses résultats doivent être lus avec prudence, d’autant plus que les auteurs sont liés à Google DeepMind et Google, qui ont un intérêt stratégique évident à démontrer l’avance de leurs systèmes.

Le système décrit n’est pas un chatbot qui répond à une question isolée. C’est un environnement avec mémoire d’état, coordination de projets, agents spécialisés, fils de recherche parallèles, revue interne, suivi des hypothèses échouées et production d’artéfacts natifs, comme des brouillons LaTeX ou des notes de marge. L’objectif est d’imiter le travail réel d’un mathématicien : explorer, échouer, reformuler, chercher dans la littérature, tester par calcul, puis seulement formaliser.

Le résultat le plus spectaculaire concerne FrontierMath Tier 4, un benchmark externe de problèmes conçus comme de courts projets de recherche. Selon le preprint, Epoch AI a évalué l’AI co-mathematician à l’aveugle et le système a résolu 23 problèmes sur 48, soit 48 %, contre 19 % pour le modèle Gemini 3.1 Pro de base utilisé dans l’architecture. C’est impressionnant, mais il y a une nuance essentielle : l’évaluation du co-mathematician n’imposait pas les mêmes limites de jetons ou d’appels modèle que certains harnais standards, ce qui signifie probablement des coûts d’inférence plus élevés.

Le papier est aussi intéressant par ses limites. Les auteurs décrivent un biais de « faux consensus », où des agents réviseurs peuvent finir par accepter un raisonnement encore erroné, et des boucles de non-terminaison où les agents se corrigent mutuellement jusqu’à dégrader leur raisonnement. Ce sont précisément les échecs que l’on redoute dans les domaines formels : non pas l’erreur grossière visible, mais l’erreur élégante, documentée et difficile à repérer.

Un historique : de l’outil expert au collègue spécialisé

Cette évolution ne sort pas de nulle part. Google DeepMind a déjà marqué le terrain avec AlphaGeometry, présenté en 2024 comme un système de géométrie de niveau olympiade et publié dans Nature, puis avec AlphaProof et AlphaGeometry 2, qui ont atteint un niveau médaille d’argent à l’Olympiade internationale de mathématiques 2024 selon Google DeepMind. FunSearch, publié dans Nature, avait montré qu’un grand modèle pouvait participer à la recherche de nouveaux programmes pour des problèmes mathématiques et informatiques. AlphaEvolve a ensuite prolongé cette logique vers la découverte et l’optimisation d’algorithmes.

Le point commun de ces systèmes n’est pas seulement le modèle de langage. C’est l’orchestration : génération d’idées, exécution de code, évaluation automatique, recherche parallèle, contraintes, révision. La même logique s’applique à la comptabilité. Un agent utile ne doit pas seulement lire une facture ; il doit rapprocher une transaction, comprendre le contexte, poser une question, conserver une piste d’audit, signaler son incertitude et produire un résultat vérifiable.

Même l’article de CNET sur le retour de Digg avec un format centré sur l’IA illustre, à la périphérie, le même besoin : filtrer le bruit. Digg veut organiser l’information à partir de voix influentes en IA. Synthetic et l’AI co-mathematician font quelque chose de plus profond : ils tentent de filtrer le bruit à l’intérieur même du travail cognitif spécialisé.

Pourquoi les domaines formels sont le vrai test

Les domaines comme la comptabilité et les mathématiques ont une propriété précieuse pour l’IA : ils sont partiellement vérifiables. Une écriture comptable doit équilibrer des comptes. Une preuve doit survivre à la critique. Un script doit passer des tests. Cette structure donne aux agents des points d’ancrage plus solides que les tâches floues de rédaction ou de conseil général.

Mais cette même rigueur augmente le risque. En comptabilité, un agent peut produire un bilan qui semble propre mais repose sur une mauvaise classification. En mathématiques, un agent peut proposer une preuve séduisante avec un lemme faux. Dans les deux cas, le danger vient de la crédibilité apparente. Plus l’agent parle le langage du domaine, plus il peut tromper un non-spécialiste.

C’est pourquoi l’avenir ne se jouera pas seulement sur la performance brute des modèles. Il se jouera sur les contrôles : pistes d’audit, séparation des responsabilités, revue humaine, tests automatisés, journalisation, politiques de confiance et capacité à dire « je ne sais pas ». Deloitte insiste justement sur la nécessité de cadres, rôles et contrôles autour de l’IA agentique en finance. Le preprint de Google DeepMind va dans la même direction en traitant l’incertitude comme une variable à orchestrer plutôt qu’un défaut à masquer.

Prospective : moins de copilotes, plus d’infrastructures de travail

La prochaine vague d’IA de domaine ne ressemblera probablement pas à une seule interface conversationnelle. Elle ressemblera davantage à une infrastructure de travail : agents spécialisés, bases de connaissance, outils métiers, règles programmatiques, évaluateurs, humains responsables et historique complet des décisions.

Pour les startups comme Synthetic, le défi sera de gagner la confiance avant de gagner le marché. Le produit devra prouver qu’il est meilleur qu’un mauvais teneur de livres, mais aussi assez fiable pour remplacer une partie du jugement humain. Pour les laboratoires comme Google DeepMind, l’enjeu sera de montrer que l’IA peut accélérer la recherche sans produire une inflation de résultats invérifiables.

La promesse est immense : réduire le coût administratif de lancer une entreprise, accélérer la découverte mathématique, transformer des logiciels passifs en collaborateurs actifs. Mais la leçon des deux exemples est claire : plus le domaine est rigoureux, plus l’agent doit être humble. L’IA agentique n’entrera durablement dans la comptabilité et les mathématiques que si elle devient non seulement plus intelligente, mais aussi plus vérifiable, plus traçable et plus honnête sur ses propres limites.