Claude Opus 4.7 : le modèle phare d'Anthropic gagne en rigueur
- Bastien
- 17 Apr, 2026
Qu’est-ce que Claude Opus 4.7
Le 16 avril 2026, Anthropic publie Claude Opus 4.7 — une mise à jour ciblée de son modèle phare centrée sur un seul thème : la rigueur dans les tâches d’ingénierie logicielle de longue durée. Là où Opus 4.6 était déjà solide sur le code agentique, la 4.7 va plus loin en optimisant le raisonnement soutenu, en resserrant le suivi des instructions et en ajoutant un nouveau niveau d’effort xhigh qui se situe entre high et max.
La tarification reste inchangée : 5 $ par million de tokens en entrée et 25 $ par million de tokens en sortie. L’identifiant API est claude-opus-4-7.
Ce qui est nouveau
Quatre évolutions définissent cette version :
Niveau d’effort xhigh — un nouveau réglage intermédiaire entre high et max. Dans Claude Code, xhigh devient le niveau par défaut pour tous les plans, reflétant la conviction d’Anthropic que les tâches de code complexes profitent d’un budget de raisonnement plus généreux.
Vision haute résolution — images jusqu’à 2 576 pixels sur le côté le plus long (environ 3,75 mégapixels), soit plus de 3x la capacité précédente. Cela débloque les schémas techniques denses, les captures d’écran haute résolution et les structures chimiques.
Budgets de tâches — une fonctionnalité en bêta publique qui permet aux développeurs de guider la dépense de tokens sur des tâches autonomes, évitant les dérapages de coûts sur les travaux longs.
/ultrareview dans Claude Code — une commande slash dédiée aux sessions de revue de code approfondies. Les utilisateurs Pro et Max bénéficient de 3 revues gratuites.
Résultats sur les benchmarks
Ingénierie logicielle et code
| Benchmark | Opus 4.7 | Opus 4.6 |
|---|---|---|
| CursorBench | 70% | 58% |
| Rakuten-SWE-Bench (tâches de production) | 3x plus résolues | référence |
| Rappel CodeRabbit | +10% | référence |
| Terminal Bench | passe des tâches que les modèles précédents échouaient | — |
Le bond de 12 points sur CursorBench (58% → 70%) est la métrique phare. Rakuten-SWE-Bench — un benchmark de code réaliste en production — montre que 4.7 résout trois fois plus de tâches que 4.6. Sur CodeRabbit, la précision reste stable tandis que le rappel s’améliore de plus de 10%.
Finance et travail professionnel
| Benchmark | Opus 4.7 | Opus 4.6 |
|---|---|---|
| General Finance module | 0.813 | 0.767 |
| GDPval-AA | état de l’art | — |
| Finance Agent | état de l’art | — |
| Harvey legal (effort élevé) | 90.9% | — |
Agentique et contexte long
| Benchmark | Opus 4.7 | Détail |
|---|---|---|
| Research-agent | 0.715 | meilleur score partagé |
| Notion Agent | +14% | vs Opus 4.6, moins d’erreurs de tokens |
| Genspark Super Agent | meilleur | ratio qualité/appel d’outil mesuré |
Vision
| Benchmark | Opus 4.7 | Opus 4.6 |
|---|---|---|
| XBOW visual-acuity | 98.5% | 54.5% |
Le bond de XBOW de 54.5% à 98.5% est le plus grand gain isolé de la version — une conséquence directe de l’augmentation de résolution et de l’entraînement multimodal amélioré.
Ce qui le distingue : la rigueur plutôt que l’étendue
Anthropic positionne Opus 4.7 comme moins largement capable que le Mythos Preview mais plus fiable sur les tâches pour lesquelles il est optimisé. Un positionnement inhabituel — le choix explicite de la profondeur au détriment de la généralité.
L’implication pratique : 4.7 suit les instructions plus strictement que 4.6. Des prompts ajustés pour 4.6 peuvent produire un comportement différent sur 4.7 et nécessiter un réajustement. Anthropic note également que le modèle produit davantage de tokens de sortie aux niveaux d’effort élevés, échangeant coût contre fiabilité.
Le tokenizer mis à jour cartographie le texte d’entrée avec une variance de 1.0–1.35x par rapport à 4.6, ce qui peut affecter les budgets de tokens sur les intégrations existantes.
Intégration Claude Code
Opus 4.7 est livré avec plusieurs améliorations pour Claude Code :
- Effort par défaut relevé à
xhighsur tous les plans - Commande slash
/ultrareviewpour des sessions de revue dédiées (3 gratuites pour Pro/Max) - Mode Auto étendu aux utilisateurs Max pour la prise de décision autonome
- Mémoire système de fichiers améliorée sur les travaux multi-sessions
- Effort recommandé pour le code :
highouxhigh
Pour les équipes qui utilisent Claude Code en production, la combinaison xhigh par défaut + cohérence long-horizon améliorée signifie moins de déraillements en cours de tâche sur des runs autonomes d’une heure ou plus.
Disponibilité
Opus 4.7 est disponible sur l’ensemble de la surface de déploiement d’Anthropic :
- API Anthropic (
platform.claude.com) - Amazon Bedrock
- Google Cloud Vertex AI
- Microsoft Foundry
- Tous les produits Claude (Claude.ai, Claude Code, etc.)
Lancés en parallèle : Claude Design (nouveau produit d’Anthropic Labs pour le travail collaboratif de design visuel) et le Cyber Verification Program pour les chercheurs en sécurité légitimes.
Sécurité et limites
Anthropic décrit 4.7 comme « globalement bien aligné et digne de confiance, bien que pas totalement idéal ». Points clés :
- Amélioré : honnêteté, résistance aux attaques par injection de prompt
- Similaire à 4.6 : faibles taux de tromperie, complaisance, coopération à des usages abusifs
- Faiblesse : conseils de réduction des risques trop détaillés sur les substances contrôlées
- Réduction volontaire : les capacités cyber sont délibérément limitées par rapport au Mythos Preview ; une détection automatique bloque les requêtes cybersécurité à haut risque interdites
Le Mythos Preview reste le modèle le mieux aligné d’Anthropic selon leurs évaluations internes. Opus 4.7 est positionné comme le modèle phare de production — plus fiable, plus précisément cadré.
Conclusion
Claude Opus 4.7 n’est pas un saut de capacité généraliste. C’est un raffinement ciblé : meilleure ingénierie logicielle, meilleure vision, suivi d’instructions plus strict, meilleure cohérence long-horizon. Pour les équipes qui utilisent Claude Code comme ingénieur autonome, le saut CursorBench (58% → 70%) et l’amélioration de 3x sur Rakuten-SWE-Bench se traduisent directement par plus de tâches accomplies par session.
Le nouveau niveau d’effort xhigh et la commande /ultrareview sont les fonctionnalités côté développeur les plus susceptibles de modifier les flux de travail quotidiens. À tarification inchangée, 4.7 est une mise à niveau claire pour les charges de code — avec la réserve que les prompts optimisés pour 4.6 peuvent nécessiter un réajustement.
Annonce : anthropic.com/news/claude-opus-4-7 · API : claude-opus-4-7
Tags :
- IA
- Anthropic
- Claude
- Code
- Claude Code
- Agentique