Comment le coût d’API LLM est-il calculé ?

Il multiplie vos tokens d’entrée par le prix d’entrée au million du modèle et vos tokens de sortie par le prix de sortie au million, puis additionne le tout. Multipliez par le champ requêtes pour projeter une dépense par lot ou mensuelle.

Les prix sont-ils à jour ?

Ils sont indicatifs et marqués d’une date « à la date du » car la tarification des fournisseurs change souvent. Confirmez toujours le tarif en vigueur sur la page de tarification d’OpenAI, Anthropic ou Google, et utilisez les champs de remplacement pour saisir les chiffres exacts.

Puis-je compter les tokens d’un vrai prompt plutôt que de deviner ?

Oui. Activez Compter depuis le prompt et collez votre texte ; le calculateur le tokenise avec le tokeniseur du modèle sélectionné et l’utilise comme compte de tokens d’entrée. Les comptes OpenAI sont exacts tandis que Claude et Gemini sont approximatifs.

Cela inclut-il l’entrée mise en cache ou la tarification par lot ?

Non. L’estimation utilise les tarifs standard du palier texte et exclut les remises sur entrée mise en cache, la tarification par lot et les tokens d’image ou d’audio. Saisissez votre tarif remisé dans le remplacement $/1M pour modéliser ces cas.

Calculateur de coût d’API LLM

Estimez les coûts d’API GPT, Claude et Gemini à partir de vos comptes de tokens. Vos prompts ne quittent jamais votre appareil.

Le comptage des tokens et les calculs de coût s’exécutent localement dans votre navigateur et rien n’est téléversé, mais évitez de coller des secrets ou des données de production dans la zone de prompt.

Besoin de comptes de tokens précis ? Ouvrez le Compteur de tokens.

À propos de Calculateur de coût LLM

Ce calculateur de coût LLM transforme des comptes de tokens en une estimation en dollars pour les API OpenAI, Anthropic et Google. Choisissez un modèle — GPT-4o, GPT-4.1, o1, Claude 3.5 Sonnet, Gemini 1.5 Pro et bien d’autres — puis saisissez les comptes de tokens d’entrée et de sortie, ou collez un prompt et laissez l’outil compter ses tokens d’entrée avec le bon tokeniseur. Il multiplie les tokens par le prix au million de chaque modèle et affiche le coût d’entrée, de sortie et total, avec un multiplicateur de requêtes optionnel pour les projections par lot ou mensuelles. Les prix sont indicatifs et changent souvent, chaque chiffre est donc étiqueté d’un repère « à la date du » et vous pouvez remplacer le prix au million d’entrée et de sortie de tout modèle pour coller aux tarifs mis en cache, par lot ou plus récents. Le comptage des tokens et les calculs s’exécutent entièrement dans votre navigateur, les prompts que vous collez sont donc traités sur votre appareil et ne le quittent jamais.

Fonctionnalités

Modèles groupés par fournisseur : OpenAI, Anthropic Claude et Google Gemini
Saisissez les tokens d’entrée directement, ou comptez-les depuis un prompt collé pour le modèle sélectionné
Champs de tokens de sortie attendus et par requête pour des estimations par lot ou mensuelles
Coût d’entrée, de sortie et total affiché en USD, plus le coût par requête
Remplacement personnalisé du $/1M d’entrée et de sortie pour coller aux prix mis en cache, par lot ou mis à jour
Comptes de tokens OpenAI exacts ; comptes Claude et Gemini étiquetés approximatifs
Prix indicatifs marqués d’une date « à la date du » pour vous rappeler de les confirmer
Tous les calculs de tokenisation et de tarification s’exécutent dans votre navigateur sans téléversement de prompt

Comment utiliser Calculateur de coût LLM

Choisissez un modèle dans la liste déroulante groupée par fournisseur.
Saisissez les tokens d’entrée, ou activez Compter depuis le prompt et collez votre prompt.
Saisissez les tokens de sortie attendus et, si besoin, un nombre de requêtes.
Lisez le coût d’entrée, de sortie et total en USD.
Remplacez le prix $/1M d’entrée ou de sortie pour coller à votre tarif réel.

Exemple

Entrée

Model: GPT-4o
Input tokens: 1,000
Output tokens: 500
Requests: 1

Sortie

Input cost:  $0.0025
Output cost: $0.0050
Total cost:  $0.0075

1 000 d’entrée à 2,50 $/M + 500 de sortie à 10 $/M = 0,0075 $ par requête.

Erreurs courantes et dépannage

Le total ne correspond pas à ma facture de fournisseur. — Les prix sont indicatifs et l’estimation exclut les remises sur entrée mise en cache, la tarification par lot, les tokens d’image ou d’audio et la surcharge par requête. Remplacez les champs $/1M par votre tarif réel et confirmez sur la page de tarification du fournisseur.
Les tokens d’entrée comptés diffèrent légèrement de ce que l’API rapporte pour Claude ou Gemini. — Les comptes de tokens Claude et Gemini sont approximatifs dans le navigateur. Utilisez des modèles OpenAI pour des comptes exacts, ou traitez les totaux Claude et Gemini comme des estimations proches et vérifiez auprès du fournisseur.
Mon prix personnalisé n’a aucun effet. — Le remplacement ne s’applique que lorsque son champ n’est pas vide. Laissez-le vide pour utiliser le prix indicatif du modèle, ou saisissez un nombre comme 1.25 pour remplacer le tarif au million.
Le coût s’affiche à 0,00 $ pour un prompt minuscule. — Les très petits coûts sont affichés avec des décimales supplémentaires, mais l’arrondi peut tout de même donner 0,00 $. Augmentez le multiplicateur de requêtes pour voir le coût projeté à l’échelle.

Foire aux questions

Comment le coût d’API LLM est-il calculé ?: Il multiplie vos tokens d’entrée par le prix d’entrée au million du modèle et vos tokens de sortie par le prix de sortie au million, puis additionne le tout. Multipliez par le champ requêtes pour projeter une dépense par lot ou mensuelle.
Les prix sont-ils à jour ?: Ils sont indicatifs et marqués d’une date « à la date du » car la tarification des fournisseurs change souvent. Confirmez toujours le tarif en vigueur sur la page de tarification d’OpenAI, Anthropic ou Google, et utilisez les champs de remplacement pour saisir les chiffres exacts.
Puis-je compter les tokens d’un vrai prompt plutôt que de deviner ?: Oui. Activez Compter depuis le prompt et collez votre texte ; le calculateur le tokenise avec le tokeniseur du modèle sélectionné et l’utilise comme compte de tokens d’entrée. Les comptes OpenAI sont exacts tandis que Claude et Gemini sont approximatifs.
Cela inclut-il l’entrée mise en cache ou la tarification par lot ?: Non. L’estimation utilise les tarifs standard du palier texte et exclut les remises sur entrée mise en cache, la tarification par lot et les tokens d’image ou d’audio. Saisissez votre tarif remisé dans le remplacement $/1M pour modéliser ces cas.
Mes prompts ou clés d’API sont-ils envoyés quelque part ?: Non. Le calculateur ne demande jamais de clé d’API, et le comptage des tokens ainsi que les calculs de coût s’exécutent localement dans votre navigateur, tout prompt que vous collez est donc traité sur votre appareil et n’est jamais téléversé.

Outils associés

Compteur de tokens — Comptez les tokens pour GPT, Claude et Gemini au fil de la frappe.
Testeur d’API OpenAI — Créez, exécutez et copiez des requêtes à l’API Chat Completions d’OpenAI en cURL, Python et JavaScript.
Testeur d’API Anthropic Claude — Créez, exécutez et copiez des requêtes à l’API Messages d’Anthropic Claude en cURL, Python et JavaScript.
Testeur d’API Google Gemini — Créez, exécutez et copiez des requêtes generateContent de Google Gemini en cURL, Python et JavaScript.
JSON vers TOON — Convertissez du JSON en TOON pour des prompts LLM avec moins de tokens.