Como o custo da API de LLM é calculado?

Ele multiplica seus tokens de entrada pelo preço de entrada por milhão do modelo e seus tokens de saída pelo preço de saída por milhão, depois soma os dois. Multiplique pelo campo de requisições para projetar o gasto em lote ou mensal.

Os preços estão atualizados?

Eles são indicativos e marcados com uma data de referência porque os preços dos provedores mudam com frequência. Sempre confirme a tarifa atual na página de preços da OpenAI, Anthropic ou Google, e use os campos de sobrescrita para inserir os números exatos.

Posso contar tokens de um prompt real em vez de chutar?

Sim. Ative Contar do prompt e cole seu texto; a calculadora o tokeniza com o tokenizador do modelo selecionado e usa isso como a contagem de tokens de entrada. As contagens da OpenAI são exatas, enquanto Claude e Gemini são aproximadas.

Isso inclui entrada em cache ou preços em lote?

Não. A estimativa usa as tarifas padrão de texto e exclui descontos de entrada em cache, preços em lote e tokens de imagem ou áudio. Insira a sua tarifa com desconto na sobrescrita de $/1M para modelar esses casos.

Calculadora de Custo de API de LLM

Estime os custos das APIs GPT, Claude e Gemini a partir das suas contagens de tokens. Seus prompts nunca saem do seu dispositivo.

A contagem de tokens e a matemática de custo rodam localmente no seu navegador e nada é enviado, mas evite colar segredos ou dados de produção na caixa de prompt.

Precisa de contagens de token precisas? Abra o Contador de Tokens.

Sobre Calculadora de Custo de LLM

Esta calculadora de custo de LLM transforma contagens de tokens em uma estimativa em dólares para as APIs da OpenAI, Anthropic e Google. Escolha um modelo — GPT-4o, GPT-4.1, o1, Claude 3.5 Sonnet, Gemini 1.5 Pro e mais — depois insira as contagens de tokens de entrada e saída, ou cole um prompt e deixe a ferramenta contar seus tokens de entrada usando o tokenizador certo. Ela multiplica os tokens pelo preço por milhão de cada modelo e mostra o custo de entrada, saída e total, com um multiplicador opcional de requisições para projeções em lote ou mensais. Os preços são indicativos e mudam com frequência, então cada valor é rotulado com um marcador de data, e você pode sobrescrever o preço de entrada e saída por milhão para qualquer modelo para combinar com tarifas em cache, em lote ou mais recentes. A contagem de tokens e a matemática rodam inteiramente no seu navegador, então os prompts que você cola são processados no seu dispositivo e nunca saem dele.

Recursos

Modelos agrupados por provedor: OpenAI, Anthropic Claude e Google Gemini
Insira tokens de entrada diretamente, ou conte-os a partir de um prompt colado para o modelo selecionado
Campos de tokens de saída esperados e por requisição para estimativas em lote ou mensais
Custo de entrada, saída e total mostrado em USD, mais o custo por requisição
Sobrescrita personalizada de $/1M para entrada e saída para combinar preços em cache, em lote ou atualizados
Contagens de token exatas da OpenAI; contagens de Claude e Gemini rotuladas como aproximadas
Preços indicativos marcados com uma data de referência para você saber que deve confirmá-los
Toda a tokenização e a matemática de preços rodam no seu navegador, sem envio do prompt

Como usar Calculadora de Custo de LLM

Escolha um modelo no menu agrupado por provedor.
Insira os tokens de entrada, ou ative Contar do prompt e cole seu prompt.
Insira os tokens de saída esperados e, se necessário, um número de requisições.
Leia o custo de entrada, saída e total em USD.
Sobrescreva o preço de entrada ou saída em $/1M para combinar com a sua tarifa real.

Exemplo

Entrada

Model: GPT-4o
Input tokens: 1,000
Output tokens: 500
Requests: 1

Saída

Input cost:  $0.0025
Output cost: $0.0050
Total cost:  $0.0075

1.000 de entrada @ $2,50/M + 500 de saída @ $10/M = $0,0075 por requisição.

Erros comuns e solução de problemas

O total não corresponde à fatura do meu provedor. — Os preços são indicativos e a estimativa exclui descontos de entrada em cache, preços em lote, tokens de imagem ou áudio e sobrecarga de requisição. Sobrescreva os campos de $/1M com a sua tarifa real e confirme na página de preços do provedor.
Os tokens de entrada contados diferem ligeiramente do que a API informa para Claude ou Gemini. — As contagens de token de Claude e Gemini são aproximadas no navegador. Use modelos da OpenAI para contagens exatas, ou trate os totais de Claude e Gemini como estimativas próximas e verifique com o provedor.
Meu preço personalizado não tem efeito. — A sobrescrita só se aplica quando o campo não está vazio. Deixe-o em branco para usar o preço indicativo do modelo, ou digite um número como 1.25 para sobrescrever a tarifa por milhão.
O custo aparece como $0,00 para um prompt minúsculo. — Custos muito pequenos são mostrados com casas decimais extras, mas o arredondamento ainda pode ler como $0,00. Aumente o multiplicador de requisições para ver o custo projetado em escala.

Perguntas frequentes

Como o custo da API de LLM é calculado?: Ele multiplica seus tokens de entrada pelo preço de entrada por milhão do modelo e seus tokens de saída pelo preço de saída por milhão, depois soma os dois. Multiplique pelo campo de requisições para projetar o gasto em lote ou mensal.
Os preços estão atualizados?: Eles são indicativos e marcados com uma data de referência porque os preços dos provedores mudam com frequência. Sempre confirme a tarifa atual na página de preços da OpenAI, Anthropic ou Google, e use os campos de sobrescrita para inserir os números exatos.
Posso contar tokens de um prompt real em vez de chutar?: Sim. Ative Contar do prompt e cole seu texto; a calculadora o tokeniza com o tokenizador do modelo selecionado e usa isso como a contagem de tokens de entrada. As contagens da OpenAI são exatas, enquanto Claude e Gemini são aproximadas.
Isso inclui entrada em cache ou preços em lote?: Não. A estimativa usa as tarifas padrão de texto e exclui descontos de entrada em cache, preços em lote e tokens de imagem ou áudio. Insira a sua tarifa com desconto na sobrescrita de $/1M para modelar esses casos.
Meus prompts ou chaves de API são enviados para algum lugar?: Não. A calculadora nunca pede uma chave de API, e a contagem de tokens mais a matemática de custo rodam localmente no seu navegador, então qualquer prompt que você cola é processado no seu dispositivo e nunca é enviado.

Ferramentas relacionadas

Contador de Tokens — Conte tokens para GPT, Claude e Gemini enquanto digita, com contagens exatas da OpenAI e estimativas para os demais.
Testador de API da OpenAI — Crie, execute e copie requisições à API Chat Completions da OpenAI como cURL, Python e JavaScript.
Testador de API da Anthropic Claude — Crie, execute e copie requisições à API Messages da Anthropic Claude como cURL, Python e JavaScript.
Testador de API do Google Gemini — Crie, execute e copie requisições generateContent do Google Gemini como cURL, Python e JavaScript.
JSON para TOON — Converta JSON para TOON e de volta; o TOON empacota os mesmos dados em menos tokens de prompt de LLM.