Calculadora de Custo de API de LLM
Estime os custos das APIs GPT, Claude e Gemini a partir das suas contagens de tokens. Seus prompts nunca saem do seu dispositivo.
A contagem de tokens e a matemática de custo rodam localmente no seu navegador e nada é enviado, mas evite colar segredos ou dados de produção na caixa de prompt.
Precisa de contagens de token precisas? Abra o Contador de Tokens.
Sobre Calculadora de Custo de LLM
Esta calculadora de custo de LLM transforma contagens de tokens em uma estimativa em dólares para as APIs da OpenAI, Anthropic e Google. Escolha um modelo — GPT-4o, GPT-4.1, o1, Claude 3.5 Sonnet, Gemini 1.5 Pro e mais — depois insira as contagens de tokens de entrada e saída, ou cole um prompt e deixe a ferramenta contar seus tokens de entrada usando o tokenizador certo. Ela multiplica os tokens pelo preço por milhão de cada modelo e mostra o custo de entrada, saída e total, com um multiplicador opcional de requisições para projeções em lote ou mensais. Os preços são indicativos e mudam com frequência, então cada valor é rotulado com um marcador de data, e você pode sobrescrever o preço de entrada e saída por milhão para qualquer modelo para combinar com tarifas em cache, em lote ou mais recentes. A contagem de tokens e a matemática rodam inteiramente no seu navegador, então os prompts que você cola são processados no seu dispositivo e nunca saem dele.
Recursos
- Modelos agrupados por provedor: OpenAI, Anthropic Claude e Google Gemini
- Insira tokens de entrada diretamente, ou conte-os a partir de um prompt colado para o modelo selecionado
- Campos de tokens de saída esperados e por requisição para estimativas em lote ou mensais
- Custo de entrada, saída e total mostrado em USD, mais o custo por requisição
- Sobrescrita personalizada de $/1M para entrada e saída para combinar preços em cache, em lote ou atualizados
- Contagens de token exatas da OpenAI; contagens de Claude e Gemini rotuladas como aproximadas
- Preços indicativos marcados com uma data de referência para você saber que deve confirmá-los
- Toda a tokenização e a matemática de preços rodam no seu navegador, sem envio do prompt
Como usar Calculadora de Custo de LLM
- Escolha um modelo no menu agrupado por provedor.
- Insira os tokens de entrada, ou ative Contar do prompt e cole seu prompt.
- Insira os tokens de saída esperados e, se necessário, um número de requisições.
- Leia o custo de entrada, saída e total em USD.
- Sobrescreva o preço de entrada ou saída em $/1M para combinar com a sua tarifa real.
Exemplo
Entrada
Model: GPT-4o
Input tokens: 1,000
Output tokens: 500
Requests: 1
Saída
Input cost: $0.0025
Output cost: $0.0050
Total cost: $0.0075
1.000 de entrada @ $2,50/M + 500 de saída @ $10/M = $0,0075 por requisição.
Erros comuns e solução de problemas
- O total não corresponde à fatura do meu provedor. — Os preços são indicativos e a estimativa exclui descontos de entrada em cache, preços em lote, tokens de imagem ou áudio e sobrecarga de requisição. Sobrescreva os campos de $/1M com a sua tarifa real e confirme na página de preços do provedor.
- Os tokens de entrada contados diferem ligeiramente do que a API informa para Claude ou Gemini. — As contagens de token de Claude e Gemini são aproximadas no navegador. Use modelos da OpenAI para contagens exatas, ou trate os totais de Claude e Gemini como estimativas próximas e verifique com o provedor.
- Meu preço personalizado não tem efeito. — A sobrescrita só se aplica quando o campo não está vazio. Deixe-o em branco para usar o preço indicativo do modelo, ou digite um número como 1.25 para sobrescrever a tarifa por milhão.
- O custo aparece como $0,00 para um prompt minúsculo. — Custos muito pequenos são mostrados com casas decimais extras, mas o arredondamento ainda pode ler como $0,00. Aumente o multiplicador de requisições para ver o custo projetado em escala.
Perguntas frequentes
- Como o custo da API de LLM é calculado?
- Ele multiplica seus tokens de entrada pelo preço de entrada por milhão do modelo e seus tokens de saída pelo preço de saída por milhão, depois soma os dois. Multiplique pelo campo de requisições para projetar o gasto em lote ou mensal.
- Os preços estão atualizados?
- Eles são indicativos e marcados com uma data de referência porque os preços dos provedores mudam com frequência. Sempre confirme a tarifa atual na página de preços da OpenAI, Anthropic ou Google, e use os campos de sobrescrita para inserir os números exatos.
- Posso contar tokens de um prompt real em vez de chutar?
- Sim. Ative Contar do prompt e cole seu texto; a calculadora o tokeniza com o tokenizador do modelo selecionado e usa isso como a contagem de tokens de entrada. As contagens da OpenAI são exatas, enquanto Claude e Gemini são aproximadas.
- Isso inclui entrada em cache ou preços em lote?
- Não. A estimativa usa as tarifas padrão de texto e exclui descontos de entrada em cache, preços em lote e tokens de imagem ou áudio. Insira a sua tarifa com desconto na sobrescrita de $/1M para modelar esses casos.
- Meus prompts ou chaves de API são enviados para algum lugar?
- Não. A calculadora nunca pede uma chave de API, e a contagem de tokens mais a matemática de custo rodam localmente no seu navegador, então qualquer prompt que você cola é processado no seu dispositivo e nunca é enviado.
Ferramentas relacionadas
- Contador de Tokens — Conte tokens para GPT, Claude e Gemini enquanto digita, com contagens exatas da OpenAI e estimativas para os demais.
- Testador de API da OpenAI — Crie, execute e copie requisições à API Chat Completions da OpenAI como cURL, Python e JavaScript.
- Testador de API da Anthropic Claude — Crie, execute e copie requisições à API Messages da Anthropic Claude como cURL, Python e JavaScript.
- Testador de API do Google Gemini — Crie, execute e copie requisições generateContent do Google Gemini como cURL, Python e JavaScript.
- JSON para TOON — Converta JSON para TOON e de volta; o TOON empacota os mesmos dados em menos tokens de prompt de LLM.
Todas as ferramentas de ArrayKit