Calculadora de Custo de API de LLM

Estime os custos das APIs GPT, Claude e Gemini a partir das suas contagens de tokens. Seus prompts nunca saem do seu dispositivo.

A contagem de tokens e a matemática de custo rodam localmente no seu navegador e nada é enviado, mas evite colar segredos ou dados de produção na caixa de prompt.

Precisa de contagens de token precisas? Abra o Contador de Tokens.

Sobre Calculadora de Custo de LLM

Esta calculadora de custo de LLM transforma contagens de tokens em uma estimativa em dólares para as APIs da OpenAI, Anthropic e Google. Escolha um modelo — GPT-4o, GPT-4.1, o1, Claude 3.5 Sonnet, Gemini 1.5 Pro e mais — depois insira as contagens de tokens de entrada e saída, ou cole um prompt e deixe a ferramenta contar seus tokens de entrada usando o tokenizador certo. Ela multiplica os tokens pelo preço por milhão de cada modelo e mostra o custo de entrada, saída e total, com um multiplicador opcional de requisições para projeções em lote ou mensais. Os preços são indicativos e mudam com frequência, então cada valor é rotulado com um marcador de data, e você pode sobrescrever o preço de entrada e saída por milhão para qualquer modelo para combinar com tarifas em cache, em lote ou mais recentes. A contagem de tokens e a matemática rodam inteiramente no seu navegador, então os prompts que você cola são processados no seu dispositivo e nunca saem dele.

Recursos

Como usar Calculadora de Custo de LLM

  1. Escolha um modelo no menu agrupado por provedor.
  2. Insira os tokens de entrada, ou ative Contar do prompt e cole seu prompt.
  3. Insira os tokens de saída esperados e, se necessário, um número de requisições.
  4. Leia o custo de entrada, saída e total em USD.
  5. Sobrescreva o preço de entrada ou saída em $/1M para combinar com a sua tarifa real.

Exemplo

Entrada

Model: GPT-4o
Input tokens: 1,000
Output tokens: 500
Requests: 1

Saída

Input cost:  $0.0025
Output cost: $0.0050
Total cost:  $0.0075

1.000 de entrada @ $2,50/M + 500 de saída @ $10/M = $0,0075 por requisição.

Erros comuns e solução de problemas

Perguntas frequentes

Como o custo da API de LLM é calculado?
Ele multiplica seus tokens de entrada pelo preço de entrada por milhão do modelo e seus tokens de saída pelo preço de saída por milhão, depois soma os dois. Multiplique pelo campo de requisições para projetar o gasto em lote ou mensal.
Os preços estão atualizados?
Eles são indicativos e marcados com uma data de referência porque os preços dos provedores mudam com frequência. Sempre confirme a tarifa atual na página de preços da OpenAI, Anthropic ou Google, e use os campos de sobrescrita para inserir os números exatos.
Posso contar tokens de um prompt real em vez de chutar?
Sim. Ative Contar do prompt e cole seu texto; a calculadora o tokeniza com o tokenizador do modelo selecionado e usa isso como a contagem de tokens de entrada. As contagens da OpenAI são exatas, enquanto Claude e Gemini são aproximadas.
Isso inclui entrada em cache ou preços em lote?
Não. A estimativa usa as tarifas padrão de texto e exclui descontos de entrada em cache, preços em lote e tokens de imagem ou áudio. Insira a sua tarifa com desconto na sobrescrita de $/1M para modelar esses casos.
Meus prompts ou chaves de API são enviados para algum lugar?
Não. A calculadora nunca pede uma chave de API, e a contagem de tokens mais a matemática de custo rodam localmente no seu navegador, então qualquer prompt que você cola é processado no seu dispositivo e nunca é enviado.

Ferramentas relacionadas

Todas as ferramentas de ArrayKit