LLM-API-Kostenrechner

Schätze GPT-, Claude- und Gemini-API-Kosten aus deinen Token-Anzahlen. Deine Prompts verlassen dein Gerät nie.

Token-Zählung und Kostenberechnung laufen lokal in deinem Browser und nichts wird hochgeladen, aber vermeide es, Geheimnisse oder Produktionsdaten in das Prompt-Feld einzufügen.

Brauchst du präzise Token-Anzahlen? Öffne den Token-Zähler.

Über LLM-Kostenrechner

Dieser LLM-Kostenrechner verwandelt Token-Anzahlen in eine Dollar-Schätzung für die OpenAI-, Anthropic- und Google-APIs. Wähle ein Modell – GPT-4o, GPT-4.1, o1, Claude 3.5 Sonnet, Gemini 1.5 Pro und mehr –, gib dann Eingabe- und Ausgabe-Token-Anzahlen ein oder füge einen Prompt ein und lass das Tool seine Eingabe-Tokens mit dem richtigen Tokenizer zählen. Es multipliziert Tokens mit dem Preis pro Million jedes Modells und zeigt Eingabe-, Ausgabe- und Gesamtkosten, mit einem optionalen Anfragen-Multiplikator für Batch- oder Monatshochrechnungen. Preise sind Richtwerte und ändern sich oft, daher ist jede Zahl mit einer Stand-Markierung versehen, und du kannst den Eingabe- und Ausgabepreis pro Million für jedes Modell überschreiben, um zwischengespeicherte, Batch- oder neuere Tarife abzubilden. Die Token-Zählung und die Berechnung laufen vollständig in deinem Browser, sodass die eingefügten Prompts auf deinem Gerät verarbeitet werden und es nie verlassen.

Funktionen

So verwendest du LLM-Kostenrechner

  1. Wähle ein Modell aus dem nach Anbieter gruppierten Dropdown.
  2. Gib die Eingabe-Tokens ein oder schalte Aus Prompt zählen ein und füge deinen Prompt ein.
  3. Gib die erwarteten Ausgabe-Tokens und bei Bedarf eine Anzahl von Anfragen ein.
  4. Lies die Eingabe-, Ausgabe- und Gesamtkosten in USD.
  5. Überschreibe den $/1M-Eingabe- oder -Ausgabepreis, um deinem tatsächlichen Tarif zu entsprechen.

Beispiel

Eingabe

Model: GPT-4o
Input tokens: 1,000
Output tokens: 500
Requests: 1

Ausgabe

Input cost:  $0.0025
Output cost: $0.0050
Total cost:  $0.0075

1.000 Eingabe @ $2,50/M + 500 Ausgabe @ $10/M = $0,0075 pro Anfrage.

Häufige Fehler & Fehlerbehebung

Häufig gestellte Fragen

Wie werden die LLM-API-Kosten berechnet?
Es multipliziert deine Eingabe-Tokens mit dem Eingabepreis pro Million des Modells und deine Ausgabe-Tokens mit dem Ausgabepreis pro Million und summiert sie dann. Multipliziere mit dem Anfragen-Feld, um Batch- oder Monatsausgaben hochzurechnen.
Sind die Preise aktuell?
Sie sind Richtwerte und mit einem Stand-Datum markiert, weil sich die Anbieterpreise oft ändern. Bestätige immer den Live-Tarif auf der Preisseite von OpenAI, Anthropic oder Google und verwende die Überschreibungsfelder, um die exakten Zahlen einzusetzen.
Kann ich Tokens aus einem echten Prompt zählen, statt zu raten?
Ja. Schalte Aus Prompt zählen ein und füge deinen Text ein; der Rechner tokenisiert ihn mit dem Tokenizer des gewählten Modells und verwendet das als Eingabe-Token-Anzahl. OpenAI-Zählungen sind exakt, während Claude und Gemini ungefähr sind.
Schließt das zwischengespeicherte Eingaben oder Batch-Preise ein?
Nein. Die Schätzung verwendet Standard-Text-Tarife und schließt Rabatte für zwischengespeicherte Eingaben, Batch-Preise sowie Bild- oder Audio-Tokens aus. Gib deinen rabattierten Tarif in die $/1M-Überschreibung ein, um diese Fälle abzubilden.
Werden meine Prompts oder API-Schlüssel irgendwohin gesendet?
Nein. Der Rechner fragt nie nach einem API-Schlüssel, und die Token-Zählung plus die Kostenberechnung laufen lokal in deinem Browser, sodass jeder eingefügte Prompt auf deinem Gerät verarbeitet und nie hochgeladen wird.

Verwandte Tools

Alle ArrayKit-Tools