Wie werden die LLM-API-Kosten berechnet?

Es multipliziert deine Eingabe-Tokens mit dem Eingabepreis pro Million des Modells und deine Ausgabe-Tokens mit dem Ausgabepreis pro Million und summiert sie dann. Multipliziere mit dem Anfragen-Feld, um Batch- oder Monatsausgaben hochzurechnen.

Sind die Preise aktuell?

Sie sind Richtwerte und mit einem Stand-Datum markiert, weil sich die Anbieterpreise oft ändern. Bestätige immer den Live-Tarif auf der Preisseite von OpenAI, Anthropic oder Google und verwende die Überschreibungsfelder, um die exakten Zahlen einzusetzen.

Kann ich Tokens aus einem echten Prompt zählen, statt zu raten?

Ja. Schalte Aus Prompt zählen ein und füge deinen Text ein; der Rechner tokenisiert ihn mit dem Tokenizer des gewählten Modells und verwendet das als Eingabe-Token-Anzahl. OpenAI-Zählungen sind exakt, während Claude und Gemini ungefähr sind.

Schließt das zwischengespeicherte Eingaben oder Batch-Preise ein?

Nein. Die Schätzung verwendet Standard-Text-Tarife und schließt Rabatte für zwischengespeicherte Eingaben, Batch-Preise sowie Bild- oder Audio-Tokens aus. Gib deinen rabattierten Tarif in die $/1M-Überschreibung ein, um diese Fälle abzubilden.

Werden meine Prompts oder API-Schlüssel irgendwohin gesendet?

Nein. Der Rechner fragt nie nach einem API-Schlüssel, und die Token-Zählung plus die Kostenberechnung laufen lokal in deinem Browser, sodass jeder eingefügte Prompt auf deinem Gerät verarbeitet und nie hochgeladen wird.

LLM-API-Kostenrechner

Schätze GPT-, Claude- und Gemini-API-Kosten aus deinen Token-Anzahlen. Deine Prompts verlassen dein Gerät nie.

Token-Zählung und Kostenberechnung laufen lokal in deinem Browser und nichts wird hochgeladen, aber vermeide es, Geheimnisse oder Produktionsdaten in das Prompt-Feld einzufügen.

Brauchst du präzise Token-Anzahlen? Öffne den Token-Zähler.

Über LLM-Kostenrechner

Dieser LLM-Kostenrechner verwandelt Token-Anzahlen in eine Dollar-Schätzung für die OpenAI-, Anthropic- und Google-APIs. Wähle ein Modell – GPT-4o, GPT-4.1, o1, Claude 3.5 Sonnet, Gemini 1.5 Pro und mehr –, gib dann Eingabe- und Ausgabe-Token-Anzahlen ein oder füge einen Prompt ein und lass das Tool seine Eingabe-Tokens mit dem richtigen Tokenizer zählen. Es multipliziert Tokens mit dem Preis pro Million jedes Modells und zeigt Eingabe-, Ausgabe- und Gesamtkosten, mit einem optionalen Anfragen-Multiplikator für Batch- oder Monatshochrechnungen. Preise sind Richtwerte und ändern sich oft, daher ist jede Zahl mit einer Stand-Markierung versehen, und du kannst den Eingabe- und Ausgabepreis pro Million für jedes Modell überschreiben, um zwischengespeicherte, Batch- oder neuere Tarife abzubilden. Die Token-Zählung und die Berechnung laufen vollständig in deinem Browser, sodass die eingefügten Prompts auf deinem Gerät verarbeitet werden und es nie verlassen.

Funktionen

Modelle nach Anbieter gruppiert: OpenAI, Anthropic Claude und Google Gemini
Gib Eingabe-Tokens direkt ein oder zähle sie aus einem eingefügten Prompt für das gewählte Modell
Felder für erwartete Ausgabe-Tokens und pro Anfrage für Batch- oder Monatsschätzungen
Eingabe-, Ausgabe- und Gesamtkosten in USD angezeigt, plus Kosten pro Anfrage
Benutzerdefinierte $/1M-Überschreibung für Eingabe und Ausgabe, um zwischengespeicherte, Batch- oder aktualisierte Preise abzubilden
Exakte OpenAI-Token-Zählungen; Claude- und Gemini-Zählungen als ungefähr gekennzeichnet
Richtpreise mit einem Stand-Datum markiert, damit du weißt, sie zu bestätigen
Die gesamte Tokenisierung und Preisberechnung läuft in deinem Browser, ohne Prompt-Upload

So verwendest du LLM-Kostenrechner

Wähle ein Modell aus dem nach Anbieter gruppierten Dropdown.
Gib die Eingabe-Tokens ein oder schalte Aus Prompt zählen ein und füge deinen Prompt ein.
Gib die erwarteten Ausgabe-Tokens und bei Bedarf eine Anzahl von Anfragen ein.
Lies die Eingabe-, Ausgabe- und Gesamtkosten in USD.
Überschreibe den $/1M-Eingabe- oder -Ausgabepreis, um deinem tatsächlichen Tarif zu entsprechen.

Beispiel

Eingabe

Model: GPT-4o
Input tokens: 1,000
Output tokens: 500
Requests: 1

Ausgabe

Input cost:  $0.0025
Output cost: $0.0050
Total cost:  $0.0075

1.000 Eingabe @ $2,50/M + 500 Ausgabe @ $10/M = $0,0075 pro Anfrage.

Häufige Fehler & Fehlerbehebung

Die Gesamtsumme stimmt nicht mit meiner Anbieter-Rechnung überein. — Preise sind Richtwerte, und die Schätzung schließt Rabatte für zwischengespeicherte Eingaben, Batch-Preise, Bild- oder Audio-Tokens und Anfrage-Overhead aus. Überschreibe die $/1M-Felder mit deinem realen Tarif und bestätige auf der Preisseite des Anbieters.
Die gezählten Eingabe-Tokens weichen leicht von dem ab, was die API für Claude oder Gemini meldet. — Claude- und Gemini-Token-Zählungen sind im Browser ungefähr. Verwende OpenAI-Modelle für exakte Zählungen oder behandle Claude- und Gemini-Summen als nahe Schätzungen und verifiziere sie beim Anbieter.
Mein benutzerdefinierter Preis hat keine Wirkung. — Die Überschreibung gilt nur, wenn ihr Feld nicht leer ist. Lass es leer, um den Richtpreis des Modells zu verwenden, oder tippe eine Zahl wie 1,25, um den Tarif pro Million zu überschreiben.
Die Kosten werden für einen winzigen Prompt als $0,00 angezeigt. — Sehr kleine Kosten werden mit zusätzlichen Dezimalstellen angezeigt, aber Rundung kann trotzdem als $0,00 erscheinen. Erhöhe den Anfragen-Multiplikator, um die hochgerechneten Kosten im Maßstab zu sehen.

Häufig gestellte Fragen

Wie werden die LLM-API-Kosten berechnet?: Es multipliziert deine Eingabe-Tokens mit dem Eingabepreis pro Million des Modells und deine Ausgabe-Tokens mit dem Ausgabepreis pro Million und summiert sie dann. Multipliziere mit dem Anfragen-Feld, um Batch- oder Monatsausgaben hochzurechnen.
Sind die Preise aktuell?: Sie sind Richtwerte und mit einem Stand-Datum markiert, weil sich die Anbieterpreise oft ändern. Bestätige immer den Live-Tarif auf der Preisseite von OpenAI, Anthropic oder Google und verwende die Überschreibungsfelder, um die exakten Zahlen einzusetzen.
Kann ich Tokens aus einem echten Prompt zählen, statt zu raten?: Ja. Schalte Aus Prompt zählen ein und füge deinen Text ein; der Rechner tokenisiert ihn mit dem Tokenizer des gewählten Modells und verwendet das als Eingabe-Token-Anzahl. OpenAI-Zählungen sind exakt, während Claude und Gemini ungefähr sind.
Schließt das zwischengespeicherte Eingaben oder Batch-Preise ein?: Nein. Die Schätzung verwendet Standard-Text-Tarife und schließt Rabatte für zwischengespeicherte Eingaben, Batch-Preise sowie Bild- oder Audio-Tokens aus. Gib deinen rabattierten Tarif in die $/1M-Überschreibung ein, um diese Fälle abzubilden.
Werden meine Prompts oder API-Schlüssel irgendwohin gesendet?: Nein. Der Rechner fragt nie nach einem API-Schlüssel, und die Token-Zählung plus die Kostenberechnung laufen lokal in deinem Browser, sodass jeder eingefügte Prompt auf deinem Gerät verarbeitet und nie hochgeladen wird.