LLM-API-Kostenrechner
Schätze GPT-, Claude- und Gemini-API-Kosten aus deinen Token-Anzahlen. Deine Prompts verlassen dein Gerät nie.
Token-Zählung und Kostenberechnung laufen lokal in deinem Browser und nichts wird hochgeladen, aber vermeide es, Geheimnisse oder Produktionsdaten in das Prompt-Feld einzufügen.
Brauchst du präzise Token-Anzahlen? Öffne den Token-Zähler.
Über LLM-Kostenrechner
Dieser LLM-Kostenrechner verwandelt Token-Anzahlen in eine Dollar-Schätzung für die OpenAI-, Anthropic- und Google-APIs. Wähle ein Modell – GPT-4o, GPT-4.1, o1, Claude 3.5 Sonnet, Gemini 1.5 Pro und mehr –, gib dann Eingabe- und Ausgabe-Token-Anzahlen ein oder füge einen Prompt ein und lass das Tool seine Eingabe-Tokens mit dem richtigen Tokenizer zählen. Es multipliziert Tokens mit dem Preis pro Million jedes Modells und zeigt Eingabe-, Ausgabe- und Gesamtkosten, mit einem optionalen Anfragen-Multiplikator für Batch- oder Monatshochrechnungen. Preise sind Richtwerte und ändern sich oft, daher ist jede Zahl mit einer Stand-Markierung versehen, und du kannst den Eingabe- und Ausgabepreis pro Million für jedes Modell überschreiben, um zwischengespeicherte, Batch- oder neuere Tarife abzubilden. Die Token-Zählung und die Berechnung laufen vollständig in deinem Browser, sodass die eingefügten Prompts auf deinem Gerät verarbeitet werden und es nie verlassen.
Funktionen
- Modelle nach Anbieter gruppiert: OpenAI, Anthropic Claude und Google Gemini
- Gib Eingabe-Tokens direkt ein oder zähle sie aus einem eingefügten Prompt für das gewählte Modell
- Felder für erwartete Ausgabe-Tokens und pro Anfrage für Batch- oder Monatsschätzungen
- Eingabe-, Ausgabe- und Gesamtkosten in USD angezeigt, plus Kosten pro Anfrage
- Benutzerdefinierte $/1M-Überschreibung für Eingabe und Ausgabe, um zwischengespeicherte, Batch- oder aktualisierte Preise abzubilden
- Exakte OpenAI-Token-Zählungen; Claude- und Gemini-Zählungen als ungefähr gekennzeichnet
- Richtpreise mit einem Stand-Datum markiert, damit du weißt, sie zu bestätigen
- Die gesamte Tokenisierung und Preisberechnung läuft in deinem Browser, ohne Prompt-Upload
So verwendest du LLM-Kostenrechner
- Wähle ein Modell aus dem nach Anbieter gruppierten Dropdown.
- Gib die Eingabe-Tokens ein oder schalte Aus Prompt zählen ein und füge deinen Prompt ein.
- Gib die erwarteten Ausgabe-Tokens und bei Bedarf eine Anzahl von Anfragen ein.
- Lies die Eingabe-, Ausgabe- und Gesamtkosten in USD.
- Überschreibe den $/1M-Eingabe- oder -Ausgabepreis, um deinem tatsächlichen Tarif zu entsprechen.
Beispiel
Eingabe
Model: GPT-4o
Input tokens: 1,000
Output tokens: 500
Requests: 1
Ausgabe
Input cost: $0.0025
Output cost: $0.0050
Total cost: $0.0075
1.000 Eingabe @ $2,50/M + 500 Ausgabe @ $10/M = $0,0075 pro Anfrage.
Häufige Fehler & Fehlerbehebung
- Die Gesamtsumme stimmt nicht mit meiner Anbieter-Rechnung überein. — Preise sind Richtwerte, und die Schätzung schließt Rabatte für zwischengespeicherte Eingaben, Batch-Preise, Bild- oder Audio-Tokens und Anfrage-Overhead aus. Überschreibe die $/1M-Felder mit deinem realen Tarif und bestätige auf der Preisseite des Anbieters.
- Die gezählten Eingabe-Tokens weichen leicht von dem ab, was die API für Claude oder Gemini meldet. — Claude- und Gemini-Token-Zählungen sind im Browser ungefähr. Verwende OpenAI-Modelle für exakte Zählungen oder behandle Claude- und Gemini-Summen als nahe Schätzungen und verifiziere sie beim Anbieter.
- Mein benutzerdefinierter Preis hat keine Wirkung. — Die Überschreibung gilt nur, wenn ihr Feld nicht leer ist. Lass es leer, um den Richtpreis des Modells zu verwenden, oder tippe eine Zahl wie 1,25, um den Tarif pro Million zu überschreiben.
- Die Kosten werden für einen winzigen Prompt als $0,00 angezeigt. — Sehr kleine Kosten werden mit zusätzlichen Dezimalstellen angezeigt, aber Rundung kann trotzdem als $0,00 erscheinen. Erhöhe den Anfragen-Multiplikator, um die hochgerechneten Kosten im Maßstab zu sehen.
Häufig gestellte Fragen
- Wie werden die LLM-API-Kosten berechnet?
- Es multipliziert deine Eingabe-Tokens mit dem Eingabepreis pro Million des Modells und deine Ausgabe-Tokens mit dem Ausgabepreis pro Million und summiert sie dann. Multipliziere mit dem Anfragen-Feld, um Batch- oder Monatsausgaben hochzurechnen.
- Sind die Preise aktuell?
- Sie sind Richtwerte und mit einem Stand-Datum markiert, weil sich die Anbieterpreise oft ändern. Bestätige immer den Live-Tarif auf der Preisseite von OpenAI, Anthropic oder Google und verwende die Überschreibungsfelder, um die exakten Zahlen einzusetzen.
- Kann ich Tokens aus einem echten Prompt zählen, statt zu raten?
- Ja. Schalte Aus Prompt zählen ein und füge deinen Text ein; der Rechner tokenisiert ihn mit dem Tokenizer des gewählten Modells und verwendet das als Eingabe-Token-Anzahl. OpenAI-Zählungen sind exakt, während Claude und Gemini ungefähr sind.
- Schließt das zwischengespeicherte Eingaben oder Batch-Preise ein?
- Nein. Die Schätzung verwendet Standard-Text-Tarife und schließt Rabatte für zwischengespeicherte Eingaben, Batch-Preise sowie Bild- oder Audio-Tokens aus. Gib deinen rabattierten Tarif in die $/1M-Überschreibung ein, um diese Fälle abzubilden.
- Werden meine Prompts oder API-Schlüssel irgendwohin gesendet?
- Nein. Der Rechner fragt nie nach einem API-Schlüssel, und die Token-Zählung plus die Kostenberechnung laufen lokal in deinem Browser, sodass jeder eingefügte Prompt auf deinem Gerät verarbeitet und nie hochgeladen wird.
Verwandte Tools
- Token-Zähler — Zähle Tokens für GPT, Claude und Gemini, während du tippst.
- OpenAI-API-Tester — Erstelle, sende und kopiere Anfragen an die OpenAI-Chat-Completions-API als cURL, Python und JavaScript.
- Anthropic-Claude-API-Tester — Erstelle, sende und kopiere Anfragen an die Anthropic-Claude-Messages-API als cURL, Python und JavaScript.
- Google-Gemini-API-Tester — Erstelle, sende und kopiere generateContent-Anfragen von Google Gemini als cURL, Python und JavaScript.
- JSON zu TOON — Konvertiere JSON zu TOON und zurück, um LLM-Prompt-Tokens zu sparen.
Alle ArrayKit-Tools