LLM API cost kaise calculate hoti hai?

Yeh aapke input tokens ko model ke input price per million se aur aapke output tokens ko output price per million se multiply karta hai, phir unhe jodta hai. Batch ya monthly spend project karne ke liye requests field se multiply karein.

Kya prices current hain?

Woh indicative hain aur ek as-of date ke saath marked hain kyunki provider pricing aksar badalti hai. Hamesha OpenAI, Anthropic ya Google ke pricing page par live rate confirm karein, aur exact numbers daalne ke liye override fields use karein.

Kya main andaaza lagane ki jagah ek real prompt se tokens count kar sakta hoon?

Haan. Count from prompt toggle karein aur apna text paste karein; calculator use selected model ke tokenizer se tokenize karta hai aur use input token count ke roop mein use karta hai. OpenAI counts exact hote hain jabki Claude aur Gemini approximate.

Kya isme cached input ya batch pricing shaamil hai?

Nahi. Estimate standard text-tier rates use karta hai aur cached-input discounts, batch pricing, aur image ya audio tokens ko chhod deta hai. Un cases ko model karne ke liye apna discounted rate $/1M override mein enter karein.

Kya mere prompts ya API keys kahin bheje jaate hain?

Nahi. Calculator kabhi API key nahi maangta, aur token counting plus cost math locally aapke browser mein chalte hain, isliye aap jo bhi prompt paste karte hain woh aapke device par process hota hai aur kabhi upload nahi hota.

LLM API Cost Calculator

Apne token counts se GPT, Claude aur Gemini API costs estimate karein. Aapke prompts aapke device se bahar nahi jaate.

Token counting aur cost math locally aapke browser mein chalte hain aur kuch bhi upload nahi hota, par prompt box mein secrets ya production data paste karne se bachein.

Precise token counts chahiye? Token Counter kholein.

LLM Cost Calculator ke baare mein

Yeh LLM cost calculator token counts ko OpenAI, Anthropic aur Google APIs ke liye ek dollar estimate mein badal deta hai. Ek model chunein — GPT-4o, GPT-4.1, o1, Claude 3.5 Sonnet, Gemini 1.5 Pro aur bahut kuch — phir input aur output token counts enter karein, ya ek prompt paste karein aur tool ko sahi tokenizer se uske input tokens count karne dein. Yeh tokens ko har model ke per-million price se multiply karta hai aur input, output aur total cost dikhata hai, batch ya monthly projections ke liye ek optional requests multiplier ke saath. Prices indicative hain aur aksar badalte hain, isliye har figure ek as-of marker ke saath labelled hota hai aur aap kisi bhi model ke liye input aur output price per million ko cached, batch ya naye rates se match karne ke liye override kar sakte hain. Token counting aur math poori tarah aapke browser mein chalte hain, isliye aap jo prompts paste karte hain woh aapke device par process hote hain aur kabhi aapke device se bahar nahi jaate.

Features

Provider ke hisaab se grouped models: OpenAI, Anthropic Claude aur Google Gemini
Input tokens seedhe enter karein, ya selected model ke liye ek pasted prompt se count karein
Batch ya monthly estimates ke liye expected-output-token aur per-request fields
Input, output aur total cost USD mein dikhaya gaya, plus cost per request
Cached, batch ya updated prices se match karne ke liye input aur output ka custom $/1M override
Exact OpenAI token counts; Claude aur Gemini counts approximate labelled
Indicative prices ek as-of date ke saath marked taaki aap unhe confirm karna jaanein
Saara tokenizing aur pricing math aapke browser mein chalta hai, bina kisi prompt upload ke

LLM Cost Calculator kaise use karein

Provider ke hisaab se grouped dropdown se ek model chunein.
Input tokens enter karein, ya Count from prompt toggle karke apna prompt paste karein.
Expected output tokens enter karein aur, agar zaroorat ho, requests ki ek sankhya.
Input, output aur total cost USD mein padhein.
Apne actual rate se match karne ke liye $/1M input ya output price override karein.

Example

Input

Model: GPT-4o
Input tokens: 1,000
Output tokens: 500
Requests: 1

Output

Input cost:  $0.0025
Output cost: $0.0050
Total cost:  $0.0075

1,000 input @ $2.50/M + 500 output @ $10/M = $0.0075 per request.

Common errors aur troubleshooting

Total mere provider invoice se match nahi karta. — Prices indicative hain aur estimate cached-input discounts, batch pricing, image ya audio tokens aur request overhead ko chhod deta hai. $/1M fields ko apne real rate se override karein aur provider ke pricing page par confirm karein.
Counted input tokens, Claude ya Gemini ke liye API jo report karta hai usse thode alag hain. — Browser mein Claude aur Gemini token counts approximate hote hain. Exact counts ke liye OpenAI models use karein, ya Claude aur Gemini totals ko close estimates maankar provider ke against verify karein.
Mera custom price ka koi asar nahi hota. — Override sirf tab apply hota hai jab uska field non-empty ho. Model ka indicative price use karne ke liye use blank chhodein, ya per-million rate override karne ke liye 1.25 jaisa number type karein.
Ek tiny prompt ke liye cost $0.00 dikhati hai. — Bahut chhoti costs extra decimal places ke saath dikhayi jaati hain, par rounding phir bhi $0.00 padh sakti hai. Scale par projected cost dekhne ke liye requests multiplier badhayein.

Aksar pooche jaane wale sawaal

LLM API cost kaise calculate hoti hai?: Yeh aapke input tokens ko model ke input price per million se aur aapke output tokens ko output price per million se multiply karta hai, phir unhe jodta hai. Batch ya monthly spend project karne ke liye requests field se multiply karein.
Kya prices current hain?: Woh indicative hain aur ek as-of date ke saath marked hain kyunki provider pricing aksar badalti hai. Hamesha OpenAI, Anthropic ya Google ke pricing page par live rate confirm karein, aur exact numbers daalne ke liye override fields use karein.
Kya main andaaza lagane ki jagah ek real prompt se tokens count kar sakta hoon?: Haan. Count from prompt toggle karein aur apna text paste karein; calculator use selected model ke tokenizer se tokenize karta hai aur use input token count ke roop mein use karta hai. OpenAI counts exact hote hain jabki Claude aur Gemini approximate.
Kya isme cached input ya batch pricing shaamil hai?: Nahi. Estimate standard text-tier rates use karta hai aur cached-input discounts, batch pricing, aur image ya audio tokens ko chhod deta hai. Un cases ko model karne ke liye apna discounted rate $/1M override mein enter karein.
Kya mere prompts ya API keys kahin bheje jaate hain?: Nahi. Calculator kabhi API key nahi maangta, aur token counting plus cost math locally aapke browser mein chalte hain, isliye aap jo bhi prompt paste karte hain woh aapke device par process hota hai aur kabhi upload nahi hota.

Related tools

Token Counter — GPT, Claude aur Gemini ke liye tokens type karte hi count karein.
OpenAI API Tester — OpenAI Chat Completions API requests banayein, chalayein aur cURL, Python aur JavaScript ke roop mein copy karein.
Anthropic Claude API Tester — Anthropic Claude Messages API requests banayein, chalayein aur cURL, Python aur JavaScript ke roop mein copy karein.
Google Gemini API Tester — Google Gemini generateContent API requests banayein, chalayein aur cURL, Python aur JavaScript ke roop mein copy karein.
JSON to TOON — JSON ko TOON mein convert karein taaki LLM prompts mein kam tokens lagein.