LLM API लागत कैसे गणना की जाती है?

यह आपके input टोकन को मॉडल की input प्रति-मिलियन कीमत से और आपके output टोकन को output प्रति-मिलियन कीमत से गुणा करता है, फिर उन्हें जोड़ता है। batch या मासिक खर्च का अनुमान लगाने के लिए requests फ़ील्ड से गुणा करें।

क्या कीमतें मौजूदा हैं?

वे सांकेतिक हैं और एक as-of तारीख के साथ चिह्नित हैं क्योंकि provider pricing अक्सर बदलती है। OpenAI, Anthropic या Google के pricing पेज पर हमेशा लाइव दर की पुष्टि करें, और सटीक संख्याएँ डालने के लिए override फ़ील्ड उपयोग करें।

क्या मैं अनुमान लगाने के बजाय एक असली prompt से टोकन गिन सकता हूँ?

हाँ। Count from prompt टॉगल करें और अपना टेक्स्ट पेस्ट करें; calculator इसे चुने गए मॉडल के tokenizer से tokenize करता है और उसे input टोकन गिनती के रूप में उपयोग करता है। OpenAI गिनती सटीक है जबकि Claude और Gemini approximate हैं।

क्या इसमें cached input या batch pricing शामिल है?

नहीं। अनुमान मानक text-tier दरें उपयोग करता है और cached-input छूट, batch pricing, और image या audio टोकन को छोड़ देता है। उन मामलों को मॉडल करने के लिए $/1M override में अपनी छूट दर डालें।

क्या मेरे prompts या API key कहीं भेजे जाते हैं?

नहीं। calculator कभी किसी API key के लिए नहीं पूछता, और टोकन गिनती तथा लागत गणित आपके ब्राउज़र में स्थानीय रूप से चलते हैं, इसलिए आपके द्वारा पेस्ट किया गया कोई भी prompt आपके डिवाइस पर संसाधित होता है और कभी अपलोड नहीं होता।

LLM API Cost Calculator

अपनी टोकन गिनती से GPT, Claude और Gemini API लागत का अनुमान लगाएँ। आपके prompts आपके डिवाइस से बाहर नहीं जाते।

टोकन गिनती और लागत गणित आपके ब्राउज़र में स्थानीय रूप से चलते हैं और कुछ भी अपलोड नहीं होता, पर prompt बॉक्स में रहस्य या production डेटा पेस्ट करने से बचें।

सटीक टोकन गिनती चाहिए? Token Counter खोलें।

LLM Cost Calculator के बारे में

यह LLM cost calculator टोकन गिनती को OpenAI, Anthropic और Google API के लिए एक डॉलर अनुमान में बदल देता है। एक मॉडल चुनें — GPT-4o, GPT-4.1, o1, Claude 3.5 Sonnet, Gemini 1.5 Pro और अधिक — फिर input और output टोकन गिनती डालें, या एक prompt पेस्ट करें और टूल को सही tokenizer का उपयोग करके उसके input टोकन गिनने दें। यह टोकन को हर मॉडल की प्रति-मिलियन कीमत से गुणा करता है और input, output तथा कुल लागत दिखाता है, batch या मासिक अनुमानों के लिए एक वैकल्पिक requests गुणक के साथ। कीमतें सांकेतिक हैं और अक्सर बदलती हैं, इसलिए हर आँकड़ा एक as-of चिह्न के साथ लेबल किया गया है और आप cached, batch या नई दरों से मिलाने के लिए किसी भी मॉडल की input और output प्रति-मिलियन कीमत बदल सकते हैं। टोकन गिनती और गणित पूरी तरह आपके ब्राउज़र में चलते हैं, इसलिए आपके द्वारा पेस्ट किए गए prompts आपके डिवाइस पर संसाधित होते हैं और कभी उससे बाहर नहीं जाते।

विशेषताएँ

provider के अनुसार समूहित मॉडल: OpenAI, Anthropic Claude और Google Gemini
input टोकन सीधे डालें, या चुने गए मॉडल के लिए एक पेस्ट किए prompt से गिनें
batch या मासिक अनुमानों के लिए expected-output-token और प्रति-request फ़ील्ड
USD में input, output और कुल लागत, साथ ही प्रति request लागत
cached, batch या अपडेटेड कीमतों से मिलाने के लिए input और output के लिए कस्टम $/1M override
सटीक OpenAI टोकन गिनती; Claude और Gemini गिनती approximate लेबल की हुई
as-of तारीख के साथ चिह्नित सांकेतिक कीमतें ताकि आप उन्हें पुष्टि करना जानें
सारी tokenizing और pricing गणित आपके ब्राउज़र में चलती है, बिना किसी prompt अपलोड के

LLM Cost Calculator का उपयोग कैसे करें

provider के अनुसार समूहित ड्रॉपडाउन से एक मॉडल चुनें।
input टोकन डालें, या Count from prompt टॉगल करें और अपना prompt पेस्ट करें।
अपेक्षित output टोकन और, यदि जरूरत हो, requests की संख्या डालें।
USD में input, output और कुल लागत पढ़ें।
अपनी असली दर से मिलाने के लिए $/1M input या output कीमत override करें।

उदाहरण

इनपुट

Model: GPT-4o
Input tokens: 1,000
Output tokens: 500
Requests: 1

आउटपुट

Input cost:  $0.0025
Output cost: $0.0050
Total cost:  $0.0075

1,000 input @ $2.50/M + 500 output @ $10/M = $0.0075 प्रति request।

सामान्य त्रुटियाँ और समस्या निवारण

कुल मेरे provider invoice से मेल नहीं खाता। — कीमतें सांकेतिक हैं और अनुमान cached-input छूट, batch pricing, image या audio टोकन और request ओवरहेड को छोड़ देता है। $/1M फ़ील्ड को अपनी असली दर से override करें और provider के pricing पेज पर पुष्टि करें।
गिने गए input टोकन Claude या Gemini के लिए API द्वारा बताए गए से थोड़ा भिन्न हैं। — Claude और Gemini टोकन गिनती ब्राउज़र में approximate है। सटीक गिनती के लिए OpenAI मॉडल उपयोग करें, या Claude और Gemini योग को करीबी अनुमान मानें और provider के विरुद्ध पुष्टि करें।
मेरी कस्टम कीमत का कोई असर नहीं होता। — override केवल तभी लागू होता है जब उसका फ़ील्ड खाली न हो। मॉडल की सांकेतिक कीमत उपयोग करने के लिए इसे खाली छोड़ें, या प्रति-मिलियन दर override करने के लिए 1.25 जैसी संख्या टाइप करें।
किसी छोटे prompt के लिए लागत $0.00 दिखती है। — बहुत छोटी लागत अतिरिक्त दशमलव स्थानों के साथ दिखाई जाती है, पर rounding फिर भी $0.00 पढ़ सकती है। बड़े पैमाने पर अनुमानित लागत देखने के लिए requests गुणक बढ़ाएँ।

अक्सर पूछे जाने वाले प्रश्न

LLM API लागत कैसे गणना की जाती है?: यह आपके input टोकन को मॉडल की input प्रति-मिलियन कीमत से और आपके output टोकन को output प्रति-मिलियन कीमत से गुणा करता है, फिर उन्हें जोड़ता है। batch या मासिक खर्च का अनुमान लगाने के लिए requests फ़ील्ड से गुणा करें।
क्या कीमतें मौजूदा हैं?: वे सांकेतिक हैं और एक as-of तारीख के साथ चिह्नित हैं क्योंकि provider pricing अक्सर बदलती है। OpenAI, Anthropic या Google के pricing पेज पर हमेशा लाइव दर की पुष्टि करें, और सटीक संख्याएँ डालने के लिए override फ़ील्ड उपयोग करें।
क्या मैं अनुमान लगाने के बजाय एक असली prompt से टोकन गिन सकता हूँ?: हाँ। Count from prompt टॉगल करें और अपना टेक्स्ट पेस्ट करें; calculator इसे चुने गए मॉडल के tokenizer से tokenize करता है और उसे input टोकन गिनती के रूप में उपयोग करता है। OpenAI गिनती सटीक है जबकि Claude और Gemini approximate हैं।
क्या इसमें cached input या batch pricing शामिल है?: नहीं। अनुमान मानक text-tier दरें उपयोग करता है और cached-input छूट, batch pricing, और image या audio टोकन को छोड़ देता है। उन मामलों को मॉडल करने के लिए $/1M override में अपनी छूट दर डालें।
क्या मेरे prompts या API key कहीं भेजे जाते हैं?: नहीं। calculator कभी किसी API key के लिए नहीं पूछता, और टोकन गिनती तथा लागत गणित आपके ब्राउज़र में स्थानीय रूप से चलते हैं, इसलिए आपके द्वारा पेस्ट किया गया कोई भी prompt आपके डिवाइस पर संसाधित होता है और कभी अपलोड नहीं होता।