शब्द और अक्षर काउंटर
टेक्स्ट पेस्ट करें और अक्षरों, वाक्यों, लाइनों, बाइट आकार और अनुमानित टोकन के साथ एक लाइव word counter पाएँ। सब कुछ आपके ब्राउज़र में चलता है।
गिनती बनाने के लिए आपका टेक्स्ट आपके ब्राउज़र में लोकल रूप से विश्लेषित होता है और कभी अपलोड नहीं होता, इसलिए नोट्स, ड्राफ्ट और प्रॉम्प्ट आपके डिवाइस पर ही रहते हैं।
उस टेक्स्ट को फिर से आकार देना है? Case Converter आज़माएँ।
शब्द और अक्षर काउंटर के बारे में
यह word counter जैसे ही आप टाइप करना शुरू करते हैं या टेक्स्ट पेस्ट करते हैं, तुरंत लाइव आँकड़े देता है। एक word counter और character counter के रूप में यह स्पेस के साथ और बिना अक्षर, शब्द, वाक्य, पैराग्राफ, लाइनें, UTF-8 बाइट आकार, एक अनुमानित LLM टोकन गिनती, और लगभग 200 शब्द प्रति मिनट पर एक अनुमानित पढ़ने का समय बताता है। अक्षर गिनती ग्राफ़ीम-अवेयर है, इसलिए एक इमोजी या झंडा एक अक्षर के रूप में गिना जाता है भले ही वह कई बाइट में फैला हो। यह एक मेटा विवरण को कसने, एक ट्वीट या कमिट संदेश में फ़िट करने, किसी मॉडल को भेजने से पहले एक प्रॉम्प्ट जाँचने, या बस लेखन को लक्ष्य पर रखने के लिए उपयोगी है। एक वैकल्पिक टॉप-शब्द फ़्रीक्वेंसी सूची भी है। सब कुछ आपके ब्राउज़र में लोकल रूप से गणना किया जाता है, इसलिए आपका पेस्ट किया गया टेक्स्ट आपके डिवाइस पर ही रहता है और कभी अपलोड नहीं होता।
विशेषताएँ
- टाइप करते ही स्पेस के साथ और बिना स्पेस के लाइव अक्षर
- शब्द, वाक्य, पैराग्राफ और लाइन गिनती तुरंत अपडेट होती है
- UTF-8 बाइट आकार ताकि आप पेलोड और स्टोरेज सीमा जाँच सकें
- ~अक्षर / 4 ह्यूरिस्टिक का उपयोग करके अनुमानित LLM टोकन गिनती, approx के रूप में चिह्नित
- लगभग 200 शब्द प्रति मिनट के आधार पर पढ़ने के समय का अनुमान
- ग्राफ़ीम-अवेयर गिनती ताकि इमोजी और संयुक्त ग्लिफ़ एक अक्षर के रूप में गिने जाएँ
- वैकल्पिक टॉप-शब्द फ़्रीक्वेंसी सूची जिसमें सामान्य स्टॉप शब्द हटा दिए जाते हैं
- Copy stats बटन हर मीट्रिक का साफ़ प्लेनटेक्स्ट सारांश कॉपी करता है
शब्द और अक्षर काउंटर का उपयोग कैसे करें
- अपना टेक्स्ट Text बॉक्स में पेस्ट या टाइप करें।
- अक्षर, शब्द, वाक्य, लाइनें, बाइट, टोकन और पढ़ने के समय के लिए लाइव स्टैट कार्ड पढ़ें।
- यह देखने के लिए वैकल्पिक टॉप-शब्द सूची स्कैन करें कि कौन से शब्द सबसे अधिक दोहराए जाते हैं।
- हर मीट्रिक का प्लेनटेक्स्ट सारांश पाने के लिए Copy stats पर क्लिक करें।
उदाहरण
इनपुट
The quick brown fox jumps over the lazy dog. 🦊
आउटपुट
Characters (with spaces): 46
Characters (no spaces): 37
Words: 9
Sentences: 1
Lines: 1
Size (UTF-8): 48 bytes
Tokens (approx): ~12
Reading time: 1 min
फ़ॉक्स इमोजी एक अक्षर के रूप में गिना जाता है लेकिन चार UTF-8 बाइट जोड़ता है।
सामान्य त्रुटियाँ और समस्या निवारण
- अक्षर गिनती आपके टाइप किए अक्षरों की संख्या से अधिक दिखती है। — डिफ़ॉल्ट गिनती में स्पेस, विराम चिह्न और लाइन ब्रेक शामिल हैं; केवल अक्षरों और दृश्य प्रतीकों के लिए दूसरा कार्ड, Characters (no spaces), जाँचें।
- एक इमोजी या उच्चारण-चिह्नित अक्षर बाइट आकार को अक्षर गिनती से अधिक बदलता है। — अक्षर ग्राफ़ीम-अवेयर तरीके से गिने जाते हैं जबकि बाइट UTF-8 हैं, इसलिए एक इमोजी एक अक्षर है पर चार बाइट; यह अपेक्षित व्यवहार है।
- टोकन संख्या आपके मॉडल के टोकनाइज़र से ठीक मेल नहीं खाती। — टोकन आँकड़ा एक अनुमान है (लगभग अक्षर / 4) और approx के रूप में चिह्नित है; जब सटीक गिनती मायने रखे तो अपने मॉडल का असली टोकनाइज़र उपयोग करें।
- बॉक्स खाली न होने के बावजूद शब्द गिनती शून्य है। — केवल स्पेस, टैब या खाली लाइनों वाले इनपुट में कोई शब्द नहीं होते; कुछ दृश्य टेक्स्ट टाइप करें और गिनती तुरंत अपडेट हो जाती है।
अक्सर पूछे जाने वाले प्रश्न
- क्या अक्षर गिनती में स्पेस और लाइन ब्रेक शामिल हैं?
- मुख्य Characters कार्ड स्पेस, विराम चिह्न और लाइन ब्रेक सहित सब कुछ गिनता है। एक अलग Characters (no spaces) कार्ड सभी व्हाइटस्पेस हटा देता है ताकि आप केवल अक्षर और दृश्य प्रतीक देख सकें।
- अक्षर गिनती इमोजी और उच्चारण-चिह्नित अक्षरों को कैसे संभालती है?
- गिनती जहाँ उपलब्ध हो वहाँ Intl.Segmenter का उपयोग करके ग्राफ़ीम-अवेयर है, इसलिए एक इमोजी, एक झंडा, या एक संयोजी उच्चारण वाला अक्षर एक ही अक्षर के रूप में गिना जाता है भले ही वह कई UTF-8 बाइट ले।
- अनुमानित टोकन गिनती किसलिए है?
- यह एक त्वरित अनुमान देती है कि आपका टेक्स्ट कितने LLM टोकन उपयोग करता है, लगभग अक्षर / 4 ह्यूरिस्टिक पर आधारित और approx के रूप में चिह्नित। यह मॉडल के कॉन्टेक्स्ट बजट के भीतर रहने के लिए उपयोगी है, पर मॉडल के सटीक टोकनाइज़र का विकल्प नहीं है।
- पढ़ने का समय कैसे गणना किया जाता है?
- पढ़ने का समय शब्द गिनती को लगभग 200 शब्द प्रति मिनट से भाग देता है और ऊपर की ओर पूर्णांकित करता है, इसलिए कोई भी खाली न होने वाला टेक्स्ट कम से कम एक मिनट दिखाता है। यह एक मोटा अनुमान है कि उस अंश को पढ़ने में कितना समय लगता है।
- बाइट आकार अक्षर गिनती से कैसे भिन्न होता है?
- बाइट आकार आपके टेक्स्ट की UTF-8 लंबाई है, जिसे कई API और डेटाबेस सीमित करते हैं। ASCII अक्षर एक बाइट होते हैं, उच्चारण-चिह्नित अक्षर आमतौर पर दो, अधिकांश CJK अक्षर तीन, और इमोजी चार, इसलिए बाइट अक्सर अक्षर गिनती से अधिक होते हैं।
- जब मैं अपना टेक्स्ट गिनता हूँ तो क्या वह अपलोड होता है?
- नहीं। word counter पूरी तरह आपके ब्राउज़र में चलता है, इसलिए आपका पेस्ट किया गया टेक्स्ट आपके डिवाइस पर लोकल रूप से प्रोसेस होता है और कभी सर्वर पर नहीं भेजा जाता।
संबंधित टूल
सभी ArrayKit टूल