Mojibake / एन्कोडिंग फ़िक्सर
Café या don’t जैसे गड़बड़ mojibake टेक्स्ट को वापस Café और don’t में ठीक करें, सीधे आपके ब्राउज़र में।
आपका टेक्स्ट आपके ब्राउज़र में स्थानीय रूप से ठीक होता है और कभी अपलोड नहीं होता, पर किसी भी ऑनलाइन टूल में संवेदनशील व्यक्तिगत डेटा पेस्ट करने से बचें।
HTML विशेष अक्षरों को escape करना है? HTML Entities टूल आज़माएँ।
Mojibake Fixer के बारे में
यह mojibake fixer एन्कोडिंग बेमेल से उत्पन्न गड़बड़ टेक्स्ट को ठीक करता है — वही तरह जो "Café" को "Café", "don't" को "don’t", और "😀" को "😀" में बदल देती है। आम वजह UTF-8 बाइट्स होते हैं जिन्हें गलती से Windows-1252 या Latin-1 के रूप में डीकोड कर दिया गया, इसलिए एक्सेंटेड अक्षर, smart quotes, डैश और emoji कचरा अक्षरों के रूप में निकलते हैं। फ़िक्सर इसे उलट देता है: यह हर गड़बड़ अक्षर को उसकी मूल बाइट पर वापस मैप करता है और परिणाम को फिर से UTF-8 के रूप में डीकोड करता है। चूँकि एक से अधिक बेमेल संभव हैं, यह कई व्याख्याएँ देता है (UTF-8 ↔ Windows-1252, UTF-8 ↔ Latin-1, और एक डबल-डीकोड पास) और सबसे साफ़ को हाइलाइट करता है, साथ ही आपको दूसरी चुनने देता है। बाईं ओर टेक्स्ट पेस्ट करें और दाईं ओर मरम्मत पढ़ें। सब कुछ आपके ब्राउज़र में चलता है, इसलिए आपके द्वारा पेस्ट किया गया टेक्स्ट आपके डिवाइस पर रहता है।
विशेषताएँ
- सबसे आम mojibake ठीक करता है: UTF-8 बाइट्स जो Windows-1252 या Latin-1 के रूप में डीकोड हुए
- एक्सेंटेड अक्षर, smart quotes, डैश, यूरो चिह्न, और टूटे emoji ठीक करता है
- कई संभावित व्याख्याएँ देता है और सबसे साफ़ मरम्मत को Best के रूप में चिह्नित करता है
- उस टेक्स्ट के लिए डबल-डीकोड पास शामिल करता है जिसे दो बार गलत डीकोड किया गया
- किसी फ़िक्स पर भरोसा करने से पहले बताता है कि इनपुट वास्तव में mojibake जैसा दिखता है या नहीं
- लाइव इनपुट और आउटपुट — बाईं ओर पेस्ट करें, दाईं ओर मरम्मत किया टेक्स्ट पढ़ें
- एक क्लिक में ठीक किया टेक्स्ट कॉपी करें, या आज़माने के लिए एक ज्ञात-गड़बड़ सैंपल लोड करें
- पूरी तरह आपके ब्राउज़र में चलता है; आपके द्वारा पेस्ट किया गया टेक्स्ट आपके डिवाइस पर संसाधित होता है
Mojibake Fixer का उपयोग कैसे करें
- बाईं ओर के इनपुट बॉक्स में गड़बड़ टेक्स्ट पेस्ट करें।
- दाईं ओर Fixed आउटपुट पैनल में सबसे अच्छी मरम्मत पढ़ें।
- Interpretations सूची देखें और यदि कोई और साफ़ पढ़ती हो तो उसे चुनें।
- मरम्मत किया टेक्स्ट पाने के लिए Copy पर क्लिक करें।
उदाहरण
इनपुट
Café — don’t panic
आउटपुट
Café — don’t panic
UTF-8 टेक्स्ट जो गलती से Windows-1252 के रूप में डीकोड हुआ, साफ़ अक्षरों में वापस ठीक किया गया।
सामान्य त्रुटियाँ और समस्या निवारण
- फ़िक्स साफ़ एक्सेंटेड टेक्स्ट को "Cé" जैसे नए कचरे में बदल देता है। — आपका टेक्स्ट शायद पहले से ही सही UTF-8 था। Original candidate चुनें, या फ़िक्सर को केवल उसी इनपुट पर चलाएँ जो वास्तव में गड़बड़ दिखता हो।
- एक पास के बाद भी कुछ अक्षर टूटे दिखते हैं। — टेक्स्ट को दो बार गलत डीकोड किया गया हो सकता है। डबल-डीकोड व्याख्या चुनें, जो मरम्मत को दूसरी बार लागू करती है।
- कुछ अक्षर एक काले हीरे वाले प्रश्नचिह्न (�) के रूप में दिखते हैं। — वे बाइट्स पेस्ट करने से पहले ही खो या बदल गए थे और वापस नहीं पाए जा सकते। मूल स्रोत से टेक्स्ट को फिर से UTF-8 के रूप में निर्यात करें।
- घुमावदार कोट्स और डैश ठीक हो गए पर एक अजीब चिह्न बचा रह गया। — Windows-1252 के बजाय Latin-1 व्याख्या आज़माएँ; दोनों में अंतर केवल कुछ विराम और चिह्न बाइट्स के लिए है।
अक्सर पूछे जाने वाले प्रश्न
- mojibake किस वजह से होता है?
- mojibake तब होता है जब एक अक्षर एन्कोडिंग में सहेजे गए टेक्स्ट को दूसरी में पढ़ा जाता है। क्लासिक मामला UTF-8 बाइट्स का Windows-1252 या Latin-1 के रूप में डीकोड होना है, इसलिए एक्सेंट, smart quotes, और emoji जैसे multi-byte अक्षर कई गलत single-byte glyph में बँट जाते हैं।
- Café, Café के रूप में क्यों दिखता है?
- UTF-8 में é दो बाइट्स (0xC3 0xA9) होती है। जब वे बाइट्स Windows-1252 के रूप में पढ़ी जाती हैं, 0xC3 à बनता है और 0xA9 © बनता है, इसलिए "Café" "Café" में बदल जाता है। फ़िक्सर उन अक्षरों को वापस बाइट्स में मैप करता है और é बहाल करने के लिए उन्हें UTF-8 के रूप में डीकोड करता है।
- एक apostrophe ’ में क्यों बदल जाता है?
- एक घुमावदार apostrophe (’, U+2019) तीन UTF-8 बाइट्स है। Windows-1252 के रूप में डीकोड होने पर वे â, €, और ™ बन जाती हैं, इसीलिए "don't" "don’t" के रूप में दिखता है। उन तीन अक्षरों को फिर से UTF-8 के रूप में डीकोड करना मूल ’ को फिर बना देता है।
- Windows-1252 और Latin-1 फ़िक्स में क्या अंतर है?
- Windows-1252 और Latin-1 (ISO-8859-1) लगभग समान हैं पर 0x80–0x9F रेंज में भिन्न हैं, जहाँ Windows-1252 में smart quotes, डैश, और यूरो चिह्न होते हैं। पहले Windows-1252 फ़िक्स आज़माएँ; यदि कोई विराम या चिह्न अक्षर अभी भी गलत हो तो Latin-1 पर जाएँ।
- क्या mojibake हमेशा ठीक किया जा सकता है?
- अक्सर, पर हमेशा नहीं। यदि मूल बाइट्स को आपके कॉपी करने से पहले एक सामान्य प्लेसहोल्डर (� प्रतिस्थापन अक्षर) से बदल दिया गया था, तो जानकारी चली गई और कोई फ़िक्सर उसे वापस नहीं ला सकता। मरम्मत तभी काम करती है जब गड़बड़-पर-उलटाने-योग्य बाइट्स बरकरार हों।
- क्या मेरे द्वारा पेस्ट किया गया टेक्स्ट कहीं अपलोड होता है?
- नहीं। mojibake मरम्मत पूरी तरह आपके ब्राउज़र में चलती है, इसलिए आपके द्वारा पेस्ट किया गया टेक्स्ट आपके डिवाइस पर स्थानीय रूप से संसाधित होता है और किसी सर्वर पर नहीं भेजा जाता।
संबंधित टूल
सभी ArrayKit टूल