Mojibake / एन्कोडिंग फ़िक्सर

Café या don’t जैसे गड़बड़ mojibake टेक्स्ट को वापस Café और don’t में ठीक करें, सीधे आपके ब्राउज़र में।

आपका टेक्स्ट आपके ब्राउज़र में स्थानीय रूप से ठीक होता है और कभी अपलोड नहीं होता, पर किसी भी ऑनलाइन टूल में संवेदनशील व्यक्तिगत डेटा पेस्ट करने से बचें।

HTML विशेष अक्षरों को escape करना है? HTML Entities टूल आज़माएँ।

Mojibake Fixer के बारे में

यह mojibake fixer एन्कोडिंग बेमेल से उत्पन्न गड़बड़ टेक्स्ट को ठीक करता है — वही तरह जो "Café" को "Café", "don't" को "don’t", और "😀" को "😀" में बदल देती है। आम वजह UTF-8 बाइट्स होते हैं जिन्हें गलती से Windows-1252 या Latin-1 के रूप में डीकोड कर दिया गया, इसलिए एक्सेंटेड अक्षर, smart quotes, डैश और emoji कचरा अक्षरों के रूप में निकलते हैं। फ़िक्सर इसे उलट देता है: यह हर गड़बड़ अक्षर को उसकी मूल बाइट पर वापस मैप करता है और परिणाम को फिर से UTF-8 के रूप में डीकोड करता है। चूँकि एक से अधिक बेमेल संभव हैं, यह कई व्याख्याएँ देता है (UTF-8 ↔ Windows-1252, UTF-8 ↔ Latin-1, और एक डबल-डीकोड पास) और सबसे साफ़ को हाइलाइट करता है, साथ ही आपको दूसरी चुनने देता है। बाईं ओर टेक्स्ट पेस्ट करें और दाईं ओर मरम्मत पढ़ें। सब कुछ आपके ब्राउज़र में चलता है, इसलिए आपके द्वारा पेस्ट किया गया टेक्स्ट आपके डिवाइस पर रहता है।

विशेषताएँ

Mojibake Fixer का उपयोग कैसे करें

  1. बाईं ओर के इनपुट बॉक्स में गड़बड़ टेक्स्ट पेस्ट करें।
  2. दाईं ओर Fixed आउटपुट पैनल में सबसे अच्छी मरम्मत पढ़ें।
  3. Interpretations सूची देखें और यदि कोई और साफ़ पढ़ती हो तो उसे चुनें।
  4. मरम्मत किया टेक्स्ट पाने के लिए Copy पर क्लिक करें।

उदाहरण

इनपुट

Café — don’t panic

आउटपुट

Café — don’t panic

UTF-8 टेक्स्ट जो गलती से Windows-1252 के रूप में डीकोड हुआ, साफ़ अक्षरों में वापस ठीक किया गया।

सामान्य त्रुटियाँ और समस्या निवारण

अक्सर पूछे जाने वाले प्रश्न

mojibake किस वजह से होता है?
mojibake तब होता है जब एक अक्षर एन्कोडिंग में सहेजे गए टेक्स्ट को दूसरी में पढ़ा जाता है। क्लासिक मामला UTF-8 बाइट्स का Windows-1252 या Latin-1 के रूप में डीकोड होना है, इसलिए एक्सेंट, smart quotes, और emoji जैसे multi-byte अक्षर कई गलत single-byte glyph में बँट जाते हैं।
Café, Café के रूप में क्यों दिखता है?
UTF-8 में é दो बाइट्स (0xC3 0xA9) होती है। जब वे बाइट्स Windows-1252 के रूप में पढ़ी जाती हैं, 0xC3 à बनता है और 0xA9 © बनता है, इसलिए "Café" "Café" में बदल जाता है। फ़िक्सर उन अक्षरों को वापस बाइट्स में मैप करता है और é बहाल करने के लिए उन्हें UTF-8 के रूप में डीकोड करता है।
एक apostrophe ’ में क्यों बदल जाता है?
एक घुमावदार apostrophe (’, U+2019) तीन UTF-8 बाइट्स है। Windows-1252 के रूप में डीकोड होने पर वे â, €, और ™ बन जाती हैं, इसीलिए "don't" "don’t" के रूप में दिखता है। उन तीन अक्षरों को फिर से UTF-8 के रूप में डीकोड करना मूल ’ को फिर बना देता है।
Windows-1252 और Latin-1 फ़िक्स में क्या अंतर है?
Windows-1252 और Latin-1 (ISO-8859-1) लगभग समान हैं पर 0x80–0x9F रेंज में भिन्न हैं, जहाँ Windows-1252 में smart quotes, डैश, और यूरो चिह्न होते हैं। पहले Windows-1252 फ़िक्स आज़माएँ; यदि कोई विराम या चिह्न अक्षर अभी भी गलत हो तो Latin-1 पर जाएँ।
क्या mojibake हमेशा ठीक किया जा सकता है?
अक्सर, पर हमेशा नहीं। यदि मूल बाइट्स को आपके कॉपी करने से पहले एक सामान्य प्लेसहोल्डर (� प्रतिस्थापन अक्षर) से बदल दिया गया था, तो जानकारी चली गई और कोई फ़िक्सर उसे वापस नहीं ला सकता। मरम्मत तभी काम करती है जब गड़बड़-पर-उलटाने-योग्य बाइट्स बरकरार हों।
क्या मेरे द्वारा पेस्ट किया गया टेक्स्ट कहीं अपलोड होता है?
नहीं। mojibake मरम्मत पूरी तरह आपके ब्राउज़र में चलती है, इसलिए आपके द्वारा पेस्ट किया गया टेक्स्ट आपके डिवाइस पर स्थानीय रूप से संसाधित होता है और किसी सर्वर पर नहीं भेजा जाता।

संबंधित टूल

सभी ArrayKit टूल