PDF से टेक्स्ट
PDF से चयन योग्य टेक्स्ट को सादे टेक्स्ट या Markdown के रूप में निकालें।
आपका PDF उसका टेक्स्ट निकालने के लिए स्थानीय रूप से आपके ब्राउज़र में पार्स होता है, और कुछ भी किसी सर्वर पर अपलोड नहीं होता।
दो PDF के बीच बदलाव देखने हैं? Compare PDFs आज़माएं।
PDF से टेक्स्ट के बारे में
यह pdf to text टूल किसी भी PDF से चयन योग्य टेक्स्ट निकालता है और इसे साफ़ प्लेन टेक्स्ट या प्रति-पेज Markdown के रूप में वापस देता है। एक अनुबंध, रिपोर्ट, या शोध पत्र ड्रॉप करें और पेज-दर-पेज कॉपी-पेस्ट किए बिना तुरंत पठनीय सामग्री निकालें। यह डेवलपर्स, तकनीकी लेखकों, QA इंजीनियर्स, और विश्लेषकों के लिए बना है जिन्हें खोज, डिफ़िंग, इंडेक्सिंग, या अन्य पाइपलाइनों में डालने के लिए PDF दस्तावेज़ों से टेक्स्ट निकालना है। पेज विभाजकों के साथ एक सरल .txt एक्सपोर्ट के लिए Text मोड चुनें, या हर पेज के लिए एक हेडिंग पाने के लिए Markdown मोड चुनें ताकि संरचना स्पष्ट रहे। सब कुछ एक इन-पेज PDF इंजन का उपयोग करके स्थानीय रूप से आपके ब्राउज़र में चलता है, इसलिए बड़ी या गोपनीय फ़ाइलें भी स्थानीय रूप से प्रोसेस होती हैं और आपका डेटा कभी आपके डिवाइस से बाहर नहीं जाता। इसका उपयोग pdf को टेक्स्ट में बदलने, उद्धरण निकालने, या सेकंडों में समीक्षा के लिए सामग्री तैयार करने हेतु करें।
विशेषताएँ
- PDF से चयन योग्य टेक्स्ट को पूरी तरह ब्राउज़र में निकालता है
- स्पष्ट प्रति-पेज विभाजकों के साथ Plain Text मोड
- Markdown मोड जो हर पेज के लिए एक हेडिंग जोड़ता है
- पठन क्रम बनाए रखने के लिए लाइनों को बेस्ट-एफ़र्ट आधार पर पुनर्निर्मित करता है
- पूरे निकाले गए आउटपुट की वन-क्लिक कॉपी
- परिणाम को .txt या .md फ़ाइल के रूप में डाउनलोड करें
- लोड किए गए PDF के लिए पेज संख्या और फ़ाइल साइज़ दिखाता है
- जब कोई PDF स्कैन किया गया हो और उसमें चयन योग्य टेक्स्ट न हो तो स्पष्ट चेतावनी देता है
PDF से टेक्स्ट का उपयोग कैसे करें
- अपलोड एरिया पर एक PDF ड्रॉप करें या फ़ाइल चुनने के लिए क्लिक करें।
- आपके ब्राउज़र में टेक्स्ट निकाले जाने के दौरान थोड़ी देर प्रतीक्षा करें।
- मोड टॉगल का उपयोग करके Text और Markdown के बीच स्विच करें।
- निकाले गए आउटपुट को कॉपी करें या इसे .txt या .md फ़ाइल के रूप में डाउनलोड करें।
- फ़ाइल साफ़ करने और एक अलग PDF लोड करने के लिए Remove क्लिक करें।
उदाहरण
इनपुट
invoice.pdf (2 पेज)
आउटपुट
Invoice #1042
Billed to: Acme Corp
Total: $1,250.00
──────────
Thank you for your business.
Text मोड में निकाला गया दो-पेज PDF, पेजों के बीच एक विभाजक के साथ।
सामान्य त्रुटियाँ और समस्या निवारण
- निकाला गया टेक्स्ट खाली वापस आता है। — PDF संभवतः स्कैन किया गया या केवल-इमेज है और इसमें कोई चयन योग्य टेक्स्ट नहीं है। OCR की ज़रूरत है और यह रोडमैप पर है; ऐसा PDF आज़माएं जो टेक्स्ट से बना हो।
- कॉलम या टेबल गड़बड़ निकलते हैं। — लाइनें बेस्ट-एफ़र्ट आधार पर पुनर्निर्मित होती हैं, इसलिए जटिल मल्टी-कॉलम या टैबुलर लेआउट पठन क्रम में संरक्षित नहीं हो सकते।
- विशेष अक्षर या लिगेचर अजीब दिखते हैं। — कुछ PDF गैर-मानक ग्लिफ़ मैपिंग एम्बेड करते हैं; निकाले गए अक्षर फ़ाइल के अंदर के फ़ॉन्ट एन्कोडिंग पर निर्भर करते हैं और दृश्य टेक्स्ट से भिन्न हो सकते हैं।
- एक बड़े PDF को प्रोसेस होने में समय लगता है। — एक्सट्रैक्शन स्थानीय रूप से आपके ब्राउज़र में होता है, इसलिए बहुत बड़े दस्तावेज़ों को एक क्षण चाहिए; कॉपी करने से पहले स्पिनर के पूरा होने का इंतज़ार करें।
अक्सर पूछे जाने वाले प्रश्न
- PDF to Text टूल क्या है?
- PDF to Text एक इन-ब्राउज़र एक्सट्रैक्टर है जो PDF से चयन योग्य टेक्स्ट पढ़ता है और इसे प्लेन टेक्स्ट या प्रति-पेज Markdown के रूप में वापस देता है, जो कॉपी या डाउनलोड के लिए तैयार होता है।
- मैं PDF to Text से PDF से टेक्स्ट कैसे निकालूं?
- एक PDF को PDF to Text टूल में ड्रॉप करें और यह चयन योग्य टेक्स्ट तुरंत निकालता है। Text या Markdown मोड चुनें, फिर परिणाम कॉपी या डाउनलोड करें।
- Text और Markdown मोड में क्या अंतर है?
- Text मोड पेजों के बीच एक विभाजक के साथ प्लेन आउटपुट देता है, जबकि Markdown मोड हर पेज से पहले एक Page N हेडिंग जोड़ता है ताकि संरचना संरक्षित रहे।
- क्या PDF to Text स्कैन किए गए या केवल-इमेज PDF पढ़ सकता है?
- अभी नहीं। स्कैन किए गए PDF में कोई चयन योग्य टेक्स्ट नहीं होता, इसलिए OCR आवश्यक है; वह क्षमता रोडमैप पर है।
- क्या PDF to Text मूल लेआउट बनाए रखता है?
- यह लाइनों को बेस्ट-एफ़र्ट आधार पर पुनर्निर्मित करता है। सरल दस्तावेज़ साफ़-सुथरे आते हैं, पर जटिल मल्टी-कॉलम लेआउट पूरी तरह संरक्षित नहीं हो सकते।
- जब मैं PDF to Text उपयोग करता हूं तो क्या मेरा PDF कहीं अपलोड होता है?
- नहीं। PDF स्थानीय रूप से आपके ब्राउज़र में प्रोसेस होता है और कुछ भी किसी सर्वर पर अपलोड नहीं होता, इसलिए आपका डेटा कभी आपके डिवाइस से बाहर नहीं जाता।
संबंधित टूल
- PDF तुलना करें — दो PDF से निकाले गए टेक्स्ट की पंक्ति-दर-पंक्ति तुलना करें।
- PDF से इमेज — PDF पेज को डाउनलोड करने योग्य PNG या JPG इमेज में कन्वर्ट करें।
- PDF विभाजित करें — पेज या रेंज (जैसे 1-3,5,7-9) निकालकर एक नया PDF बनाएँ।
- PDF व्यवस्थित करें — थंबनेल से पेज पुनः क्रमबद्ध करें, घुमाएँ और हटाएँ, फिर एक्सपोर्ट करें।
- PDF मर्ज करें — पुनः क्रमबद्ध करने के साथ कई PDF को एक में मिलाएँ।
- इमेज से PDF — इमेज को एक ही PDF में जोड़ें (स्वतः / पोर्ट्रेट / लैंडस्केप)।
- PDF कंप्रेस करें — चुनी गई गुणवत्ता और रिज़ॉल्यूशन पर हर पेज को JPEG में पुनः रेंडर करके PDF का आकार घटाएँ।
- Markdown पूर्वावलोकन — लाइव पूर्वावलोकन के साथ Markdown को HTML में रेंडर करें।
सभी ArrayKit टूल