पीडीएफ टेक्स्ट को कैसे पहचानें

विषयसूची:

पीडीएफ टेक्स्ट को कैसे पहचानें
पीडीएफ टेक्स्ट को कैसे पहचानें

वीडियो: पीडीएफ टेक्स्ट को कैसे पहचानें

वीडियो: पीडीएफ टेक्स्ट को कैसे पहचानें
वीडियो: स्कैन किए गए पीडीएफ दस्तावेज़ों में पाठ को पहचानना | एक्रोबैट एक्स टिप्स एंड ट्रिक्स | एडोब दस्तावेज़ क्लाउड 2024, नवंबर
Anonim

दस्तावेजों, स्कैन की गई पुस्तकों और पीडीएफ फाइलों के साथ काम करते समय, उन्हें संपादित करना अक्सर आवश्यक होता है। ऐसा करने के लिए, आपको पाठ को पीडीएफ प्रारूप में पहचानना होगा और इसे सादे पाठ प्रारूप में बदलना होगा। यह कई मायनों में किया जा सकता है।

पीडीएफ टेक्स्ट को कैसे पहचानें
पीडीएफ टेक्स्ट को कैसे पहचानें

पीडीएफ टेक्स्ट को पहचानें

टेक्स्ट एडिटर द्वारा बनाए गए इलेक्ट्रॉनिक दस्तावेजों को मुफ्त एडोब रीडर प्रोग्राम द्वारा आसानी से पहचाना जा सकता है। कार्यक्रम में आवश्यक पीडीएफ फाइल खोलें, "संपादित करें" मेनू पर जाएं, ड्रॉप-डाउन विंडो में "क्लिपबोर्ड पर कॉपी करें" लाइन का चयन करें। Word में एक नया दस्तावेज़ बनाएं, उसमें क्लिपबोर्ड से टेक्स्ट पेस्ट करें और उसे संपादित करें, फिर उसे आवश्यक प्रारूप में सहेजें।

आप बहु-कार्यात्मक उपयोगिता एक्रोबेट रीडर डीसी का उपयोग करके पीडीएफ फाइलों को परिवर्तित और संपादित भी कर सकते हैं। सॉफ्टवेयर उत्पाद में इलेक्ट्रॉनिक दस्तावेजों के साथ काम करने के लिए बड़ी संख्या में उपकरण हैं।

वे अच्छे कार्यक्रम हैं, लेकिन अगर पीडीएफ दस्तावेज़ों को संपादित करने या कागज से स्कैन करने से सुरक्षित हैं तो वे पाठ को नहीं पहचान पाएंगे। इस मामले में, आपको एक विशेष ओसीआर कार्यक्रम की आवश्यकता है।

ओसीआर

image
image

निर्विवाद नेता एबीबीवाई फाइनरीडर है, कार्यक्रम अलग-अलग पृष्ठों को पहचानता है और बैच मोड में काम करता है। संसाधित पाठ को txt, doc, html और अन्य स्वरूपों में सहेजा जा सकता है। कार्यक्रम पीडीएफ पाठ को अच्छी तरह से पहचानता है। गलत तरीके से पहचाने गए वर्णों का एक छोटा प्रतिशत हो सकता है और दस्तावेज़ को मैन्युअल संशोधन की आवश्यकता होगी, परिणाम स्कैन की गुणवत्ता पर निर्भर करता है। इस कार्यक्रम में एक खामी है - इसका भुगतान किया जाता है।

ऐसे अन्य सशुल्क और निःशुल्क प्रोग्राम हैं जो आपको टेक्स्ट को पीडीएफ़ से वर्ड में पहचानने और परिवर्तित करने की अनुमति देते हैं: मुफ़्त - क्यूनिफ़ॉर्म, फ्रीमोर ओसीआर, फ्रीओसीआर; सशुल्क - रीडिरिस प्रो, नाइट्रो पीडीएफ प्रोफेशनल।

टेक्स्ट को ऑनलाइन पहचानें

यदि आप हर दिन इलेक्ट्रॉनिक दस्तावेजों को परिवर्तित नहीं करते हैं, तो आपको केवल एक बार पीडीएफ प्रारूप के साथ काम करने की आवश्यकता है, इस मामले में आपके कंप्यूटर पर प्रोग्राम स्थापित करने का कोई मतलब नहीं है। ऐसे एपिसोड के लिए ऑनलाइन सेवाएं हैं। यात्रा के दौरान काम पर उनका उपयोग करना भी सुविधाजनक होता है, जब पास में स्थापित प्रोग्राम वाला कोई कंप्यूटर नहीं होता है। ऑनलाइन सेवाएं आपको टेक्स्ट को निःशुल्क और शीघ्रता से पहचानने देती हैं। यहाँ कुछ हैं:

- ऑनलाइन ओसीआर - www.onlineocr.net

- न्यूओसीआर - www.newocr.com

- फ्री-ओसीआर - www.free-ocr.com

- OCRConvert - www.ocrconvert.com

ऑनलाइन पाठ पहचान में कई सकारात्मक पहलू हैं, लेकिन इसके नुकसान भी हैं: आपको सेवा पर पंजीकरण करने की आवश्यकता है; सभी सेवाओं में निर्यात फ़ंक्शन नहीं होता है, आपको वेब पेज से मान्यता प्राप्त पाठ की प्रतिलिपि बनाने की आवश्यकता होती है; कुछ सेवाओं में संसाधित दस्तावेज़ों की संख्या की सीमा होती है; अंतिम परिणाम की गुणवत्ता इंटरनेट की गति पर निर्भर करती है।

जैसा कि यह निकला, पीडीएफ पाठ को पहचानना मुश्किल नहीं है, विभिन्न कार्यक्रम हैं, आप कोई भी चुन सकते हैं।

सिफारिश की: