दस्तावेजों, स्कैन की गई पुस्तकों और पीडीएफ फाइलों के साथ काम करते समय, उन्हें संपादित करना अक्सर आवश्यक होता है। ऐसा करने के लिए, आपको पाठ को पीडीएफ प्रारूप में पहचानना होगा और इसे सादे पाठ प्रारूप में बदलना होगा। यह कई मायनों में किया जा सकता है।
पीडीएफ टेक्स्ट को पहचानें
टेक्स्ट एडिटर द्वारा बनाए गए इलेक्ट्रॉनिक दस्तावेजों को मुफ्त एडोब रीडर प्रोग्राम द्वारा आसानी से पहचाना जा सकता है। कार्यक्रम में आवश्यक पीडीएफ फाइल खोलें, "संपादित करें" मेनू पर जाएं, ड्रॉप-डाउन विंडो में "क्लिपबोर्ड पर कॉपी करें" लाइन का चयन करें। Word में एक नया दस्तावेज़ बनाएं, उसमें क्लिपबोर्ड से टेक्स्ट पेस्ट करें और उसे संपादित करें, फिर उसे आवश्यक प्रारूप में सहेजें।
आप बहु-कार्यात्मक उपयोगिता एक्रोबेट रीडर डीसी का उपयोग करके पीडीएफ फाइलों को परिवर्तित और संपादित भी कर सकते हैं। सॉफ्टवेयर उत्पाद में इलेक्ट्रॉनिक दस्तावेजों के साथ काम करने के लिए बड़ी संख्या में उपकरण हैं।
वे अच्छे कार्यक्रम हैं, लेकिन अगर पीडीएफ दस्तावेज़ों को संपादित करने या कागज से स्कैन करने से सुरक्षित हैं तो वे पाठ को नहीं पहचान पाएंगे। इस मामले में, आपको एक विशेष ओसीआर कार्यक्रम की आवश्यकता है।
ओसीआर
निर्विवाद नेता एबीबीवाई फाइनरीडर है, कार्यक्रम अलग-अलग पृष्ठों को पहचानता है और बैच मोड में काम करता है। संसाधित पाठ को txt, doc, html और अन्य स्वरूपों में सहेजा जा सकता है। कार्यक्रम पीडीएफ पाठ को अच्छी तरह से पहचानता है। गलत तरीके से पहचाने गए वर्णों का एक छोटा प्रतिशत हो सकता है और दस्तावेज़ को मैन्युअल संशोधन की आवश्यकता होगी, परिणाम स्कैन की गुणवत्ता पर निर्भर करता है। इस कार्यक्रम में एक खामी है - इसका भुगतान किया जाता है।
ऐसे अन्य सशुल्क और निःशुल्क प्रोग्राम हैं जो आपको टेक्स्ट को पीडीएफ़ से वर्ड में पहचानने और परिवर्तित करने की अनुमति देते हैं: मुफ़्त - क्यूनिफ़ॉर्म, फ्रीमोर ओसीआर, फ्रीओसीआर; सशुल्क - रीडिरिस प्रो, नाइट्रो पीडीएफ प्रोफेशनल।
टेक्स्ट को ऑनलाइन पहचानें
यदि आप हर दिन इलेक्ट्रॉनिक दस्तावेजों को परिवर्तित नहीं करते हैं, तो आपको केवल एक बार पीडीएफ प्रारूप के साथ काम करने की आवश्यकता है, इस मामले में आपके कंप्यूटर पर प्रोग्राम स्थापित करने का कोई मतलब नहीं है। ऐसे एपिसोड के लिए ऑनलाइन सेवाएं हैं। यात्रा के दौरान काम पर उनका उपयोग करना भी सुविधाजनक होता है, जब पास में स्थापित प्रोग्राम वाला कोई कंप्यूटर नहीं होता है। ऑनलाइन सेवाएं आपको टेक्स्ट को निःशुल्क और शीघ्रता से पहचानने देती हैं। यहाँ कुछ हैं:
- ऑनलाइन ओसीआर - www.onlineocr.net
- न्यूओसीआर - www.newocr.com
- फ्री-ओसीआर - www.free-ocr.com
- OCRConvert - www.ocrconvert.com
ऑनलाइन पाठ पहचान में कई सकारात्मक पहलू हैं, लेकिन इसके नुकसान भी हैं: आपको सेवा पर पंजीकरण करने की आवश्यकता है; सभी सेवाओं में निर्यात फ़ंक्शन नहीं होता है, आपको वेब पेज से मान्यता प्राप्त पाठ की प्रतिलिपि बनाने की आवश्यकता होती है; कुछ सेवाओं में संसाधित दस्तावेज़ों की संख्या की सीमा होती है; अंतिम परिणाम की गुणवत्ता इंटरनेट की गति पर निर्भर करती है।
जैसा कि यह निकला, पीडीएफ पाठ को पहचानना मुश्किल नहीं है, विभिन्न कार्यक्रम हैं, आप कोई भी चुन सकते हैं।