कैसे एक पार्सर बनाने के लिए

विषयसूची:

कैसे एक पार्सर बनाने के लिए
कैसे एक पार्सर बनाने के लिए

वीडियो: कैसे एक पार्सर बनाने के लिए

वीडियो: कैसे एक पार्सर बनाने के लिए
वीडियो: स्क्रैच से एक पार्सर बनाना। व्याख्यान [१/१८]: टोकनिज़र | पार्सर 2024, मई
Anonim

पार्सिंग वेब पेज प्रोग्रामिंग में व्यापक रूप से उपयोग की जाने वाली तकनीकों में से एक है। यह आसानी से और आसानी से आपको कम संख्या में कमांड का उपयोग करके साइट पर आवश्यक सेवा प्राप्त करने की अनुमति देता है, जब आवश्यक स्क्रिप्ट को स्वयं लिखने का कोई तरीका नहीं है।

कैसे एक पार्सर बनाने के लिए
कैसे एक पार्सर बनाने के लिए

निर्देश

चरण 1

पार्स करने का सबसे आसान तरीका PHP फ़ंक्शन file_get_contents () के साथ है। यह आपको फ़ाइल की सामग्री को टेक्स्ट स्ट्रिंग के रूप में प्राप्त करने की अनुमति देता है। फ़ंक्शन "मेमोरी मैपिंग" एल्गोरिथम का उपयोग करता है, जो इसके प्रदर्शन को बेहतर बनाता है।

चरण 2

उदाहरण के लिए, एक स्क्रिप्ट लिखने के लिए जो रूसी संघ के सेंट्रल बैंक की वेबसाइट से डेटा का विश्लेषण करती है, आपको साइट के लिए उपयुक्त प्रारूप में तारीख को पहले से परिभाषित करने के बाद, उपयुक्त फ़ंक्शन का उपयोग करके एक एक्सएमएल पेज की सामग्री प्राप्त करने की आवश्यकता है, और फिर इसे विभाजित करने के लिए नियमित अभिव्यक्तियों का उपयोग करना। चयनित मुद्रा प्रदर्शित करने के लिए, बैंक की वेबसाइट से प्राप्त कोड का उपयोग किया जाता है: $ डेटा = दिनांक ("डी / एम / वाई"); $ प्राप्त = file_get_contents (https://www.cbr.ru/scripts/XML_daily.asp ?date_req=$ डेटा); preg_match ("/(.*?)/ is", $ get, $ string); preg_match ("/(.*?)/ is", $ string [1], $ str);

चरण 3

यदि आप XML फ़ाइल को स्वयं पार्स करना चाहते हैं, तो इसके लिए संबंधित कार्य भी हैं। पार्सर शुरू करने के लिए, आपको xml_parser_create का उपयोग करके इसे इनिशियलाइज़ करना होगा: $ parser = xml_parser_create ();

चरण 4

फिर कार्यों की एक सूची निर्दिष्ट की जाती है जो संबंधित टैग और पाठ जानकारी को संसाधित करेगी। संबंधित XML तत्व प्रारंभ और समाप्ति हैंडलर सेट हैं: xml_set_element_handler ($ पार्सर, "स्टार्ट एलीमेंट", "एंडएलिमेंट");

चरण 5

उपयुक्त लूप के भीतर मानक fopen () और fgets () फ़ंक्शन का उपयोग करके डेटा को पढ़ा जा सकता है। फ़ाइलों की सामग्री xml_parse () में लाइन से लाइन लौटाई जाती है। अंतिम पैरामीटर में अंतिम पंक्ति को पढ़ने का ध्वज होता है: जबकि ($ सामग्री = fgets ($ fparse)) {

अगर (! xml_parse ($ पार्सर, $ सामग्री, feof ($ fparse))) {

गूंज "त्रुटि";

विराम; }}

चरण 6

Xml_parser_free () फ़ंक्शन का उपयोग सिस्टम के कब्जे वाले संसाधनों को मुक्त करने के लिए किया जाता है। XML फ़ाइलों को संसाधित करते समय ये फ़ंक्शन सबसे शक्तिशाली होते हैं।

सिफारिश की: