Playwright के साथ रूबी का उपयोग करना: 2024 के लिए चरण-दर-चरण मार्गदर्शिका

Lucas Mitchell
Automation Engineer
02-Sep-2024
रूबीसँग प्लेराइट प्रयोग गर्दै: २०२४ को लागि चरण-दर-चरण गाइड
वेब स्क्र्यापिङ वेबसाइटहरूबाट डेटा सङ्कलन गर्नुपर्ने विकासकर्ताहरूको लागि एउटा महत्त्वपूर्ण सीप भएको छ। प्लेराइट, एउटा शक्तिशाली ब्राउजर स्वचालन उपकरण, प्रायः यस उद्देश्यको लागि प्रयोग गरिन्छ। यस गाइडमा, हामी वेबसाइटबाट डेटा स्क्र्याप गर्न रूबीसँग प्लेराइट प्रयोग गर्ने तरिका अन्वेषण गर्नेछौँ। हामी उद्धरणहरू स्क्र्याप गर्न वेबसाइट प्रयोग गरेर व्यावहारिक उदाहरणमार्फत हिँड्नेछौँ।
पूर्वावश्यकताहरू
हामी सुरु गर्नु अघि, तपाईँको मेसिनमा निम्न स्थापना भएको सुनिश्चित गर्नुहोस्:
- रूबी (संस्करण २.७ वा पछि)
- नोड.जेएस (प्लेराइटलाई चलाउन नोड.जेएस चाहिन्छ)
- प्लेराइट जेम (प्लेराइटको लागि रूबी व्र्यापर)
तपाईँ निम्न चलाएर आवश्यक निर्भरताहरू स्थापना गर्न सक्नुहुन्छ:
bash
gem install playwright-ruby-client
प्लेराइट सेट अप गर्दै
playwright-ruby-client जेम स्थापना गरेपछि, तपाईँको रूबी स्क्रिप्टमा प्लेराइट सेट अप गर्नुपर्छ। तपाईँ यो कसरी गर्न सक्नुहुन्छ भनेर यहाँ छ:
ruby
require 'playwright'
Playwright.create(playwright_cli_executable_path: '/path/to/node_modules/.bin/playwright') do |playwright|
browser = playwright.chromium.launch(headless: false)
page = browser.new_page
page.goto('http://quotes.toscrape.com/')
# उदाहरण स्क्र्यापिङ कोड यहाँ जानेछ
browser.close
end
तपाईँको प्रणालीमा प्लेराइट सीएलआईको वास्तविक बाटोसँग '/path/to/node_modules/.bin/playwright' प्रतिस्थापन गर्नुहोस्।
वेबसाइटबाट उद्धरणहरू स्क्र्यापिङ गर्दै
अब, वेबसाइटबाट उद्धरणहरू स्क्र्याप गर्न कोड लेखौँ। हामी प्रत्येक उद्धरणको पाठ र सम्बन्धित लेखक निकाल्नेछौँ।
ruby
require 'playwright'
Playwright.create(playwright_cli_executable_path: '/path/to/node_modules/.bin/playwright') do |playwright|
browser = playwright.chromium.launch(headless: false)
page = browser.new_page
page.goto('http://quotes.toscrape.com/')
quotes = page.query_selector_all('.quote')
quotes.each do |quote|
ruby
quote_text = quote.query_selector('.text').text_content.strip
author = quote.query_selector('.author').text_content.strip
puts "#{quote_text} - #{author}"
end
browser.close
end
यह गाइड आपको दिखाता है कि कैसे Playwright को Ruby के साथ सेट करें और किसी वेबसाइट से डेटा स्क्रैप करें। यहाँ इस्तेमाल किया गया उदाहरण सरल है लेकिन इसे और अधिक जटिल कार्यों के लिए विस्तारित किया जा सकता है। ब्राउज़र कार्यों को स्वचालित करने की Playwright की क्षमता इसे वेब स्क्रैपिंग और परीक्षण के लिए एक शक्तिशाली उपकरण बनाती है।
खुश स्क्रैपिंग!
अनुपालन अस्वीकरण: इस ब्लॉग पर प्रदान की गई जानकारी केवल सूचनात्मक उद्देश्यों के लिए है। CapSolver सभी लागू कानूनों और विनियमों का पालन करने के लिए प्रतिबद्ध है। CapSolver नेटवर्क का उपयोग अवैध, धोखाधड़ी या दुरुपयोग करने वाली गतिविधियों के लिए करना सख्त वर्जित है और इसकी जांच की जाएगी। हमारे कैप्चा समाधान उपयोगकर्ता अनुभव को बेहतर बनाने के साथ-साथ सार्वजनिक डेटा क्रॉलिंग के दौरान कैप्चा कठिनाइयों को हल करने में 100% अनुपालन सुनिश्चित करते हैं। हम अपनी सेवाओं के जिम्मेदार उपयोग की प्रोत्साहना करते हैं। अधिक जानकारी के लिए, कृपया हमारी सेवा की शर्तें और गोपनीयता नीति पर जाएं।
अधिक
No data

