🚀 מחזירים לחיים את ה-Web Scraper האהוב: שדרוג לכלי הגירוד שכולנו צריכים מכירים את זה שמצאתם תוסף מושלם שחוסך לכם שעות של עבודה ידנית, ואז ביום בהיר אחד הוא פשוט... מפסיק לעבוד?
זה בדיוק מה שקרה עם אחד מכלי ה-Scraping הפופולריים לכרום. במקום לחפש אלטרנטיבות מורכבות, החלטתי לנצל את הזמן הפנוי שלי בחודשים האחרונים כדי "להחיות" אותו, לתקן את הבאגים ולהפוך אותו שוב לכלי עבודה עוצמתי.
אז מה זה בעצם Scraper ולמה זה טוב? 🛠️ הכלי מאפשר לבצע Data Crawling ואיסוף מידע מכל אתר בצורה ויזואלית ומהירה, בלי לכתוב שורת קוד אחת (כמעט).
הנה מה שאפשר לעשות איתו:
אוטומציה של איסוף נתונים: שליפת טבלאות, רשימות מוצרים או נתוני שוק ישירות לקובץ Excel או Google Sheets.
דיוק בעזרת XPath: התוסף מתבסס על שיטת ה-XPath (נתיבי XML) כדי לזהות אלמנטים ספציפיים בדף בצורה מדויקת, גם באתרים מורכבים.
יצירת "Recipes": הגדרת חוקים קבועים לגירוד נתונים מאתרים שאתם מבקרים בהם בתדירות גבוהה.
מה עשיתי שם? 💻 הפרויקט המקורי הפסיק לקבל תחזוקה, מה שיצר בעיות תאימות עם הגרסאות החדשות של דפדפן כרום. נכנסתי מתחת למכסה המנוע, תיקנתי את הליבה (Core) של התוסף ודאגתי שהוא יחזור לעבוד בצורה חלקה ומהירה.
מוזמנים לבדוק את הקוד, להוריד ולהשתמש ב-Repo שלי ב-GitHub: 👉 [כאן הלינק לפרויקט: https://github.com/Meir-Tools/Scraper]
יש לכם שאלות על XPath? צריכים עזרה עם סקריפטים של Scraping? דברו איתי בתגובות! 👇
#WebScraping #OpenSource #GitHub #DataAnalysis #XPath #Automation #WebDevelopment #Programming