Categories
Data

#27 Web Scraping ดึง 20 ข่าวล่าสุดจากเว็บข่าวด้วย Selenium

ปกติการดึงข่าวล่าสุด อันนี้เราใช้ RSS (Really Simple Syndication) หรือ Feedly ได้เลย อย่างไรก็ดี ไม่ใช่ทุกเว็บไซต์ที่จะรองรับวิธีนี้ได้ อาจจะเป็นเพราะทางนั้นไม่ได้ให้ลิ้งค์สำหรับ RSS ไว้ครับ

เมื่อเจอปัญหานี้แล้ว ในบทความนี้เราแนะนำวิธีหนึ่งที่คนใช้กัน วิธีนี้เรียกว่า Web Scraping

Categories
Computer

นำโพสโซเชียลมาอ่านบน RSS Reader โดย rss.app

ปกติเวลาที่ใช้งานเว็บโซเชียลอย่างเฟสบุ๊ค ทวิตเตอร์ ไอจี ยูทูป หรืออื่น ๆ เราจะมาแฟนเพจ หรือบุคคลที่ติดตามในนั้นที่เราจะอ่านคอนเท้นต์อยู่ตลอด แต่ทีนี้ถ้าเราไม่มีสมาชิกใช้งานก็จะไม่สามารถติดตามคอนเท้นต์เหล่านั้นได้ อย่างไรก็ดีมีสิ่งหนึ่งที่เราไม่จำเป็นต้องสมัครสมาชิก เพียงแค่มีโปรแกรมสำหรับอ่านบทความเหล่านั้นได้คือ RSS (Really Simple Syndication)

RSS (Really Simple Syndication) คือเว็บฟีตชนิดหนึ่งที่จะแปลงให้อยู่ในรูปฟอร์แมตทีคอมพิวเตอร์เข้าใจอย่าง XML ใช้สำหรับการกระจายข้อมูลที่มีการอัพเดทบ่อยอย่างเช่นเว็บไซต์ และบล็อก เครื่องมือนี้ทำให้เราแบ่งปันเนื้อหาจากเว็บหนึ่งไปติดในหน้าเว็บของเรา หรือดึงบทความที่ปรากฏบนเว็บไซต์เข้าไปในโปรแกรมที่เราใช้งานอยู่ในขณะนี้ได้สะดวก โดยโปรแกรมเหล่านี้เรียกว่า RSS Reader