İçeriğe geç

Python ile Web Scraping: BeautifulSoup ve Requests Rehberi

25.06.2024 5 okunma

Web Scraping Nedir?

Web Scraping, web sitelerindeki verileri otomatik olarak toplama ve yapılandırma sürecidir. E-ticaret fiyat analizi, haber takibi, iş ilanı toplama gibi onlarca kullanım alanı vardır.

Gerekli Kütüphaneler

pip install requests beautifulsoup4

Temel Kullanım

import requests\nfrom bs4 import BeautifulSoup\n\nurl = "https://example.com"\nresponse = requests.get(url)\nsoup = BeautifulSoup(response.text, "html.parser")\n\n# Tüm başlıkları çek\nbasliklar = soup.find_all("h2")\nfor b in basliklar:\n    print(b.text)

CSS Seçicileri ile Veri Seçme

# ID ile seçim\nsoup.find(id="urun-fiyat")\n\n# Class ile seçim\nsoup.find_all(class_="fiyat-kutusu")\n\n# CSS selector\nsoup.select(".urun-listesi .fiyat")

Etik Web Scraping Kuralları

  • robots.txt dosyasını kontrol edin
  • Sunucuyu aşırı yüklemekten kaçınmak için istekler arasında bekleme ekleyin
  • Kişisel verileri scraping'den kaçının
  • Sitenin kullanım şartlarını okuyun

Selenium ile Dinamik İçerik

JavaScript ile yüklenen içerikleri Requests+BeautifulSoup okuyamaz. Bunun için Selenium kullanmanız gerekir. Selenium gerçek bir tarayıcıyı kontrol ederek dinamik sayfaları işler.

python web scraping beautifulsoup python python requests veri toplama python python kursu pendik
İLERİ DÜZEY PYTHON PROGRAMLAMA hakkında bilgi almak ister misiniz?

Birebir özel yüz yüze eğitim yada uzaktan eğitim, esnek ders saatleri ile Pendik Kurtköy'de.