Skip to content

adhimrahman/Tokopedia-Scraper

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 
 
 

Repository files navigation

🛍️ Tokopedia Product Scraper

📌 Deskripsi

Script ini merupakan alat scraping otomatis berbasis Python yang digunakan untuk mengambil seluruh data produk dari sebuah toko di Tokopedia.
Data yang diambil meliputi:

  • Nama produk
  • Harga produk
  • Link gambar produk
  • Deskripsi produk
  • Link halaman produk Semua data disimpan ke dalam file CSV (prods.csv).

🚀 Fitur

  • Scraping seluruh halaman toko (pagination otomatis)
  • Scroll otomatis hingga semua produk termuat (lazy load)
  • Ambil data dari setiap produk, termasuk deskripsi lengkap
  • Klik tombol “Lihat Selengkapnya” jika deskripsi tersembunyi
  • Menyimpan hasil dalam format CSV

🛠️ Prerequisite

  • Python 3.x
  • Google Chrome
  • ChromeDriver (harus cocok dengan versi Google Chrome)

📦 Library

pip install selenium beautifulsoup4
pip install pandas openpyxl

⚙️ Cara Kerja

  1. Mulai dari halaman 1 → 2 → 3 dan seterusnya menggunakan pagination.
  2. Scroll ke bawah secara bertahap untuk memuat semua produk (lazy loading).
  3. Mengambil informasi seperti nama produk, harga, gambar, dan link menuju halaman detail.
  4. Setiap produk dibuka di tab baru untuk mengambil deskripsi lengkap.
  5. Jika deskripsi disembunyikan, tombol akan diklik terlebih dahulu untuk menampilkan isi penuh.
  6. Deskripsi produk diambil dan proses dilanjutkan kembali ke halaman utama toko.
  7. Semua informasi produk dikumpulkan dan disimpan ke dalam list di Python.
  8. Proses dilanjutkan untuk produk lainnya di halaman yang sama.
  9. Setelah semua produk di satu halaman selesai, lanjut ke halaman berikutnya.
  10. Semua data produk dari seluruh halaman disimpan ke file prods.csv.

⏱️ Estimasi Waktu

  • ~10 detik per produk
  • 80 produk per halaman
  • 31 halaman toko
  • Total: 2.480 produk
  • Estimasi total waktu scraping: ±7–8 jam

About

No muerdas más de lo que puedes masticar

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages