Merhabalar, şöyle bir sorunum var: Bazı web siteleri üzerinden bilgi çekerken işin içersine javascript manipülasyonları girdiğinde, örneğin sitedeki tüm <img taglarini yakalayamadığım anlar oluyor. Bu duruma en basit örnek ise jquery eklentisi olan lazy load kullanılması. (img tagina kişinin belirlediği bir attribute üzerinden sayfa scroll edildikçe, src attribute değiştiriyor eklenti özetle bu da sayfanın hızlı yüklenmesini sağlıyor)

Tek site üzerinden veri çekmekten ziyade tüm sitelerden veri çekmek olduğu için problem, bu manipülasyonlardan etkilenmemem gerekiyor. Yardımcı olabilir misiniz?

soruldu: 09 Mar '14, 17:27

blue-code's gravatar image

blue-code
835812
cevap kabul oranı: 0%

değiştirildi: 10 Mar '14, 06:58

CemIkta's gravatar image

CemIkta ♦
19.9k29125190

cevaplar için çok teşekkür ederim. 2 güne kadar başlayacağım yazmaya, buraya tecruberlerimi muhakkak yazacağım.

(10 Mar '14, 05:17) blue-code blue-code's gravatar image

Merhaba.

htmlunit deneyebilirsin veya selenium driver kullanarak da aynı işi yapabilirsin.

permanent link

cevaplandı: 10 Mar '14, 03:17

myururdurmaz's gravatar image

myururdurmaz
2.2k11027
cevap kabul oranı: 23%

Aynı sorunu biz phantomjs ile çözdük. phantom'u service olarak çalıştır ve sayfayı gönder render edip gönderir. Tafsiyem google analytics alexa vs gibi javascript kodlarını render blokla. Çünkü render inanılmaz fazla sürüyor.

permanent link

cevaplandı: 10 Mar '14, 04:10

yaqmoz's gravatar image

yaqmoz
2074512
cevap kabul oranı: 4%

Cevabınız
toggle preview

Bu soruyu takip et

E-Posta üzerinden:

Üyelik girişi yaptıktan sonra abonelik işlemlerini yapabilirsiniz

RSS üzerinden:

Cevaplar

Cevaplar ve Yorumlar

Yazı Formatlama

  • *italic* ya da _italic_
  • **bold** ya da __bold__
  • link:[text](http://url.com/ "başlık")
  • resim?![alt text](/path/img.jpg "başlık")
  • liste: 1. Foo 2. Bar
  • temel HTML etiketleri de kullanılabilir

Bu sorunun etiketleri:

×1,080
×137
×4

Soruldu: 09 Mar '14, 17:27

Görüntüleme: 831 kez

Son güncelleme: 10 Mar '14, 06:58

powered by BitNami OSQA