Merhaba Haberleri çekeceğim site hürriyet diyelim.Hürriyetin anasayfa rss adresi bu: http://rss.hurriyet.com.tr/rss.aspx?sectionId=1

Rss feeddeki kodları görmek için sayfa kaynağını görüntülüyorum ve html kodları çıkıyor xml kodları çıkmıyor. Projemde sax parser kullanarak buradaki veriyi filtrelemeye çalışıyorum fakat bir yere kadar yapabiliyorum.Linki başlığı ve yayınlanma tarihini elde edebiliyorum fakat resimleri ve haber açıklamasını çekemiyorum.Örneğin resim için:

<enclosure url="http://img.hurriyet.com.tr/_np/1642/25241642.jpg" type="image/jpeg" length="50000"/> <media:thumbnail url="http://img.hurriyet.com.tr/_np/1642/25241642.jpg"/> <media:content url="http://img.hurriyet.com.tr/_np/1642/25241642.jpg" type="image/jpeg" lang=""/>

kod bloğu kullanılmış.Burda parsing olayını nasıl yapabilirim?

soruldu: 16 Tem '14, 20:10

juanov's gravatar image

juanov
455465555
cevap kabul oranı: 33%

genel olarak xml parsing ile ilgili tecrübelerimedn söyleyim, gösterdiğin xml datasındaki değerler "attribute", value değl. node'ların attributeları üzerinden bu değerleri alabilirsin..

(17 Tem '14, 01:56) dreampowder dreampowder's gravatar image

bahsettiğim linkte sadece ilk 5-6 satırda xml var geri kalanı hep html. Xmli bir görebilsem belki dediğiniz gibi yapacağım fakat xml parsing diye soruyorum ama html parçalıyorum şuanda.Rss feederlar normal şartlarda xml şeklinde yayın yapmazlar mı?Bu hürriyetle ilgili bir sorun mudur?

(17 Tem '14, 07:07) juanov juanov's gravatar image

@juanov dediğiniz linki incelediğimde gayette xml erisi olarak görüyorum :)

verdiğiniz linkteki içeriği şu siteye yapıştırarak aypısını görebilirsiniz: http://xmlprettyprint.com/

(18 Tem '14, 09:34) dreampowder dreampowder's gravatar image

Cevap olarak yazmak daha kolay oalcak sanırım:

Verdiğiniz linki xml pretty print sitesine yapıştırdığımda gördüğüm yapı aşağıdaki gibi:

    <?xml version="1.0" encoding="utf-8"?>
<rss xmlns:itunes="http://www.itunes.com/dtds/podcast-1.0.dtd" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:taxo="http://purl.org/rss/1.0/modules/taxonomy/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:media="http://search.yahoo.com/mrss/" xmlns:feedburner="http://rssnamespace.org/feedburner/ext/1.0" version="2.0">
<channel>
    <atom10:link xmlns:atom10="http://www.w3.org/2005/Atom" href="http://rss.hurriyet.com.tr/rss.aspx?sectionId=1" rel="self" type="application/rss+xml"/>
    <title>Hürriyet ANASAYFA</title>
    <link>http://www.hurriyet.com.tr/anasayfa/</link>
    <description>TÜRKİYE'NİN AÇILIŞ SAYFASI</description>
    <image>
        <title>Hürriyet ANASAYFA</title>
        <width>60</width>
        <height>60</height>
        <link>http://www.hurriyet.com.tr/anasayfa/</link>
        <url>http://rss.hurriyet.com.tr/msn/images/hurriyetcomtrlogo.jpg</url>
    </image>
    <item>
        <title>Filistin lideri Mahmud Abbas İstanbul'da</title>
        <link>http://www.hurriyet.com.tr/dunya/26839440.asp</link>
        <pubDate>Fri, 18 Jul 2014 13:31:18 GMT</pubDate>
        <guid isPermaLink="false">http://www.hurriyet.com.tr/dunya/26839440.asp</guid>
        <enclosure url="http://img.hurriyet.com.tr/_np/0730/25260730.jpg" type="image/jpeg" length="50000"/>
        <media:thumbnail url="http://img.hurriyet.com.tr/_np/0730/25260730.jpg"/>
        <media:content url="http://img.hurriyet.com.tr/_np/0730/25260730.jpg" type="image/jpeg" lang=""/>
        <description>&lt;a href="http://www.hurriyet.com.tr/dunya/26839440.asp"&gt;&lt;img src="http://img.hurriyet.com.tr/_np/0730/25260730.jpg" alt="Filistin lideri Mahmud Abbas İstanbul'da" align="left" style="padding-right:5px;" border="0" width="80" height="80" /&gt;&lt;/a&gt;Filistin Devlet Başkanı Mahmud Abbas, İsrail'in Gazze'ye yönelik kara operasyonu sürerken İstanbul'a geldi.</description>
    </item>
... diye devam ediyor.

Gördüğümüz kadarıyla title, link, description ve image değelerinden sonra asıl incelenecek kızım "item" nesnesi içerisindeki yapı.

HTML kodu gördüğünüz kısmı description içerisindeki içerik olarak gözüküyor. Benim de benzer şekilde çalışan bir ios uygulamam var, description içeriğini sizin hiç uğraşmadan bir webview içerisine koymanız yapılacak en mantıklı çözüm olarak gözüküyor, html'i parse etmenize gerek yok.

Ayrıca benim terchim bu tarz küçük çaplı xml verilerinde dom parser kullanmak olurdu. bu sayede bütün xml nesnesini ayıklayıp parçaladıktan sonra daha klay bir şekilde işleme sokabilirsin..

permanent link

cevaplandı: 18 Tem '14, 09:40

dreampowder's gravatar image

dreampowder
3.3k112849
cevap kabul oranı: 23%

teşekkürler.tam aradığım cevap olmuş.bu pretty xml i de bilmiyordum iyi oldu.

(19 Tem '14, 18:47) juanov juanov's gravatar image

ek bilgi geceyim: aktif olarak kullandıgım bir rss uygulaması vardı hurriyeti kaynak olarak kullanan, bir sure once marketten kaldırıldı. sordum gelistiriciye; uygulamanın download sayısı artınca hurriyet gormus ve uygulamayı kaldırmasını istemis o yuzden o da istenileni yapmıs mecbur

(20 Tem '14, 19:08) gturedi gturedi's gravatar image
Cevabınız
toggle preview

Bu soruyu takip et

E-Posta üzerinden:

Üyelik girişi yaptıktan sonra abonelik işlemlerini yapabilirsiniz

RSS üzerinden:

Cevaplar

Cevaplar ve Yorumlar

Yazı Formatlama

  • *italic* ya da _italic_
  • **bold** ya da __bold__
  • link:[text](http://url.com/ "başlık")
  • resim?![alt text](/path/img.jpg "başlık")
  • liste: 1. Foo 2. Bar
  • temel HTML etiketleri de kullanılabilir

Bu sorunun etiketleri:

×1
×1
×1
×1

Soruldu: 16 Tem '14, 20:10

Görüntüleme: 785 kez

Son güncelleme: 20 Tem '14, 19:08

Benzer sorular

powered by BitNami OSQA