Yapra: 東京外国語大学の「日本語で読む中東メディア」新着の全文フィードを生成する設定ファイル

Ruby 1.8.7 / Yapra 0.2.0

- module: Feed::Custom
  config: 
    url: http://www.el.tufs.ac.jp/prmeis/html/pc/top.html
    extract_xpath: 
      # capture: "#id('title_top')" # NG
      capture: "#title_top"
      split: ./div
      title: ./a/text()
      link: 
        first_node: ./a
        attr: :href
      description: ./*[1]/..
    apply_template_after_extracted:
      link: "http://www.el.tufs.ac.jp/prmeis/html/pc/<%= item.link %>"
      date: "<%= ymd = item.description.scan( %r{\d{4}/\d{2}/\d{2}} )[0] ; Date.parse ymd %>"

- module: head
  config:
    n: 10 # 新しい方から10件だけ

- module: Filter::EntryFullText
  config: 
    extract_xpath:
      title: '//title/text()'
      description: "//div[@class='article']"

- module: RSS::save
  config:
    filename: out.rss
    title: News from the Middle East 日本語で読む中東メディア 新着ニュース
    link: http://www.el.tufs.ac.jp/prmeis/html/pc/top.html

追記 2011-02-24 23:03

作った後で気付いたんですが、同じことやってる方がいらっしゃいました。