はてなブックマークでは独自タグが多くて、 <dc:XXXXX>
となっている部分がfeedparserではてなブックマークのRSSをパースした場合のキーがわからなかったので調べた。
サンプルコード
import feedparser import pprint urls = [ "http://b.hatena.ne.jp/entrylist/it.rss" ] posts = [] for url in urls: posts.extend(feedparser.parse(url).entries) # pprint.pprint(posts[0].keys()) print(posts[0].keys())
実行結果
dict_keys(['id', 'title', 'title_detail', 'links', 'link', 'summary', 'summary_detail', 'updated', 'updated_parsed', 'tags', 'rdf_li', 'rdf_bag', 'taxo_topics', 'content', 'hatena_bookmarkcommentlistpageurl', 'hatena_bookmarkcount', 'hatena_bookmarksiteentrieslisturl', 'hatena_imageurl'])
ちなみにQiitaはこちら。
dict_keys(['id', 'guidislink', 'link', 'published', 'published_parsed', 'updated', 'updated_parsed', 'links', 'href', 'title', 'title_detail', 'content', 'summary', 'authors', 'author_detail', 'author'])
結構違うなー。published
がないのか。