/var/www/yatta47.log

/var/www/yatta47.log

やったのログ置場です。スクラップみたいな短編が多いかと。

はてなブックマークのRSSの構造

f:id:yatta47:20210503114029p:plain

はてなブックマークでは独自タグが多くて、 <dc:XXXXX> となっている部分がfeedparserではてなブックマークRSSをパースした場合のキーがわからなかったので調べた。

サンプルコード

import feedparser
import pprint

urls = [
    "http://b.hatena.ne.jp/entrylist/it.rss"
]

posts = []
for url in urls:
    posts.extend(feedparser.parse(url).entries)

# pprint.pprint(posts[0].keys())
print(posts[0].keys())

 

実行結果

dict_keys(['id', 'title', 'title_detail', 'links', 'link', 'summary', 'summary_detail', 'updated', 'updated_parsed', 'tags', 'rdf_li', 'rdf_bag', 'taxo_topics', 'content', 'hatena_bookmarkcommentlistpageurl', 'hatena_bookmarkcount', 'hatena_bookmarksiteentrieslisturl', 'hatena_imageurl'])

ちなみにQiitaはこちら。

dict_keys(['id', 'guidislink', 'link', 'published', 'published_parsed', 'updated', 'updated_parsed', 'links', 'href', 'title', 'title_detail', 'content', 'summary', 'authors', 'author_detail', 'author'])

結構違うなー。publishedがないのか。