文書生活 : TEXT LIFE

文書のある生活

気分は低空飛行

情けない話だが、先日の仕事場での理不尽な扱いが未だ尾を引いて、気分はふさぎっぱなし。仕事やる気ゼロ。こういうときは無駄なことに持てる最大限のエナジィを投入するに限る。

ということで、RSSを引っ張ってきて、そこから記事のLINKを辿り記事のHTMLを取得し、そこから記事本文PARSEして分かち書きして単語抽出、予め登録されているキーワードと合致したら、その記事をDB登録して翌日に「昨日の注目ニュース」として自動配信するアプリを設計してみた。PEARXML_RSS、HTTP_Request等組み合わせると、技術的な課題はほぼ解消。残課題はRSS配信先毎に記事本文をPARSEするのが個別実装となっている点。これは厳しいよ。RSSでdescription tagが付いていれば記事本文は不要なのだが、description tagは少ないんだよね。ゴタゴタ言ってないでゴリゴリ個別実装すれば済む話なのだが。あとは実装のみ。