The Perl Toolchain Summit needs more sponsors. If your company depends on Perl, please support this very important event.

NAME

WWW::Mixi::Cookbook - WWW::Mixiのクックブック

DESCRIPTION

このドキュメントにはWWW::Mixiの典型的な使い方を示すいくつかのサンプルが入っています。

mixiからのデータ取得

WWW::Mixiモジュールには、ログイン用のloginメソッドと、それから1メソッドで直接コメントなどを取得できるデータ取得メソッドがあります。 これらを使うと、mixiへのアクセスは非常に簡単です。

ログイン

mixiへのログインは、loginコマンド一つで完了します。 ログイン後には、LWP::UserAgentスタイルでのRequestメソッドやget、postメソッドでのmixiアクセスも、mixiからのデータ取得メソッドでのデータ取得も可能になります。

 use WWW::Mixi;
 use HTTP::Request::Common;
 
 my $mixi = WWW::Mixi->new('me@mixi.user', 'mixi_password');
 
 print "ログインします。\n";
 my $response = $mixi->login;

マイミクシイ最新日記の取得

mixiからの情報取得も、私がデータ取得メソッドと読んでいるいくつかの便利なメソッドで簡単に済ませることができます。 すべてのデータ取得に対応しているわけではありませんが、それを使うのが一番簡単な方法です。

まず、マイミクシイ最新日記用のデータ取得メソッド"get_new_friend_diary"を紹介しましょう。 このメソッドは、次のような配列のリファレンスを返します。

 {
        'subject' => 'mixiの本。',
        'link' => 'http://mixi.jp/list_item_review.pl?reviewer_id=xxxx&item_id=xxxxx',
        'name' => '塚本牧生',
        'time' => '2004/08/18 13:18'
 }

例として、マイミクシイ最新日記をテキストで出力するスクリプトを挙げましょう。

 use WWW::Mixi;
 
 my $mixi = WWW::Mixi->new('me@mixi.user', 'mixi_password');
 
 print "ログインします。\n";
 my $response = $mixi->login;
 
 print "マイミクシイ最新日記を取得します。\n";
 my =item get_new_friend_diary;
 print "マイミクシイ最新日記を出力します。\n";
 foreach my $item (@items) {
        my $subject = $item->{'subject'};
        my $link = $item->{'link'};
        my $name = $item->{'name'};
        my $time = $item->{'time'};
        print "■ $subject\n[日時] $time\n[名前] $name\n[Link] $link\n\n";
 }

ちょっと気を付けておきたいのは、mixiの文字コードがEUCだということです。 Windowsのコマンドラインなどで使う時には、文字コードをSJISにしてやる必要があるでしょうから、その時はJcodeモジュールなども組合わせてみてください。

その他のデータ取得メソッド

マイミクシイ最新日記用のget_new_friend_diaryの他にも、いくつかのデータ取得メソッドがあります。 以下は0.21版で利用できるデータ取得メソッドの一部ですが、基本的には後述の「parse_~」というメソッドには、対応する「get_~」メソッドがあると思ってまず間違いはありません。 正確で完全な一覧は、ドキュメントを確認してください。

多くのデータ取得メソッドは、get_new_friend_diaryと同じように引数なしで実行でき、それぞれ決まった形式の(でもget_new_friend_diaryと似た感じの)ハッシュリファレンスを複数返します。

get_information

ホームに表示される「管理者からのお知らせ」を取得します。

get_list_comment

最近のコメントに表示される「最近のコメント一覧」を取得します。

get_list_message

メッセージに表示される「受信箱」を取得します。

get_new_bbs

コミュニティ最新書き込みを取得します。

get_new_comment

日記コメント記入履歴を取得します。

get_new_friend_diary

マイミクシイ最新日記を取得します。

get_new_review

マイミクシイ最新レビューを取得します。

get_show_log

あしあとを取得します。

例外として、メインメニュー項目を取得するget_main_menu、バナーを取得するget_banner、ツールバー項目を取得するget_tool_barの3つは、引数でURLを指定できます。 これらはどのページにでもあるからです。 URLは"home.pl"のように、ページ名の部分だけでも構いません。

 my =item get_main_menu("home.pl");

URLを省略した時には、最後にデータ取得メソッドか、getまたはpostメソッドで取得したページになります。

get_main_menu

ページ先頭部のメインメニューを取得します。

get_banner

バナーを取得します。

get_tool_bar

メインメニューの下に標示されるツールバーを取得します。

また、別の例外としてget_show_log_countはあしあと数を返します。 同様に、get_self_idは自分のIDを返します。 これらの返り値は配列でも、ハッシュリファレンスでもなく、単なるスカラです。

 my $count = $mixi->get_show_log_count;
 my $id = $mixi->get_self_id;
get_show_log_count

あしあとを取得します。

get_self_id

自分のIDを取得します。

LWP::UserAgentスタイルでのアクセス

ログインとデータ取得メソッドを使ったコーディングは簡単ですが、取得できるデータは限られますし、エラーハンドリングの弱さが泣き所です。 もう少し細かい制御と自由な利用を考えるのであれば、これをLWP::UserAgentだと思って使ってみてください。

実際に、WWW::MixiのスーパークラスはLWP::RobotUAで、さらにそのスーパークラスはLWP::UserAgentです。 多くのメソッドがLWP::UserAgentから継承されており、それほど違いを感じることはないでしょう。

ログイン

LWP::UserAgentスタイルでコーディングするにしても、ログインはloginメソッドを使ってしまって良いでしょう。

LWP::UserAgentを使う時のログイン作業は、POSTのHTTP::Requestオブジェクトを生成し、Cookieを有効にし、ログインページにアクセスするといった手順になります。 ログインメソッドは、内部的には単にこれを順番に行います。 その後はCookieでセッションIDが自動的に送受信されますので、LWP::UserAgentでするようにrequestやsimple_requestメソッドで各ページにアクセスできます。

例えば、ログイン後にホームのHTML部分を出力するには以下のようにします。

 use WWW::Mixi;
 use HTTP::Request::Common;
 
 my $mixi = WWW::Mixi->new('me@mixi.user', 'mixi_password');
 
 print "ログインします。\n";
 my $response = $mixi->login;
 
 print "ホームを取得します。\n";
 $request = &HTTP::Request::Common::GET('http://mixi.jp/home.pl');
 $response = $mixi->request($request);
 print $response->content;

getメソッド

LWP::UserAgentモジュールでの標準的なページ取得は(1)HTTP::Requestオブジェクトの生成、(2)requestメソッドでリクエストの処理の手順になります。 WWW::Mixiモジュールでは、この他にgetとpostという簡易的なメソッドを用意しており、これを使うこともできます。

例えば、上では次の様にしてホームを取得しました。

 use WWW::Mixi;
 use HTTP::Request::Common;
 
 (略)
 
 print "ホームを取得します。\n";
 $request = &HTTP::Request::Common::GET('http://mixi.jp/home.pl');
 $response = $mixi->request($request);
 print $response->content;

getを使うと、HTTP::Request::Commonモジュールなどを使ったリクエストの生成をせずに、直接URLを指定すれば済みます。 また、URLも'http://'から始まる絶対URLではなく、最後のファイル名(またはそこから拡張子の'.pl'を省いたもの)を指定すれば十分です。 つまり、下のように書けば同じ事ができます。

 use WWW::Mixi;
 
 (略)
 
 print "ホームを取得します。\n";
 $response = $mixi->get('home.pl');
 print $response->content;

postメソッド

簡単にGETでページを取得するためのメソッドとして、WWW::Mixiにはgetというメソッドが用意されていました。

同様にPOSTでフォームの入力値を送信するには、postという簡易的なメソッドを使うことができます。 postでは、URLの他にフォームデータを引数で渡します。 例えば、次のようにすれば日記の投稿ができます。

 use WWW::Mixi;
 
 my %diary = (
        'submit'      => 'confirm',                  # プレビュー:main、作成:confirm、修正:cancel
        'diary_title' => 'WWW::Mixiで日記の投稿',
        'diary_body'  => "WWW::Mixiモジュールで日記を投稿してみます。\nPOSTメソッドの試験です。",
        'photo1'      => '',
        'photo2'      => '',
        'photo3'      => '',
 );
 
 my $mixi = WWW::Mixi->new('me@mixi.user', 'mixi_password');
 
 print "ログインします。\n";
 my ($result, $response) = $mixi->login;
 
 print "日記を投稿します。\n";
 $response = $mixi->post('add_diary.pl', %diary);

フォームの値は、送信前に自動的にエンコードされます。 意識的にエンコードやエスケープをする必要はありません。

ファイルの送信

postメソッドでは写真など、ファイルを送信することも考慮されています(が、まったく試験されていません。ぜひ試験して、結果を教えてください)。

例えば、日記のプレビューを表示するためのアクションでは、日記に貼付する写真を「photo1」「photo2」「photo3」の3つのフィールドに入れてやることができます。 フィールド値にファイルを指定したい時は、ファイルパスだけを持つ配列リファレンスを指定します。

 use WWW::Mixi;
 
 my %diary = (
        'submit'      => 'main',                  # プレビュー:main、作成:confirm、修正:cancel
        'diary_title' => 'WWW::Mixiで日記の投稿',
        'diary_body'  => "WWW::Mixiモジュールで日記を投稿してみます。\nPOSTメソッドの試験です。",
        'photo1'      => ['c:\My Documents\photos\walrus.png'],
        'photo2'      => '',
        'photo3'      => '',
 );
 
 my $mixi = WWW::Mixi->new('me@mixi.user', 'mixi_password');
 
 print "ログインします。\n";
 my ($result, $response) = $mixi->login;
 
 print "日記を投稿します。\n";
 $response = $mixi->post('add_diary.pl', %diary);

メインメニューの解析メソッド

コンテンツの取得が済めば、次は必要なデータを取り出すための解析をするでしょう。 WWW::Mixiモジュールには、いくつかのページ用の解析メソッドがあります。

解析系で一番簡単な(そして最初に作られた)解析メソッドがメインメニュー(ページ先頭のmixiのログと一緒に「ホーム」「検索」等のボタンが埋め込まれたメニューです)を解析するparse_main_menuメソッドです。 このメソッドは、次のような配列のリファレンスを返します。

 {
        'subject' => 'ホーム',
        'link' => 'http://mixi.jp/home.pl'
 }

例として、ホームを取得してメインメニューの各項目を出力するスクリプトを挙げましょう。 ただしホームの取得までの部分は、「ページの取得」の項で出てきたものと同じなのでざっくり済ませています。

 use WWW::Mixi;
 
 my $mixi = WWW::Mixi->new('me@mixi.user', 'mixi_password');
 print "ログインします。\n";
 my $response = $mixi->login;
 print "ホームを取得します。\n";
 $response = $mixi->get('home.pl');
 
 print "メインメニューを出力します。\n";
 my =item parse_main_menu($response);
 foreach my $item (@items) {
        my $subject = $item->{'subject'};
        my $link = $item->{'link'};
        print "$subject -> $link\n";
 }

なお、$responseを指定しなかった時は、最後にgetまたはpostメソッドで取得したデータを解析します(requestやsimple_requestは対象外です)。 上の例では、解析しているのは最後にgetで取得したデータなので、下のように$responseの指定は省いても構いません。

 my =item parse_main_menu();

その他の解析メソッド

メインメニュー用のparse_main_methodの他にも、いくつかの解析メソッドが設けられています。

解析メソッドはいずれも$responseを引数に取り、ほとんどはハッシュリファレンスの配列を返します。 $responseを指定しなかった時の解析対象は、最後にgetまたはpostメソッドで取得したデータです。 ハッシュリファレンスの持つキー項目は、メソッドごとに違います。

以下は0.21版で利用できる解析用メソッドの一覧です。 最新版ではメソッドが追加されていたり変更されていたりするかも知れませんので、詳細はドキュメントを確認してください。

parse_main_menu

ページ先頭部のメインメニューを解析します。

parse_banner

メインメニューに埋め込まれているバナーを解析します。

parse_tool_bar

メインメニューの下に標示されるツールバーを解析します。

parse_information

ホーム(home.pl)に表示される「管理者からのお知らせ」を解析します。

parse_community_id

コミュニティトップ(view_community.pl)、トピック一覧(list_bbs.pl)、トピック(view_bbs.plのメイン部)などを解析します。

parse_list_bbs

トピック一覧(list_bbs.plのメイン部)を解析します。

parse_list_bbs_next

トピック一覧(list_bbs.plのメイン部)の「次のページ」へのリンクを解析します。

parse_list_bbs_previous

トピック一覧(list_bbs.plのメイン部)の「前のページ」へのリンクを解析します。

parse_list_bookmark

お気に入り(list_bookmark.pl)を解析します。

parse_calendar

カレンダー(calendar.pl)上のイベント(参加イベント、不参加イベント、マイミクシィの誕生日)を解析します。

parse_calendar_term

カレンダー(calendar.pl)が表示している期間(年月)を解析します。

parse_calendar_next

カレンダー(calendar.pl)の「次の月」へのリンクを解析します。

parse_calendar_previous

カレンダー(calendar.pl)の「前の月」へのリンクを解析します。

parse_list_comment

最近のコメント(list_comment.pl)に表示される「最近のコメント一覧」を解析します。

parse_list_community

コミュニティ一覧(list_community.pl)に表示されるコミュニティを解析します。

parse_list_community_next

コミュニティ一覧(list_community.pl)の「次のページ」へのリンクを解析します。

parse_list_community_previous

コミュニティ一覧(list_community.pl)の「前のページ」へのリンクを解析します。

parse_list_diary

日記(list_diary.pl)の日記項目を解析します。

parse_list_diary_next

日記(list_diary.pl)の「次のxx件」へのリンクを解析します。

parse_list_diary_previous

日記(list_diary.pl)の「前のxx件」へのリンクを解析します。

parse_list_friend

友人・知人一覧(list_friend.pl)の友人・知人を解析します。

parse_list_friend_next

友人・知人一覧(list_friend.pl)の「次のページ」へのリンクを解析します。

parse_list_friend_previous

友人・知人一覧(list_friend.pl)の「前のページ」へのリンクを解析します。

parse_list_member

メンバー一覧(list_member.plのメイン部)を解析します。

parse_list_member_next

メンバー一覧(list_member.plのメイン部))の「次を表示」へのリンクを解析します。

parse_list_member_previous

メンバー一覧(list_member.plのメイン部))の「前を表示」へのリンクを解析します。

parse_list_message

メッセージ(list_message.pl)に表示される「受信箱」を解析します。

parse_list_request

承認待ち一覧(list_request.plのメイン部)を解析します。

parse_new_bbs

コミュニティ最新書き込み(new_bbs.pl)を解析します。

parse_new_bbs_next

コミュニティ最新書き込み(new_bbs.pl)の「次を表示」へのリンクを解析します。

parse_new_bbs_previous

コミュニティ最新書き込み(new_bbs.pl)の「前を表示」へのリンクを解析します。

parse_new_comment

日記コメント記入履歴(new_comment.pl)を解析します。

parse_new_friend_diary

マイミクシイ最新日記(new_friend_diary.pl)を解析します。

parse_new_friend_diary_next

マイミクシィ最新日記(new_friend_diary.pl)の「次のページ」へのリンクを解析します。

parse_new_friend_diary_previous

マイミクシィ最新日記(new_friend_diary.pl)の「前のページ」へのリンクを解析します。

parse_new_review

マイミクシイ最新レビュー(new_review.pl)を解析します。

parse_release_info

リリース情報・障害情報(release_info.pl)を解析します。

parse_show_log

あしあと(show_log.pl)を解析します。

parse_show_log_count

あしあと(show_log.pl)の「ページ全体のアクセス数」を解析します。 このメソッドの返り値はアクセス数で、ハッシュリファレンスの配列ではありません。

parse_view_bbs

トピック(view_bbs.plのメイン部)を解析します。

parse_add_diary_preview

日記作成のプレビュー(add_diary.pl)を解析し、各ボタンに相当するフォームの値を返します。

parse_self_id

おすすめレビュー(list_review.pl)を解析し、自分のIDを返します。 このメソッドの返り値はIDで、ハッシュリファレンスの配列ではありません。

SEE ALSO

WWW::Mixi, LWP::UserAgent, WWW::RobotUA, HTTP::Request::Common

COPYRIGHT

Copyright 2004-2004 TSUKAMOTO Makio.

This text is free document; you can redistribute it and/or modify it under the same terms as Perl itself.