ココログ
のBooksリスト管理画面をEUCで保存してから、@niftyBOOKSアフィリエイトの
タイトル/著者/詳細ページURL/表紙サムネール画像URL
情報を抽出し、hnfのLIMG/LINKディレクティブを出力するPerlプログラムを書いてみた。
#!/usr/bin/perl
use strict;
my ($title, $author, $url, $img);
while(<>){
if(m(^<td align="center"><a href="(http://nifty\.bk1\.co\.jp/cgi-bin/srch/srch_detail\.cgi\?bibid=[0-9]+)"><img class="thumb" src="(http://www\.bk1\.co\.jp/bookimages/.*\.jpg)" alt="" /></a></td>$)){
($url,$img)=($1,$2);
}elsif(m(^<input size="30" class="box" name="title" id="[^"]*" value="([^"]*)" /></div>$)){
$title=$1;
}elsif(m(^<input size="30" class="box" name="author" id="[^"]*" value="([^"]*)著" />)){
$author=$1;
}elsif(m(^</tr>$) && $url ne ""){
print "LIMG $url n $img [表紙画像: $title]\n";
print "LINK $url $title (${author}著)\n\n";
}
}
よしよし……と思ったらアフィリエイト情報が入ってなくてタダの紹介だよorz
まぁLIMGとLINKを両方出力するように改造した
前のスクリプト
の出力結果を見ると、アフィリエイト情報は&aid=nifc(略)で固定らしいので、
上のリンク先は手で追加、スクリプトも出力のところに書いておくけど。
しかもさらに、最初($url,$img)=($2,$1)とか書いてて激しくアフォな出力結果が……。