忍者ブログ
シフラ,超絶技巧練習曲,ピアノ,ロマン派のエチュード,かっこいい曲,PC便利系,音楽系,動画系,youtube,blog系など
Blog Infomation





Today / Yesterday
/



 フィードメーター - The J.Mazeppa


 
Monthly
Recent Comment
Infomation
Circle Chat
Access Rank
KeyWord Rank
Weather & \\ vs $

-天気予報コム-

購入時2005/11は106.1
2024/11/24 (Sun) 02:38 / /
×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。


2011/01/09 (Sun) 22:37 / /
まあ固定の画像が埋め込まれてるフラッシュなら適当にソフトで抜けばいいんですが、ちょっと高度な方法です。
けっこうあくどい事ができますが、まあ金銭が絡んでくることには使用しないでくださいね。
美人時計の画像を全部抜き出すとか、そんなことができるようです。

フラッシュ(.swf)が渡されたパラメータに応じて画像のURLを拾ってくるような場合、
クライアントのブラウザが画像URLにそのままアクセスしたような形のリクエストを送っているはずです。
このような場合、http://~で画像が拾える可能性が高いと思われます。
フラッシュの内部でGET http://~みたいなことを見えないように行っているのでそれを解析します。

いわゆるパケットキャプチャソフトの出番だと思うのですが、WindowsであればWireSharkってのがわりと有名です。
今回はhttpの80番くらいをパケットキャプチャできればいいので、Firefoxのアドオンを使うことにします。

HttpFoxというアドオンが見つかったのが今回はこれを使用します。
今回の対象のサイトの場合は、

(パラメータをもって)htmlにアクセス→パラメータを渡しフラッシュ呼び出し→対応した画像がフラッシュ内に表示

という仕組みで画像をダウンロードしているようです。
まずは個別ページをみてhtmlURL→画像URLの規則性を見出します。

htmlのURLは僕の場合はブラウザに表示されていました。
画像のURLはもちろんそれが表示されないので、ここでHttpFoxを使用します。

Img/1294577629


ある程度マスクしてありますが、モザイクしてあるのが画像のURLです。
※htmlのURLがブラウザに表示されず、わからない場合はここで探してみましょう

例えば、次のような関係にあったとします。


* html
http://mazeppa.jp/pict/111_222_333.html
* image
http://mazeppa.jp/pict/storaged_555_444_333_666777_mazeppa.jpeg

まず、画像そのもののURLを直接ブラウザのアドレスバーに入れて、
たたいた画像が表示されるまたはダウンロードできることを確認してください。
できなかったらあきためてください(おい・・・)

表示できた場合、次に進みましょう。
htmlのURLから画像のURLを推測するには明らかに情報が足りないことがわかります。
ここであきらめずに、画像をサムネイルで表示する一覧画面があった場合はそちらも見てみましょう。
その中で、クリックすると上の画像表示htmlを呼び出すサムネイルのURLが次のようになっていたとします。


* thumbs
http://files.mazeppa.jp/show_list.pl?a=333&b=444&c=555&d=666777&e=888&f=999

サムネイルのURLから画像本体のURLが推測できることがわかります。
ここでhtmlのURLのことは忘れて、2つのURLを並べてみるとわかりやすいでしょう。


* thumbs
http://files.mazeppa.jp/show_list.pl?a=333&b=444&c=555&d=666777&e=888&f=999
* image
http://mazeppa.jp/pict/storaged_555_444_333_666777_mazeppa.jpeg

HttpFoxでstoragedでフィルターをかけて、右クリックすべての行をコピーすると、
下記のようにthumbsのURLを含んだ行だけががっさがっさ落ちてくるはずです。


00:00:18.091 4.928 514 176 GET 200 image/jpeg http://files.mazeppa.jp/show_list.pl?a=333&b=444&c=555&d=666777&e=888&f=999
00:00:18.127 4.968 514 176 GET 200 image/jpeg http://files.mazeppa.jp/show_list.pl?a=333&b=444&c=555&d=666778&e=888&f=999
00:00:18.145 5.027 514 176 GET 200 image/jpeg http://files.mazeppa.jp/show_list.pl?a=333&b=444&c=555&d=666779&e=888&f=999
...

これをtxt.txtなどと保存してperlとかメモ帳とかほかのツールでがんばって変更します。
保存したい画像が非常に多く、個別ページをいちいち見るのが面倒な場合もこれでいいでしょう。

以下は上記のtxt.txtをperlで画像のURLに一括で変換する例:


$ perl -n -e 'print "http://mazeppa.jp/pict/storaged_$3_$2_$1_$4$5_mazeppa.jpeg\n" if (/show_list.pl\?a=(\d+)&b=(\d+)&c=(\d+)&d=(\d\d\d)(\d\d\d)/)' txt.txt
http://mazeppa.jp/pict/storaged_555_444_333_666777_mazeppa.jpeg
http://mazeppa.jp/pict/storaged_555_444_333_666778_mazeppa.jpeg
http://mazeppa.jp/pict/storaged_555_444_333_666779_mazeppa.jpeg
...

で、上の結果をirvineとかいったダウンローダに貼り付けて後はお任せです。

ところが、そもそも画像のURLとるのに認証通過したからきたから、
irvineだけじゃだめそうなんだけど?ということがおきることがあります。
User-AgentだったりCookieの情報が必要な場合です、自分もここで詰まったので、方法を書いておきます。

上の画像でマスクした部分が下記のようになっているとします。


(リクエスト・ライン)
GET /pict/storaged_555_444_333_666777_mazeppa.jpeg HTTP/1.1
Host mazeppa.jp
User-Agent Mozilla/5.0 (Windows; U; Windows NT 5.1; ja; rv:1.9.2.4) Gecko/20100611 Firefox/3.6.4
...
Cookie MAZEPPA_SESSION=123456789mazeppa54321;
If-Modified-Since Sun, 09 Jan 2011 09:02:17 GMT
Cache-Control max-age=0

このHttpFoxからUser-AgentとCookieの情報を抜き出して、それをIrvineに反映してみましょう。
※Irvineの使い方はわかっているものとして、貼り付け方は省略します。

抜き出すのは簡単で、抜き出したいリクエストヘッダのラインで右クリックすると、


Copy 'MAZEPPA_SESSION=123456789mazeppa54321;'

ってのがでてくるので、それをコピペしてIrvineのキューフォルダ設定とかに貼り付けておきます。
もし必要であればUser-AgentやReffererの設定も書いておきます(必要ならURLごとに用意)。

Img/1294581756


万全を期すために、さらにここでオプションで最大接続数を1とかにしておくといいかもです。
同時ダウンロードは不正なアクセスとみなされ途中でダウンロードがとめられる場合があります。

ダウンロードが成功した場合に、一括で名前を変更したい場合などがあります。
コマンドプロンプトで一括で名前を.jpeg->.jpgに変更する方法を書いておきます(自分用メモ)。


C:\Documents and Settings\jm>D:

D:\>cd "jmDoc\My Pictures"

D:\jmDoc\My Pictures>dir *.jpeg

2011/01/04 17:09 136,735 storaged_555_444_333_666777_mazeppa.jpeg
2011/01/04 17:04 149,805 storaged_555_444_333_666778_mazeppa.jpeg
2011/01/04 17:47 125,216 storaged_555_444_333_666779_mazeppa.jpeg

D:\jmDoc\My Pictures>rename *.jpeg *.jpg

D:\jmDoc\My Pictures>dir *.jpg

2011/01/04 17:09 136,735 storaged_555_444_333_666777_mazeppa.jpg
2011/01/04 17:04 149,805 storaged_555_444_333_666778_mazeppa.jpg
2011/01/04 17:47 125,216 storaged_555_444_333_666779_mazeppa.jpg



何をかいてるか意味不明だと思いますが、以上です。

拍手[1回]

PR



▼Comment
   NAME:  TITLE:  COLOR:
   PASS:   URL:  EMAIL:
 COMMENT!: Vodafone絵文字 i-mode絵文字 Ezweb絵文字
     
△▲最上部へ戻る▲△ △▲プラグインへ▲△