Monthly
New Article
09/08
pad twitpic memo
08/17
CentOS6 setup memo
06/30
曲紹介が長くなる・・・
02/04
水の歴龍 - 蒼の孤島 攻略
01/13
炎の歴龍 - 紅の孤島 攻略
01/07
パズドラ始めました(去年の話)
09/17
club nintendo 2012
05/27
6/9にむけてラフマニノフ練習中
05/19
独自ドメイン設定メモ2
02/13
yui3でカレンダー
12/13
DS DQ5-5
11/20
ハワードのリスト独奏曲全集セット
11/18
TwitterProfileMemo
11/15
足立の花火2011
11/05
レモン家鍋
11/04
誕生25周年記念ドラゴンクエスト展
08/28
PCに入ってるソフトmemo
08/21
FFT for iphone (PSP)
08/01
DS版DQ4タイムアタック
07/18
DS DQ5-4
07/18
DS DQ5 -3
07/03
DS版DQ6クリア後メモ
06/19
トルネコ一発素もぐりクリア
04/03
原発とエネルギーについて
Recent Comment
Categories
<
[03/04]
Haorutia
@MP3音質チェック!
>
<
[02/25]
SgjvHo
@PhotoShifter
>
<
[02/25]
SmsQY
@PhotoShifter
>
<
[02/24]
WTeMA
@DS版DQ4タイムアタック
>
<
[02/24]
qcCZQ
@DS版DQ4タイムアタック
>
<
[02/23]
AvNMHf
@DS版DQ4タイムアタック
>
<
[02/23]
xgmjAJ
@DS版DQ4タイムアタック
>
<
[02/22]
OBareM
@DS版DQ4タイムアタック
>
<
[02/22]
wodzez
@PhotoShifter
>
<
[02/22]
fVXYeriz
@PhotoShifter
>
<
[02/22]
FPQxMOPh
@DS版DQ4タイムアタック
>
<
[02/22]
TXszNkwu
@DS版DQ4タイムアタック
>
<
[02/22]
XaMQbz
@DS版DQ4タイムアタック
>
<
[02/22]
jQPOzSSo
@DS版DQ4タイムアタック
>
<
[02/22]
XpfSXG
@DS版DQ4タイムアタック
>
<
[02/22]
kGoiBQGd
@DS版DQ4タイムアタック
>
<
[02/21]
XFEzXsX
@DS版DQ4タイムアタック
>
<
[02/21]
iDWQgLoM
@DS版DQ4タイムアタック
>
<
[02/21]
GsbnhD
@PhotoShifter
>
<
[02/21]
vnNxq
@DS版DQ4タイムアタック
>
<
[02/21]
VbkWZaEn
@DS版DQ4タイムアタック
>
<
[02/20]
yNArLEnE
@DS版DQ4タイムアタック
>
<
[02/20]
iCbDkM
@DS版DQ4タイムアタック
>
<
[02/20]
oOgXpHvl
@DS版DQ4タイムアタック
>
<
[02/20]
QUwKc
@PhotoShifter
>
2011/01/09 (Sun) 22:37
/
PC-Software
/
まあ固定の画像が埋め込まれてるフラッシュなら適当にソフトで抜けばいいんですが、ちょっと高度な方法です。
けっこうあくどい事ができますが、まあ金銭が絡んでくることには使用しないでくださいね。
美人時計の画像を全部抜き出すとか、そんなことができるようです。
フラッシュ(.swf)が渡されたパラメータに応じて画像のURLを拾ってくるような場合、
クライアントのブラウザが画像URLにそのままアクセスしたような形のリクエストを送っているはずです。
このような場合、http://~で画像が拾える可能性が高いと思われます。
フラッシュの内部でGET http://~みたいなことを見えないように行っているのでそれを解析します。
いわゆるパケットキャプチャソフトの出番だと思うのですが、WindowsであればWireSharkってのがわりと有名です。
今回はhttpの80番くらいをパケットキャプチャできればいいので、Firefoxのアドオンを使うことにします。
HttpFoxというアドオンが見つかったのが今回はこれを使用します。
今回の対象のサイトの場合は、
(パラメータをもって)htmlにアクセス→パラメータを渡しフラッシュ呼び出し→対応した画像がフラッシュ内に表示
という仕組みで画像をダウンロードしているようです。
まずは個別ページをみてhtmlURL→画像URLの規則性を見出します。
htmlのURLは僕の場合はブラウザに表示されていました。
画像のURLはもちろんそれが表示されないので、ここでHttpFoxを使用します。
ある程度マスクしてありますが、モザイクしてあるのが画像のURLです。
※htmlのURLがブラウザに表示されず、わからない場合はここで探してみましょう
例えば、次のような関係にあったとします。
まず、画像そのもののURLを直接ブラウザのアドレスバーに入れて、
たたいた画像が表示されるまたはダウンロードできることを確認してください。
できなかったらあきためてください(おい・・・)
表示できた場合、次に進みましょう。
htmlのURLから画像のURLを推測するには明らかに情報が足りないことがわかります。
ここであきらめずに、画像をサムネイルで表示する一覧画面があった場合はそちらも見てみましょう。
その中で、クリックすると上の画像表示htmlを呼び出すサムネイルのURLが次のようになっていたとします。
サムネイルのURLから画像本体のURLが推測できることがわかります。
ここでhtmlのURLのことは忘れて、2つのURLを並べてみるとわかりやすいでしょう。
HttpFoxでstoragedでフィルターをかけて、右クリックすべての行をコピーすると、
下記のようにthumbsのURLを含んだ行だけががっさがっさ落ちてくるはずです。
これをtxt.txtなどと保存してperlとかメモ帳とかほかのツールでがんばって変更します。
保存したい画像が非常に多く、個別ページをいちいち見るのが面倒な場合もこれでいいでしょう。
以下は上記のtxt.txtをperlで画像のURLに一括で変換する例:
で、上の結果をirvineとかいったダウンローダに貼り付けて後はお任せです。
ところが、そもそも画像のURLとるのに認証通過したからきたから、
irvineだけじゃだめそうなんだけど?ということがおきることがあります。
User-AgentだったりCookieの情報が必要な場合です、自分もここで詰まったので、方法を書いておきます。
上の画像でマスクした部分が下記のようになっているとします。
このHttpFoxからUser-AgentとCookieの情報を抜き出して、それをIrvineに反映してみましょう。
※Irvineの使い方はわかっているものとして、貼り付け方は省略します。
抜き出すのは簡単で、抜き出したいリクエストヘッダのラインで右クリックすると、
ってのがでてくるので、それをコピペしてIrvineのキューフォルダ設定とかに貼り付けておきます。
もし必要であればUser-AgentやReffererの設定も書いておきます(必要ならURLごとに用意)。
万全を期すために、さらにここでオプションで最大接続数を1とかにしておくといいかもです。
同時ダウンロードは不正なアクセスとみなされ途中でダウンロードがとめられる場合があります。
ダウンロードが成功した場合に、一括で名前を変更したい場合などがあります。
コマンドプロンプトで一括で名前を.jpeg->.jpgに変更する方法を書いておきます(自分用メモ)。
何をかいてるか意味不明だと思いますが、以上です。
けっこうあくどい事ができますが、まあ金銭が絡んでくることには使用しないでくださいね。
美人時計の画像を全部抜き出すとか、そんなことができるようです。
フラッシュ(.swf)が渡されたパラメータに応じて画像のURLを拾ってくるような場合、
クライアントのブラウザが画像URLにそのままアクセスしたような形のリクエストを送っているはずです。
このような場合、http://~で画像が拾える可能性が高いと思われます。
フラッシュの内部でGET http://~みたいなことを見えないように行っているのでそれを解析します。
いわゆるパケットキャプチャソフトの出番だと思うのですが、WindowsであればWireSharkってのがわりと有名です。
今回はhttpの80番くらいをパケットキャプチャできればいいので、Firefoxのアドオンを使うことにします。
HttpFoxというアドオンが見つかったのが今回はこれを使用します。
今回の対象のサイトの場合は、
(パラメータをもって)htmlにアクセス→パラメータを渡しフラッシュ呼び出し→対応した画像がフラッシュ内に表示
という仕組みで画像をダウンロードしているようです。
まずは個別ページをみてhtmlURL→画像URLの規則性を見出します。
htmlのURLは僕の場合はブラウザに表示されていました。
画像のURLはもちろんそれが表示されないので、ここでHttpFoxを使用します。
ある程度マスクしてありますが、モザイクしてあるのが画像のURLです。
※htmlのURLがブラウザに表示されず、わからない場合はここで探してみましょう
例えば、次のような関係にあったとします。
* html
http://mazeppa.jp/pict/111_222_333.html
* image
http://mazeppa.jp/pict/storaged_555_444_333_666777_mazeppa.jpeg
まず、画像そのもののURLを直接ブラウザのアドレスバーに入れて、
たたいた画像が表示されるまたはダウンロードできることを確認してください。
できなかったらあきためてください(おい・・・)
表示できた場合、次に進みましょう。
htmlのURLから画像のURLを推測するには明らかに情報が足りないことがわかります。
ここであきらめずに、画像をサムネイルで表示する一覧画面があった場合はそちらも見てみましょう。
その中で、クリックすると上の画像表示htmlを呼び出すサムネイルのURLが次のようになっていたとします。
* thumbs
http://files.mazeppa.jp/show_list.pl?a=333&b=444&c=555&d=666777&e=888&f=999
サムネイルのURLから画像本体のURLが推測できることがわかります。
ここでhtmlのURLのことは忘れて、2つのURLを並べてみるとわかりやすいでしょう。
* thumbs
http://files.mazeppa.jp/show_list.pl?a=333&b=444&c=555&d=666777&e=888&f=999
* image
http://mazeppa.jp/pict/storaged_555_444_333_666777_mazeppa.jpeg
HttpFoxでstoragedでフィルターをかけて、右クリックすべての行をコピーすると、
下記のようにthumbsのURLを含んだ行だけががっさがっさ落ちてくるはずです。
00:00:18.091 4.928 514 176 GET 200 image/jpeg http://files.mazeppa.jp/show_list.pl?a=333&b=444&c=555&d=666777&e=888&f=999
00:00:18.127 4.968 514 176 GET 200 image/jpeg http://files.mazeppa.jp/show_list.pl?a=333&b=444&c=555&d=666778&e=888&f=999
00:00:18.145 5.027 514 176 GET 200 image/jpeg http://files.mazeppa.jp/show_list.pl?a=333&b=444&c=555&d=666779&e=888&f=999
...
これをtxt.txtなどと保存してperlとかメモ帳とかほかのツールでがんばって変更します。
保存したい画像が非常に多く、個別ページをいちいち見るのが面倒な場合もこれでいいでしょう。
以下は上記のtxt.txtをperlで画像のURLに一括で変換する例:
$ perl -n -e 'print "http://mazeppa.jp/pict/storaged_$3_$2_$1_$4$5_mazeppa.jpeg\n" if (/show_list.pl\?a=(\d+)&b=(\d+)&c=(\d+)&d=(\d\d\d)(\d\d\d)/)' txt.txt
http://mazeppa.jp/pict/storaged_555_444_333_666777_mazeppa.jpeg
http://mazeppa.jp/pict/storaged_555_444_333_666778_mazeppa.jpeg
http://mazeppa.jp/pict/storaged_555_444_333_666779_mazeppa.jpeg
...
で、上の結果をirvineとかいったダウンローダに貼り付けて後はお任せです。
ところが、そもそも画像のURLとるのに認証通過したからきたから、
irvineだけじゃだめそうなんだけど?ということがおきることがあります。
User-AgentだったりCookieの情報が必要な場合です、自分もここで詰まったので、方法を書いておきます。
上の画像でマスクした部分が下記のようになっているとします。
(リクエスト・ライン)
GET /pict/storaged_555_444_333_666777_mazeppa.jpeg HTTP/1.1
Host mazeppa.jp
User-Agent Mozilla/5.0 (Windows; U; Windows NT 5.1; ja; rv:1.9.2.4) Gecko/20100611 Firefox/3.6.4
...
Cookie MAZEPPA_SESSION=123456789mazeppa54321;
If-Modified-Since Sun, 09 Jan 2011 09:02:17 GMT
Cache-Control max-age=0
このHttpFoxからUser-AgentとCookieの情報を抜き出して、それをIrvineに反映してみましょう。
※Irvineの使い方はわかっているものとして、貼り付け方は省略します。
抜き出すのは簡単で、抜き出したいリクエストヘッダのラインで右クリックすると、
Copy 'MAZEPPA_SESSION=123456789mazeppa54321;'
ってのがでてくるので、それをコピペしてIrvineのキューフォルダ設定とかに貼り付けておきます。
もし必要であればUser-AgentやReffererの設定も書いておきます(必要ならURLごとに用意)。
万全を期すために、さらにここでオプションで最大接続数を1とかにしておくといいかもです。
同時ダウンロードは不正なアクセスとみなされ途中でダウンロードがとめられる場合があります。
ダウンロードが成功した場合に、一括で名前を変更したい場合などがあります。
コマンドプロンプトで一括で名前を.jpeg->.jpgに変更する方法を書いておきます(自分用メモ)。
C:\Documents and Settings\jm>D:
D:\>cd "jmDoc\My Pictures"
D:\jmDoc\My Pictures>dir *.jpeg
2011/01/04 17:09 136,735 storaged_555_444_333_666777_mazeppa.jpeg
2011/01/04 17:04 149,805 storaged_555_444_333_666778_mazeppa.jpeg
2011/01/04 17:47 125,216 storaged_555_444_333_666779_mazeppa.jpeg
D:\jmDoc\My Pictures>rename *.jpeg *.jpg
D:\jmDoc\My Pictures>dir *.jpg
2011/01/04 17:09 136,735 storaged_555_444_333_666777_mazeppa.jpg
2011/01/04 17:04 149,805 storaged_555_444_333_666778_mazeppa.jpg
2011/01/04 17:47 125,216 storaged_555_444_333_666779_mazeppa.jpg
何をかいてるか意味不明だと思いますが、以上です。
PR
▼Comment
03/04 Haorutia
02/25 SgjvHo
02/25 SmsQY
02/24 WTeMA
02/24 qcCZQ
02/23 AvNMHf
02/23 xgmjAJ
02/22 OBareM
02/22 wodzez
02/22 fVXYeriz
02/22 FPQxMOPh
02/22 TXszNkwu
02/22 XaMQbz
02/22 jQPOzSSo
02/22 XpfSXG
02/22 kGoiBQGd
02/21 XFEzXsX
02/21 iDWQgLoM
02/21 GsbnhD
02/21 vnNxq
02/21 VbkWZaEn
02/20 yNArLEnE
02/20 iCbDkM
02/20 oOgXpHvl
02/20 QUwKc