Gポイントポイ活 Amazon Yahoo 楽天

無料ホームページ 楽天モバイル[UNLIMITが今なら1円] 海外格安航空券 海外旅行保険が無料!

告知欄です


■掲示板に戻る■ 全部 1- 101- 201- 301- 401- 501- 601- 701- 最新50
メモ

248 :名無しさん@勉強中 ★:05/09/26 19:53:03 ID:???
で、とりあえず二つやってみました。
それぞれ
1→右クリック保存(UTF-8)
2→エディタ(xyzzy)でシフトJISに保存しなおしたもの
3→ブラウザ(IE)からシフトJISで保存

http://www.geocities.jp/mirrorhenkan/dumper/test1-1.html
http://www.geocities.jp/mirrorhenkan/dumper/test1-2.html
http://www.geocities.jp/mirrorhenkan/dumper/test1-3.html
http://www.geocities.jp/mirrorhenkan/dumper/test1-1.html
http://www.geocities.jp/mirrorhenkan/dumper/test1-2.html
http://www.geocities.jp/mirrorhenkan/dumper/test1-3.html
単に変換しただけでcharset等は全く手をつけてないので文字化けしますが
それはそれとして
1と2を見てみると、本文のソースは んもう改行無しにベターーっと続いています。
エディタでも、なかなか開かず しばらく待ってたら強制終了したりして。
htmltodatで色々やってみたのですが、どうやっても出来ませんでした。
(失敗例をとっておけば良かったな)
ただ、3だけ成功しました。正規表現は以下で。
m#<DT>([0-9]+) :.*?(?:<A href="mailto:(.*)">)?<B>(.+)</B>.*? ?:(.+?)<DD>(.*)<BR><BR> *?(<DT>|</DD>)#mi

249 :名無しさん@勉強中 ★:05/09/26 19:53:35 ID:???
「ブラウザから保存すると勝手にソースを変えてしまうから良くない」
とよく言われますが、この場合はそう悪くないなと思いましたです。
という事で
2ch.dumper.jpのスレをdat化したい時は
ブラウザ(IE)からシフトJISで保存して
タイトル部分を変えて上記の正規表現でdat変換する
 ・・という手順でいいでしょうか。(誰に聞いてるんだ)

あと2の正規表現は、どういうものが考えられるでしょうか(だから誰に(ry)



500KB
続きを読む

掲示板に戻る 全部 前100 次100 最新50
名前: E-mail(省略可)

0ch BBS 2006-02-27