PC用眼鏡【管理人も使ってますがマジで疲れません】 解約手数料0円【あしたでんき】 Yahoo 楽天 NTT-X Store

無料ホームページ 無料のクレジットカード 海外格安航空券 ふるさと納税 海外旅行保険が無料! 海外ホテル

告知欄です


■掲示板に戻る■ 全部 1- 101- 201- 301- 401- 501- 601- 701- 801- 最新50
メモ4

539 :名無しさん@停滞中 ★:10/06/13 17:54:55 ID:???
メモ
2channel archives(http://chara.moe.hm/arc/)のdat化について

URL例
http://2chbrowser.moe.hm/vip_archive/ajax/el/1276347471?ita=dat

正規表現
m#<DT.+?>([0-9]+) : <FONT color="lightgrey">()<B>(.+?)</B></FONT> : (.+?)<DD.+?>(.+?)</DD></DT><BR>#mik

前処理
s#^(.+?)<>#<title>$1</title><>#ik


Ajaxでデータ取得表示しているみたいなので
ブラウザで表示しているhtmlを指定しても何も出てこないです

html表示
http://chara.moe.hm/arc/thread/1276347471?ita=dat
dat化用データ
http://2chbrowser.moe.hm/vip_archive/ajax/el/1276347471?ita=dat

dat化用データですが、呼び出し当初は文字化けしますが
htmltodatのURL欄に「その86」のdat用のURLを入力して
「文字コード自動判別」チェックボックスをオフにして「HTML取得」をクリックして呼び出してから
「UTF-8 -> SJIS変換」にして
「->SJIS変換(J)」のボタンをクリックすれば文字化けがなくなるので
その後で上の正規表現と前処理でdat化するです。

500KB
続きを読む

掲示板に戻る 全部 前100 次100 最新50
名前: E-mail(省略可)

0ch BBS 2006-02-27