PC用眼鏡【管理人も使ってますがマジで疲れません】 解約手数料0円【あしたでんき】 Yahoo 楽天 NTT-X Store

無料ホームページ 無料のクレジットカード 海外格安航空券 ふるさと納税 海外旅行保険が無料! 海外ホテル

告知欄です


■掲示板に戻る■ 全部 1- 101- 201- 301- 401- 501- 601- 701- 最新50
メモ3

496 :名無しさん@勉強中 ★:08/02/18 19:36:29 ID:???
>>495
確かにsnapshotのdat変換ページのものでは出来ないですね。
何でだろ

配布版p2の最近のバージョンを見てみたですが
本文に到達するまでにJavaScriptやmetaタグその他が
んもうズラーっと200行くらいあるですね。

何かここまで長大な行となると
htmltodatの前処理で取り払うよりも
「○行目から○行目まではスルーする」
みたいなオプションがあったらいいなと思ったですが
どんなもんでしょうか(って誰に言ってるのよ)



それはそうと
自分で使ってたものだと変換出来てたので次レスにて。
もしyykakikoに書けなかったら したらばにでも書きますか。

497 :名無しさん@勉強中 ★:08/02/18 19:48:16 ID:???
メモ
snapshotのdat化について

URL例
http://p2.chbox.jp/read.php?url=http://love6.2ch.net/test/read.cgi/aasaloon/1197207826/all


正規表現
m#<dt.*?>([0-9]+).+?(?:"mailto:\.?(.+?)">)?<b>(.*)</b>.*?:(.*?)</dt>.*<dd> ?(.*)<br><br></dd>#mik

前処理
s#\n(?:\t| +).+?\n##ig
s#\n<div.+?\n##ig
s#(<a )target=_top (href=)#$1$2#ig
s#(</a> )\[<a href="subject\.php\?host=.+?target="subject">板をp2で開く</a>\] #$1#ig
s#<title.*?>(.*?)/(.*?)</title>#<title>$2</title>#
s#\(<a href="read.php\?bbs=([^:]+?)ID:([^<]+?)(</a>(?:\(\d+\))?)#ID:$2#g
s#(\(p\))(h?ttp://)#$2#ig
s#(<><>)(.*?)( :)#<>$2<>#ig
s#\(<a href="http://be.2ch.net/test/p.php\?i=(\d+)&u=(.+?)\?(\#*)</a> *?</dt>#BE:$1-$3</dt>#g
s#<dd id=.*?\n##ig
s#</i></dd>##ig
s#<b>(.*?) </b>(.*):(.*?) :#<a href=\"mailto:$3\"><b>$1</b></a> :#ig
s#\(<a(.+?)\">p</a>\)##ig
s#<b>(.*?) </b>#<b>$1</b>#g
s#<a href="read.php\?host=.+?>(\d+)</a>#$1#ig


過度のレスアンカーやURLがある所とかだと
これでは対処できないかも。

500KB
続きを読む

掲示板に戻る 全部 前100 次100 最新50
名前: E-mail(省略可)

0ch BBS 2006-02-27