テレワークならECナビ Yahoo 楽天
LINEがデータ消費ゼロで月額500円〜!
無料ホームページ 無料のクレジットカード 海外格安航空券 海外旅行保険が無料! 海外ホテル
■掲示板に戻る■ 全部 1- 101- 201- 301- 401- 501- 601- 701- 最新50
メモ3
- 738 :名無しさん@停滞中 ★:08/06/14 12:44:26 ID:???
- >>737
えーと、言葉が足りませんでしたが
> subback.htmlからsubject.txtを作るのは前処理で容易にできる気がします
いちおう出来るには出来ますが
ヘッダとフッタが残ってしまい
それらを手動で消さなければならないように思うですが。
http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038409548/72
のように。
頭の体操的に無理矢理に考えてみると
ヘッダ除去
s#^(?.|\n|\r)+?(\n.+?<>)#$1#ik
フッタ除去
s#(<>(?:\r)?\n)(?:.|\n|\r)+?$#$1#igk
とかなるのかな。。
先読みの使い方ってこれでいいのかな。
具体的には
http://www.ichigobbs.net/cgi/aska_list.cgi?bo=economy
とか
http://tieba.baidu.com/f?kw=%C8%D5%B1%BE%CE%C4%BB%AF
からsubject.txtを生成したいのですが
試行錯誤するツールがあったら嬉しいなと思ったのです
500KB
続きを読む
掲示板に戻る 全部 前100 次100 最新50