PC用眼鏡【管理人も使ってますがマジで疲れません】 解約手数料0円【あしたでんき】
Yahoo 楽天 NTT-X Store
無料ホームページ 無料のクレジットカード 海外格安航空券
ふるさと納税 海外旅行保険が無料! 海外ホテル
■掲示板に戻る■ 全部 1- 101- 201- 301- 401- 501- 601- 701- 最新50
メモ3
- 742 :名無しさん@停滞中 ★:08/06/14 21:56:07 ID:???
- > > http://www.ichigobbs.net/cgi/aska_list.cgi?bo=economy
> > http://tieba.baidu.com/f?kw=%C8%D5%B1%BE%CE%C4%BB%AF
>
> 前者はともかく後者はヘッダが長すぎて一発のsコマンドでは
> fatal errorを起こしてしまうので何回かに分けて地道にやるしか
> なさそうですね。
うーむ
とりあえずUTF-8にしてアップしてみたです
http://mirror.sarashi.com/htmltodat/subjecttest.html
前処理で
s#\n(?:<meta|<link|</?style|div|a|\.|</?script|<input|[^<]).+?(?=\n)##ig
s#\r(?=\n)##ig
s#\n(?=\n)##ig
これでガラガラと空行がある程度省けたので
かなり見通しがよくなったかな
で、肝心のデータ部分は
<td class="d">80037</td>
<td class="d">354</td>
<td class="s"><a class=t href="/f?kz=22542052" target=_blank > 初到?京的感
受~~(ZT) </a>[<font class="red">精品</font>]&nbsp;[<font class="red">置?</fon
t>]&nbsp;</td>
なので以下略
後で考えてみますか
500KB
続きを読む
掲示板に戻る 全部 前100 次100 最新50