Gポイントポイ活 Amazon Yahoo 楽天

無料ホームページ 楽天モバイル[UNLIMITが今なら1円] 海外格安航空券 海外旅行保険が無料!

告知欄です


■掲示板に戻る■ 全部 1- 101- 201- 301- 401- 501- 601- 701- 最新50
メモ

1 :663:05/05/01 17:30:46 ID:boieiukf
思いついた事など

110 :名無しさん@勉強中:05/08/04 03:10:46 ID:9ahl2XKu
質問・雑談スレ129@運用情報板 ←p2 error: ご指定のDATはありませんでした
http://p2.2ch.net/p2/dat.php?host=qb5.2ch.net&bbs=operate&key=1113630156
1000 名前:19[sage] 投稿日:2005/04/17(日) 16:27:48 ID:JAxlk1O10

質問・雑談スレ130@運用情報板 ←datあった
http://p2.2ch.net/p2/dat.php?host=qb5.2ch.net&bbs=operate&key=1113711175
1000 名前:●[] 投稿日:2005/04/19(火) 19:37:47 ID:oLTNZ64Y0

ってことは、
(2005/8/4) - (2005/4/18) = 108日ぐらい?

ハードディスクの容量で判定している可能性もあるから、しばらく様子見で。。。

111 :名無しさん@勉強中 ★:05/08/06 20:20:01 ID:???
ふむふむ
二日の違いでそうなるんですか・・

それにしても今日はアクセス多い感じだなー
まあ夏休みだからなのでしょうが

112 :名無しさん@勉強中:05/08/06 23:34:49 ID:Qbh2EBm/
まだダウソできるみたいね >>110 質雑130
古いdatは空きディスク容量が少なくなったら、aki氏が手動で消しているに100ペリカ

113 :名無しさん@勉強中 ★:05/08/07 17:22:35 ID:???
かなり以前にやってあったのですが、
dat2htmlのphp版へのリンクをつけました。

使い道としては、web上にあるdatをhtml化して読むことでしょうか(そのまんまだ)
makimo.toのdatをhtml変換すれば、見慣れた書式で読めると思います。
あと人大杉の板で読み込むとか。
まだレスアンカーのポップアップとかつけてないです。

設置したサーバの負荷がどのくらいのものなのかさっぱりわかりませんので
さてどうなることか。

>>112
もしかしたら多分
dat圧縮のように、設定容量の上限が来たら
バッサリと消えているのかもですね。


114 :名無しさん@勉強中 ★:05/08/07 17:27:44 ID:???
あと、こういうのもありました。
http://pc.2ch.net/test/read.cgi/php/1011001700/

移転か何かで2ch上では見えませんが
変換スクリプトで調べたら ありました。
偽モナメントに上げてみました。
http://user.ftth100.com/mirrorhenkan/test/read.php?key=1011001700&st=1&to=1001

これ、現役スレッドのみ対応しているみたいですが
それ以外のdatにも使えたらいいなー。

スレを読むと
Rubyで組んであるのか・・・。


115 :名無しさん@勉強中 ★:05/08/08 22:14:56 ID:???
変換スクリプトのphp版
手直しにまだ手をつけられない状態ですが
(何せ多忙リナックスにてスマニエル)

何か 色々調べたら

CGI版も出来そうだぞ

116 :名無しさん@勉強中 ★:05/08/13 13:29:35 ID:???
さて

正規表現でhttp://を分離して
ホスト名とその後に続くアドレスとに分ける事が出来ました。

http://mirrorhenkan.hp.infoseek.co.jp/cgi-bin/url.cgi?http://that3.2ch.net/test/read.cgi/gline/1118753283/

↑「?」以降のものを書き換えると、中に書いてあるものも変わると思います。


で、
ここで詰まりました。
perlで スラッシュ(「/」)を目印に区切る方法がわからない。

通常の書式だと、例えば「<>」を目印に区切るには

@youso = split(/<>/, $url);

となるのですが、「/」を目印に区切るにはどうすればいいんだろうか。
「\/」とかやってみてもエラーになるし。

117 :名無しさん@勉強中 ★:05/08/13 18:03:39 ID:???
おー出来たー。

「\/」で良かったんだー。

118 :名無しさん@勉強中 ★:05/08/13 18:31:20 ID:???
javascriptもphpも、URLを単純に「/」で区切って並べ替えているだけなのですが
正規表現でやってみたらかっこいいかもです^^:

javascriptだと、execメソッドを使えば
10行くらいで表現してあるものが1行で済ませられるかもしれません。

http://homepage3.nifty.com/aya_js/js2/js236.htm

でもまあいいや

119 :名無しさん@勉強中 ★:05/08/15 12:22:04 ID:???
保守がてら本スレに書こうと思いましたが
「スレ違い」と言われそうなので思い直してこちらに


javascriptに詳しい方に質問です

http://qb.2ch.net/test/read.cgi/operate/1052923573/38
で、javascriptでsubback.htmlを生成する方法を出していた方が居たので
真似して設置しようとしたのだが、うまくいかないです。。

geocitiesに置くと問題無く動作するのですが
http://www.geocities.jp/mirrorhenkan/be/subback.html

全く同じものを置いても一覧表示出来ない・・
http://user.ftth100.com/mirrorhenkan/test/subback.html

改行コードその他見てみたのですが、全く同じみたいだし。
何でなんだろうか。



120 :名無しさん@勉強中 ★:05/08/15 12:27:19 ID:???
メモ
http://tubox.skr.jp/2chsv/

121 :名無しさん@勉強中 ★:05/08/16 13:09:51 ID:???
上で出したスクリプトを元にdat2htmlとヘッドラインを作ってみました

http://www.geocities.jp/mirrorhenkan/dat2html-3/

ちなみに
http://that3.2ch.net/test/read.cgi/gline/1118753283/321
に書いた「まあdatだけアップしてあってDLしないと読めない過去ログ倉庫」は
これ↓です

http://www.geocities.jp/kako_logs/

ここまで思い切った過去ログ倉庫だと、いっそ清々しい感じです。


ちなみに上のサイト
http://life7.2ch.net/test/read.cgi/kankon/1123025718/l50
の過去スレで当スクリプトを出した方が居たので
ググって見つかったのでした。

しかし、考えさせるスレだなー
こんな事してなきゃ 一生見なかったかもしれない。

122 :名無しさん@勉強中 ★:05/08/17 21:27:06 ID:???
やはりIEのみ対応だった・・。

しょうがないので
>>65のスクリプトをいじってみようかな
Operaでは動くみたいだし


それより
・・・php版の手直しが先かな  ?

123 :名無しさん@勉強中 ★:05/08/18 14:52:51 ID:???
長ーいdatばっかり置いたからもたつくように思えるので
dat2html-1でサンプルにしたdatも置いてみました。

http://www.geocities.jp/mirrorhenkan/dat2html-3/dat/read.html?key=1002458845

・・・なんだ、体感的には1よりもずっと早い感じじゃないか。

124 :名無しさん@勉強中 ★:05/08/19 20:13:17 ID:???
http://www.geocities.jp/mirrorhenkan/dat2html-3/
で、URLオートリンクを実装してみました。

正規表現面白いー。

125 :名無しさん@勉強中 ★:05/08/19 20:25:18 ID:???
http://www.geocities.jp/mirrorhenkan/dat2html.html
もURLリンクを実装しました。

正規表現ですが、通常のタイプはOKですが
かちゅ〜しゃ形式のdatでリンクさせるものは
正規表現変換の際 終点のデリミタがなかなか厄介そうです。

126 :名無しさん@勉強中 ★:05/08/19 21:27:56 ID:???
>>125
と思ったら出来ました

でもそろそろphp変換スクリプトに取りかかるべきか

127 :659:05/08/19 23:33:43 ID:syVM+YfW
>http://yy14.kakiko.com/test/read.cgi/mirror/1114936246/124-125n
これでレスのポップアップまで可能になれば
29chの感覚で見れるかもしれない

そういえば
http://www.geocities.jp/mirrorhenkan/を組み込んだ
新しい2ch専用ブラウザができたら面白い鴨
100%まじりっけなしの素人の勝手な妄想だけど
ここ数ヶ月の663サソの著しい成長を考えれば
そこにパントサソの技術力が加わればと思うと
あながち夢でもない気もするけどなあ

128 :659:05/08/19 23:34:07 ID:syVM+YfW
誤爆スマソorz

129 :名無しさん@勉強中:05/08/20 18:33:32 ID:Mw8/bBbJ
メモ
http://qb5.2ch.net/test/read.cgi/operate/1105909861/320
320 名前:動け動けウゴウゴ2ちゃんねる[sage] 投稿日:2005/08/06(土) 16:49:26 ID:ACS+63tT0
<dt>と<dl>にid付けて<dt id="dtレス番">、<dl id="dlレス番">みたいにして
例 <dt id="dt3">3 :<font color=green><b>名無し </b></font>:2005/08/06(土) 16:15:20 <dd id ="dd3"> ・・・・・・
IEで見たときにも>>レス番のポップアップするようにしてみたんだけどどうかな?

// レスポップアップ
function popAnchor() {
var evt = window.event.srcElement;
if ((evt.tagName == 'A') && (evt.title == "")) {
if (evt.innerText.search(/^>>(\d+)\-?(\d*)/) !=-1) { // ハイパーリンクなら
var st = RegExp.$1;
var ed = RegExp.$2;
if ((st > ed) || (ed == "")) {ed = st;} // 変なリンクチェック
if ((ed - st) > 5) {ed = eval(st) + 5;} // 5レス以上は5に
while (st <= ed) {
evt.title += document.getElementById('dt'+st).innerText + "\n" + document.getElementById('dd'+st).innerText + "\n\n"; // レス内容獲得
st ++;
}
}
}
}

document.onmouseover = popAnchor; // マウス監視

130 :名無しさん@勉強中 ★:05/08/20 23:44:50 ID:???
あらま
レスがついてるなんて

>>127-128誤爆にレス
レス番ポップアップは難しいですなぁ
javascriptで生成したhtmlにjavascriptを埋め込む訳だから
エスケープだの分離だので何が何だか

それと
自分がやってる事はほとんどJaneで実現されているor実現可能だと思いますよ
外部コマンドで変換スクリプトに飛ばす事もだけど
スクリプトを導入すれば
みみずん・makimo.toのどちらからも右クリックからdat取得出来るようになりますし

>>129
javascriptのエレメント要素とinnerHTMLはまだよくわかんない状態です
そんな状態で思うのも何ですが

・javascriptでhtml整形するスクリプトにはinnerHTMLを使っているのですが
 その中にさらにinnerHTMLを使って 有効なのかどうか
・上で挙げられたスクリプトはレス内容を獲得するところまでありますが
 それをポップアップ表示する命令がないみたい
 div要素とスタイルシートをつければいいのだろうか(←あてずっぽうです)

とりあえずやってみました(文中のAタグは小文字にしないとエラーが出ました)
・・・ポップアップしない。。どこを直せばいいのだろう??

http://www.geocities.jp/mirrorhenkan/dat2html-3/dat/test.html


ちなみにピタハハさんのスクリプトを代わりに埋め込んでみました。
・・・素晴らしい。

http://www.geocities.jp/mirrorhenkan/dat2html-3/dat/test_pita.html


上記のjavascriptを外部ファイルにして呼び出してもポップアップします

http://www.geocities.jp/mirrorhenkan/dat2html-3/dat/test_jslink.html

ただ、http://www.geocities.jp/mirrorhenkan/dat2html.htmlでもこの方式
(外部jsファイル呼び出し)にしたのですが、呼び出してくれません。
でも自動生成したhtmlファイルを保存して呼び出してみると、
ちゃんとポップアップしてくれます。何でだろ。
生成したものをいったんリフレッシュするスクリプトを埋め込んでも駄目した。。

あー愚痴みたい。
出来ても出来なくても大勢には影響の無い事だし、まあ適当にやってみるか。

131 :名無しさん@勉強中 ★:05/08/24 23:04:20 ID:???
あちこちのスレで「簡単だ」「すぐ出来る」という書き込みを散見するのに
ほとんど見かけない 通常dat→かちゅ〜しゃdatへのコンバータですが
誰も作ってくれないのなら やってみるか(かちゅ〜しゃ 入れてないけど)
まずはとりあえずjavascriptで。

今の所、レスアンカー以外は何とかなりました。
http://www.geocities.jp/mirrorhenkan/katu/


レスアンカーの正規表現もあちこちで勉強して
これ↓をこしらえてみました。

<a href="../test/read.cgi/([^/"]+?)/(\d+)/(\d+)" target="_blank">&gt;&gt;(\d{1,3})-?(\d{1,3})?</a>


さあ あと一息だ。

132 :名無しさん@勉強中 ★:05/08/24 23:12:53 ID:???
正規表現の探り当ては
http://www.geocities.jp/mirrorhenkan/regexp.html
のものをフィールドを拡げてやってみました。
考えた正規表現が正しいかどうか即座に反映されます

http://www.geocities.jp/mirrorhenkan/regexp.html

世の中、すごい人だらけです。



133 :名無しさん@勉強中:05/08/26 00:43:04 ID:le3q0vpZ
簡単にできるものなら誰かがとっくにやってそうなものだけど。
HTML→通常datの変換なんてもう何年も前に作られてるのに。
何が障害になってるんだろうね?

134 :名無しさん@勉強中 ★:05/08/26 01:40:07 ID:???
レスアンカーも何とかなりました
といっても「〜&st=○○&to=△△」の箇所が一考を要しますが


さて、URLの自動リンクが何故だかうまくいかないぞ。
エスケープ記号や何かが間違っておるのだろうか。

dat2html-1と3では成功してるのに何でだろうか
↓どちらもhttp://の自動リンクは効いておるというのに

http://www.geocities.jp/mirrorhenkan/dat2html.html
http://www.geocities.jp/mirrorhenkan/dat2html-3/dat/read.html?key=1002458845

135 :名無しさん@勉強中 ★:05/08/26 01:42:39 ID:???
>>133
やろうとする人が少なかっただけだと思うです(自分だって別にこれといって)
かちゅ〜しゃスレのにゃあさんが上手くいっているみたいです
正規表現さえ何とかなれば何だよなあ(自分も)

136 :名無しさん@勉強中 ★:05/08/26 02:35:11 ID:???
レスアンカーはやはり鬼門だ
&gt;1←これだけで引数も何も無しでリンクされるみたいだし

仕方ない、サーバ名だけではなくボード名キーb熾ハ個入力するしかなさそうだ
いや、スレのURLを入力してもらうほうがいいか

137 :名無しさん@勉強中 ★:05/08/26 10:48:39 ID:???
とりあえず形になったのでdatアップスレに書き込んでしまいましたが
「へっ 何やってんだ自分」とか思ったりして

あっちこっちのかちゅ〜しゃスレを覗くにつけ
ますますそう思ったりして

やはり かちゅ〜しゃ使いの人のほうが適任だったよなぁ とか思ったりして

138 :名無しさん@勉強中 ★:05/08/26 19:20:15 ID:???
作ったフォームで自分も変換してみました。
1001行ものテキストをフォームに貼り付けるだけでも2〜3分待つ感じです。
いつ変換が終わるのかわかるように、完了時にはアラートを出すようにしたです。
で、下窓のコピーも大変なので クリックしたら全選択するようにしました。

datアップスレでの ミラーにdatが存在するかちゅdatと
ミラーの生datを自前変換保存したdatを比較してみると
違いは>>136で書いた特殊なレスアンカーのみのようです。
そこをクリアすれば かちゅdatと全くほぼ同一のものが可能みたい。

引き続きやってみますか。




139 :名無しさん@勉強中:05/08/27 05:21:10 ID:Ye/HV6B+
p2.2chの古いdatの削除があったもよん

質問・雑談スレ171@運用情報板 ←p2 error: ご指定のDATはありませんでした
http://qb5.2ch.net/test/read.cgi/operate/1118196311/
1000 名前:動け動けウゴウゴ2ちゃんねる[] 投稿日:2005/06/09(木) 17:34:29 ID:VFo3Tyyx0

質問・雑談スレ172@運用情報板 ←datあった
http://qb5.2ch.net/test/read.cgi/operate/1118305656/
1000 名前:動け動けウゴウゴ2ちゃんねる[sage] 投稿日:2005/06/10(金) 14:21:47 ID:9DeP2wEo0

(2005/8/27) - (2005/6/10) = 78日?

140 :名無しさん@勉強中 ★:05/08/28 12:52:10 ID:???
「www.」で始まるURLの自動リンク化
変換結果を1クリックでクリップボードコピー実装(IEのみ)
メモ帳を開くボタン実装(IEのみ)

>>136の件も目星がつきました
ミラー変換スクリプトを一部使えばいいみたい
今夜にでもやってみようか

それにしてもdat2idxの作者である にゃあさん はどうされたのでしょうか。
まだリンク切れみたい
したらばログをかちゅ変換するdat2logも出しておられるのだから
2chdat変換もリリースされれば良いのに・・・
(「出来てます」という書き込みをされていたから)

>>139
あらま
ま 仕方無いです

141 :名無しさん@勉強中 ★:05/08/31 18:52:59 ID:???
かちゅdatコンバータですが
あとは全角数字のレス番にアンカーをつける事くらいです。
(「&gt;&gt;1」「&gt;1」「>>1」「>1」とか)

で・・・どうやればいいのだろうか。
一行だけでは無理なのだろうか?

今の所は、これ↓で代用していますが
(それぞれline[3]は本文内容・sp1/sp2/sp3はレスアンカーをつける為の変数)

line[3] = line[3].replace(/([^>\;]|^)(&gt;|&gt;&gt;|>|>>|≫)
([0-9]+)([^<-]|$)/g,"$1"+sp1+"$3"+sp2+"$3"+sp3+"$2$3<\/a>$4");

これだとレスアンカーは(他の所と同様に)うまく付きますが、
問題はURL部分でも全角数字がついてしまう事です。

例えば
http://that3.2ch.net/test/read.cgi/gline/1118753283/342
で出た全角数字のレスアンカーだと
「>1」を例にとると

<a href="http://that3.2ch.net/test/read.cgi?bbs=gline&key=1118753283
&st=1&to=1&nofirst=true" tartet="_blank">>1</a>

というようになってしまいます。

evalを使えばよいのかと思い、
正規表現の公報参照部分の「$3」を

eval("$3=$3.replace(\/1\/g,\"1\").replace(\/2\/g,\"2\").
replace(\/3\/g,\"3\").replace(/4/g,\"4\").replace(/5/g,\"5\").
replace(/6/g,\"6\").replace(/7/g,\"7\").replace(/8/g,\"8\").
replace(/9/g,\"9\")\;")

としましたが、エラーが出てしまいました。

どうしたもんか。一行では無理なのだろうか。
正規表現でマッチさせて マッチしたらfor文で全角数字部分を半角に変換させるしかないのだろうか。

正規表現スレやjavascript質問スレで聞いても厳しい返事しか返ってこないだろうしなぁ。



142 :名無しさん@勉強中 ★:05/08/31 19:05:22 ID:???
上の書き込み、何とも浮いている感じなので捕捉

正規表現については
http://moewe.xrea.jp/log/2004_08.html#d20040821
がすごくわかりやすいです。
これ読んで「あ、そうなのか なるほどなるほど」状態だったもので。

後方参照とかも、上のを見て
http://www.geocities.jp/mirrorhenkan/regexp.html
で色々試したら 目から鱗状態でした。

あと>>132はミスしてましたです。
元はこちら↓
http://wwwrsphysse.anu.edu.au/~mxk121/javascript/jsReplace.html

143 :名無しさん@勉強中 ★:05/09/01 11:23:24 ID:???
どうしてもわからないので
質問してみました。
http://pc8.2ch.net/test/read.cgi/tech/1062152374/916-918n


怒られたら、多分泣くことでしょう・・・。

144 :名無しさん@勉強中 ★:05/09/01 11:35:27 ID:???
・・まあ、返事が頂ければ儲けものという気構えでいるしかないですね。。
これ以上ウジウジとらわれていてもしょうがない。

145 :名無しさん@勉強中 ★:05/09/01 20:00:09 ID:???
http://jbbs.livedoor.jp/bbs/read.cgi/computer/21256/1116159529/146

うむ、その通りじゃ(´・ω・`)ショボーン

だが、すぐそっちにも書くと「マルチuzeeee」とか言われかねないので
一週間くらい待ってみますか。
そのうちに反応してくれる人も居るかもしれないですし。

146 :659:05/09/01 22:22:34 ID:yCHAAM7y
あらま
ハケーソされていたのですね(汗
一週間ですか
その間ににゃあサソと連絡がとれるといいですな

只今依頼の少ない専用ブラウザのdatファイルについて調査中しております
663サソに無茶なおながいをするかもしれませんが
支障のない範囲で協力していただけたら幸いです

147 :名無しさん@勉強中 ★:05/09/02 20:31:33 ID:???
ですね

でも
お願いされても多分出来る事は限られているでしょうし
何だか疲れちゃった

みんなパワーがあっていいなぁ

148 :名無しさん@勉強中 ★:05/09/03 17:21:01 ID:???
気をとり直して
p2で出力されるhtmlをdatにする正規表現でも考えてみますか。

まずはサンプル

<dt id="r■番号■">■■番号■■ :<span class="name"><b>■■名前■■</b></span>:■■メール欄■■ :■■日付・ID■■</dt>
<dd> ■■本文■■</dd>


149 :名無しさん@勉強中 ★:05/09/03 17:29:38 ID:???
ここでいきなり暗礁に乗り上げました。

日付・IDの項目ですが
何度も書き込んでいる人が居た場合
IDのところにタグがついてしまいます
(改行は適当)

2005/06/25(土) 09:56:12
(<a href="read.php?bbs=news4vip&
key=1119660972&
host=ex11.2ch.net&
ls=all&field=id&word=Dv5R%2BWaC0&
method=just&match=on&
idpopup=1&offline=1"
onMouseover="showHtmlPopUp
('read.php?bbs=news4vip&
key=1119660972&host=ex11.2ch.net&ls=all&field=id&word=Dv5R%2BWaC0&
method=just&match=on&idpopup=1&offline=1',event,0.2)"
onMouseout="offHtmlPopUp()">p</a>)
<a href="read.php?bbs=news4vip&key=1119660972&host=ex11.2ch.net&ls=all&field=id&word=Dv5R%2BWaC0&method=just&match=on&idpopup=1&offline=1">
ID:Dv5R+WaC0</a>(42)

とはいえ
ID無しのスレッドでもdat変換出来る訳ですから
特に問題無いのかもしれないですね

問題があった場合は・・・htmltodatをバージョンupしてもらうしかないのかも


150 :名無しさん@勉強中 ★:05/09/03 17:37:24 ID:???
あと
本文欄でも
URLのリンクが大変そうです

まあdat整形時には
URLの表示部分(「http://〜」)のみ取り出す訳だから
大丈夫なのかな

151 :名無しさん@勉強中 ★:05/09/03 18:55:53 ID:???
とりあえずこれらを総合して
htmltodatのreadme.txtと補足.txtを参照して
>>148の取り出したい部分を後方参照させると

<dt id="r??">$1 :<span class="name"><b>$2</b></span>:$3 :$4</dt>
<dd> $5</dd>

という事になるでしょうか。

ところで、readme.txtの
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
正規表現を作成する際は、m演算子を使ってm#hoge#の形式で
$1:レス番号
$2:メール欄
$3:名前・トリップ
$4:投稿日・ID
$5:レス内容
となるように設定します。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

の箇所なんですが
$2と$3は逆なのではないかな と思ったり。
こちらの勘違いなのだろうか・・


152 :名無しさん@勉強中 ★:05/09/03 19:03:18 ID:???
と書いたけど
sampleの正規表現を見てみると
こちらの勘違いみたいですね
バーカバーカ(←自分)

153 :名無しさん@勉強中 ★:05/09/04 19:48:02 ID:???
かちゅ〜しゃスレで動きがありましたが
もうどうでもいいです

書き込んだ自分の文章にまた凹んでしまったりしましたが
まあいいや

154 :名無しさん@勉強中 ★:05/09/05 02:33:58 ID:???
あ、私は元気ですよ
という程の事もないですけど
かちゅdatへのコンバータ 何とかうまくいってるみたいで良かったです

という訳で質問してみました
手ひどく叱られそうで怖いのです
http://pc8.2ch.net/test/read.cgi/php/1105930285/623-

あと今のところの問題は
上のスレで書いた事と
全角数字レスの処理なんだようなあ


155 :名無しさん@勉強中 ★:05/09/05 09:53:42 ID:???
メモ
http://snapshot.publog.net/dat.php?url=http://ex11.2ch.net/test/read.cgi/news4vip/1119660972/
http://snapshot.publog.net/html/news4vip/2005/06/25/095612.html

156 :名無しさん@勉強中 ★:05/09/05 16:28:47 ID:???
>>155のURLでならhtmltodatで変換出来そうなんですが
なかなか難しいです。。

ソースを見ると、本文がべたーっと改行なしで続いていますし
各番号に「<a name="#1"></a>」というのがあり これがまた厄介だ
レスアンカーもみんな「<a href="#1">&gt:&gt;1</a>」とかなってるし。

readmeを読むと
htmltodatにおいては「#」が正規表現の始端と終端の識別記号になってるそうなので
もしかしたら 作者さんに聞かないと お手上げかもしれない・・・


157 :名無しさん@勉強中 ★:05/09/05 18:36:13 ID:???
頭が煮詰まってどうしようもなくなってきたので
聞いてみました
http://jbbs.shitaraba.com/bbs/read.cgi/computer/1929/1038588508/182-


>>154はスルーされそうです・・・


158 :659:05/09/06 11:47:37 ID:FA2MTYjG
乙かれさまです
これからはその9もdatうpスレで対応させていただきます
>>157
志村!http://pc8.2ch.net/test/read.cgi/php/1105930285/629n
http://pc8.2ch.net/test/read.cgi/php/1105930285/629n

159 :名無しさん@勉強中 ★:05/09/06 18:28:19 ID:???
htmltodatの作者さんのお陰で
あっという間に解決しました
すごいなあ

>>158
という事で
偉いのは作者さんです
あとスレの件どうもです

dat2logですが
>>アルゴリズム的には完全な互換性を確保することも可能ですが
是非是非やってみて下さい下さい
少なくともjavascript版より激遅になる事もないでしょうし

まあここ見てなさそうなのでこんな事書いてるんですが

160 :名無しさん@勉強中 ★:05/09/06 19:13:02 ID:???
見てなさそうだろうついでに

http://mewnet.hp.infoseek.co.jp/
が、どのページを見てもinfoseekの広告が無いのですが
何をされたのでしょうか

広告免除の振り込みをしただけなのかな

161 :名無しさん@勉強中 ★:05/09/06 20:41:32 ID:???
やだなあ判ってますよ(独り言)

154の件は何とかなりました。
あとは全角数字のレスアンカー処理が解決出来れば・・・完成です

・・この前比較した時の差異は、そこだけだったので。

162 :名無しさん@勉強中 ★:05/09/07 06:46:56 ID:???
メモ

<script>
url = "http://hoge.com?bbs=hoge&st=551&to=552";
url = url.replace(/([0-9])/g, function(){return escape(arguments[1]).substr(5)});
document.write(url);
</script>

正規表現道場スレ631さんありがとうございます
すごいです
出来そうなので、うまくいってから書き込みたいと思います

163 :名無しさん@勉強中 ★:05/09/07 10:08:35 ID:???
<script>
url = "<a href=\"http://hoge.com?bbs=hoge&st=551&to=552\">&gt;551-552</a>";
url = url.replace(/([0-9])/g, function(){return escape(arguments[1]).substr(5)});
document.write(url);
</script>

ここからどうすればいいのだろうか

164 :名無しさん@勉強中 ★:05/09/07 17:49:49 ID:???
あともう一つバグがありました。

「&gt;156と&gt;157」等のように、レスナンバーが
くっついて書かれると、レスアンカーがつきません。
うーむ

165 :名無しさん@勉強中 ★:05/09/07 19:56:43 ID:???
際限無く質問してる感じで
何だかごめんなさいというしか

166 :名無しさん@勉強中 ★:05/09/08 10:12:54 ID:???
昨晩 datを javascript版コンバータでかちゅ〜しゃ変換して
手持ちのかちゅ〜しゃdatと比較してみたら
同一か 違っても1〜2箇所だったので
もう充分な気がしてきました。。
勿論 上で書いたような不具合が残っていますが
正規表現道場スレで質問したものですし、レスを頂けたら
余裕が出来た時に さらにバグを直すつもりではありますが。

とりあえず
試したdatを上げておきます(ただの自己満足ですが)
違いがあるかどうか・色々なブラウザで使えるかどうか試して頂ければ嬉しいな と
順番に、元スレ・元dat・(datアップスレで頂いた)かちゅ〜しゃdat です

http://life7.2ch.net/test/read.cgi/kankon/1120041586
http://www.geocities.jp/mirrorhenkan/katu/dat/2ch_1120041586.dat
http://www.geocities.jp/mirrorhenkan/katu/dat/k_1120041586.dat

http://anime.2ch.net/test/read.cgi/shar/1117720061
http://www.geocities.jp/mirrorhenkan/katu/dat/2ch_1117720061.dat
http://www.geocities.jp/mirrorhenkan/katu/dat/k_1117720061.dat

あと ファイルを比較するソフトはベクターからDLしたのですが
現在ページがなくなっています
READMEに「再配布は御自由に」との事なので、上げておきます
http://www.geocities.jp/mirrorhenkan/katu/dat/doldiff.lzh


167 :名無しさん@勉強中 ★:05/09/08 10:25:30 ID:???
それと
にゃあさんのお作りになられたdat2log(http://www.geocities.jp/mewtools/dat2log/)ですが
私の環境では ランタイムエラーが発生して 使えないです
(dat2idxは動くんだけどな)
まあ 時代遅れのPCを使っているから しょうがありませんなぁ
にゃあさんのページでも「〜での動作は保証いたしかねます」とあるし。
(因みにPC環境の詳細は・・・恥ずかしくて言えないレベルです)

ただ、<a>タグについては「>>」+半角数字だけ対応 との事なので
まだ今のところはjavascript版のほうがいいかもしれません。
早くバージョンアップして欲しいな と思ったりして。。

それにしても、HSPでもBregexp.dll使えるのになぁ・・
その橋渡しをするapがベクターにあるです。


168 :にゃあ:05/09/09 01:06:25 ID:Nj/yICzH
>>159
見てたりしますw

>>160
去年の夏、出張先からmewnet垢を覗いてみたら
でかでと貼られた広告の醜悪さに呆れました
普段はノートン先生でバナーベースの広告を全てカットしてるので
全く気づかずにいたのです
iswebでは有料アクセス解析を利用してたのですが
今年の春、無料の忍者ツールズへ乗り換えたので
その分の資金を広告免除へと回した、という次第です

>>167
ランタイムエラーですか。。。
dat2logもdat2idxも、使ってるモジュールは同じなのですけどもね。。。

ほよ〜
HSPからBREGEXP.DLLを利用できるのでつか?
耳寄りな情報をありがとうございます♪

169 :にゃあ:05/09/09 01:10:53 ID:7bdRABqZ
かちゅのレスアンカー仕様についてメモを書いておきます

かちゅ+kageでは、「>」と「&gt;」
半角数字と全角数字は等値と見なしているようです

test :
>>>>>2000

170 :にゃあ:05/09/09 01:13:25 ID:7bdRABqZ
>>169のテストで明らかなように
1個以上の「>」または「&gt;」の連続と
1個以上の半角数字または全角数字の連続が併置されると
かちゅ+kageでは、それをレスアンカーと見なします

171 :名無しさん@勉強中 ★:05/09/09 18:18:58 ID:???
>>168-170
うわ見てましたか(ってもういちいち驚いていられないですが)

dat2logですが、何度目かで何とか使えるようになりました。
>>166のものを変換したら・・・15分かかりましたです。。
(javascript版では7〜8分でしたが)

で思ったのですが、
元datに上書きする仕様みたいですが
元datを別名にして残すようにされたほうが良いのではないでしょうか。

あと、ニュー速vip等でよく使われる「wwwwwww」ですが
全部「<a href=http://www.wwww" target="_blank">wwwwwww</a>」
と変換されるようです。
多分、正規表現で「〜www\.〜」と、ドットをエスケープさせると解決するのでは
と愚考する次第。
あと もう見つけられたと思いますが
htpのBregexp.dllプラグインは
http://www.vector.co.jp/soft/win95/prog/se337635.html
ですー

172 :名無しさん@勉強中 ★:05/09/09 18:25:15 ID:???
レスアンカーの件ですが
此方では あと全角数字のレス番の処理が考え中です
URL表示部分を半角数字にしなければならないのですが
その正規表現がなかなかうまくいかない。
どうしてもわからないので、正規表現スレでいろいろ教わっています
「みんな何でこんなに優しいんだろ」と何だか申し訳なくなってきてます・・



173 :名無しさん@勉強中 ★:05/09/09 18:37:04 ID:???
せっかくなので、2点ほど伺わせて下さい

1.かちゅ〜しゃdatでは「あぼーん」「透明あぼーん」はどのように表示されるのでしょうか。

http://smile.poosan.net/mirrorhenkan/test/read.php/1046742687/70n
によるとそれぞれ
「あぼーん」←(一行にこれだけ)
「<><><><>」
のようですが・・。

2.改行コードについて

かちゅ〜しゃdatはcrlfだそうですが、lfでは読み込めないのでしょうか。
janeとかだと どちらでも良いみたいですが。

174 :名無しさん@勉強中 ★:05/09/09 18:45:11 ID:???
もう一つありました

3.「>>100-」等のように終端がないレス番は、かちゅ〜しゃdatではどう表現されますか?

175 :名無しさん@勉強中 ★:05/09/09 20:32:30 ID:???
・・あれ?
http://snapshot.publog.net/dat.php?url=http://live20.2ch.net/test/read.cgi/liveanb/1126241150/
が表示されないぞ

やはり
http://p2.chbox.jp/read.php?host=live20.2ch.net&bbs=liveanb&key=1126241150&ls=all
をhtmltodatで変換させないといけないのだろうか。

176 :にゃあ:05/09/10 00:28:44 ID:gsQKLVMp
ランタイムエラーの生じた原因が、おおよそつかめました
Speeeeed.exeの処理完了を検出するため
0.1秒ごとにSpeeeeed.exeの生成した一次ファイルの存否を確認し
一次ファイルの消滅をもってSpeeeeed.exeと判断しています
ところがNT系とWin9x系では、ファイル存否のタイミングが異なるため
実際には処理が完了していないにも拘わらず
処理完了と誤認して次の処理へ移行してしまい
これによりSpeeeeed.exeにエラーが生じて停止するようです
modoki.exeでも同様のトラブル報告があったのを思い出しました

変換元のdatファイルを別名で保存することについては、個人的に好みません
複数のファイルを変換する場合
原ファイルと変換後ファイルを手作業にて分別する必要があるからです
変換元フォルダと変換先フォルダを区別することについては検討したことがあるので
dat2logのメジャーバージョンアップをする際、この機能を追加しようと考えています

ご指摘のあった「wwwwwww」のリンクについては
仰有るようにピリオドをエスケープすることで解決しました
ご教示ありがとうございます

hspbre.dllは、ぐぐってみつけましたw
附属ドキュメントをざっと読んでみたところ、2 byte文字に関する記述が皆無です
この辺のところに不安を感じているのですが。。。
期待する置換結果を得るには、どのようにコーディングすればよいか
じっくりと試してみるつもりです

177 :にゃあ:05/09/10 00:29:45 ID:gsQKLVMp
レスアンカーについては、下記の通りです

(1) 鯖側のあぼーん
あぼーん<>あぼーん<>あぼーん<>あぼーん<>あぼーん
    ↓
<b>あぼーん</b>,あぼーん,あぼーん,あぼーん,

(2) かちゅ側のあぼ〜ん
虐殺マンセー♥<>sage<>05/09/09 22:00:00<>( ・∀・)<しぃを殺すのは虐殺ではない、駆除と言うのだw<>
    ↓
<b>透明あぼ〜ん</b>,透明あぼ〜ん,透明あぼ〜ん,,

(3) 終端なしのレスアンカー
>>100-
    ↓
<a href="http://www.nullpo.net/test/read.cgi?bbs=nullpo&key=0000000000&st=100&to=100" target="_blank">>>100</a>-

(3)の結果は、>>170にて示した定義により導かれます

178 :にゃあ:05/09/10 03:35:22 ID:L8Pi4xyy
うぎゃ。。。
>>177はなんかむちゃくちゃなレスですね
書き直します

ご質問の点ついては、下記の通りです

(1) あぼーん処理
 a. 鯖側のあぼーん
あぼーん<>あぼーん<>あぼーん<>あぼーん<>あぼーん
    ↓
<b>あぼーん</b>,あぼーん,あぼーん,あぼーん,

 b.かちゅ側のあぼ〜ん
虐殺マンセー?<>sage<>05/09/09 22:00:00<>( ・∀・)<しぃを殺すのは虐殺ではない、駆除と言うのだw<>
    ↓
<b>透明あぼ〜ん</b>,透明あぼ〜ん,透明あぼ〜ん,,

(2) LF型改行コードのdatファイル
一旦開いたdatファイルとidxファイルは
ウィンドウを閉じた際に上書き保存するというのがかちゅの仕様です
LF型改行コードのdatファイルを開く場合
CRLF型改行コードら変換してから表示し、CRLF型として再保存します

(3) 終端なしのレスアンカー
&gt;&gt;100-
    ↓
<a href="http://www.nullpo.net/test/read.cgi?bbs=nullpo&key=0000000000&st=100&to=100" target="_blank">&gt;&gt;100</a>-

(3)の結果は、>>170にて示した定義により導かれます

179 :にゃあ:05/09/10 04:11:48 ID:ChPRT1GY
ご報告です
全角数字がレスアンカーのURLに含まれている場合について、HSP上で実験したところ
次のようなtr構文を用いることにより成功しました

tr/&st=(0-9+)&to=(0-9+)\" target=\"_blank\">/&st=(0-9+)&to=(0-9+)\" target=\"_blank\">/kg

180 :名無しさん@勉強中 ★:05/09/10 18:54:52 ID:???
えーと

ランタイムエラーの件納得です
だから遅かった訳か

別名保存はやはり必要だと思いますが・・。
ちょっと意味が異なりますが、例えば何かのソフトやcgi等をDLして
それがzipだった場合、解凍したら元zipが消える仕様になっていたら・・・泣きます。

今回の自分の場合も、生datを(かちゅdatと区別する意味で)別名にしておいたのですが
変換すると レスアンカーのアドレスのキーbェおかしくなっていました。
で 元datは無くなって(というか書き換えられて)いるし makimo.toはなかなか繋がらないしで
難儀しました。
「手作業で分別」が大変との事ですが、拡張子を変換させれば何の事はないと思いますが・・。
まあ せめてフォルダ変更されては如何でしょうか

2byte文字の件ですが、delphiのbregexp.dllユニットのヘルプにも載ってませんので
大丈夫なのではないかと。

あぼーん設定とレスアンカーの件もどうもです
全角数字の変換もそんなに楽に出来るんですか
此方も 正規表現スレのほうで解答を頂いたので やってみようと思います

181 :名無しさん@勉強中 ★:05/09/10 19:25:27 ID:???
あれ?違ったかな
とにかく不正終了して 元datが残ってなかったです

あと、かちゅ〜しゃ変換したdatは
改行コードlfのままでも問題無いという事ですね?

dat2html-3を作っている時に
datテキストを一行づつ処理する訳ですが、
その際の分離記号でかなり悩み
結局 改行コードが原因だった事がありましたが
だから何だというのだろう(←一人ツッコミ)
ただ思い出しただけの事だったか・・。

・・とりあえず、crlf変換せずに保存しても無問題という訳ですね。

182 :にゃあ:05/09/11 02:15:50 ID:956OrO3n
dat2log 2.0はかなりいい感じでコーディングできました
beコードを変換する部分のみ未実装ですが
それ以外はかちゅのログとほぼ完全な互換性を確保しています
で、いままでは4行しかない手製のdatファイルで実験してたので
beから71287 byteのdatファイルをダウソして動作確認をしてみたら。。。

。・゚ ゚・(*>_<)・゚ ゚・。

原因不明の強制終了。。。
バッファサイズを調整してみたり、いろいろと手を尽くしましたが
ファイルサイズが大きくなると、正常に動作しないようです
hspbre.dll側の問題であると思われます

というわけで、HSP側で正規表現を試用することは取り止め
Speeeeed.exeをコマンドライン経由で制御するという従来の方針を継続することにし
最新バージョンdat2log 1.1を公開しました
EUCエンコードとbeコードに対応し、>>171でご指摘頂いたバグを解消しています

183 :にゃあ:05/09/11 02:20:42 ID:0D+a3FBn
元ファイルのバックアップ機能については、ごめんなさい。。。
変換先のフォルダを指定できるようにしました

2 byte文字の件については、修飾子「k」を使用することで解決できました

LF型改行コードのdatファイル読み込みについては、先述の通り無問題です

184 :にゃあ:05/09/11 17:57:08 ID:Z3KxwNgc
バグレポートです

http://www.geocities.jp/mirrorhenkan/トップページのURL生成に関する部分に
次のような誤りがあります

×
var sono4 = 'http:\/\/ 〜 +'/'+h;
var sono4a= 'http:\/\/ 〜 +'/'+h;


var sono4 = 'http:\/\/ 〜 +'/'+h+'/';
var sono4a= 'http:\/\/ 〜 +'/'+h+'/';

お手数ですが、修正して頂きますようお願いします

185 :名無しさん@勉強中 ★:05/09/11 18:34:00 ID:???
snapshotをhtmltodat化した奴をさらに整形する為の正規表現も必要だなぁ
解答頂いたスクリプトもまだ組み入れる余裕もないし

>>182-184
以前 ぜろちゃんねるスクリプトをbe用に改変した事がありますが
datについては文字コードがEUCなだけで 特に他のdatとの違いはありませんでした
IDの後にbeコードがありましたが、普通のプレーンテキストで
スクリプト側でそれを変換していましたが、
かちゅ〜しゃではその辺りはどうなっていますか?


バグレポートの件ですが、>>20を御覧下さい


http://mimizun.com:81/log/2ch/software/pc7.2ch.net/test/read.cgi/software/1005970423
×http://mimizun.com:81/log/2ch/software/pc7.2ch.net/test/read.cgi/software/1005970423/



186 :にゃあ:05/09/11 22:03:48 ID:H4Xtvu2u
>>185
おお、失礼しました
確かに、>>20のような現象が発生しますね
スレッドを熟読もせずに、申し訳ありませんでした
でも、みみずんタソったら。。。w

かちゅにおけるbeコードの処理は、やはり独特です
正規表現式はこんな感じになるでしょう

<a href=javascript:w=window.open\('http://(.+?)&u=d:([^>]+)>(.+?)</a>
      ↓
<a href= http://$1&u=d: >$3</a>

<BE:(\d+?):(\d+?)><>
      ↓
<:$1>Lv.$2<>

(.*?)<>(.*?)<>(.*?)BE:(\d+?)-
      ↓
<b>$1,$2,$3<:$4>?

187 :にゃあ:05/09/11 22:10:05 ID:jVXVl9KR
おっと、半角スペースが消えてるw

<a href=javascript:w=window.open\('http://(.+?)&u=d:([^>]+)>(.+?)</a>
      ↓
<a href=半角スペース26個http://$1&u=d:半角スペース39個>$3</a>

<BE:(\d+?):(\d+?)><>
      ↓
<:$1>Lv.$2<>

(.*?)<>(.*?)<>(.*?)BE:(\d+?)-
      ↓
<b>$1,$2,$3<:$4>?

188 :名無しさん@勉強中 ★:05/09/12 19:05:40 ID:???
まあ色々ありますわな
それにしてもjavascriptというのは
ソース丸出しだもんで何とも恥ずかしいもんだわい
大した事してないのバレバレ

なのに何故かこことモナメントと偽モナメントが登録されている・・
659さんの板もだ。いつ登録されたんだろう?
 →http://hima2908.hp.infoseek.co.jp/2channel.txt
まあ2ch関連の板を網羅しようという事なんでしょうか。
ここ(http://hima2908.hp.infoseek.co.jp/)のボード一覧、
専用ブラウザ入れたての時に使わせてもらったっけなぁ

be用のコンバータもやってみようかな
とふと思ったけど、車輪の再発明以上のものにはなりそうにないのでやめます。
(この言葉 尊敬するお方のパクリです)
そもそもかちゅ〜しゃ入れてないですし


189 :名無しさん@勉強中 ★:05/09/13 17:57:00 ID:???
さて
snapshotにしか無いスレをhtmltodatで変換したものを
専用ブラウザで読む時の不具合を取り除こうとしています。

htmltodatで変換する正規表現は
http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/187-190n
で 作者さんから教えて頂きました。

上ので変換したdatの不具合についてですが、
作者さんも言われるように

(1) 名前欄とメール欄の切り分けが出来ずに名前欄に二つともついてしまっている

(2) >>149で見たように、日付けとIDの間にjavascriptのコードが挟まれていて
 専用ブラウザだと夥しい量のゴミがついてしまっている(偽モナメントだと大丈夫ですが)
 あと IDの後に「</a><2>」のようなものが付いている

(3) IDの後にbeコードのjavascriptが付いている

(4) 本文の「http://」の前に「(p)」が付いている

(5) レスアンカーのリンクが全部消えている

このうち(4)は簡単な正規表現で対処可能です。
(5)は(少なくとも)janeでは無問題。

問題は(1)〜(3)です。
(達人なら「問題」でも何でもないんでしょうけど)

190 :名無しさん@勉強中 ★:05/09/13 18:40:52 ID:???
とりあえず、(2)の処理を考えてみましょう。

いっぺんに置換する正規表現を少し考えてみたのですが
何せヘタレゆえ すぐには無理
細切れに 合致する箇所を取り除いてみようかと。

delphiで作れば勉強にもなって一石二鳥ですが
何せヘタレゆえ すぐには無理
フリーで配布されている正規表現可能なソフトを使わせて頂こうかと。
但し 処理項目が3〜40くらいになるので、編集上限20のSpeeeeedでは無理です
別のソフトで やってみますか。

191 :謎の通りすがり:05/09/13 19:28:05 ID:/Ul102+A
(2)ですが、IDの後の余分なものは実際にはhtmltodatで取り除けるのですが
IDなし板の場合のHTMLではどのような形式になるのかわからなかったので
記述を省略しました。
日付とIDの間の余分なものですが、結局はほとんどがHTMLタグだったり
するので、個別の要素にはこだわらず全部一括で取り除くアプローチのほうが
簡単なような気がします。
(perlの正規表現ならgスイッチというのを使えば簡単にできるのですが
他でできるかはわかりません)


192 :謎の通りすがり:05/09/13 19:37:45 ID:/Ul102+A
> (5)は(少なくとも)janeでは無問題。
たいていの2ch用ブラウザでは問題ないはずです。
逆に、アンカータグがついているとレス番ポップアップがうまくいかない
ブラウザがあり、わざわざ除去する機能をつけたという経緯があります。
(readme参照)

193 :謎の通りすがり:05/09/13 20:00:20 ID:/Ul102+A
個人的には一番厄介ぽいのは(1)かなと考えます。
(「名前欄とメール欄の切り分けが出来ずに名前欄に二つともついてしまっている」ではなく「日付欄に二つともついてしまっている」が正しいですが)
というのは、メール欄がHTML要素で区切られておらず単に全角コロンで
区切られているだけなので、「ここがメール欄である」ことを確定すること
が論理的に不可能だからです。
とはいえ、現実には問題となるのは「メール欄の中自体に全角コロンが
含まれる」というレアケースだけなので、そこを割り切ってしまえば
perlで書けば
s/<><>(.*?):/<>\1<>/
みたいなひっくり返しをするだけで済む話なのかもしれません。

194 :にゃあ:05/09/13 22:19:28 ID:9qVgIGss
手許にあるログを比較して、beコードに関するオリジナルdatとかちゅログの相違点をまとめてみました

be.2ch.net/be (旧形式)
<a href=/test/p.php?i=9860148 target=_blank>?</a>
<a href=/test/p.php?i=12324858 target=_blank>?*</a>
かちゅ〜しゃ
<a href=/test/p.php?i=9860148 target=_blank>?</a>
<a href=/test/p.php?i=12324858 target=_blank>?*</a>

be.2ch.net/be (現形式)
<BE:289693477:0><>
<BE:99540353:4><>
かちゅ〜しゃ
<:232271257>Lv.0,
<:99540353>Lv.4,

qa.2ch.net/argue (旧形式)
<a href=javascript:w=window.open('http://be.2ch.net/test/p.php?i=243874&u=d:'+document.URL);if(w)w.focus();void(0);>? </a>
<a href=javascript:w=window.open('http://be.2ch.net/test/p.php?i=76234&u=d:'+document.URL);if(w)w.focus();void(0);>?##</a>
かちゅ〜しゃ
<a href= http://be.2ch.net/test/p.php?i=243874&u=d: >? </a>
<a href= http://be.2ch.net/test/p.php?i=76234&u=d: >?##</a>

qa.2ch.net/argue (現形式)
BE:262437375- <>
BE:85638274-##<>
かちゅ〜しゃ
<:262437375>? ,
<:85638274>?##,

195 :にゃあ:05/09/13 22:26:34 ID:ec4Oy5eD
現在、かちゅ〜しゃのログをteri型または旧型datに変換するツールを開発中ですが
beコードに関する処理は、Speeeeed.exeにて次のように行っています

<:(\d+?)>Lv.(\d+?),[tab]<BE:$1:$2>,[tab]E
<a href=半角スペース26個http://(.+?)/test/p.php\?i=(\d+?)&u=d:半角スペース39個>\?(.*?)</a>[tab]
<a href=javascript:w=window.open\('http://be.2ch.net/test/p.php\?i=$1&u=d:'+document.URL\);if\(w\)w.focus\(\);void\(0\);>\?$2</a>[tab]E
<:(\d+?)>\?(.*?),[tab]BE:$1-$2,[tab]E


196 :名無しさん@勉強中 ★:05/09/14 19:50:59 ID:???
>>191-193
・・・のけぞりました。

それはさておき、ヒント(というか答え)をありがとうございます。
(2)は一括で取り除き、(1)はそのまま使わせて頂きました。
意外に (3)のbe処理が何だか色々あって厄介でした。

で、5つの正規表現で何とか処理出来た感じです。
フリーで使わせて頂ける置換ソフトでやってみたのですが
自分の環境では問題無いです
「再配布可能」との事なので、同梱させて頂きました。
http://www.geocities.jp/mirrorhenkan/snapshot/snapshot2dat.zip
もし良かったら試して頂けないでしょうか。(>all)

ほんとに驚きましたです。
これからも宜しくお願い致します。

197 :名無しさん@勉強中 ★:05/09/14 19:55:59 ID:???
>>194-195
659さんの所で拝見した時に判った事実に
これまたのけぞりましたが
その 別方面でのまとめサイトで その技術が活かされている訳ですね。
確かに beコード付きのかちゅdatを 通常datに変換するコンバータは無さそうですし。


198 :名無しさん@勉強中 ★:05/09/15 19:03:41 ID:???
http://ex13.2ch.net/test/read.cgi/gline/1118753283/390
にあるsnapshot(というか「p2.chbox.jp〜」のスレのみ
先頭に「http://」末尾に「/all」を付け加え、簡単なhtmlリンクを作って
一つ一つDLして、htmltodatで一括変換してみたところ(タイトルが違うのは承知の上です)
8スレ中 dat変換に成功したのは3スレのみでした。。
・・何故なのでしょう?(いや、別に頼っている訳ではないのですが・・)

対象スレ:
(1)http://p2.chbox.jp/read.php?url=http://news19.2ch.net/test/read.cgi/newsplus/1126372408/all
(2)http://p2.chbox.jp/read.php?url=http://news19.2ch.net/test/read.cgi/newsplus/1126372282/all
(3)http://p2.chbox.jp/read.php?url=http://news19.2ch.net/test/read.cgi/newsplus/1126368731/all
(4)http://p2.chbox.jp/read.php?url=http://news19.2ch.net/test/read.cgi/newsplus/1126372069/all
(5)http://p2.chbox.jp/read.php?url=http://news19.2ch.net/test/read.cgi/newsplus/1126378029/all
(6)http://p2.chbox.jp/read.php?url=http://news19.2ch.net/test/read.cgi/newsplus/1126166580/all
(7)http://p2.chbox.jp/read.php?url=http://news19.2ch.net/test/read.cgi/newsplus/1126363579/all
(8)http://p2.chbox.jp/read.php?url=http://news19.2ch.net/test/read.cgi/news/1126373580/all

このうち、dat変換に成功したのは(1)(2)(6)でした。


199 :名無しさん@勉強中 ★:05/09/15 19:12:11 ID:???
で、dat変換に成功した3スレを>>196で出した変換ソフトで一括置換して
janeで読み込んでみましたが、どうやら問題無いみたいです。
偽モナメントに上げて 読み込んでみましたが、やはり問題無いみたいです。やったー。

それにしても、タイトル部分の「newsplus/ タイトル」というスタイルですが
http://best-thread.xrea.jpに似ています。(あちらは「[newsplus] 本文」のスタイルですが)
一つ一つ変えているのでしょうか。

にしても 変換されないのは・・・うーん。

200 :名無しさん@勉強中 ★:05/09/15 20:56:32 ID:???
と思ったのですが、早速駄目でした

http://p2.chbox.jp/read.php?url=http://news19.2ch.net/test/read.cgi/newsplus/1126368731/all

1の「文:ぽこたん( ・∀・ ))」のコロン(「:」)に反応してしまってるみたいです・・
http://user.ftth100.com/mirrorhenkan/test/read.php?key=1126372408&st=1&to=1001

201 :名無しさん@勉強中 ★:05/09/15 21:29:50 ID:???
リンク間違いです
http://p2.chbox.jp/read.php?url=http://news19.2ch.net/test/read.cgi/newsplus/1126372408/all

http://user.ftth100.com/mirrorhenkan/test/read.php?key=1126372408&st=1&to=1001
です

>>200の件ですが
「最短一致」ってどうやるんだったかなー
まだ正規表現のやり方 よくわかんないです
ちなみに ない頭を絞って捻出した正規表現は↓です(4個目と5個目は一緒にした方がいいなぁ)

s/(\(<a href=\"read.php)([^:]+?)ID:([^<]+?)(<\/a>\(\d+\))/ID:$3/g
s/(\(p\))(h?ttp://)/$2/g
s/(<><>)(.*?)( :)/<>$2<>/g
s/(\(<a href=\"http:\/\/be.2ch.net/test/p.php\?i=)(\d+)&u=(.+?)\?\#*<\/a> ?<>/BE:$2-#<>/g
s/(\(<a href=\'http:\/\/be.2ch.net/test/p.php\?i=)(\d+)&u=(.+?)\?\#*<\/a> ?<>/BE:$2-#<>/g

今日は
ケアレスミスばかりだ

202 :名無しさん@勉強中 ★:05/09/16 17:46:38 ID:???
>>198の dat変換出来なかったスレですが、
変換途中で止まった行と発言番号(?)の箇所を見てみると
例えばこういうタグがありました。(そのまま出るかどうか判りませんが)
改行は適当です

<dd id="q342of1126368731" class="respopup"
onMouseover="showResPopUp('q342of1126368731',event)"
onMouseout="hideResPopUp('q342of1126368731')">
<i>342 :<b>名無しさん@そうだ選挙に行こう </b> :2005/09/11(日)
13:52:04 (<a href="read.php?bbs=newsplus&key=1126368731&
host=news19.2ch.net&ls=all&field=id&word=kQNBKyf50&
method=just&match=on&idpopup=1&offline=1"
onMouseover="showHtmlPopUp('read.php?bbs=newsplus&
key=1126368731&host=news19.2ch.net&ls=all&
field=id&word=kQNBKyf50&method=just&
match=on&idpopup=1&offline=1',event,0.2)"
onMouseout="offHtmlPopUp()">p</a>)
<a href="read.php?bbs=newsplus&key=1126368731&
host=news19.2ch.net&ls=all&field=id&
word=kQNBKyf50&method=just&match=on&
idpopup=1&offline=1">ID:kQNBKyf50</a>
(3)<br> なんか弁理士さんサイトでアドバイスくれてなかった?
<br> どこだっけ <br>
</i></dd>

レスアンカーのポップアップをしている箇所みたいです。
これらが
(3)だと発言番号7の下に
(5)だと発言番号732と733に
(7)だと発言番号162に
同じようにタグがあり、それらを除去すると 最後まで変換されました。

つまり
「<dd id=" 〜 (中略) 〜 </i></dd>」
の部分が 邪魔になっているようです。

これは 手動で取り除くしか無さそうな感じですが・・・どうしましょう。

203 :名無しさん@勉強中 ★:05/09/16 17:53:53 ID:???
ちなみに
(4)は何の変換もせずにエラーが出たので
htmlの最初のあたりの<table>〜</table>をごっそり取り去ると
何故かエラーが出なくなりました。
あと(8)は何の問題も無く変換出来ました(昨日は駄目だったのに)

メール欄と日付を切り分ける正規表現も
考え直してやってみたら うまくいった感じです。
「メール欄で会話するスレ」関係もやってみましたが
不具合は無さそうです。
(せっかく変換したので 偽モナメントに上げてみました)
いやー 嬉しいなあ。


204 : ◆/vmukiyuzw :05/09/16 19:23:54 ID:6Ag13ksh
>>198
dat変換に失敗する原因がわかりました。
ここに書いてもいいんですが、情報が分散してしまうのはあまり好ましく
ないと思うので、お手数ですが再度うちの掲示板の方で質問して頂けないでしょうか。

あと、(1)〜(8)のHTMLを眺めているうちに、名前欄の中に数字が含まれる
ケースでもリンクが貼られてp2コードが付加されるケースが散見されました。
((4)の307他)
これも後処理で考慮されたほうがいいかもしれません。

205 :名無しさん@勉強中 ★:05/09/16 19:49:19 ID:???
あ、すみませんです・・。

では>>198をhtmltodatサポート板へ貼らせて頂きます。

206 :名無しさん@勉強中 ★:05/09/16 20:05:26 ID:???
あと
ここのURLを出しても全然構わなかったのですが
何だか宣伝してるみたいで何なので 控えました。。

207 : ◆/vmukiyuzw :05/09/16 22:07:25 ID:6Ag13ksh
回答しておきました。

> つまり
> 「<dd id=" 〜 (中略) 〜 </i></dd>」
> の部分が 邪魔になっているようです。
>
> これは 手動で取り除くしか無さそうな感じですが・・・どうしましょう。

まさにそのとおりでしたが・・・取り除くのはそんな難しいですか?
行単位で扱えるエディタやツールなら「<dd id=」で始まる行を取り除くのは
普通にできる気がするのですが。ちなみに私は秀丸で取り除きました。
</i></dd>の部分は改行の後ですが大して容量取ってないので残してても
特に問題ないと思います。

208 :にゃあ:05/09/17 10:31:49 ID:7ejWEA/J
>>187をSpeeeeed.exeでの定義に書き換えておきます

<BE:(\d+?):(\d+?)>,[tab]<:$1>Lv.$2,[tab]E[改行]
<a href=javascript:w=window.open\('http://(.+?)&u=d:([^>]+)>(.+?)</a>[tab]
<a href=半角スペース26個http://$1&u=d:半角スペース39個>$3</a>[tab]E
BE:(\d+?)-(#*?),[tab]<:$1>?$2,[tab]E[改行]


209 :名無しさん@勉強中 ★:05/09/17 20:42:18 ID:???
>>207
ありがとうございます。
気力があれば 今夜試してみたいと思います。
・・・雑談スレで書き過ぎて疲れちゃった。。

>>208
ありがとうございます
自分のコンバータに手を加える時(っていつの話だ) 参考にさせて頂きます
(というか にゃあさんがお書きになられた物しか 手に入る情報は 無いのです)

210 :名無しさん@勉強中 ★:05/09/18 13:17:04 ID:???
メモ

s/^(<dd id=\"q)(.*?)$//g
s/^</i></dd>$//g

手が空いたら組み入れてみます。

500KB
続きを読む

掲示板に戻る 全部 前100 次100 最新50
名前: E-mail(省略可)

0ch BBS 2006-02-27