楽天モバイル[UNLIMITが今なら1円] ECナビでポインと Yahoo 楽天 LINEがデータ消費ゼロで月額500円〜!


無料ホームページ 無料のクレジットカード 海外格安航空券 解約手数料0円【あしたでんき】 海外旅行保険が無料! 海外ホテル
告知欄です


■掲示板に戻る■ 全部 1- 101- 201- 301- 401- 501- 601- 701- 最新50
メモ

1 :663:05/05/01 17:30:46 ID:boieiukf
思いついた事など

132 :名無しさん@勉強中 ★:05/08/24 23:12:53 ID:???
正規表現の探り当ては
http://www.geocities.jp/mirrorhenkan/regexp.html
のものをフィールドを拡げてやってみました。
考えた正規表現が正しいかどうか即座に反映されます

http://www.geocities.jp/mirrorhenkan/regexp.html

世の中、すごい人だらけです。



133 :名無しさん@勉強中:05/08/26 00:43:04 ID:le3q0vpZ
簡単にできるものなら誰かがとっくにやってそうなものだけど。
HTML→通常datの変換なんてもう何年も前に作られてるのに。
何が障害になってるんだろうね?

134 :名無しさん@勉強中 ★:05/08/26 01:40:07 ID:???
レスアンカーも何とかなりました
といっても「〜&st=○○&to=△△」の箇所が一考を要しますが


さて、URLの自動リンクが何故だかうまくいかないぞ。
エスケープ記号や何かが間違っておるのだろうか。

dat2html-1と3では成功してるのに何でだろうか
↓どちらもhttp://の自動リンクは効いておるというのに

http://www.geocities.jp/mirrorhenkan/dat2html.html
http://www.geocities.jp/mirrorhenkan/dat2html-3/dat/read.html?key=1002458845

135 :名無しさん@勉強中 ★:05/08/26 01:42:39 ID:???
>>133
やろうとする人が少なかっただけだと思うです(自分だって別にこれといって)
かちゅ〜しゃスレのにゃあさんが上手くいっているみたいです
正規表現さえ何とかなれば何だよなあ(自分も)

136 :名無しさん@勉強中 ★:05/08/26 02:35:11 ID:???
レスアンカーはやはり鬼門だ
>1←これだけで引数も何も無しでリンクされるみたいだし

仕方ない、サーバ名だけではなくボード名キーb熾ハ個入力するしかなさそうだ
いや、スレのURLを入力してもらうほうがいいか

137 :名無しさん@勉強中 ★:05/08/26 10:48:39 ID:???
とりあえず形になったのでdatアップスレに書き込んでしまいましたが
「へっ 何やってんだ自分」とか思ったりして

あっちこっちのかちゅ〜しゃスレを覗くにつけ
ますますそう思ったりして

やはり かちゅ〜しゃ使いの人のほうが適任だったよなぁ とか思ったりして

138 :名無しさん@勉強中 ★:05/08/26 19:20:15 ID:???
作ったフォームで自分も変換してみました。
1001行ものテキストをフォームに貼り付けるだけでも2〜3分待つ感じです。
いつ変換が終わるのかわかるように、完了時にはアラートを出すようにしたです。
で、下窓のコピーも大変なので クリックしたら全選択するようにしました。

datアップスレでの ミラーにdatが存在するかちゅdatと
ミラーの生datを自前変換保存したdatを比較してみると
違いは>>136で書いた特殊なレスアンカーのみのようです。
そこをクリアすれば かちゅdatと全くほぼ同一のものが可能みたい。

引き続きやってみますか。




139 :名無しさん@勉強中:05/08/27 05:21:10 ID:Ye/HV6B+
p2.2chの古いdatの削除があったもよん

質問・雑談スレ171@運用情報板 ←p2 error: ご指定のDATはありませんでした
http://qb5.2ch.net/test/read.cgi/operate/1118196311/
1000 名前:動け動けウゴウゴ2ちゃんねる[] 投稿日:2005/06/09(木) 17:34:29 ID:VFo3Tyyx0

質問・雑談スレ172@運用情報板 ←datあった
http://qb5.2ch.net/test/read.cgi/operate/1118305656/
1000 名前:動け動けウゴウゴ2ちゃんねる[sage] 投稿日:2005/06/10(金) 14:21:47 ID:9DeP2wEo0

(2005/8/27) - (2005/6/10) = 78日?

140 :名無しさん@勉強中 ★:05/08/28 12:52:10 ID:???
「www.」で始まるURLの自動リンク化
変換結果を1クリックでクリップボードコピー実装(IEのみ)
メモ帳を開くボタン実装(IEのみ)

>>136の件も目星がつきました
ミラー変換スクリプトを一部使えばいいみたい
今夜にでもやってみようか

それにしてもdat2idxの作者である にゃあさん はどうされたのでしょうか。
まだリンク切れみたい
したらばログをかちゅ変換するdat2logも出しておられるのだから
2chdat変換もリリースされれば良いのに・・・
(「出来てます」という書き込みをされていたから)

>>139
あらま
ま 仕方無いです

141 :名無しさん@勉強中 ★:05/08/31 18:52:59 ID:???
かちゅdatコンバータですが
あとは全角数字のレス番にアンカーをつける事くらいです。
(「>>1」「>1」「>>1」「>1」とか)

で・・・どうやればいいのだろうか。
一行だけでは無理なのだろうか?

今の所は、これ↓で代用していますが
(それぞれline[3]は本文内容・sp1/sp2/sp3はレスアンカーをつける為の変数)

line[3] = line[3].replace(/([^>\;]|^)(>|>>|>|>>|≫)
([0-9]+)([^<-]|$)/g,"$1"+sp1+"$3"+sp2+"$3"+sp3+"$2$3<\/a>$4");

これだとレスアンカーは(他の所と同様に)うまく付きますが、
問題はURL部分でも全角数字がついてしまう事です。

例えば
http://that3.2ch.net/test/read.cgi/gline/1118753283/342
で出た全角数字のレスアンカーだと
「>1」を例にとると

<a href="http://that3.2ch.net/test/read.cgi?bbs=gline&key=1118753283
&st=1&to=1&nofirst=true" tartet="_blank">>1</a>

というようになってしまいます。

evalを使えばよいのかと思い、
正規表現の公報参照部分の「$3」を

eval("$3=$3.replace(\/1\/g,\"1\").replace(\/2\/g,\"2\").
replace(\/3\/g,\"3\").replace(/4/g,\"4\").replace(/5/g,\"5\").
replace(/6/g,\"6\").replace(/7/g,\"7\").replace(/8/g,\"8\").
replace(/9/g,\"9\")\;")

としましたが、エラーが出てしまいました。

どうしたもんか。一行では無理なのだろうか。
正規表現でマッチさせて マッチしたらfor文で全角数字部分を半角に変換させるしかないのだろうか。

正規表現スレやjavascript質問スレで聞いても厳しい返事しか返ってこないだろうしなぁ。



142 :名無しさん@勉強中 ★:05/08/31 19:05:22 ID:???
上の書き込み、何とも浮いている感じなので捕捉

正規表現については
http://moewe.xrea.jp/log/2004_08.html#d20040821
がすごくわかりやすいです。
これ読んで「あ、そうなのか なるほどなるほど」状態だったもので。

後方参照とかも、上のを見て
http://www.geocities.jp/mirrorhenkan/regexp.html
で色々試したら 目から鱗状態でした。

あと>>132はミスしてましたです。
元はこちら↓
http://wwwrsphysse.anu.edu.au/~mxk121/javascript/jsReplace.html

143 :名無しさん@勉強中 ★:05/09/01 11:23:24 ID:???
どうしてもわからないので
質問してみました。
http://pc8.2ch.net/test/read.cgi/tech/1062152374/916-918n


怒られたら、多分泣くことでしょう・・・。

144 :名無しさん@勉強中 ★:05/09/01 11:35:27 ID:???
・・まあ、返事が頂ければ儲けものという気構えでいるしかないですね。。
これ以上ウジウジとらわれていてもしょうがない。

145 :名無しさん@勉強中 ★:05/09/01 20:00:09 ID:???
http://jbbs.livedoor.jp/bbs/read.cgi/computer/21256/1116159529/146

うむ、その通りじゃ(´・ω・`)ショボーン

だが、すぐそっちにも書くと「マルチuzeeee」とか言われかねないので
一週間くらい待ってみますか。
そのうちに反応してくれる人も居るかもしれないですし。

146 :659:05/09/01 22:22:34 ID:yCHAAM7y
あらま
ハケーソされていたのですね(汗
一週間ですか
その間ににゃあサソと連絡がとれるといいですな

只今依頼の少ない専用ブラウザのdatファイルについて調査中しております
663サソに無茶なおながいをするかもしれませんが
支障のない範囲で協力していただけたら幸いです

147 :名無しさん@勉強中 ★:05/09/02 20:31:33 ID:???
ですね

でも
お願いされても多分出来る事は限られているでしょうし
何だか疲れちゃった

みんなパワーがあっていいなぁ

148 :名無しさん@勉強中 ★:05/09/03 17:21:01 ID:???
気をとり直して
p2で出力されるhtmlをdatにする正規表現でも考えてみますか。

まずはサンプル

<dt id="r■番号■">■■番号■■ :<span class="name"><b>■■名前■■</b></span>:■■メール欄■■ :■■日付・ID■■</dt>
<dd> ■■本文■■</dd>


149 :名無しさん@勉強中 ★:05/09/03 17:29:38 ID:???
ここでいきなり暗礁に乗り上げました。

日付・IDの項目ですが
何度も書き込んでいる人が居た場合
IDのところにタグがついてしまいます
(改行は適当)

2005/06/25(土) 09:56:12
(<a href="read.php?bbs=news4vip&
key=1119660972&
host=ex11.2ch.net&
ls=all&field=id&word=Dv5R%2BWaC0&
method=just&match=on&
idpopup=1&offline=1"
onMouseover="showHtmlPopUp
('read.php?bbs=news4vip&
key=1119660972&host=ex11.2ch.net&ls=all&field=id&word=Dv5R%2BWaC0&
method=just&match=on&idpopup=1&offline=1',event,0.2)"
onMouseout="offHtmlPopUp()">p</a>)
<a href="read.php?bbs=news4vip&key=1119660972&host=ex11.2ch.net&ls=all&field=id&word=Dv5R%2BWaC0&method=just&match=on&idpopup=1&offline=1">
ID:Dv5R+WaC0</a>(42)

とはいえ
ID無しのスレッドでもdat変換出来る訳ですから
特に問題無いのかもしれないですね

問題があった場合は・・・htmltodatをバージョンupしてもらうしかないのかも


150 :名無しさん@勉強中 ★:05/09/03 17:37:24 ID:???
あと
本文欄でも
URLのリンクが大変そうです

まあdat整形時には
URLの表示部分(「http://〜」)のみ取り出す訳だから
大丈夫なのかな

151 :名無しさん@勉強中 ★:05/09/03 18:55:53 ID:???
とりあえずこれらを総合して
htmltodatのreadme.txtと補足.txtを参照して
>>148の取り出したい部分を後方参照させると

<dt id="r??">$1 :<span class="name"><b>$2</b></span>:$3 :$4</dt>
<dd> $5</dd>

という事になるでしょうか。

ところで、readme.txtの
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
正規表現を作成する際は、m演算子を使ってm#hoge#の形式で
$1:レス番号
$2:メール欄
$3:名前・トリップ
$4:投稿日・ID
$5:レス内容
となるように設定します。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

の箇所なんですが
$2と$3は逆なのではないかな と思ったり。
こちらの勘違いなのだろうか・・


152 :名無しさん@勉強中 ★:05/09/03 19:03:18 ID:???
と書いたけど
sampleの正規表現を見てみると
こちらの勘違いみたいですね
バーカバーカ(←自分)

153 :名無しさん@勉強中 ★:05/09/04 19:48:02 ID:???
かちゅ〜しゃスレで動きがありましたが
もうどうでもいいです

書き込んだ自分の文章にまた凹んでしまったりしましたが
まあいいや

154 :名無しさん@勉強中 ★:05/09/05 02:33:58 ID:???
あ、私は元気ですよ
という程の事もないですけど
かちゅdatへのコンバータ 何とかうまくいってるみたいで良かったです

という訳で質問してみました
手ひどく叱られそうで怖いのです
http://pc8.2ch.net/test/read.cgi/php/1105930285/623-

あと今のところの問題は
上のスレで書いた事と
全角数字レスの処理なんだようなあ


155 :名無しさん@勉強中 ★:05/09/05 09:53:42 ID:???
メモ
http://snapshot.publog.net/dat.php?url=http://ex11.2ch.net/test/read.cgi/news4vip/1119660972/
http://snapshot.publog.net/html/news4vip/2005/06/25/095612.html

156 :名無しさん@勉強中 ★:05/09/05 16:28:47 ID:???
>>155のURLでならhtmltodatで変換出来そうなんですが
なかなか難しいです。。

ソースを見ると、本文がべたーっと改行なしで続いていますし
各番号に「<a name="#1"></a>」というのがあり これがまた厄介だ
レスアンカーもみんな「<a href="#1">&gt:&gt;1</a>」とかなってるし。

readmeを読むと
htmltodatにおいては「#」が正規表現の始端と終端の識別記号になってるそうなので
もしかしたら 作者さんに聞かないと お手上げかもしれない・・・


157 :名無しさん@勉強中 ★:05/09/05 18:36:13 ID:???
頭が煮詰まってどうしようもなくなってきたので
聞いてみました
http://jbbs.shitaraba.com/bbs/read.cgi/computer/1929/1038588508/182-


>>154はスルーされそうです・・・


158 :659:05/09/06 11:47:37 ID:FA2MTYjG
乙かれさまです
これからはその9もdatうpスレで対応させていただきます
>>157
志村!http://pc8.2ch.net/test/read.cgi/php/1105930285/629n
http://pc8.2ch.net/test/read.cgi/php/1105930285/629n

159 :名無しさん@勉強中 ★:05/09/06 18:28:19 ID:???
htmltodatの作者さんのお陰で
あっという間に解決しました
すごいなあ

>>158
という事で
偉いのは作者さんです
あとスレの件どうもです

dat2logですが
>>アルゴリズム的には完全な互換性を確保することも可能ですが
是非是非やってみて下さい下さい
少なくともjavascript版より激遅になる事もないでしょうし

まあここ見てなさそうなのでこんな事書いてるんですが

160 :名無しさん@勉強中 ★:05/09/06 19:13:02 ID:???
見てなさそうだろうついでに

http://mewnet.hp.infoseek.co.jp/
が、どのページを見てもinfoseekの広告が無いのですが
何をされたのでしょうか

広告免除の振り込みをしただけなのかな

161 :名無しさん@勉強中 ★:05/09/06 20:41:32 ID:???
やだなあ判ってますよ(独り言)

154の件は何とかなりました。
あとは全角数字のレスアンカー処理が解決出来れば・・・完成です

・・この前比較した時の差異は、そこだけだったので。

162 :名無しさん@勉強中 ★:05/09/07 06:46:56 ID:???
メモ

<script>
url = "http://hoge.com?bbs=hoge&st=551&to=552";
url = url.replace(/([0-9])/g, function(){return escape(arguments[1]).substr(5)});
document.write(url);
</script>

正規表現道場スレ631さんありがとうございます
すごいです
出来そうなので、うまくいってから書き込みたいと思います

163 :名無しさん@勉強中 ★:05/09/07 10:08:35 ID:???
<script>
url = "<a href=\"http://hoge.com?bbs=hoge&st=551&to=552\">&gt;551-552</a>";
url = url.replace(/([0-9])/g, function(){return escape(arguments[1]).substr(5)});
document.write(url);
</script>

ここからどうすればいいのだろうか

164 :名無しさん@勉強中 ★:05/09/07 17:49:49 ID:???
あともう一つバグがありました。

「&gt;156と&gt;157」等のように、レスナンバーが
くっついて書かれると、レスアンカーがつきません。
うーむ

165 :名無しさん@勉強中 ★:05/09/07 19:56:43 ID:???
際限無く質問してる感じで
何だかごめんなさいというしか

166 :名無しさん@勉強中 ★:05/09/08 10:12:54 ID:???
昨晩 datを javascript版コンバータでかちゅ〜しゃ変換して
手持ちのかちゅ〜しゃdatと比較してみたら
同一か 違っても1〜2箇所だったので
もう充分な気がしてきました。。
勿論 上で書いたような不具合が残っていますが
正規表現道場スレで質問したものですし、レスを頂けたら
余裕が出来た時に さらにバグを直すつもりではありますが。

とりあえず
試したdatを上げておきます(ただの自己満足ですが)
違いがあるかどうか・色々なブラウザで使えるかどうか試して頂ければ嬉しいな と
順番に、元スレ・元dat・(datアップスレで頂いた)かちゅ〜しゃdat です

http://life7.2ch.net/test/read.cgi/kankon/1120041586
http://www.geocities.jp/mirrorhenkan/katu/dat/2ch_1120041586.dat
http://www.geocities.jp/mirrorhenkan/katu/dat/k_1120041586.dat

http://anime.2ch.net/test/read.cgi/shar/1117720061
http://www.geocities.jp/mirrorhenkan/katu/dat/2ch_1117720061.dat
http://www.geocities.jp/mirrorhenkan/katu/dat/k_1117720061.dat

あと ファイルを比較するソフトはベクターからDLしたのですが
現在ページがなくなっています
READMEに「再配布は御自由に」との事なので、上げておきます
http://www.geocities.jp/mirrorhenkan/katu/dat/doldiff.lzh


167 :名無しさん@勉強中 ★:05/09/08 10:25:30 ID:???
それと
にゃあさんのお作りになられたdat2log(http://www.geocities.jp/mewtools/dat2log/)ですが
私の環境では ランタイムエラーが発生して 使えないです
(dat2idxは動くんだけどな)
まあ 時代遅れのPCを使っているから しょうがありませんなぁ
にゃあさんのページでも「〜での動作は保証いたしかねます」とあるし。
(因みにPC環境の詳細は・・・恥ずかしくて言えないレベルです)

ただ、<a>タグについては「>>」+半角数字だけ対応 との事なので
まだ今のところはjavascript版のほうがいいかもしれません。
早くバージョンアップして欲しいな と思ったりして。。

それにしても、HSPでもBregexp.dll使えるのになぁ・・
その橋渡しをするapがベクターにあるです。


168 :にゃあ:05/09/09 01:06:25 ID:Nj/yICzH
>>159
見てたりしますw

>>160
去年の夏、出張先からmewnet垢を覗いてみたら
でかでと貼られた広告の醜悪さに呆れました
普段はノートン先生でバナーベースの広告を全てカットしてるので
全く気づかずにいたのです
iswebでは有料アクセス解析を利用してたのですが
今年の春、無料の忍者ツールズへ乗り換えたので
その分の資金を広告免除へと回した、という次第です

>>167
ランタイムエラーですか。。。
dat2logもdat2idxも、使ってるモジュールは同じなのですけどもね。。。

ほよ〜
HSPからBREGEXP.DLLを利用できるのでつか?
耳寄りな情報をありがとうございます♪

169 :にゃあ:05/09/09 01:10:53 ID:7bdRABqZ
かちゅのレスアンカー仕様についてメモを書いておきます

かちゅ+kageでは、「>」と「&gt;」
半角数字と全角数字は等値と見なしているようです

test :
>>>>>2000

170 :にゃあ:05/09/09 01:13:25 ID:7bdRABqZ
>>169のテストで明らかなように
1個以上の「>」または「&gt;」の連続と
1個以上の半角数字または全角数字の連続が併置されると
かちゅ+kageでは、それをレスアンカーと見なします

171 :名無しさん@勉強中 ★:05/09/09 18:18:58 ID:???
>>168-170
うわ見てましたか(ってもういちいち驚いていられないですが)

dat2logですが、何度目かで何とか使えるようになりました。
>>166のものを変換したら・・・15分かかりましたです。。
(javascript版では7〜8分でしたが)

で思ったのですが、
元datに上書きする仕様みたいですが
元datを別名にして残すようにされたほうが良いのではないでしょうか。

あと、ニュー速vip等でよく使われる「wwwwwww」ですが
全部「<a href=http://www.wwww" target="_blank">wwwwwww</a>」
と変換されるようです。
多分、正規表現で「〜www\.〜」と、ドットをエスケープさせると解決するのでは
と愚考する次第。
あと もう見つけられたと思いますが
htpのBregexp.dllプラグインは
http://www.vector.co.jp/soft/win95/prog/se337635.html
ですー

172 :名無しさん@勉強中 ★:05/09/09 18:25:15 ID:???
レスアンカーの件ですが
此方では あと全角数字のレス番の処理が考え中です
URL表示部分を半角数字にしなければならないのですが
その正規表現がなかなかうまくいかない。
どうしてもわからないので、正規表現スレでいろいろ教わっています
「みんな何でこんなに優しいんだろ」と何だか申し訳なくなってきてます・・



173 :名無しさん@勉強中 ★:05/09/09 18:37:04 ID:???
せっかくなので、2点ほど伺わせて下さい

1.かちゅ〜しゃdatでは「あぼーん」「透明あぼーん」はどのように表示されるのでしょうか。

http://smile.poosan.net/mirrorhenkan/test/read.php/1046742687/70n
によるとそれぞれ
「あぼーん」←(一行にこれだけ)
「<><><><>」
のようですが・・。

2.改行コードについて

かちゅ〜しゃdatはcrlfだそうですが、lfでは読み込めないのでしょうか。
janeとかだと どちらでも良いみたいですが。

174 :名無しさん@勉強中 ★:05/09/09 18:45:11 ID:???
もう一つありました

3.「>>100-」等のように終端がないレス番は、かちゅ〜しゃdatではどう表現されますか?

175 :名無しさん@勉強中 ★:05/09/09 20:32:30 ID:???
・・あれ?
http://snapshot.publog.net/dat.php?url=http://live20.2ch.net/test/read.cgi/liveanb/1126241150/
が表示されないぞ

やはり
http://p2.chbox.jp/read.php?host=live20.2ch.net&bbs=liveanb&key=1126241150&ls=all
をhtmltodatで変換させないといけないのだろうか。

176 :にゃあ:05/09/10 00:28:44 ID:gsQKLVMp
ランタイムエラーの生じた原因が、おおよそつかめました
Speeeeed.exeの処理完了を検出するため
0.1秒ごとにSpeeeeed.exeの生成した一次ファイルの存否を確認し
一次ファイルの消滅をもってSpeeeeed.exeと判断しています
ところがNT系とWin9x系では、ファイル存否のタイミングが異なるため
実際には処理が完了していないにも拘わらず
処理完了と誤認して次の処理へ移行してしまい
これによりSpeeeeed.exeにエラーが生じて停止するようです
modoki.exeでも同様のトラブル報告があったのを思い出しました

変換元のdatファイルを別名で保存することについては、個人的に好みません
複数のファイルを変換する場合
原ファイルと変換後ファイルを手作業にて分別する必要があるからです
変換元フォルダと変換先フォルダを区別することについては検討したことがあるので
dat2logのメジャーバージョンアップをする際、この機能を追加しようと考えています

ご指摘のあった「wwwwwww」のリンクについては
仰有るようにピリオドをエスケープすることで解決しました
ご教示ありがとうございます

hspbre.dllは、ぐぐってみつけましたw
附属ドキュメントをざっと読んでみたところ、2 byte文字に関する記述が皆無です
この辺のところに不安を感じているのですが。。。
期待する置換結果を得るには、どのようにコーディングすればよいか
じっくりと試してみるつもりです

177 :にゃあ:05/09/10 00:29:45 ID:gsQKLVMp
レスアンカーについては、下記の通りです

(1) 鯖側のあぼーん
あぼーん<>あぼーん<>あぼーん<>あぼーん<>あぼーん
    ↓
<b>あぼーん</b>,あぼーん,あぼーん,あぼーん,

(2) かちゅ側のあぼ〜ん
虐殺マンセー♥<>sage<>05/09/09 22:00:00<>( ・∀・)<しぃを殺すのは虐殺ではない、駆除と言うのだw<>
    ↓
<b>透明あぼ〜ん</b>,透明あぼ〜ん,透明あぼ〜ん,,

(3) 終端なしのレスアンカー
>>100-
    ↓
<a href="http://www.nullpo.net/test/read.cgi?bbs=nullpo&key=0000000000&st=100&to=100" target="_blank">>>100</a>-

(3)の結果は、>>170にて示した定義により導かれます

178 :にゃあ:05/09/10 03:35:22 ID:L8Pi4xyy
うぎゃ。。。
>>177はなんかむちゃくちゃなレスですね
書き直します

ご質問の点ついては、下記の通りです

(1) あぼーん処理
 a. 鯖側のあぼーん
あぼーん<>あぼーん<>あぼーん<>あぼーん<>あぼーん
    ↓
<b>あぼーん</b>,あぼーん,あぼーん,あぼーん,

 b.かちゅ側のあぼ〜ん
虐殺マンセー?<>sage<>05/09/09 22:00:00<>( ・∀・)<しぃを殺すのは虐殺ではない、駆除と言うのだw<>
    ↓
<b>透明あぼ〜ん</b>,透明あぼ〜ん,透明あぼ〜ん,,

(2) LF型改行コードのdatファイル
一旦開いたdatファイルとidxファイルは
ウィンドウを閉じた際に上書き保存するというのがかちゅの仕様です
LF型改行コードのdatファイルを開く場合
CRLF型改行コードら変換してから表示し、CRLF型として再保存します

(3) 終端なしのレスアンカー
&gt;&gt;100-
    ↓
<a href="http://www.nullpo.net/test/read.cgi?bbs=nullpo&key=0000000000&st=100&to=100" target="_blank">&gt;&gt;100</a>-

(3)の結果は、>>170にて示した定義により導かれます

179 :にゃあ:05/09/10 04:11:48 ID:ChPRT1GY
ご報告です
全角数字がレスアンカーのURLに含まれている場合について、HSP上で実験したところ
次のようなtr構文を用いることにより成功しました

tr/&st=(0-9+)&to=(0-9+)\" target=\"_blank\">/&st=(0-9+)&to=(0-9+)\" target=\"_blank\">/kg

180 :名無しさん@勉強中 ★:05/09/10 18:54:52 ID:???
えーと

ランタイムエラーの件納得です
だから遅かった訳か

別名保存はやはり必要だと思いますが・・。
ちょっと意味が異なりますが、例えば何かのソフトやcgi等をDLして
それがzipだった場合、解凍したら元zipが消える仕様になっていたら・・・泣きます。

今回の自分の場合も、生datを(かちゅdatと区別する意味で)別名にしておいたのですが
変換すると レスアンカーのアドレスのキーbェおかしくなっていました。
で 元datは無くなって(というか書き換えられて)いるし makimo.toはなかなか繋がらないしで
難儀しました。
「手作業で分別」が大変との事ですが、拡張子を変換させれば何の事はないと思いますが・・。
まあ せめてフォルダ変更されては如何でしょうか

2byte文字の件ですが、delphiのbregexp.dllユニットのヘルプにも載ってませんので
大丈夫なのではないかと。

あぼーん設定とレスアンカーの件もどうもです
全角数字の変換もそんなに楽に出来るんですか
此方も 正規表現スレのほうで解答を頂いたので やってみようと思います

181 :名無しさん@勉強中 ★:05/09/10 19:25:27 ID:???
あれ?違ったかな
とにかく不正終了して 元datが残ってなかったです

あと、かちゅ〜しゃ変換したdatは
改行コードlfのままでも問題無いという事ですね?

dat2html-3を作っている時に
datテキストを一行づつ処理する訳ですが、
その際の分離記号でかなり悩み
結局 改行コードが原因だった事がありましたが
だから何だというのだろう(←一人ツッコミ)
ただ思い出しただけの事だったか・・。

・・とりあえず、crlf変換せずに保存しても無問題という訳ですね。

182 :にゃあ:05/09/11 02:15:50 ID:956OrO3n
dat2log 2.0はかなりいい感じでコーディングできました
beコードを変換する部分のみ未実装ですが
それ以外はかちゅのログとほぼ完全な互換性を確保しています
で、いままでは4行しかない手製のdatファイルで実験してたので
beから71287 byteのdatファイルをダウソして動作確認をしてみたら。。。

。・゚ ゚・(*>_<)・゚ ゚・。

原因不明の強制終了。。。
バッファサイズを調整してみたり、いろいろと手を尽くしましたが
ファイルサイズが大きくなると、正常に動作しないようです
hspbre.dll側の問題であると思われます

というわけで、HSP側で正規表現を試用することは取り止め
Speeeeed.exeをコマンドライン経由で制御するという従来の方針を継続することにし
最新バージョンdat2log 1.1を公開しました
EUCエンコードとbeコードに対応し、>>171でご指摘頂いたバグを解消しています

183 :にゃあ:05/09/11 02:20:42 ID:0D+a3FBn
元ファイルのバックアップ機能については、ごめんなさい。。。
変換先のフォルダを指定できるようにしました

2 byte文字の件については、修飾子「k」を使用することで解決できました

LF型改行コードのdatファイル読み込みについては、先述の通り無問題です

184 :にゃあ:05/09/11 17:57:08 ID:Z3KxwNgc
バグレポートです

http://www.geocities.jp/mirrorhenkan/トップページのURL生成に関する部分に
次のような誤りがあります

×
var sono4 = 'http:\/\/ 〜 +'/'+h;
var sono4a= 'http:\/\/ 〜 +'/'+h;


var sono4 = 'http:\/\/ 〜 +'/'+h+'/';
var sono4a= 'http:\/\/ 〜 +'/'+h+'/';

お手数ですが、修正して頂きますようお願いします

185 :名無しさん@勉強中 ★:05/09/11 18:34:00 ID:???
snapshotをhtmltodat化した奴をさらに整形する為の正規表現も必要だなぁ
解答頂いたスクリプトもまだ組み入れる余裕もないし

>>182-184
以前 ぜろちゃんねるスクリプトをbe用に改変した事がありますが
datについては文字コードがEUCなだけで 特に他のdatとの違いはありませんでした
IDの後にbeコードがありましたが、普通のプレーンテキストで
スクリプト側でそれを変換していましたが、
かちゅ〜しゃではその辺りはどうなっていますか?


バグレポートの件ですが、>>20を御覧下さい


http://mimizun.com:81/log/2ch/software/pc7.2ch.net/test/read.cgi/software/1005970423
×http://mimizun.com:81/log/2ch/software/pc7.2ch.net/test/read.cgi/software/1005970423/



186 :にゃあ:05/09/11 22:03:48 ID:H4Xtvu2u
>>185
おお、失礼しました
確かに、>>20のような現象が発生しますね
スレッドを熟読もせずに、申し訳ありませんでした
でも、みみずんタソったら。。。w

かちゅにおけるbeコードの処理は、やはり独特です
正規表現式はこんな感じになるでしょう

<a href=javascript:w=window.open\('http://(.+?)&u=d:([^>]+)>(.+?)</a>
      ↓
<a href= http://$1&u=d: >$3</a>

<BE:(\d+?):(\d+?)><>
      ↓
<:$1>Lv.$2<>

(.*?)<>(.*?)<>(.*?)BE:(\d+?)-
      ↓
<b>$1,$2,$3<:$4>?

187 :にゃあ:05/09/11 22:10:05 ID:jVXVl9KR
おっと、半角スペースが消えてるw

<a href=javascript:w=window.open\('http://(.+?)&u=d:([^>]+)>(.+?)</a>
      ↓
<a href=半角スペース26個http://$1&u=d:半角スペース39個>$3</a>

<BE:(\d+?):(\d+?)><>
      ↓
<:$1>Lv.$2<>

(.*?)<>(.*?)<>(.*?)BE:(\d+?)-
      ↓
<b>$1,$2,$3<:$4>?

188 :名無しさん@勉強中 ★:05/09/12 19:05:40 ID:???
まあ色々ありますわな
それにしてもjavascriptというのは
ソース丸出しだもんで何とも恥ずかしいもんだわい
大した事してないのバレバレ

なのに何故かこことモナメントと偽モナメントが登録されている・・
659さんの板もだ。いつ登録されたんだろう?
 →http://hima2908.hp.infoseek.co.jp/2channel.txt
まあ2ch関連の板を網羅しようという事なんでしょうか。
ここ(http://hima2908.hp.infoseek.co.jp/)のボード一覧、
専用ブラウザ入れたての時に使わせてもらったっけなぁ

be用のコンバータもやってみようかな
とふと思ったけど、車輪の再発明以上のものにはなりそうにないのでやめます。
(この言葉 尊敬するお方のパクリです)
そもそもかちゅ〜しゃ入れてないですし


189 :名無しさん@勉強中 ★:05/09/13 17:57:00 ID:???
さて
snapshotにしか無いスレをhtmltodatで変換したものを
専用ブラウザで読む時の不具合を取り除こうとしています。

htmltodatで変換する正規表現は
http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/187-190n
で 作者さんから教えて頂きました。

上ので変換したdatの不具合についてですが、
作者さんも言われるように

(1) 名前欄とメール欄の切り分けが出来ずに名前欄に二つともついてしまっている

(2) >>149で見たように、日付けとIDの間にjavascriptのコードが挟まれていて
 専用ブラウザだと夥しい量のゴミがついてしまっている(偽モナメントだと大丈夫ですが)
 あと IDの後に「</a><2>」のようなものが付いている

(3) IDの後にbeコードのjavascriptが付いている

(4) 本文の「http://」の前に「(p)」が付いている

(5) レスアンカーのリンクが全部消えている

このうち(4)は簡単な正規表現で対処可能です。
(5)は(少なくとも)janeでは無問題。

問題は(1)〜(3)です。
(達人なら「問題」でも何でもないんでしょうけど)

190 :名無しさん@勉強中 ★:05/09/13 18:40:52 ID:???
とりあえず、(2)の処理を考えてみましょう。

いっぺんに置換する正規表現を少し考えてみたのですが
何せヘタレゆえ すぐには無理
細切れに 合致する箇所を取り除いてみようかと。

delphiで作れば勉強にもなって一石二鳥ですが
何せヘタレゆえ すぐには無理
フリーで配布されている正規表現可能なソフトを使わせて頂こうかと。
但し 処理項目が3〜40くらいになるので、編集上限20のSpeeeeedでは無理です
別のソフトで やってみますか。

191 :謎の通りすがり:05/09/13 19:28:05 ID:/Ul102+A
(2)ですが、IDの後の余分なものは実際にはhtmltodatで取り除けるのですが
IDなし板の場合のHTMLではどのような形式になるのかわからなかったので
記述を省略しました。
日付とIDの間の余分なものですが、結局はほとんどがHTMLタグだったり
するので、個別の要素にはこだわらず全部一括で取り除くアプローチのほうが
簡単なような気がします。
(perlの正規表現ならgスイッチというのを使えば簡単にできるのですが
他でできるかはわかりません)


192 :謎の通りすがり:05/09/13 19:37:45 ID:/Ul102+A
> (5)は(少なくとも)janeでは無問題。
たいていの2ch用ブラウザでは問題ないはずです。
逆に、アンカータグがついているとレス番ポップアップがうまくいかない
ブラウザがあり、わざわざ除去する機能をつけたという経緯があります。
(readme参照)

193 :謎の通りすがり:05/09/13 20:00:20 ID:/Ul102+A
個人的には一番厄介ぽいのは(1)かなと考えます。
(「名前欄とメール欄の切り分けが出来ずに名前欄に二つともついてしまっている」ではなく「日付欄に二つともついてしまっている」が正しいですが)
というのは、メール欄がHTML要素で区切られておらず単に全角コロンで
区切られているだけなので、「ここがメール欄である」ことを確定すること
が論理的に不可能だからです。
とはいえ、現実には問題となるのは「メール欄の中自体に全角コロンが
含まれる」というレアケースだけなので、そこを割り切ってしまえば
perlで書けば
s/<><>(.*?):/<>\1<>/
みたいなひっくり返しをするだけで済む話なのかもしれません。

194 :にゃあ:05/09/13 22:19:28 ID:9qVgIGss
手許にあるログを比較して、beコードに関するオリジナルdatとかちゅログの相違点をまとめてみました

be.2ch.net/be (旧形式)
<a href=/test/p.php?i=9860148 target=_blank>?</a>
<a href=/test/p.php?i=12324858 target=_blank>?*</a>
かちゅ〜しゃ
<a href=/test/p.php?i=9860148 target=_blank>?</a>
<a href=/test/p.php?i=12324858 target=_blank>?*</a>

be.2ch.net/be (現形式)
<BE:289693477:0><>
<BE:99540353:4><>
かちゅ〜しゃ
<:232271257>Lv.0,
<:99540353>Lv.4,

qa.2ch.net/argue (旧形式)
<a href=javascript:w=window.open('http://be.2ch.net/test/p.php?i=243874&u=d:'+document.URL);if(w)w.focus();void(0);>? </a>
<a href=javascript:w=window.open('http://be.2ch.net/test/p.php?i=76234&u=d:'+document.URL);if(w)w.focus();void(0);>?##</a>
かちゅ〜しゃ
<a href= http://be.2ch.net/test/p.php?i=243874&u=d: >? </a>
<a href= http://be.2ch.net/test/p.php?i=76234&u=d: >?##</a>

qa.2ch.net/argue (現形式)
BE:262437375- <>
BE:85638274-##<>
かちゅ〜しゃ
<:262437375>? ,
<:85638274>?##,

195 :にゃあ:05/09/13 22:26:34 ID:ec4Oy5eD
現在、かちゅ〜しゃのログをteri型または旧型datに変換するツールを開発中ですが
beコードに関する処理は、Speeeeed.exeにて次のように行っています

<:(\d+?)>Lv.(\d+?),[tab]<BE:$1:$2>,[tab]E
<a href=半角スペース26個http://(.+?)/test/p.php\?i=(\d+?)&u=d:半角スペース39個>\?(.*?)</a>[tab]
<a href=javascript:w=window.open\('http://be.2ch.net/test/p.php\?i=$1&u=d:'+document.URL\);if\(w\)w.focus\(\);void\(0\);>\?$2</a>[tab]E
<:(\d+?)>\?(.*?),[tab]BE:$1-$2,[tab]E


196 :名無しさん@勉強中 ★:05/09/14 19:50:59 ID:???
>>191-193
・・・のけぞりました。

それはさておき、ヒント(というか答え)をありがとうございます。
(2)は一括で取り除き、(1)はそのまま使わせて頂きました。
意外に (3)のbe処理が何だか色々あって厄介でした。

で、5つの正規表現で何とか処理出来た感じです。
フリーで使わせて頂ける置換ソフトでやってみたのですが
自分の環境では問題無いです
「再配布可能」との事なので、同梱させて頂きました。
http://www.geocities.jp/mirrorhenkan/snapshot/snapshot2dat.zip
もし良かったら試して頂けないでしょうか。(>all)

ほんとに驚きましたです。
これからも宜しくお願い致します。

197 :名無しさん@勉強中 ★:05/09/14 19:55:59 ID:???
>>194-195
659さんの所で拝見した時に判った事実に
これまたのけぞりましたが
その 別方面でのまとめサイトで その技術が活かされている訳ですね。
確かに beコード付きのかちゅdatを 通常datに変換するコンバータは無さそうですし。


198 :名無しさん@勉強中 ★:05/09/15 19:03:41 ID:???
http://ex13.2ch.net/test/read.cgi/gline/1118753283/390
にあるsnapshot(というか「p2.chbox.jp〜」のスレのみ
先頭に「http://」末尾に「/all」を付け加え、簡単なhtmlリンクを作って
一つ一つDLして、htmltodatで一括変換してみたところ(タイトルが違うのは承知の上です)
8スレ中 dat変換に成功したのは3スレのみでした。。
・・何故なのでしょう?(いや、別に頼っている訳ではないのですが・・)

対象スレ:
(1)http://p2.chbox.jp/read.php?url=http://news19.2ch.net/test/read.cgi/newsplus/1126372408/all
(2)http://p2.chbox.jp/read.php?url=http://news19.2ch.net/test/read.cgi/newsplus/1126372282/all
(3)http://p2.chbox.jp/read.php?url=http://news19.2ch.net/test/read.cgi/newsplus/1126368731/all
(4)http://p2.chbox.jp/read.php?url=http://news19.2ch.net/test/read.cgi/newsplus/1126372069/all
(5)http://p2.chbox.jp/read.php?url=http://news19.2ch.net/test/read.cgi/newsplus/1126378029/all
(6)http://p2.chbox.jp/read.php?url=http://news19.2ch.net/test/read.cgi/newsplus/1126166580/all
(7)http://p2.chbox.jp/read.php?url=http://news19.2ch.net/test/read.cgi/newsplus/1126363579/all
(8)http://p2.chbox.jp/read.php?url=http://news19.2ch.net/test/read.cgi/news/1126373580/all

このうち、dat変換に成功したのは(1)(2)(6)でした。


199 :名無しさん@勉強中 ★:05/09/15 19:12:11 ID:???
で、dat変換に成功した3スレを>>196で出した変換ソフトで一括置換して
janeで読み込んでみましたが、どうやら問題無いみたいです。
偽モナメントに上げて 読み込んでみましたが、やはり問題無いみたいです。やったー。

それにしても、タイトル部分の「newsplus/ タイトル」というスタイルですが
http://best-thread.xrea.jpに似ています。(あちらは「[newsplus] 本文」のスタイルですが)
一つ一つ変えているのでしょうか。

にしても 変換されないのは・・・うーん。

200 :名無しさん@勉強中 ★:05/09/15 20:56:32 ID:???
と思ったのですが、早速駄目でした

http://p2.chbox.jp/read.php?url=http://news19.2ch.net/test/read.cgi/newsplus/1126368731/all

1の「文:ぽこたん( ・∀・ ))」のコロン(「:」)に反応してしまってるみたいです・・
http://user.ftth100.com/mirrorhenkan/test/read.php?key=1126372408&st=1&to=1001

201 :名無しさん@勉強中 ★:05/09/15 21:29:50 ID:???
リンク間違いです
http://p2.chbox.jp/read.php?url=http://news19.2ch.net/test/read.cgi/newsplus/1126372408/all

http://user.ftth100.com/mirrorhenkan/test/read.php?key=1126372408&st=1&to=1001
です

>>200の件ですが
「最短一致」ってどうやるんだったかなー
まだ正規表現のやり方 よくわかんないです
ちなみに ない頭を絞って捻出した正規表現は↓です(4個目と5個目は一緒にした方がいいなぁ)

s/(\(<a href=\"read.php)([^:]+?)ID:([^<]+?)(<\/a>\(\d+\))/ID:$3/g
s/(\(p\))(h?ttp://)/$2/g
s/(<><>)(.*?)( :)/<>$2<>/g
s/(\(<a href=\"http:\/\/be.2ch.net/test/p.php\?i=)(\d+)&u=(.+?)\?\#*<\/a> ?<>/BE:$2-#<>/g
s/(\(<a href=\'http:\/\/be.2ch.net/test/p.php\?i=)(\d+)&u=(.+?)\?\#*<\/a> ?<>/BE:$2-#<>/g

今日は
ケアレスミスばかりだ

202 :名無しさん@勉強中 ★:05/09/16 17:46:38 ID:???
>>198の dat変換出来なかったスレですが、
変換途中で止まった行と発言番号(?)の箇所を見てみると
例えばこういうタグがありました。(そのまま出るかどうか判りませんが)
改行は適当です

<dd id="q342of1126368731" class="respopup"
onMouseover="showResPopUp('q342of1126368731',event)"
onMouseout="hideResPopUp('q342of1126368731')">
<i>342 :<b>名無しさん@そうだ選挙に行こう </b> :2005/09/11(日)
13:52:04 (<a href="read.php?bbs=newsplus&key=1126368731&
host=news19.2ch.net&ls=all&field=id&word=kQNBKyf50&
method=just&match=on&idpopup=1&offline=1"
onMouseover="showHtmlPopUp('read.php?bbs=newsplus&
key=1126368731&host=news19.2ch.net&ls=all&
field=id&word=kQNBKyf50&method=just&
match=on&idpopup=1&offline=1',event,0.2)"
onMouseout="offHtmlPopUp()">p</a>)
<a href="read.php?bbs=newsplus&key=1126368731&
host=news19.2ch.net&ls=all&field=id&
word=kQNBKyf50&method=just&match=on&
idpopup=1&offline=1">ID:kQNBKyf50</a>
(3)<br> なんか弁理士さんサイトでアドバイスくれてなかった?
<br> どこだっけ <br>
</i></dd>

レスアンカーのポップアップをしている箇所みたいです。
これらが
(3)だと発言番号7の下に
(5)だと発言番号732と733に
(7)だと発言番号162に
同じようにタグがあり、それらを除去すると 最後まで変換されました。

つまり
「<dd id=" 〜 (中略) 〜 </i></dd>」
の部分が 邪魔になっているようです。

これは 手動で取り除くしか無さそうな感じですが・・・どうしましょう。

203 :名無しさん@勉強中 ★:05/09/16 17:53:53 ID:???
ちなみに
(4)は何の変換もせずにエラーが出たので
htmlの最初のあたりの<table>〜</table>をごっそり取り去ると
何故かエラーが出なくなりました。
あと(8)は何の問題も無く変換出来ました(昨日は駄目だったのに)

メール欄と日付を切り分ける正規表現も
考え直してやってみたら うまくいった感じです。
「メール欄で会話するスレ」関係もやってみましたが
不具合は無さそうです。
(せっかく変換したので 偽モナメントに上げてみました)
いやー 嬉しいなあ。


204 : ◆/vmukiyuzw :05/09/16 19:23:54 ID:6Ag13ksh
>>198
dat変換に失敗する原因がわかりました。
ここに書いてもいいんですが、情報が分散してしまうのはあまり好ましく
ないと思うので、お手数ですが再度うちの掲示板の方で質問して頂けないでしょうか。

あと、(1)〜(8)のHTMLを眺めているうちに、名前欄の中に数字が含まれる
ケースでもリンクが貼られてp2コードが付加されるケースが散見されました。
((4)の307他)
これも後処理で考慮されたほうがいいかもしれません。

205 :名無しさん@勉強中 ★:05/09/16 19:49:19 ID:???
あ、すみませんです・・。

では>>198をhtmltodatサポート板へ貼らせて頂きます。

206 :名無しさん@勉強中 ★:05/09/16 20:05:26 ID:???
あと
ここのURLを出しても全然構わなかったのですが
何だか宣伝してるみたいで何なので 控えました。。

207 : ◆/vmukiyuzw :05/09/16 22:07:25 ID:6Ag13ksh
回答しておきました。

> つまり
> 「<dd id=" 〜 (中略) 〜 </i></dd>」
> の部分が 邪魔になっているようです。
>
> これは 手動で取り除くしか無さそうな感じですが・・・どうしましょう。

まさにそのとおりでしたが・・・取り除くのはそんな難しいですか?
行単位で扱えるエディタやツールなら「<dd id=」で始まる行を取り除くのは
普通にできる気がするのですが。ちなみに私は秀丸で取り除きました。
</i></dd>の部分は改行の後ですが大して容量取ってないので残してても
特に問題ないと思います。

208 :にゃあ:05/09/17 10:31:49 ID:7ejWEA/J
>>187をSpeeeeed.exeでの定義に書き換えておきます

<BE:(\d+?):(\d+?)>,[tab]<:$1>Lv.$2,[tab]E[改行]
<a href=javascript:w=window.open\('http://(.+?)&u=d:([^>]+)>(.+?)</a>[tab]
<a href=半角スペース26個http://$1&u=d:半角スペース39個>$3</a>[tab]E
BE:(\d+?)-(#*?),[tab]<:$1>?$2,[tab]E[改行]


209 :名無しさん@勉強中 ★:05/09/17 20:42:18 ID:???
>>207
ありがとうございます。
気力があれば 今夜試してみたいと思います。
・・・雑談スレで書き過ぎて疲れちゃった。。

>>208
ありがとうございます
自分のコンバータに手を加える時(っていつの話だ) 参考にさせて頂きます
(というか にゃあさんがお書きになられた物しか 手に入る情報は 無いのです)

210 :名無しさん@勉強中 ★:05/09/18 13:17:04 ID:???
メモ

s/^(<dd id=\"q)(.*?)$//g
s/^</i></dd>$//g

手が空いたら組み入れてみます。

211 :名無しさん@勉強中 ★:05/09/18 13:19:53 ID:???
あ、<table>〜</table>も除去しておいた方が良さそうですね

s/<table>(.*)<\/table>//g

でもこれでいいのだろうか??(やってみれば判るけど)

212 :名無しさん@勉強中 ★:05/09/18 13:53:15 ID:???
・・・何とかなったら
htmltodatサポート板の方に御礼報告させて頂きますので・・
(反応が遅い言い訳ですが)

213 :にゃあ:05/09/19 11:55:36 ID:5IA5GYVg
JavaScriptはわからんちんなのでつが
dat2katjudatのソースコードを頼りに、標準datのbeコード処理について考えてみました

lines[i] = lines[i].replace(/<BE:(\d+?):(\d+?)><>/g,"<:$1>Lv.$2<>");
lines[i] = lines[i].replace(/<a href=javascript:w=window\.open\('http:\/\/(.+?)&u=d:([^>]+)>(.+?)<\/a>/g,
"<a href=半角スペース26個数http:\/\/$1&u=d:半角スペース39個数>$3<\/a>");
lines[i] = lines[i].replace(/BE:(\d+?)-/g,"<:$1>?");

上記3行を「if(lines[i].length <= 5){ break; }」の直後に入れ
面白ネタnews板・朝生板両板のdatを処理したところ、正常に変換されました

レスアンカー変換については、次のような処理を行いました

line[3] = line[3].replace(/([^>\-\;]|^)((>|>)+)([0-90-9]+)(-)([0-90-9]+)([^<]|$)/g,"$1"+sp1+"$4"+sp2+"$6"+sp3+"$2$4$5$6<\/a>$7");
line[3] = line[3].replace(/([^>\-\;]|^)((>|>)+)([0-90-9]+)([^<-]|$)/g,"$1"+sp1+"$4"+sp2+"$4"+sp3+"$2$4<\/a>$5");

上記の置換処理により、>>169のようなレスアンカーも、正確に変換されます
この2行は、「//不具合直りました・・〜」に続く2行と置き換えました
で、問題はURL中の全角数字です。。。
いろいろとぐぐってみたのでつけど、JavaScriptは正規表現のtr構文が使えないみたいですね
ものすご〜く面倒な処理になりそうです
うぐぅ

214 :名無しさん@勉強中 ★:05/09/19 20:26:28 ID:???
なんとか、なんとかなった感じなので(←変ですね)
htmltodatサポート板のほうへ御礼レスをさせて頂きました。

で、これを一般化させる方法は・・と考えているうちに
「もう少し処理を簡略化出来ないか」とか思ったりして。
現状のままだと
  (1)エディタで不具合処理→(2)htmltodatでdat化処理→(3)エディタで不具合処理
と 3工程(スレのローカル保存も入れたら4工程)かかる訳ですが
be処理とガラガラ処理は(1)でやってみて問題無かったので
ついでに(3)の処理を省略出来れば楽ちんだな、と。

この場合、(3)では
(a)メール・日付欄の切り分け 
(b)http://またはttp://の前の「(p)」の除去
の二つの処理になりますが、これらを(1)に組み入れられれば と思います。
さあ後で考えてみよう。

215 :名無しさん@勉強中 ★:05/09/19 20:38:21 ID:???
>>213
えーと・・後で考えてみます
というか beの変換処理 そのまま使わせて頂くかも

レスアンカー処理のコードについてですが
「([0-90-9]+)」だと、数字が続いたら全角半角混じりでも反応してしまうので
(例えば「>523」とか)
「([0-9]+|[0-9]+)」とかにしたほうがいいかも。
ただ、かちゅ〜しゃ本体のほうではどう処理されているのだろう・・

全角数字のURL処理ですが、正規表現スレのほうで解答を頂いているのですが、
まだ見せて頂く余裕がありません・・。
http://pc8.2ch.net/test/read.cgi/php/1105930285/653-654n

これを繋げてアップしたものが↓です。見事に全角数字が半角になっています
http://www.geocities.jp/mirrorhenkan/katu/regexp-dojo.html


さあ後で考えてみよう。

216 :にゃあ:05/09/19 20:38:50 ID:+quF0Ogk
全角数字の問題は、JaveScriptの門外漢である漏れにとってかなりヘビーでちた
そこで、お願いがあります
dat2katjudatの改造バージョンをclip2logに同梱させて頂いてもいいでしょうか?
URL中の全角数字については、clip2log側で対応しますので。。。
勿論、同梱dat2katjudatの原作者として663タソのお名前を明記させて頂きます

217 :にゃあ:05/09/19 20:43:04 ID:+quF0Ogk
おっと、時間差でしたw
あえて「([0-90-9]+)」としているのは
かちゅの処理は>>169のような半角全角混じりでも変換するからです

218 :名無しさん@勉強中 ★:05/09/19 20:56:19 ID:???
あらま
同梱どうぞー

動けばいいんですよ
何だか検索でみつけた所ですが
http://bt2097.org/i/cgi-bin/gate/n.cgi?MoN=g&UoN=www.geocities.jp%2Fmirrorhenkan%2Findex0.html
何かのフィルタの自動取得みたいですが
せめてちゃんと動くようにしてくれよ と

それが かちゅのデフォルトでしたか。
そういえば以前調べた時「>4000」とかもちゃんと反応してたっけなw


という訳で、こちらからもお願いを
いつになるか判りませんが スレタイ検索とかやってみようかなとか思うので
http://www.geocities.jp/mewlist/
の各種subjectリストを使わせてもらうかもしれません。
勿論、加工・整形して ですが。

それにしても膨大な量だ・・・何メガあるんですか?

219 :にゃあ:05/09/19 21:20:07 ID:Q0HkqExh
おお、ご許可頂き、ありがとうございます
今度の連休中には、clip2logを書き直してリリースします

mewlistの件は諒解しました
つーか、HTML形式でもいいのでつか?
自作ツール実行時に、次のような3種類のリストを作成しています

(1) HTML形式 : 拡張子html
(2) Text形式 : 拡張子lst
 1行目最終更新日時・2行目空白・3行目以降スレッドキーのみを列挙
(3) Text形式 : 拡張子txt
 スレッドURL[tab]スレッドタイトル (レス数)[改行]
 最終更新日の記載なし

現在公開しているのは、(1)のリストをSpeeeeedでちょこっと整形したものでつけど
ご要望があれば、別垢を取得して(2)とか(3)のリストを公開してもいいでつよー
mewlist系全垢の総量は、昨年11月の開設時で800MBを越えてましたw
最近のニュー速なんか、1鯖で50MBを越えるHTMLファイルになったりするので
簡略版しか公開してません(爆)

220 :名無しさん@勉強中 ★:05/09/20 18:14:20 ID:???
多忙だもんで(言い訳)何も進展してませんが

>>213
be処理をする箇所ですが
それだと名前やメール欄・本文に入ったbeコードにも反応してしまいます(レアケースですが)
splitで各要素をline配列に入れた後で処理しないといけないと思うです
その際 line[i]をline[2]にするだけで良いのではないかと

>>219
スレタイとURLが必要なので(1)と(3)があれば幸せかも(私が)
にしても800メガですか。

ちなみに偽モナメントを今見てみましたが、350メガ程使っているようです。
他にやってるサイトも見たら700メガくらいだし、まあ大丈夫でしょう。

221 :にゃあ:05/09/21 01:33:00 ID:qVQ+2/Xy
どもども
dat2katjudat.htmlのカスタマイズとclip2logの開発は、ほぼ完了しました
dat2katjudat.htmlについては、次のような機能追加を行っています

・ beコードに対応
・ teri型の行と旧型の行の混在したdatに対応
・ 現したらば(旧・JBBS@したらば)や一時期における2ch運営系にて採用の1行6列型datに対応
・ レスアンカーはタブ区切りで出力

つまり、2ch純正の全datファイルと
現したらばの管理画面からダウソしたdatファイルに対応しているというわけです

clip2logについては、次のような仕様変更を行っています
・ 入力されたタブ区切りのレスアンカーをかちゅの仕様に準拠して整形
・ EUCエンコードからの変換機能を削除
・ スレッドメモ入力欄の追加

beコードの処理については、>>213を書いた15分後に気づきましたw
勿論、line[2]を置換対象に設定しています
ただ、beコードの両端は< >で閉じられたタグ扱いなので
正確にコーディングされたbbs.cgiによって正常に生成されたdatファイルである限り
line[i]を置換対象としても誤変換はあり得ませんけど。。。w

明晩、最終チェックを行ったのち、clip2log 2.0としてリリースします

222 :にゃあ:05/09/21 01:38:24 ID:qhOnoZo9
リスト(3)の件は、諒解しました
リスト(1)は、既にgeocitiesのmewlist系垢にて公開済みなので
新たな垢を取得してリスト(3)を公開することにします
ただし、単なるテキストファイルを公開するつもりはなかったりします
どういう書式になるかは、公開してからのお楽しみということでw
とは言っても、1ヶ月以上先のことになると思いますが。。。

223 :にゃあ:05/09/21 01:53:40 ID:Sl8HJU+e
あ、すいません
beコードの誤変換は、原理的にあり得ますね
名前欄・メール欄の欄末にBE:(\d+?)-(#*?)の形式で入力すれば、見事に誤反応します
0chスクリプトの場合は、本文欄の欄末に入力しても反応するでしょう
うぐぅ

224 :名無しさん@勉強中 ★:05/09/21 08:25:28 ID:???
どもども
何だかすごいですね

朝の慌ただしい中での無駄レスでした

225 :名無しさん@勉強中 ★:05/09/21 18:52:43 ID:???
とりあえず
be処理と全角数字のレスアンカーをつけてみました
http://www.geocities.jp/mirrorhenkan/katu/index20050921.html

全角数字は、URL部分だけ見事に半角数字になってくれますが
「<a href="../test/read.cgi/board/12345567890/2-3" target="_blank">&gt;&gt;2-3</a>」
等の 生datで既にアンカーをふってある箇所にも 更にアンカーをつけてしまいます。

これを直す方法としては二つ考えられる・・・かな?
(1) >>215で付け加えた正規表現に、前後にレスアンカーの符号をつけておく
     「([^>\-\;]|^)」とか「([^<]|$)」とか・・・かなぁ
(2) 最初に、いったん全てのレスアンカーを取っ払う処理を施してから>>215の処理を行う

こんなもんでしょうか。
かちゅ〜しゃの内部処理(って知らないけど)を考えると(2)のほうが良いのでしょうが
削る箇所が結構あって訳わかんなくなりそうです。

(1)のほうが把握しやすそうなので 暇が出来ればやってみましょうか。

226 :名無しさん@勉強中 ★:05/09/21 19:04:15 ID:???
あ、でも
(2)の処理をしとけば
htmltodatでdat変換したものとかも かちゅdatに変換可能ですね
というか そういうdatについても考えておいたほうがいいですね

とか思ったりしました
いずれにしても 後で考えよう

227 :にゃあ:05/09/22 02:19:35 ID:ZJQDnTmr
どもども
更新版を試してみました
やはり、レスアンカーの処理が不完全のようです。。。
「/////////内容欄の変更ここからですよ///////////」の直後に
aタグを全削除するコードを追加してみたのですが、改善されませんでした。。。
line[3] = line[3].replace(/<a href=\"([^>]+)>(.*?)<\/a>/g,"$2");
エスケープ文字を挿入してみては如何でしょう?
漏れはこんな感じでコーディングして、期待する処理結果を得ました
line[3] = line[3].replace(/((&gt;|>)+)([0-90-9]+)([-−])([0-90-9]+)/g,"\t$3\t$5\t$1\t$3$4$5<\/a>");
line[3] = line[3].replace(/((&gt;|>)+)([0-90-9]+)/g,"\t$3\t$3\t$1\t$3<\/a>");
かちゅ・kageは、恐らく「,」をレスアンカーのエスケープ文字として使用しているものと思われます

ところで、かちゅ本来の処理では、datファイル中のaタグを一旦全て削除してから
レスアンカーURLと一般URLのハイパーリンクを振り直しています
http://pc7.2ch.net/test/read.cgi/software/1117804210/394
この処理を怠ると、dat2katjudatで入力したスレッドURLの板フォルダ名が
レスアンカーURLに反映されないという不具合が生じます
つまり、&gt;&gt;\d+形式のレスアンカーとそれ以外のレスアンカーでは
板フォルダ名が同一にならないというケースも起こりうるのです

228 :にゃあ:05/09/22 02:20:12 ID:ZJQDnTmr
それからかちゅの場合、「≫」と「ー」は
レスアンカーを構成する文字たり得ないことが判明しました
http://pc8.2ch.net/test/read.cgi/jobs/1091109234/27
上記レスのかちゅdatは、下記の通りです

<b>にゃあ</b>,sage,2005/09/21(水) 23:03:37 , 失敗w <br> 再てすと <br>  <br>
 >≫<a href="http://pc8.2ch.net/test/read.cgi?bbs=jobs&key=1091109234&st=2000&to=2000&nofirst=true" target="_blank">&gt;2000-2000</a> <br>
 >≫<a href="http://pc8.2ch.net/test/read.cgi?bbs=jobs&key=1091109234&st=2000&to=2000&nofirst=true" target="_blank">&gt;2000</a>ー2000 ,

229 :名無しさん@勉強中 ★:05/09/22 18:57:59 ID:???
結局、最初にアンカータグを全部取っ払うほうにしました
htmltodatでdat変換したもの等に対する対応には勿論の事ですが
最近の、異常なほどの板の細分化による ボード名のスレ途中の変化
(生活サロン系とかスポーツ系板の増殖とか)にも対応するようにとか考えたら
これしかないよなーと思うもんで

http://www.geocities.jp/mirrorhenkan/katu/index20050922noanc.html

ギチギチに試してはいませんが
全角数字レスアンカーもタグ付きレスアンカーもまあうまくいってるのではなかろうかと。

URLリンク処理やレスアンカー処理も
色んなケースに対して場当たり的に色々書いてはみたんですが
結局、外部URLで二つ・レスアンカー処理で一つ 正規表現を付けただけでOKみたいです。
エディタで見ると エスケープ処理した行のほうが多い感じですね


という事で
これで良かったらいいな と はい。

230 :名無しさん@勉強中 ★:05/09/22 19:06:00 ID:???
あと レスアンカーの構成記号とかは
別に多くても問題無いのではないかと思うです

かちゅ〜しゃスレとか見てると 例えば
「『tp://〜』にもリンクが欲しいな」とかいう書き込みがあったりして
優柔不断に付和雷同に「うんうん」と思ってしまう方なんだよなあ自分

231 :名無しさん@勉強中 ★:05/09/22 19:16:48 ID:???
という事で
>>227のエスケープ文字云々以下の件りは
申し訳ありませんがよく理解出来なかったのですが
別に問題無いですか?

問題が有ったら
さあ後で考えてみよう

232 :名無しさん@勉強中 ★:05/09/23 10:22:38 ID:???
昨日やってみたら全て一致したんでもういいでしょう
というか そもそも私かちゅ〜しゃ入れ(ry

それはともかく、過去スレを色々見たんですが
作者さん いい人だな と感じました
ただ作者さんトリップつけてなかったので 騙りの人が出て
いろいろとちょっかい出してて(winnyの47氏と同じですね)
「こりゃ自分もトリップしたほうがいいかな」とか頭をよぎりましたが
それは違うと思いますよ

------

という事で
次いってみよう。

>>214の件について。

(a)メール・日付欄の切り分け 
(b)http://またはttp://の前の「(p)」の除去

考えてみました

s/<b>(.*?)</b>(.*):(.*?) :/<a href=\"mailto:$3\"><b>$1<\/b><\/a>/g
s/(\(<a href=\")([^>]+?)>p<\/a>\)//g

500KB
続きを読む

掲示板に戻る 全部 前100 次100 最新50
名前: E-mail(省略可)

0ch BBS 2006-02-27