メモ

Gポイントポイ活　 Amazon Yahoo 楽天

無料ホームページ楽天モバイル[UNLIMITが今なら1円] 海外格安航空券海外旅行保険が無料！

告知欄です

■掲示板に戻る■ 全部 1- 101- 201- 301- 401- 501- 601- 701- 最新50

1 ：663：05/05/01 17:30:46 ID:boieiukf: 思いついた事など
173 ：名無しさん＠勉強中 ★：05/09/09 18:37:04 ID:???: せっかくなので、２点ほど伺わせて下さい

１．かちゅ～しゃdatでは「あぼーん」「透明あぼーん」はどのように表示されるのでしょうか。

http://smile.poosan.net/mirrorhenkan/test/read.php/1046742687/70n
によるとそれぞれ
「あぼーん」←（一行にこれだけ）
「<><><><>」
のようですが・・。

２．改行コードについて

かちゅ～しゃdatはcrlfだそうですが、lfでは読み込めないのでしょうか。
janeとかだとどちらでも良いみたいですが。
174 ：名無しさん＠勉強中 ★：05/09/09 18:45:11 ID:???: もう一つありました

３．「>>100-」等のように終端がないレス番は、かちゅ～しゃdatではどう表現されますか？
175 ：名無しさん＠勉強中 ★：05/09/09 20:32:30 ID:???: ・・あれ？
http://snapshot.publog.net/dat.php?url=http://live20.2ch.net/test/read.cgi/liveanb/1126241150/
が表示されないぞ

やはり
http://p2.chbox.jp/read.php?host=live20.2ch.net&bbs=liveanb&key=1126241150&ls=all
をhtmltodatで変換させないといけないのだろうか。
176 ：にゃあ：05/09/10 00:28:44 ID:gsQKLVMp: ランタイムエラーの生じた原因が、おおよそつかめました
Speeeeed.exeの処理完了を検出するため
0.1秒ごとにSpeeeeed.exeの生成した一次ファイルの存否を確認し
一次ファイルの消滅をもってSpeeeeed.exeと判断しています
ところがNT系とWin9x系では、ファイル存否のタイミングが異なるため
実際には処理が完了していないにも拘わらず
処理完了と誤認して次の処理へ移行してしまい
これによりSpeeeeed.exeにエラーが生じて停止するようです
modoki.exeでも同様のトラブル報告があったのを思い出しました

変換元のdatファイルを別名で保存することについては、個人的に好みません
複数のファイルを変換する場合
原ファイルと変換後ファイルを手作業にて分別する必要があるからです
変換元フォルダと変換先フォルダを区別することについては検討したことがあるので
dat2logのメジャーバージョンアップをする際、この機能を追加しようと考えています

ご指摘のあった「wwwwwww」のリンクについては
仰有るようにピリオドをエスケープすることで解決しました
ご教示ありがとうございます

hspbre.dllは、ぐぐってみつけましたw
附属ドキュメントをざっと読んでみたところ、2 byte文字に関する記述が皆無です
この辺のところに不安を感じているのですが。。。
期待する置換結果を得るには、どのようにコーディングすればよいか
じっくりと試してみるつもりです
177 ：にゃあ：05/09/10 00:29:45 ID:gsQKLVMp: レスアンカーについては、下記の通りです

(1) 鯖側のあぼーん
あぼーん<>あぼーん<>あぼーん<>あぼーん<>あぼーん
　　　　↓
あぼーん,あぼーん,あぼーん,あぼーん,

(2) かちゅ側のあぼ～ん
虐殺ﾏﾝｾｰ♥<>sage<>05/09/09 22:00:00<>（　・∀・）＜しぃを殺すのは虐殺ではない、駆除と言うのだw<>
　　　　↓
透明あぼ～ん,透明あぼ～ん,透明あぼ～ん,,

(3) 終端なしのレスアンカー
>>100-
　　　　↓
<a href="http://www.nullpo.net/test/read.cgi?bbs=nullpo&key=0000000000&st=100&to=100" target="_blank">>>100</a>-

(3)の結果は、>>170にて示した定義により導かれます
178 ：にゃあ：05/09/10 03:35:22 ID:L8Pi4xyy: うぎゃ。。。
>>177はなんかむちゃくちゃなレスですね
書き直します

ご質問の点ついては、下記の通りです

(1) あぼーん処理
　a. 鯖側のあぼーん
あぼーん<>あぼーん<>あぼーん<>あぼーん<>あぼーん
　　　　↓
あぼーん,あぼーん,あぼーん,あぼーん,

　b.かちゅ側のあぼ～ん
虐殺ﾏﾝｾｰ?<>sage<>05/09/09 22:00:00<>（　・∀・）＜しぃを殺すのは虐殺ではない、駆除と言うのだw<>
　　　　↓
透明あぼ～ん,透明あぼ～ん,透明あぼ～ん,,

(2) LF型改行コードのdatファイル
一旦開いたdatファイルとidxファイルは
ウィンドウを閉じた際に上書き保存するというのがかちゅの仕様です
LF型改行コードのdatファイルを開く場合
CRLF型改行コードら変換してから表示し、CRLF型として再保存します

(3) 終端なしのレスアンカー
>>100-
　　　　↓
<a href="ｈｔtp://ｗww.nullpo.net/test/read.cgi?bbs=nullpo&key=0000000000&st=100&to=100" target="_blank">>>100</a>-

(3)の結果は、>>170にて示した定義により導かれます
179 ：にゃあ：05/09/10 04:11:48 ID:ChPRT1GY: ご報告です
全角数字がレスアンカーのURLに含まれている場合について、HSP上で実験したところ
次のようなtr構文を用いることにより成功しました

tr/&st=(０-９+)&to=(０-９+)\" target=\"_blank\">/&st=(0-9+)&to=(0-9+)\" target=\"_blank\">/kg
180 ：名無しさん＠勉強中 ★：05/09/10 18:54:52 ID:???: えーと

ランタイムエラーの件納得です
だから遅かった訳か

別名保存はやはり必要だと思いますが・・。
ちょっと意味が異なりますが、例えば何かのソフトやcgi等をＤＬして
それがzipだった場合、解凍したら元zipが消える仕様になっていたら・・・泣きます。

今回の自分の場合も、生datを（かちゅdatと区別する意味で）別名にしておいたのですが
変換するとレスアンカーのアドレスのキー№がおかしくなっていました。
で元datは無くなって（というか書き換えられて）いるし makimo.toはなかなか繋がらないしで
難儀しました。
「手作業で分別」が大変との事ですが、拡張子を変換させれば何の事はないと思いますが・・。
まあせめてフォルダ変更されては如何でしょうか

２byte文字の件ですが、delphiのbregexp.dllユニットのヘルプにも載ってませんので
大丈夫なのではないかと。

あぼーん設定とレスアンカーの件もどうもです
全角数字の変換もそんなに楽に出来るんですか
此方も正規表現スレのほうで解答を頂いたのでやってみようと思います
181 ：名無しさん＠勉強中 ★：05/09/10 19:25:27 ID:???: あれ？違ったかな
とにかく不正終了して元datが残ってなかったです

あと、かちゅ～しゃ変換したdatは
改行コードlfのままでも問題無いという事ですね？

dat2html-3を作っている時に
datテキストを一行づつ処理する訳ですが、
その際の分離記号でかなり悩み
結局改行コードが原因だった事がありましたが
だから何だというのだろう（←一人ツッコミ）
ただ思い出しただけの事だったか・・。

・・とりあえず、crlf変換せずに保存しても無問題という訳ですね。
182 ：にゃあ：05/09/11 02:15:50 ID:956OrO3n: dat2log 2.0はかなりいい感じでコーディングできました
beコードを変換する部分のみ未実装ですが
それ以外はかちゅのログとほぼ完全な互換性を確保しています
で、いままでは4行しかない手製のdatファイルで実験してたので
beから71287 byteのdatファイルをﾀﾞｳｿして動作確認をしてみたら。。。

｡・ﾟﾟ・(*>_<)・ﾟﾟ・｡

原因不明の強制終了。。。
バッファサイズを調整してみたり、いろいろと手を尽くしましたが
ファイルサイズが大きくなると、正常に動作しないようです
hspbre.dll側の問題であると思われます

というわけで、HSP側で正規表現を試用することは取り止め
Speeeeed.exeをコマンドライン経由で制御するという従来の方針を継続することにし
最新バージョンdat2log 1.1を公開しました
EUCエンコードとbeコードに対応し、>>171でご指摘頂いたバグを解消しています
183 ：にゃあ：05/09/11 02:20:42 ID:0D+a3FBn: 元ファイルのバックアップ機能については、ごめんなさい。。。
変換先のフォルダを指定できるようにしました

2 byte文字の件については、修飾子「k」を使用することで解決できました

LF型改行コードのdatファイル読み込みについては、先述の通り無問題です
184 ：にゃあ：05/09/11 17:57:08 ID:Z3KxwNgc: バグレポートです

http://www.geocities.jp/mirrorhenkan/トップページのURL生成に関する部分に
次のような誤りがあります

×
var sono4 = 'http:\/\/ ～ +'/'+h;
var sono4a= 'http:\/\/ ～ +'/'+h;

○
var sono4 = 'http:\/\/ ～ +'/'+h+'/';
var sono4a= 'http:\/\/ ～ +'/'+h+'/';

お手数ですが、修正して頂きますようお願いします
185 ：名無しさん＠勉強中 ★：05/09/11 18:34:00 ID:???: snapshotをhtmltodat化した奴をさらに整形する為の正規表現も必要だなぁ
解答頂いたスクリプトもまだ組み入れる余裕もないし

 >>182-184
以前ぜろちゃんねるスクリプトをbe用に改変した事がありますが
datについては文字コードがEUCなだけで特に他のdatとの違いはありませんでした
ＩＤの後にbeコードがありましたが、普通のプレーンテキストで
スクリプト側でそれを変換していましたが、
かちゅ～しゃではその辺りはどうなっていますか？

バグレポートの件ですが、>>20を御覧下さい

例
○http://mimizun.com:81/log/2ch/software/pc7.2ch.net/test/read.cgi/software/1005970423
×http://mimizun.com:81/log/2ch/software/pc7.2ch.net/test/read.cgi/software/1005970423/
186 ：にゃあ：05/09/11 22:03:48 ID:H4Xtvu2u: >>185
おお、失礼しました
確かに、>>20のような現象が発生しますね
スレッドを熟読もせずに、申し訳ありませんでした
でも、みみずんﾀｿったら。。。w

かちゅにおけるbeコードの処理は、やはり独特です
正規表現式はこんな感じになるでしょう

<a href=javascript:w=window.open\('http://(.+?)&u=d:([^>]+)>(.+?)</a>
　　　　　　↓
<a href= ｈｔtp://$1&u=d: >$3</a>

<BE:(\d+?):(\d+?)><>
　　　　　　↓
<:$1>Lv.$2<>

(.*?)<>(.*?)<>(.*?)BE:(\d+?)-
　　　　　　↓
$1,$2,$3<:$4>?
187 ：にゃあ：05/09/11 22:10:05 ID:jVXVl9KR: おっと、半角スペースが消えてるw

<a href=javascript:w=window.open\('http://(.+?)&u=d:([^>]+)>(.+?)</a>
　　　　　　↓
<a href=半角スペース26個ｈｔtp://$1&u=d:半角スペース39個>$3</a>

<BE:(\d+?):(\d+?)><>
　　　　　　↓
<:$1>Lv.$2<>

(.*?)<>(.*?)<>(.*?)BE:(\d+?)-
　　　　　　↓
$1,$2,$3<:$4>?
188 ：名無しさん＠勉強中 ★：05/09/12 19:05:40 ID:???: まあ色々ありますわな
それにしてもjavascriptというのは
ソース丸出しだもんで何とも恥ずかしいもんだわい
大した事してないのバレバレ

なのに何故かこことモナメントと偽モナメントが登録されている・・
659さんの板もだ。いつ登録されたんだろう？
　→http://hima2908.hp.infoseek.co.jp/2channel.txt
まあ2ch関連の板を網羅しようという事なんでしょうか。
ここ（http://hima2908.hp.infoseek.co.jp/）のボード一覧、
専用ブラウザ入れたての時に使わせてもらったっけなぁ

be用のコンバータもやってみようかな
とふと思ったけど、車輪の再発明以上のものにはなりそうにないのでやめます。
（この言葉　尊敬するお方のパクリです）
そもそもかちゅ～しゃ入れてないですし
189 ：名無しさん＠勉強中 ★：05/09/13 17:57:00 ID:???: さて
snapshotにしか無いスレをhtmltodatで変換したものを
専用ブラウザで読む時の不具合を取り除こうとしています。

htmltodatで変換する正規表現は
http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/187-190n
で作者さんから教えて頂きました。

上ので変換したdatの不具合についてですが、
作者さんも言われるように

(1) 名前欄とメール欄の切り分けが出来ずに名前欄に二つともついてしまっている

(2) >>149で見たように、日付けとＩＤの間にjavascriptのコードが挟まれていて
　専用ブラウザだと夥しい量のゴミがついてしまっている（偽モナメントだと大丈夫ですが）
　あとＩＤの後に「</a><2>」のようなものが付いている

(3) ＩＤの後にbeコードのjavascriptが付いている

(4) 本文の「http://」の前に「(p)」が付いている

(5) レスアンカーのリンクが全部消えている

このうち(4)は簡単な正規表現で対処可能です。
(5)は（少なくとも）janeでは無問題。

問題は(1)～(3)です。
（達人なら「問題」でも何でもないんでしょうけど）
190 ：名無しさん＠勉強中 ★：05/09/13 18:40:52 ID:???: とりあえず、(2)の処理を考えてみましょう。

いっぺんに置換する正規表現を少し考えてみたのですが
何せヘタレゆえすぐには無理
細切れに合致する箇所を取り除いてみようかと。

delphiで作れば勉強にもなって一石二鳥ですが
何せヘタレゆえすぐには無理
フリーで配布されている正規表現可能なソフトを使わせて頂こうかと。
但し処理項目が３～４０くらいになるので、編集上限20のSpeeeeedでは無理です
別のソフトでやってみますか。
191 ：謎の通りすがり：05/09/13 19:28:05 ID:/Ul102+A: (2)ですが、IDの後の余分なものは実際にはhtmltodatで取り除けるのですが
IDなし板の場合のHTMLではどのような形式になるのかわからなかったので
記述を省略しました。
日付とIDの間の余分なものですが、結局はほとんどがHTMLタグだったり
するので、個別の要素にはこだわらず全部一括で取り除くアプローチのほうが
簡単なような気がします。
（perlの正規表現ならgスイッチというのを使えば簡単にできるのですが
他でできるかはわかりません）
192 ：謎の通りすがり：05/09/13 19:37:45 ID:/Ul102+A: > (5)は（少なくとも）janeでは無問題。
たいていの2ch用ブラウザでは問題ないはずです。
逆に、アンカータグがついているとレス番ポップアップがうまくいかない
ブラウザがあり、わざわざ除去する機能をつけたという経緯があります。
（readme参照）
193 ：謎の通りすがり：05/09/13 20:00:20 ID:/Ul102+A: 個人的には一番厄介ぽいのは(1)かなと考えます。
（「名前欄とメール欄の切り分けが出来ずに名前欄に二つともついてしまっている」ではなく「日付欄に二つともついてしまっている」が正しいですが）
というのは、メール欄がHTML要素で区切られておらず単に全角コロンで
区切られているだけなので、「ここがメール欄である」ことを確定すること
が論理的に不可能だからです。
とはいえ、現実には問題となるのは「メール欄の中自体に全角コロンが
含まれる」というレアケースだけなので、そこを割り切ってしまえば
perlで書けば
s/<><>(.*?)：/<>\1<>/
みたいなひっくり返しをするだけで済む話なのかもしれません。
194 ：にゃあ：05/09/13 22:19:28 ID:9qVgIGss: 手許にあるログを比較して、beコードに関するオリジナルdatとかちゅログの相違点をまとめてみました

be.2ch.net/be (旧形式)
<a href=/test/p.php?i=9860148 target=_blank>?</a>
<a href=/test/p.php?i=12324858 target=_blank>?*</a>
かちゅ～しゃ
<a href=/test/p.php?i=9860148 target=_blank>?</a>
<a href=/test/p.php?i=12324858 target=_blank>?*</a>

be.2ch.net/be (現形式)
<BE:289693477:0><>
<BE:99540353:4><>
かちゅ～しゃ
<:232271257>Lv.0,
<:99540353>Lv.4,

qa.2ch.net/argue (旧形式)
<a href=javascript:w=window.open('ｈｔtp://be.2ch.net/test/p.php?i=243874&u=d:'+document.URL);if(w)w.focus();void(0);>? </a>
<a href=javascript:w=window.open('ｈｔtp://be.2ch.net/test/p.php?i=76234&u=d:'+document.URL);if(w)w.focus();void(0);>?##</a>
かちゅ～しゃ
<a href= ｈｔtp://be.2ch.net/test/p.php?i=243874&u=d: >? </a>
<a href= ｈｔtp://be.2ch.net/test/p.php?i=76234&u=d: >?##</a>

qa.2ch.net/argue (現形式)
BE:262437375- <>
BE:85638274-##<>
かちゅ～しゃ
<:262437375>? ,
<:85638274>?##,
195 ：にゃあ：05/09/13 22:26:34 ID:ec4Oy5eD: 現在、かちゅ～しゃのログをteri型または旧型datに変換するツールを開発中ですが
beコードに関する処理は、Speeeeed.exeにて次のように行っています

<:(\d+?)>Lv.(\d+?),[tab]<BE:$1:$2>,[tab]E
<a href=半角スペース26個ｈｔtp://(.+?)/test/p.php\?i=(\d+?)&u=d:半角スペース39個>\?(.*?)</a>[tab]
<a href=javascript:w=window.open$'http://be.2ch.net/test/p.php\?i=$1&u=d:'+document.URL$;if$w$w.focus;void$0$;>\?$2</a>[tab]E
<:(\d+?)>\?(.*?),[tab]BE:$1-$2,[tab]E
196 ：名無しさん＠勉強中 ★：05/09/14 19:50:59 ID:???: >>191-193
・・・のけぞりました。

それはさておき、ヒント（というか答え）をありがとうございます。
(2)は一括で取り除き、(1)はそのまま使わせて頂きました。
意外に (3)のbe処理が何だか色々あって厄介でした。

で、５つの正規表現で何とか処理出来た感じです。
フリーで使わせて頂ける置換ソフトでやってみたのですが
自分の環境では問題無いです
「再配布可能」との事なので、同梱させて頂きました。
http://www.geocities.jp/mirrorhenkan/snapshot/snapshot2dat.zip
もし良かったら試して頂けないでしょうか。（＞all）

ほんとに驚きましたです。
これからも宜しくお願い致します。
197 ：名無しさん＠勉強中 ★：05/09/14 19:55:59 ID:???: >>194-195
659さんの所で拝見した時に判った事実に
これまたのけぞりましたが
その別方面でのまとめサイトでその技術が活かされている訳ですね。
確かに beコード付きのかちゅdatを通常datに変換するコンバータは無さそうですし。
198 ：名無しさん＠勉強中 ★：05/09/15 19:03:41 ID:???: http://ex13.2ch.net/test/read.cgi/gline/1118753283/390
にあるsnapshot（というか「p2.chbox.jp～」のスレのみ
先頭に「http://」末尾に「/all」を付け加え、簡単なhtmlリンクを作って
一つ一つＤＬして、htmltodatで一括変換してみたところ（タイトルが違うのは承知の上です）
８スレ中 dat変換に成功したのは３スレのみでした。。
・・何故なのでしょう？（いや、別に頼っている訳ではないのですが・・）

対象スレ：
(1)http://p2.chbox.jp/read.php?url=http://news19.2ch.net/test/read.cgi/newsplus/1126372408/all
(2)http://p2.chbox.jp/read.php?url=http://news19.2ch.net/test/read.cgi/newsplus/1126372282/all
(3)http://p2.chbox.jp/read.php?url=http://news19.2ch.net/test/read.cgi/newsplus/1126368731/all
(4)http://p2.chbox.jp/read.php?url=http://news19.2ch.net/test/read.cgi/newsplus/1126372069/all
(5)http://p2.chbox.jp/read.php?url=http://news19.2ch.net/test/read.cgi/newsplus/1126378029/all
(6)http://p2.chbox.jp/read.php?url=http://news19.2ch.net/test/read.cgi/newsplus/1126166580/all
(7)http://p2.chbox.jp/read.php?url=http://news19.2ch.net/test/read.cgi/newsplus/1126363579/all
(8)http://p2.chbox.jp/read.php?url=http://news19.2ch.net/test/read.cgi/news/1126373580/all

このうち、dat変換に成功したのは(1)(2)(6)でした。
199 ：名無しさん＠勉強中 ★：05/09/15 19:12:11 ID:???: で、dat変換に成功した３スレを >>196で出した変換ソフトで一括置換して
janeで読み込んでみましたが、どうやら問題無いみたいです。
偽モナメントに上げて読み込んでみましたが、やはり問題無いみたいです。やったー。

それにしても、タイトル部分の「newsplus/ タイトル」というスタイルですが
http://best-thread.xrea.jpに似ています。（あちらは「[newsplus] 本文」のスタイルですが）
一つ一つ変えているのでしょうか。

にしても変換されないのは・・・うーん。
200 ：名無しさん＠勉強中 ★：05/09/15 20:56:32 ID:???: と思ったのですが、早速駄目でした

http://p2.chbox.jp/read.php?url=http://news19.2ch.net/test/read.cgi/newsplus/1126368731/all

１の「文：ぽこたん（・∀・））」のコロン（「：」）に反応してしまってるみたいです・・
http://user.ftth100.com/mirrorhenkan/test/read.php?key=1126372408&st=1&to=1001
201 ：名無しさん＠勉強中 ★：05/09/15 21:29:50 ID:???: リンク間違いです
http://p2.chbox.jp/read.php?url=http://news19.2ch.net/test/read.cgi/newsplus/1126372408/all
と
http://user.ftth100.com/mirrorhenkan/test/read.php?key=1126372408&st=1&to=1001
です

 >>200の件ですが
「最短一致」ってどうやるんだったかなー
まだ正規表現のやり方　よくわかんないです
ちなみにない頭を絞って捻出した正規表現は↓です（４個目と５個目は一緒にした方がいいなぁ）

s/($<a href=\"read.php)([^:]+?)ID:([^<]+?)(<\/a>\(\d+$)/ID:$3/g
s/($p$)(h?ttp://)/$2/g
s/(<><>)(.*?)( ：)/<>$2<>/g
s/(\(<a href=\"http:\/\/be.2ch.net/test/p.php\?i=)(\d+)&u=(.+?)\?\#*<\/a> ?<>/BE:$2-#<>/g
s/(\(<a href=\'http:\/\/be.2ch.net/test/p.php\?i=)(\d+)&u=(.+?)\?\#*<\/a> ?<>/BE:$2-#<>/g

今日は
ケアレスミスばかりだ
202 ：名無しさん＠勉強中 ★：05/09/16 17:46:38 ID:???: >>198の dat変換出来なかったスレですが、
変換途中で止まった行と発言番号(?)の箇所を見てみると
例えばこういうタグがありました。（そのまま出るかどうか判りませんが）
改行は適当です
↓
<dd id="q342of1126368731" class="respopup"
onMouseover="showResPopUp('q342of1126368731',event)"
onMouseout="hideResPopUp('q342of1126368731')">
342 ：名無しさん＠そうだ選挙に行こう ：2005/09/11(日)
13:52:04 (<a href="read.php?bbs=newsplus&key=1126368731&
host=news19.2ch.net&ls=all&field=id&word=kQNBKyf50&
method=just&match=on&idpopup=1&offline=1"
onMouseover="showHtmlPopUp('read.php?bbs=newsplus&
key=1126368731&host=news19.2ch.net&ls=all&
field=id&word=kQNBKyf50&method=just&
match=on&idpopup=1&offline=1',event,0.2)"
onMouseout="offHtmlPopUp()">p</a>)
<a href="read.php?bbs=newsplus&key=1126368731&
host=news19.2ch.net&ls=all&field=id&
word=kQNBKyf50&method=just&match=on&
idpopup=1&offline=1">ID:kQNBKyf50</a>
(3) なんか弁理士さんサイトでアドバイスくれてなかった？
 どこだっけ 
</dd>

レスアンカーのポップアップをしている箇所みたいです。
これらが
(3)だと発言番号７の下に
(5)だと発言番号732と733に
(7)だと発言番号162に
同じようにタグがあり、それらを除去すると最後まで変換されました。

つまり
「<dd id="　～ (中略）　～　</dd>」
の部分が邪魔になっているようです。

これは手動で取り除くしか無さそうな感じですが・・・どうしましょう。
203 ：名無しさん＠勉強中 ★：05/09/16 17:53:53 ID:???: ちなみに
(4)は何の変換もせずにエラーが出たので
htmlの最初のあたりの<table>～</table>をごっそり取り去ると
何故かエラーが出なくなりました。
あと(8)は何の問題も無く変換出来ました（昨日は駄目だったのに）

メール欄と日付を切り分ける正規表現も
考え直してやってみたら　うまくいった感じです。
「メール欄で会話するスレ」関係もやってみましたが
不具合は無さそうです。
（せっかく変換したので偽モナメントに上げてみました）
いやー嬉しいなあ。
204 ： ◆/vmukiyuzw ：05/09/16 19:23:54 ID:6Ag13ksh: >>198
dat変換に失敗する原因がわかりました。
ここに書いてもいいんですが、情報が分散してしまうのはあまり好ましく
ないと思うので、お手数ですが再度うちの掲示板の方で質問して頂けないでしょうか。

あと、(1)～(8)のHTMLを眺めているうちに、名前欄の中に数字が含まれる
ケースでもリンクが貼られてp2コードが付加されるケースが散見されました。
（(4)の307他）
これも後処理で考慮されたほうがいいかもしれません。
205 ：名無しさん＠勉強中 ★：05/09/16 19:49:19 ID:???: あ、すみませんです・・。

では >>198をhtmltodatサポート板へ貼らせて頂きます。
206 ：名無しさん＠勉強中 ★：05/09/16 20:05:26 ID:???: あと
ここのURLを出しても全然構わなかったのですが
何だか宣伝してるみたいで何なので控えました。。
207 ： ◆/vmukiyuzw ：05/09/16 22:07:25 ID:6Ag13ksh: 回答しておきました。

> つまり
> 「<dd id="　～ (中略）　～　</dd>」
> の部分が邪魔になっているようです。
>
> これは手動で取り除くしか無さそうな感じですが・・・どうしましょう。

まさにそのとおりでしたが・・・取り除くのはそんな難しいですか？
行単位で扱えるエディタやツールなら「<dd id=」で始まる行を取り除くのは
普通にできる気がするのですが。ちなみに私は秀丸で取り除きました。
</dd>の部分は改行の後ですが大して容量取ってないので残してても
特に問題ないと思います。
208 ：にゃあ：05/09/17 10:31:49 ID:7ejWEA/J: >>187をSpeeeeed.exeでの定義に書き換えておきます

<BE:(\d+?):(\d+?)>,[tab]<:$1>Lv.$2,[tab]E[改行]
<a href=javascript:w=window.open\('ｈｔtp://(.+?)&u=d:([^>]+)>(.+?)</a>[tab]
<a href=半角スペース26個ｈｔtp://$1&u=d:半角スペース39個>$3</a>[tab]E
BE:(\d+?)-(#*?),[tab]<:$1>?$2,[tab]E[改行]
209 ：名無しさん＠勉強中 ★：05/09/17 20:42:18 ID:???: >>207
ありがとうございます。
気力があれば今夜試してみたいと思います。
･･･雑談スレで書き過ぎて疲れちゃった。。

>>208
ありがとうございます
自分のコンバータに手を加える時（っていつの話だ）参考にさせて頂きます
（というかにゃあさんがお書きになられた物しか手に入る情報は無いのです）
210 ：名無しさん＠勉強中 ★：05/09/18 13:17:04 ID:???: メモ

s/^(<dd id=\"q)(.*?)$//g
s/^</dd>$//g

手が空いたら組み入れてみます。
211 ：名無しさん＠勉強中 ★：05/09/18 13:19:53 ID:???: あ、<table>～</table>も除去しておいた方が良さそうですね

s/<table>(.*)<\/table>//g

でもこれでいいのだろうか？？（やってみれば判るけど）
212 ：名無しさん＠勉強中 ★：05/09/18 13:53:15 ID:???: ･･･何とかなったら
htmltodatサポート板の方に御礼報告させて頂きますので・・
（反応が遅い言い訳ですが）
213 ：にゃあ：05/09/19 11:55:36 ID:5IA5GYVg: JavaScriptはわからんちんなのでつが
dat2katjudatのソースコードを頼りに、標準datのbeコード処理について考えてみました

lines[i] = lines[i].replace(/<BE:(\d+?):(\d+?)><>/g,"<:$1>Lv.$2<>");
lines[i] = lines[i].replace(/<a href=javascript:w=window\.open\('http:\/\/(.+?)&u=d:([^>]+)>(.+?)<\/a>/g,
"<a href=半角スペース26個数http:\/\/$1&u=d:半角スペース39個数>$3<\/a>");
lines[i] = lines[i].replace(/BE:(\d+?)-/g,"<:$1>?");

上記3行を「if(lines[i].length <= 5){ break; }」の直後に入れ
面白ネタnews板・朝生板両板のdatを処理したところ、正常に変換されました

レスアンカー変換については、次のような処理を行いました

line[3] = line[3].replace(/([^>\-\;]|^)((>|＞)+)([0-9０-９]+)(-)([0-9０-９]+)([^<]|$)/g,"$1"+sp1+"$4"+sp2+"$6"+sp3+"$2$4$5$6<\/a>$7");
line[3] = line[3].replace(/([^>\-\;]|^)((>|＞)+)([0-9０-９]+)([^<-]|$)/g,"$1"+sp1+"$4"+sp2+"$4"+sp3+"$2$4<\/a>$5");

上記の置換処理により、>>169のようなレスアンカーも、正確に変換されます
この2行は、「//不具合直りました・・～」に続く2行と置き換えました
で、問題はURL中の全角数字です。。。
いろいろとぐぐってみたのでつけど、JavaScriptは正規表現のtr構文が使えないみたいですね
ものすご～く面倒な処理になりそうです
うぐぅ
214 ：名無しさん＠勉強中 ★：05/09/19 20:26:28 ID:???: なんとか、なんとかなった感じなので（←変ですね）
htmltodatサポート板のほうへ御礼レスをさせて頂きました。

で、これを一般化させる方法は・・と考えているうちに
「もう少し処理を簡略化出来ないか」とか思ったりして。
現状のままだと
　　(1)エディタで不具合処理→(2)htmltodatでdat化処理→(3)エディタで不具合処理
と３工程（スレのローカル保存も入れたら４工程）かかる訳ですが
be処理とガラガラ処理は(1)でやってみて問題無かったので
ついでに(3)の処理を省略出来れば楽ちんだな、と。

この場合、(3)では
(a)メール・日付欄の切り分け　
(b)http://またはttp://の前の「(p)」の除去
の二つの処理になりますが、これらを(1)に組み入れられればと思います。
さあ後で考えてみよう。
215 ：名無しさん＠勉強中 ★：05/09/19 20:38:21 ID:???: >>213
えーと・・後で考えてみます
というか beの変換処理そのまま使わせて頂くかも

レスアンカー処理のコードについてですが
「([0-9０-９]+)」だと、数字が続いたら全角半角混じりでも反応してしまうので
（例えば「＞５2３」とか）
「([0-9]+|[０-９]+)」とかにしたほうがいいかも。
ただ、かちゅ～しゃ本体のほうではどう処理されているのだろう・・

全角数字のURL処理ですが、正規表現スレのほうで解答を頂いているのですが、
まだ見せて頂く余裕がありません・・。
http://pc8.2ch.net/test/read.cgi/php/1105930285/653-654n

これを繋げてアップしたものが↓です。見事に全角数字が半角になっています
http://www.geocities.jp/mirrorhenkan/katu/regexp-dojo.html

さあ後で考えてみよう。
216 ：にゃあ：05/09/19 20:38:50 ID:+quF0Ogk: 全角数字の問題は、JaveScriptの門外漢である漏れにとってかなりヘビーでちた
そこで、お願いがあります
dat2katjudatの改造バージョンをclip2logに同梱させて頂いてもいいでしょうか？
URL中の全角数字については、clip2log側で対応しますので。。。
勿論、同梱dat2katjudatの原作者として663ﾀｿのお名前を明記させて頂きます
217 ：にゃあ：05/09/19 20:43:04 ID:+quF0Ogk: おっと、時間差でしたw
あえて「([0-9０-９]+)」としているのは
かちゅの処理は >>169のような半角全角混じりでも変換するからです
218 ：名無しさん＠勉強中 ★：05/09/19 20:56:19 ID:???: あらま
同梱どうぞー

動けばいいんですよ
何だか検索でみつけた所ですが
http://bt2097.org/i/cgi-bin/gate/n.cgi?MoN=g&UoN=www.geocities.jp%2Fmirrorhenkan%2Findex0.html
何かのフィルタの自動取得みたいですが
せめてちゃんと動くようにしてくれよと

それがかちゅのデフォルトでしたか。
そういえば以前調べた時「>4000」とかもちゃんと反応してたっけなｗ

という訳で、こちらからもお願いを
いつになるか判りませんがスレタイ検索とかやってみようかなとか思うので
http://www.geocities.jp/mewlist/
の各種subjectリストを使わせてもらうかもしれません。
勿論、加工・整形してですが。

それにしても膨大な量だ・・・何メガあるんですか？
219 ：にゃあ：05/09/19 21:20:07 ID:Q0HkqExh: おお、ご許可頂き、ありがとうございます
今度の連休中には、clip2logを書き直してリリースします

mewlistの件は諒解しました
つーか、HTML形式でもいいのでつか？
自作ツール実行時に、次のような3種類のリストを作成しています

(1) HTML形式 : 拡張子html
(2) Text形式 : 拡張子lst
　1行目最終更新日時・2行目空白・3行目以降スレッドキーのみを列挙
(3) Text形式 : 拡張子txt
　スレッドURL[tab]スレッドタイトル (レス数)[改行]
　最終更新日の記載なし

現在公開しているのは、(1)のリストをSpeeeeedでちょこっと整形したものでつけど
ご要望があれば、別垢を取得して(2)とか(3)のリストを公開してもいいでつよー
mewlist系全垢の総量は、昨年11月の開設時で800MBを越えてましたw
最近のニュー速なんか、1鯖で50MBを越えるHTMLファイルになったりするので
簡略版しか公開してません(爆)
220 ：名無しさん＠勉強中 ★：05/09/20 18:14:20 ID:???: 多忙だもんで（言い訳）何も進展してませんが

 >>213
be処理をする箇所ですが
それだと名前やメール欄・本文に入ったbeコードにも反応してしまいます（レアケースですが）
splitで各要素をline配列に入れた後で処理しないといけないと思うです
その際 line[i]をline[2]にするだけで良いのではないかと

 >>219
スレタイとURLが必要なので(1)と(3)があれば幸せかも（私が）
にしても800メガですか。

ちなみに偽モナメントを今見てみましたが、３５０メガ程使っているようです。
他にやってるサイトも見たら７００メガくらいだし、まあ大丈夫でしょう。
221 ：にゃあ：05/09/21 01:33:00 ID:qVQ+2/Xy: どもども
dat2katjudat.htmlのカスタマイズとclip2logの開発は、ほぼ完了しました
dat2katjudat.htmlについては、次のような機能追加を行っています

・ beコードに対応
・ teri型の行と旧型の行の混在したdatに対応
・現したらば(旧・ＪＢＢＳ＠したらば)や一時期における2ch運営系にて採用の1行6列型datに対応
・レスアンカーはタブ区切りで出力

つまり、2ch純正の全datファイルと
現したらばの管理画面からﾀﾞｳｿしたdatファイルに対応しているというわけです

clip2logについては、次のような仕様変更を行っています
・入力されたタブ区切りのレスアンカーをかちゅの仕様に準拠して整形
・ EUCエンコードからの変換機能を削除
・スレッドメモ入力欄の追加

beコードの処理については、>>213を書いた15分後に気づきましたw
勿論、line[2]を置換対象に設定しています
ただ、beコードの両端は< >で閉じられたタグ扱いなので
正確にコーディングされたbbs.cgiによって正常に生成されたdatファイルである限り
line[i]を置換対象としても誤変換はあり得ませんけど。。。w

明晩、最終チェックを行ったのち、clip2log 2.0としてリリースします
222 ：にゃあ：05/09/21 01:38:24 ID:qhOnoZo9: リスト(3)の件は、諒解しました
リスト(1)は、既にgeocitiesのmewlist系垢にて公開済みなので
新たな垢を取得してリスト(3)を公開することにします
ただし、単なるテキストファイルを公開するつもりはなかったりします
どういう書式になるかは、公開してからのお楽しみということでw
とは言っても、1ヶ月以上先のことになると思いますが。。。
223 ：にゃあ：05/09/21 01:53:40 ID:Sl8HJU+e: あ、すいません
beコードの誤変換は、原理的にあり得ますね
名前欄・メール欄の欄末にBE:(\d+?)-(#*?)の形式で入力すれば、見事に誤反応します
0chスクリプトの場合は、本文欄の欄末に入力しても反応するでしょう
うぐぅ
224 ：名無しさん＠勉強中 ★：05/09/21 08:25:28 ID:???: どもども
何だかすごいですね

朝の慌ただしい中での無駄レスでした
225 ：名無しさん＠勉強中 ★：05/09/21 18:52:43 ID:???: とりあえず
be処理と全角数字のレスアンカーをつけてみました
http://www.geocities.jp/mirrorhenkan/katu/index20050921.html

全角数字は、URL部分だけ見事に半角数字になってくれますが
「<a href="../test/read.cgi/board/12345567890/2-3" target="_blank">＆gt;＆gt;2-3</a>」
等の生datで既にアンカーをふってある箇所にも更にアンカーをつけてしまいます。

これを直す方法としては二つ考えられる・・・かな？
(1) >>215で付け加えた正規表現に、前後にレスアンカーの符号をつけておく
　　　　　「([^>\-\;]|^)」とか「([^<]|$)」とか・・・かなぁ
(2) 最初に、いったん全てのレスアンカーを取っ払う処理を施してから >>215の処理を行う

こんなもんでしょうか。
かちゅ～しゃの内部処理（って知らないけど）を考えると(2)のほうが良いのでしょうが
削る箇所が結構あって訳わかんなくなりそうです。

(1)のほうが把握しやすそうなので暇が出来ればやってみましょうか。
226 ：名無しさん＠勉強中 ★：05/09/21 19:04:15 ID:???: あ、でも
(2)の処理をしとけば
htmltodatでdat変換したものとかもかちゅdatに変換可能ですね
というかそういうdatについても考えておいたほうがいいですね

とか思ったりしました
いずれにしても後で考えよう
227 ：にゃあ：05/09/22 02:19:35 ID:ZJQDnTmr: どもども
更新版を試してみました
やはり、レスアンカーの処理が不完全のようです。。。
「/////////内容欄の変更ここからですよ///////////」の直後に
aタグを全削除するコードを追加してみたのですが、改善されませんでした。。。
line[3] = line[3].replace(/<a href=\"([^>]+)>(.*?)<\/a>/g,"$2");
エスケープ文字を挿入してみては如何でしょう？
漏れはこんな感じでコーディングして、期待する処理結果を得ました
line[3] = line[3].replace(/((>|＞)+)([0-9０-９]+)([-－])([0-9０-９]+)/g,"\t$3\t$5\t$1\t$3$4$5<\/a>");
line[3] = line[3].replace(/((>|＞)+)([0-9０-９]+)/g,"\t$3\t$3\t$1\t$3<\/a>");
かちゅ・kageは、恐らく「,」をレスアンカーのエスケープ文字として使用しているものと思われます

ところで、かちゅ本来の処理では、datファイル中のaタグを一旦全て削除してから
レスアンカーURLと一般URLのハイパーリンクを振り直しています
http://pc7.2ch.net/test/read.cgi/software/1117804210/394
この処理を怠ると、dat2katjudatで入力したスレッドURLの板フォルダ名が
レスアンカーURLに反映されないという不具合が生じます
つまり、>>\d+形式のレスアンカーとそれ以外のレスアンカーでは
板フォルダ名が同一にならないというケースも起こりうるのです
228 ：にゃあ：05/09/22 02:20:12 ID:ZJQDnTmr: それからかちゅの場合、「≫」と「ー」は
レスアンカーを構成する文字たり得ないことが判明しました
http://pc8.2ch.net/test/read.cgi/jobs/1091109234/27
上記レスのかちゅdatは、下記の通りです

にゃあ,sage,2005/09/21(水) 23:03:37 , 失敗w 再てすと 
＞≫<a href="ｈｔtp://pc8.2ch.net/test/read.cgi?bbs=jobs&key=1091109234&st=2000&to=2000&nofirst=true" target="_blank">>2000-2000</a> 
＞≫<a href="ｈｔtp://pc8.2ch.net/test/read.cgi?bbs=jobs&key=1091109234&st=2000&to=2000&nofirst=true" target="_blank">>2000</a>ー2000 ,
229 ：名無しさん＠勉強中 ★：05/09/22 18:57:59 ID:???: 結局、最初にアンカータグを全部取っ払うほうにしました
htmltodatでdat変換したもの等に対する対応には勿論の事ですが
最近の、異常なほどの板の細分化によるボード名のスレ途中の変化
（生活サロン系とかスポーツ系板の増殖とか）にも対応するようにとか考えたら
これしかないよなーと思うもんで

http://www.geocities.jp/mirrorhenkan/katu/index20050922noanc.html

ギチギチに試してはいませんが
全角数字レスアンカーもタグ付きレスアンカーもまあうまくいってるのではなかろうかと。

URLリンク処理やレスアンカー処理も
色んなケースに対して場当たり的に色々書いてはみたんですが
結局、外部URLで二つ・レスアンカー処理で一つ　正規表現を付けただけでＯＫみたいです。
エディタで見るとエスケープ処理した行のほうが多い感じですね

という事で
これで良かったらいいな　と　はい。
230 ：名無しさん＠勉強中 ★：05/09/22 19:06:00 ID:???: あと　レスアンカーの構成記号とかは
別に多くても問題無いのではないかと思うです

かちゅ～しゃスレとか見てると　例えば
「『tp://～』にもリンクが欲しいな」とかいう書き込みがあったりして
優柔不断に付和雷同に「うんうん」と思ってしまう方なんだよなあ自分
231 ：名無しさん＠勉強中 ★：05/09/22 19:16:48 ID:???: という事で
 >>227のエスケープ文字云々以下の件りは
申し訳ありませんがよく理解出来なかったのですが
別に問題無いですか？

問題が有ったら
さあ後で考えてみよう
232 ：名無しさん＠勉強中 ★：05/09/23 10:22:38 ID:???: 昨日やってみたら全て一致したんでもういいでしょう
というかそもそも私かちゅ～しゃ入れ(ry

それはともかく、過去スレを色々見たんですが
作者さんいい人だな　と感じました
ただ作者さんトリップつけてなかったので騙りの人が出て
いろいろとちょっかい出してて（winnyの47氏と同じですね）
「こりゃ自分もトリップしたほうがいいかな」とか頭をよぎりましたが
それは違うと思いますよ

------

という事で
次いってみよう。

>>214の件について。

(a)メール・日付欄の切り分け　
(b)http://またはttp://の前の「(p)」の除去

考えてみました

s/(.*?)(.*)：(.*?) ：/<a href=\"mailto:$3\">$1<\/b><\/a>/g
s/($<a href=\")([^>]+?)>p<\/a>$//g
233 ：にゃあ：05/09/23 16:03:16 ID:pKplq7PX: どもども
 >>227で触れた「レスアンカーのエスケープ文字云々」については、忘れてください
ここのところ、睡眠時間が極端に少なかったもので。。。w

index20050922noanc.htmlをテストしてみました
かちゅとの相違点・バグ・要望を挙げれば次の通りです

相違点
 >>169で申し上げた通り、かちゅでは((>|＞)+)に相当する処理を行っていますが
index20050922noanc.htmlでは、(>|>>|＞|＞＞|≫)と5種類のみに限定されています

バグ
http://pc7.2ch.net/test/read.cgi/software/1117804210/784で申し上げた通り
www.bell-tree.com/~chika/cgi-bin、www.apc.7777.net/bbs等
鯖名にサブディレクトリを含む場合に、レスアンカーのURLが正しく変換されません
外部板の消失ログを変換したいケースでは、とても困ったことになります
かと言って、URLの書式を自動判別するコードを書くのは、煩雑に過ぎるでしょう
漏れは、かちゅidxファイル専用エディタに自動判別ルーチンを組み込みましたが
実際問題、コーディングするのがｶﾅｰﾘめんどーでしたw
鯖名にサブディレクトリを含むURLには対応していない旨を明記してはいかがでしょうか。。。
234 ：にゃあ：05/09/23 16:06:10 ID:pKplq7PX: 要望
clip2logで変換する際、鯖名その他の項目を入力する必要があります
鯖フォルダと板フォルダを作成し、ログファイルを作成するためには、必要不可欠な情報だからです
一方、index20050922noanc.htmlにてdat変換する際にも
スレッドURLの入力が必須となっています
つまりユーザーは、同じような情報を二度も入力するよう強制されるわけです
index20050922noanc.htmlにおける出力結果の末尾に
「<dat2katjudat>\t鯖名\tボードキー\tスレッドキー\n」のようなフッタを付けて頂ければ
clip2logでの入力は省略できるように改良します

以上の点を除けば、Shift JISエンコードかつ純粋なteri型かつ1行5列であるdatを変換対象とする限り
index20050922noanc.htmlは完全な処理結果の得られることを確認しました

それから、ご報告です
dat2katjudat.htmlを同梱したclip2logを公開しました

つ http://www.geocities.jp/mewtools/clip2log/

重ね重ね、お礼を申し上げます
235 ：名無しさん＠勉強中 ★：05/09/24 17:56:03 ID:???: んもーしょうがないなー（←気にしない事）

>>233-234
相違点の件ですが、仕様という事で。（「仕様」いい言葉だなー）

バグの件ですが、サブディレクトリにも対応しておきました。
（想定外の件だったので「バグ」と言われるとおいおいという感じですが・・）
自動判別ルーチンとかコーディングとかどのように書いておられるのか判りませんが
正規表現のmatch文一発でＯＫだと思うのですが・・（お気を悪くされたらすみません）
サーバ名は「http://」と「/test/read.cgi/～」の間を取り出すだけでいいんですよね？
（違ってたらこれ又ごめんなさいなのですが）

要望の件ですが、オプションとして対応しておきました。

http://www.geocities.jp/mirrorhenkan/katu/

あと
報告どうもありがとうございます。

＋＋＋＋＋

さて次は何をやろうか。
236 ：名無しさん＠勉強中 ★：05/09/24 20:08:46 ID:???: 追記です

datアップスレで頂いたかちゅdatを見ていると
確かに「＆gt;＆gt;＆gt;1」とかにもレスアンカーついてますね
「>>>>>>>>>>>>>>>>>>1」←これとか
「＞＞＞＞＞＞＞＞＞＞1」←これはどうですか？
（↑あ、この掲示板をかちゅ～しゃに登録しないとわかりませんね・・別にいいです）

かちゅdatと自前変換のかちゅdatを比較すると、あと２つ相違点がありました。
(1)「あぼーん」について
　　かちゅdatは「あぼーん,あぼーん,あぼーん,あぼーん」と４つですが
　　自前datは「あぼーん,あぼーん,あぼーん,あぼーん,あぼーん」と５つです
　　かちゅ～しゃではあぼーんされたレスの本文が空欄になっているという事なのかな

(2)　メール欄の空欄（全角半角問わず）
　　かちゅdatでは生datにあった（というかあった場合）空欄部分が全て消えています

以上２点ですが、まあ大勢に影響無いのではないかと思うです。
それよりもレスアンカー変換が全て一致したのが　嬉しいなー。
237 ：にゃあ：05/09/25 03:36:41 ID:7OB3J9R/: 気を悪くするどころか、嬉々としてお答えしますよ～&herats;

漏れの知ってるだけでも、かちゅの対応しているURLは下記の通りです
http://pc8.2ch.net/test/read.cgi/jobs/994816959/157-159n
これをHSPでコーディングするのは、ｶﾅｰﾘ大変でしたw
でもよく考えてみれば、板とスレッドのURLを判別する必要はないわけだし
JavaScriptは、正規表現が使えるうえにelse if構文も使えるので、思ったよりも簡単ですね
で、現在のところ、ここまでコーディングしました
238 ：にゃあ：05/09/25 03:37:30 ID:7OB3J9R/: url = document.rep.url.value;
if (url.match(/http:\/\/(.+?)\/test\/read\.(cgi|php|pl)\/(.+?)\/(\d+)/)) {
//(*ﾟーﾟ) PATH_INFO形式
var server = RegExp.$1;//サーバ名（サブディレクトリ有りのものも含む）
var board = RegExp.$3;//ボードキー
var key = RegExp.$4;//スレッドキー
} else if (url.match(/http:\/\/(.+?)\/test\/read\.(cgi|php|pl)\?bbs=(.+?)&key=(\d+)/)) {
//(*ﾟーﾟ) QUERY_LINK形式
var server = RegExp.$1;
var board = RegExp.$3;
var key = RegExp.$4;
} else if (url.match(/http:\/\/(.+?)\/(.+?)\/dat\/(\d+)\.dat/)) {
//(*ﾟーﾟ) datディレクトリ
var server = RegExp.$1;
var board = RegExp.$2;
var key = RegExp.$3;
} else if (url.match(/http:\/\/(.+?)\/(.+?)\/dat(\d*?)\/(\d+)\.dat/)) {
//(*ﾟーﾟ) dat2～ディレクトリ
//(*ﾟーﾟ) cf. http://www.geocities.jp/mewlist/hiddendir.html
var server = RegExp.$1;
var board = RegExp.$2;
var datdir = RegExp.$3;
var key = RegExp.$4;
server = server + "\/dat" + datdir
} else if (url.match(/http:\/\/(.+?)\/(.+?)\/log(.*?)\/(\d+)\.dat/)) {
//(*ﾟーﾟ) logディレクトリ
//(*ﾟーﾟ) cf. http://www.geocities.jp/mewlist/hiddendir.html
var server = RegExp.$1;
var board = RegExp.$2;
var logdir = RegExp.$3;
var key = RegExp.$4;
server = server + "\/log" + logdir
} else {
alert ("（；・∀・） URLの解析に失敗したからな！"); return(false);
}
239 ：にゃあ：05/09/25 03:53:12 ID:eukjsklx: レスアンカーについては、dat2katjudat上で処理することにしました
現行dat2katjudatのソースコードを使わせて頂きたく存じます

レスアンカーのフォーマットについては、>>169で申し上げた通りです
かちゅでは、((>|＞)+)に相当する処理を行っています
従って、>>169をかちゅで読み込むと、ローカルには次のように保存されます

<a href="http://yy14.kakiko.com/test/read.cgi?bbs=mirror&key=1114936246&st=2000&to=2000&nofirst=true" target="_blank">
＞>＞>＞ 2０0０</a>

>>236をかちゅで読み込むと、ローカルには次のように保存されます

<a href="ｈｔtp://yy14.kakiko.com/test/read.cgi?bbs=mirror&key=1114936246&st=1&to=1&nofirst=true" target="_blank">
>>>>>>>>>>>>>>>>>>1</a>

<a href="ｈｔtp://yy14.kakiko.com/test/read.cgi?bbs=mirror&key=1114936246&st=1&to=1&nofirst=true" target="_blank">
＞＞＞＞＞＞＞＞＞＞１</a>

それゆえ、現行dat2katjudatのソースコードは次のように書き換えました
240 ：にゃあ：05/09/25 03:53:52 ID:eukjsklx: function replacefunc(m) {
if (m.match(/((>|＞)+)([0-9０-９]+)([-－]([0-9０-９]+))/)) {
return m.replace(/((>|＞)+)([0-9０-９]+)([-－]([0-9０-９]+))/,
sp1 + "$3" + sp2 + "$5" + sp3 + "$1$3$4<\/a>"
).replace(/(st|to)=[0-9０-９]+/g, toascii);
} else {
return m.replace(/((>|＞)+)([0-9０-９]+)/,
sp1 + "$3" + sp2 + "$3" + sp3 + "$1$3<\/a>"
).replace(/(st|to)=[0-9０-９]+/g, toascii);
}
}

line[3] = line[3].replace(/((>|＞)+)([0-9０-９]+)([-－][0-9０-９]+)?/g,replacefunc);
241 ：にゃあ：05/09/25 04:06:37 ID:ZxWRpkId: 名前欄のトリムについては、未確認です

あぼーん処理については、>>178でご報告した通りです
かちゅの処理法に準拠するため、dat2katjudatのソースコードを次のように書き換えています

//(*ﾟーﾟ) teri型datの場合は、旧型datへ変換するにゃあ
var teri = lines[i].indexOf("<>");
if (teri != -1) {
lines[i] = lines[i].replace(/\,/g,"＠｀");
lines[i] = lines[i].replace(/<>/g,"\,");
}

//(*ﾟーﾟ) 6列目が存在する場合は、ｻｸｰｼﾞｮするにゃあ
//1行6列形式は、現したらば(旧ＪＢＢＳ＠したらば)とか
//一時期における2ch運営系の板にて採用されているにゃあ
//ちなみに、6列目には投稿者のリモートホストが記録されているにゃあ
lines[i] = lines[i].replace(/(.*?)\,(.*?)\,(.*?)\,(.*?)\,(.*?)\,(.*?)/g,"$1\,$2\,$3\,$4\,$5");

var line=lines[i].split("\,");
// line[0]:名前
// line[1]:メールアドレス
// line[2]:日付
// line[3]:内容
// line[4]:スレッドタイトル

replaced_lines = replaced_lines + line[0]+ ',' +line[1]+','+line[2]+','+line[3]+',';
//(*ﾟーﾟ) 1行目の場合は5列目をも追加、2行目以降は5列目を省略するにゃあ
if (i == 0) { replaced_lines = replaced_lines + line[4]; }
replaced_lines = replaced_lines + '\n';
242 ：にゃあ：05/09/25 04:16:12 ID:jLnjA1yZ: clip2log用フッタのオプションを追加して頂き、ありがとうございます

clip2logの操作法が、やや煩雑であるとのご意見を頂きました
http://pc7.2ch.net/test/read.cgi/software/1117804210/959
どういったUIに変えようか考えていたところ
フッタを追加して頂いたことを知り、方向が定まりました
同梱版dat2katjudatでは、フッタを強制的に添付することにします

というわけで、明日にはclip2log 3.0をリリースするつもりです
243 ：にゃあ：05/09/25 04:18:37 ID:jLnjA1yZ: ちなみに、このスレは毎日かちゅで巡回していますw
244 ：名無しさん＠勉強中 ★：05/09/25 17:56:57 ID:???: まあ頑張って下さいな
私これに関してはもうやる事も無さそうだし
まあ　idxファイルをjavascriptで作ってみるとか無きにしも非ずですが
もういいや

とりあえず　色んな過去スレで
「そんなモン簡単だ何なら作ってやろうか」と小難しい理屈を長々と述べてるクセに
結局何にもしなかった口だけだった実に多くの方々に勝ったぜフハハハ　という
ちっぽけな虚栄心が満たされたと事で良しとしましょうか。
（↑この辺問題発言っぽいけど）

それと、毎日巡回されているとの事ですが
もうそろそろネタ切れです
まだ誰もやって無い事とか他にあるかなー。
（って別にそういう観点からやってる訳でもないですが）

＋＋＋＋＋＋

閑話休題。

snapshotのスレをdat化させる方法について、まとめてみました。

http://www.geocities.jp/mirrorhenkan/snapshot/

mukiyuさん（とお呼びして構わないでしょうか）から教えて頂いた方法だと
変換に３段階かかるので
少しやり方を考えて　２段階でdat化出来るようにやってみました。

htmltodatも含めたら　３箇所からＤＬしなくてはならず
面倒くさいと思われるかもしれないので
避難所スレとか　datアップスレとかに書いてもスルーされそうだなー。
他の方々に色々試してもらいたいんだけど・・・。
245 ：にゃあ：05/09/25 23:34:09 ID:XS3eLH9A: どもども
clip2log 3.0をリリースしました
datフォルダを作ってそこにdatファイルを入れ、適当に作ったsubject.txtと一緒にFTPでうｐり
外部板としてかちゅで取り込み、datファイルとidxファイルをテキスト置換ツールで書き換え。。。
なんていう回りくどい手順を踏まなくても
標準datをかちゅのログへ手軽にコンバートできるようになりました
それもこれも、663ﾀﾝのお陰です
ありがとうございました
246 ：名無しさん＠勉強中 ★：05/09/26 19:13:22 ID:???: 良かったですね
これで当方も別の事出来ます（って何やるんだか）

あと
ちょっと244は筆が滑りました
「具体例を」と言われても困ります
ごめんねごめんね
とはいえ
http://user.ftth100.com/mirrorhenkan/test/read.php?key=1046742687&st=1&to=1001
↑このスレの最初の辺りなんかそんな事書いてますよね
ちなみにこのスレの60で44さんが出しておられるRuby製のコンバータですが
ＤＬしてREADMEを見てみるとまだかちゅ～しゃ変換は未実装みたいです
にしてもすごいな
247 ：名無しさん＠勉強中 ★：05/09/26 19:52:23 ID:???: さて http://2ch.dumper.jp/ も検索対象に入れさせて頂いたのですが、
結構、そこにしか残って無いスレもあるみたいです。
で、dat化する方策を考えてみましょう。
とはいえ、今の所 htmltodatは文字コードUTF-8には
未対応なので、さてどうしたものか。
（バージョンアップされるまで待つというのも一つの手ではありますが）
シフトJISならＯＫなので、現状で考えられる方法として二つあると思います。
(1)　リンクを作り右クリック保存して　適当なエディタでシフトJISに保存し直す
(2)　ブラウザで呼び出し、「ファイル」→「名前をつけて保存」で
　エンコードの種類を「日本語（シフトJIS）」にする
248 ：名無しさん＠勉強中 ★：05/09/26 19:53:03 ID:???: で、とりあえず二つやってみました。
それぞれ
１→右クリック保存（UTF-8）
２→エディタ（xyzzy)でシフトJISに保存しなおしたもの
３→ブラウザ（IE）からシフトJISで保存

http://www.geocities.jp/mirrorhenkan/dumper/test1-1.html
http://www.geocities.jp/mirrorhenkan/dumper/test1-2.html
http://www.geocities.jp/mirrorhenkan/dumper/test1-3.html
http://www.geocities.jp/mirrorhenkan/dumper/test1-1.html
http://www.geocities.jp/mirrorhenkan/dumper/test1-2.html
http://www.geocities.jp/mirrorhenkan/dumper/test1-3.html
単に変換しただけでcharset等は全く手をつけてないので文字化けしますが
それはそれとして
１と２を見てみると、本文のソースはんもう改行無しにベターーっと続いています。
エディタでも、なかなか開かずしばらく待ってたら強制終了したりして。
htmltodatで色々やってみたのですが、どうやっても出来ませんでした。
（失敗例をとっておけば良かったな）
ただ、３だけ成功しました。正規表現は以下で。
m#<DT>([0-9]+) ：.*?(?:<A href="mailto:(.*)">)?(.+).*? ?：(.+?)<DD>(.*) *?(<DT>|</DD>)#mi
249 ：名無しさん＠勉強中 ★：05/09/26 19:53:35 ID:???: 「ブラウザから保存すると勝手にソースを変えてしまうから良くない」
とよく言われますが、この場合はそう悪くないなと思いましたです。
という事で
2ch.dumper.jpのスレをdat化したい時は
ブラウザ（IE）からシフトJISで保存して
タイトル部分を変えて上記の正規表現でdat変換する
　・・という手順でいいでしょうか。（誰に聞いてるんだ）

あと２の正規表現は、どういうものが考えられるでしょうか（だから誰に(ry）
250 ： ◆/vmukiyuzw ：05/09/26 20:38:22 ID:mylPXBdT: >>247
> とはいえ、今の所 htmltodatは文字コードUTF-8には
> 未対応なので、さてどうしたものか。
うーむ、プレッシャーをびんびん感じます＾＾；
まあ、（後述しますが）多分近々やりますよ。

>>248-249
１はUTF-8のままなのでまあ論外として、２は自分の環境では
「read.cgi7.00？」で変換できましたよ。
（ということはdatベースではなくread.cgiベースでクロールかけて
それをUTF-8変換してるってことだろうか？2chサイドからしたら
結構ｶﾞｸﾌﾞﾙな事してますなあ・・・
確かにメールでの問合せの回答でもdatでは保存していないような
感じでしたし）

ところでこのHTMLからはスレタイが取得できませんでした。
というのはhtmltodatでは<title>タグからスレタイを取得してるのですが
このHTMLのように<title lang=～みたいに<title>タグに余分なものが
くっついてるケースを考慮していなかったためです。
ということで、不具合として修正する必要が出てきましたので、ついでに
当面のもろもろも対処してしまおうかと。

# ただ、このHTMLのスレタイは「D言語 Part 6 - DUMPER.JP」
# になっちゃうんですよね・・・うーむ微妙
251 ：にゃあ：05/09/26 21:15:57 ID:dMn/Z86W: どもども
なんかよくわかんないのですけど、>>248のtest1-1.htmlをIEで表示させ
右クリックでソースを表示させると、なかなか興味深い結果になりました

特徴
(1) HTMLファイル中に出現する<dl>タグは、ただひとつのみ
(2) 最終レスの末尾には</dl>タグが付随
(3) 各レス先頭には、<dt>タグが付随

スレッドタイトルは、<title>タグ内の文字列から抽出すればいいので
(1)～(3)により、datファイルの1列目から4列目までに相当するデータを入手することが出来ます
後は、TatsuさんのDAT2HTMLからdatへ変換するのとそれほどの違いはないでしょう
252 ：にゃあ：05/09/26 21:35:54 ID:QRXpgneK: 漏れなら、次の手順でソースコードを整形します

(1) <title>タグ内の文字列からスレッドタイトルを抽出
(2) 改行コードを全削除
(3) 文頭から<dl>までを削除
(4) </dl>から文末までを\nへ置換
(5) <dt>を \n<dt>へ置換

んで、UTF-8からShift_JISへ直接変換できないものかと考え
clip2logでも採用しているjccっていうDLLの仕様書を読んでみましたが
UTF-8はサポート対象外でした。。。
昨日、あるコマンドをjccに追加して頂こうと作者様管理の掲示板にておながいしたところ
コマンドの追加自体はOKだったのでつけど、最近は忙しいので半年ほど先になるとのことでした
なので、UTF-8のサポートをおながいするのは気が引ける状態です。。。
253 ：にゃあ：05/09/26 22:12:47 ID:xKyLl5qV: と思ってぐぐってみたら、コンバータが早速見つかりましたw
GUIでもコマンドラインでも動作します

つ http://www.vector.co.jp/soft/win95/util/se134905.html
254 ：にゃあ：05/09/26 22:33:18 ID:XFH65OIt: つーか、いまhttp://2ch.dumper.jp/から適当なスレッドを右クリックでﾀﾞｳｿしてみたのですが
改行コードがLF型になってるだけで、ふつーにメモ帳で読めました
ぐぐってコンバータを探し出し、わざわざRtfconvをｲﾝｽｺした努力は一体。。。
うぐぅ
255 ：にゃあ：05/09/26 22:39:45 ID:CAgjriOt: ちなみに、漏れの落としたスレもこんな感じでした

<title lang="ja">スレッドタイトル - DUMPER.JP</title>
256 ： ◆/vmukiyuzw ：05/09/26 22:51:39 ID:mylPXBdT: にゃあさんって私の名前をNGワードにでもしてるのかなあ・・・
> 漏れなら、次の手順でソースコードを整形します（以下略
って、まさにそういうことをやろうとしてるのがhtmltodatなんですが・・・

なんかやる気が沸いてきたのでUTF-8対応は今週中にはやりますよ。
宣言しときます。
257 ：にゃあ：05/09/27 01:38:06 ID:ZJxoyjBE: >>255を書いた5分後くらいに、ソ板で「htmltodatの正規表現」ってスレを見つけました
読んでいくうちに、◆/vmukiyuzwさんのトリップがあったので
リンクされていたサポートスレへ飛んでみました
で、トップページにある配布サイトのURLを見たとき
どっかで見たことあるにゃあ、、、と思いました
readme & historyのページを目にした刹那。。。((；ﾟДﾟ)ｶﾞｸｶﾞｸﾌﾞﾙﾌﾞﾙ
ローカルのフォルダを探してみたら、全バージョンが揃ってました
ﾞｳｿさせて頂いたツールの名称を「html2dat」であるといまのいままで思いこんでおり
「htmltodat」が、monazilla.orgでもリンクされているツールだとは気づかなかった次第です
知らぬこととは言え、大変失礼をしました
数々の暴言、お許しください

 >>254で落としたファイルを、Speeeeedで変換しようとしたところ。。。

メモ帳ではなんの問題もなく表示されるのですが
<dt>(\d+?) ：(.*?) ：(.+?) <dd>(.+?) \rだとか
<dt>(\d+?) ：<a href="mailto:(.+?)">(.*?)</a> ：(.+?) <dd>(.+?) \rだとかが
Speeeeedでは変換できませんでした
IEでスレッドを開き、右クリックからソースを開き
別名保存でローカルにテキストファイルとして保存してから
同様の置換処理を行おうとしたところ、やはり失敗しました
勿論、rtfconvで文字コートを変換した後のものは、正常に処理されました
258 ：にゃあ：05/09/27 01:48:51 ID:ZJxoyjBE: PS.
UTF-8への対応、期待しております
漏れの方は、jane2logの開発でも模索してみます。。。
259 ：名無しさん＠勉強中 ★：05/09/27 20:53:45 ID:???: えーと
早朝から外に出て神経すり減らした一日だったもんで
一回休み
260 ：名無しさん＠勉強中 ★：05/09/27 20:58:39 ID:???: とはいえ

＞mikiyuさん
もう対応なされたんですね。すごいや
実は、あと２点要望がありました。

(1)　beコード対応
　・・・といっても色々なhtmlがあるでしょうから
　日付ＩＤ欄の「タグを削除する」チェック欄があったらいいかなと。
(2)　正規表現記入欄に横スクロール
　・・があったら嬉しいな　と。
　正規表現を微調整するのにいちいち別のエディタでコピペしないといけないもので。

もう寝ます
261 ：名無しさん＠勉強中 ★：05/09/27 21:06:29 ID:???: でもスルーしてるみたいで何なので

＞にゃあさん
いっそ「htmltoかちゅdat」を作ってみたらどうでしょう
htmltodatのかちゅdat変換バージョン
神になれるチャンスですぞ

私？

とんでもない、あたしゃ神様だよ。（←志村の口調で）

ハイ当然嘘です（まず絶対そんな事思えませんって）
うわ何をするやめ

すっごい失礼しました＞all
やめてムチでいじめて
262 ： ◆/vmukiyuzw ：05/09/27 22:00:52 ID:RLe7TetM: >>260
> (1)　beコード対応
> 　・・・といっても色々なhtmlがあるでしょうから
> 　日付ＩＤ欄の「タグを削除する」チェック欄があったらいいかなと。
beコードについては実はあんまり理解していなかったりします・・・
単にHTMLタグを全部除去すればいいんですかね？特に難しい事ではないですが。

> (2)　正規表現記入欄に横スクロール
> 　・・があったら嬉しいな　と。
HTMLソース欄、dat変換結果欄と同じコンポを使ってるのでこれも難しくは無いです。
ただ、ここは常に全部見えていたほうが編集しやすいだろうなと思ったのであえて
付けなかったのですが、そうではない意見もあるんだなあと思う次第です。
（理想としては秀丸みたいなエディタがコンポ化されていて、それを使うことが出来れば
一番うれしいんですが。検索とかもできると便利だし）
まあ次の修正あたりでつけましょう。いつになるかはわかりませんが。
263 ：名無しさん＠勉強中：05/09/27 23:40:34 ID:g99clHOy: >>262
>beコード
コピペだけど

<a href=/test/p.php?i=12345 target=_blank>!</a>
2004/11/26 - 2004/12/11(面白ネタnews)
初期に面白ネタnews板で使用された形式。
<a href=javascript:w=window.open('http://be.2ch.net/test/p.php?i=12345&u=d:'+document.URL);if(w)w.focus();void(0);>?#</a>
2004/12/11 - 2005/02/02(面白ネタnews)
2004/12/30 - 2005/01/12(その他の2ch)
Beが全板対応になると共にJavaScriptを使う物に変更された。
BE:12345-#
2005/01/12 - 現在(その他の2ch)
read.cgiやブラウザ側でリンクすることを前提にした、すっきりした形式。
<BE:12345:1>
2005/02/02 - 現在(面白ネタnews)
WebブラウザのJavaScriptをオフにするとタグとして扱われるため、表示されない。
264 ：名無しさん＠勉強中：05/09/27 23:42:59 ID:g99clHOy: >>261
俺の「無知」で質問攻めにしていじめられるかも知れん。
265 ： ◆/vmukiyuzw ：05/09/28 00:11:05 ID:5+alcFpu: >>263
申し訳ないですが、そのヒントでは私の頭では何をどうすればいいのか
さっぱりわかりません。
せめて、何か元のURLと「どこが不要なのか」がわかれば嬉しいのですが。
266 ： ◆/vmukiyuzw ：05/09/28 02:46:09 ID:5+alcFpu: なんか順序が逆転してしまったようでいまさらですが
htmltodatをバージョンアップしましたので報告しておきます
やっとUTF-8対応しました＾＾ｖ
http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/202-203
267 ：名無しさん＠勉強中 ★：05/09/28 19:06:50 ID:???: えーとですね

 >>262
　>>263さんが出して下さったように色々あるので
(1)タグを削除して頂けるだけで構わないです。
そうすればsnapshot等のガラガラも取り除けますし。（←後知恵ですが）

ところで、beコードはどう表示してるんかな・・と
htmltodat最新版でbeのスレを開こうとしたら
何度やっても「http/1.1 500 Internal Server Error」と出てしまうです。
他と通信方法が違うのでしょうか。
ちなみに開こうとしたスレはhttp://be.2ch.net/test/read.cgi/be/1111061495/　ですが。

(2)　私の環境だと、正規表現記入欄の文字が隠れてしまって
　全部は見渡せないのです。
　そんなものなのかな　と　ずっと思っていました。
　http://www.geocities.jp/mirrorhenkan/htmltodat/myhtmltodat.png
　なので正規表現記入欄単独での編集は出来ないのです・・。
268 ：名無しさん＠勉強中 ★：05/09/28 19:13:31 ID:???: >>264
いやー私も無知ですから。
二人会わせてムチムチですね。

ところで、2chタイプの掲示板スクリプトを配布しているサイトのサポ板で
管理人さんが「ぼくは素人ですから」と言ってるのを読んで
うそだー　と思った事ありますが
もしかして同じような事　思われてるのかなーとか思ったりして。

いや、こっちはほんとに無知な素人なんですよ・・・
269 ：名無しさん＠勉強中 ★：05/09/28 19:45:38 ID:???: ところで、>>261を書いた手前
誠に恐れ多くも htmltodatみたいなスクリプトが出来ないかと
ちょっと考えてみて少しだけやってみたら、何だか出来そうです・・・。

まさしく車輪の再生産以外の何物でもないのですが、意外に簡単そうなので
やってみようかな
270 ： ◆/vmukiyuzw ：05/09/28 20:51:19 ID:5+alcFpu: >>267
> (1)タグを削除して頂けるだけで構わないです。
> そうすればsnapshot等のガラガラも取り除けますし。（←後知恵ですが）
了解です。でも、逆にこのタグを利用しているブラウザもあるかもしれないので
アンカータグ削除と同様、オプションの形でつけると思います。

> ところで、beコードはどう表示してるんかな・・と
> htmltodat最新版でbeのスレを開こうとしたら
> 何度やっても「http/1.1 500 Internal Server Error」と出てしまうです。
確かにこのエラー出ますね。
IEとhtmltodatのHTTPリクエストの内容を比べてみると多少の違いがあるので
この辺に原因があるのだと思います。ちょっと調べてみます。

> (2)　私の環境だと、正規表現記入欄の文字が隠れてしまって
> 　全部は見渡せないのです。
私もサブマシンの9x機で試してみるとこの状態になりました。
使ってるコンポのバグだと思うのですが、コンポ自体を修正する力量は多分
私にはないので、ご要望のとおり横スクロールありで対処しようと思います。

>>269
多分簡単ですよ。もともと私もperlでスクリプト書いて変換してましたし。
つーかhtmltodat自体、スクリプトでやってたことにGUIの皮をかぶせた程度の
ものですんでｗ
271 ：にゃあ：05/09/29 00:11:01 ID:e6uRIWVS: 「htmltoかちゅdat」って文字列を見た瞬間、かなり色気が出ましたけど
すぐに無謀であることに気づきました
なんせ、HSP単体ではまともに正規表現が動かないのでw
272 ：名無しさん＠勉強中 ★：05/09/29 18:54:12 ID:???: 何だか本当に出来そうなので
神をも恐れぬ行為に及んでみようかと思います
実用性云々ではなくできるかなできるかなはてさてハハーというスタンスですが
（ってかちゅ～datコンバータもその程度の動機でしたけど）
ごめんなさいごめんなさい

という事で
↓ここまで出来ました

http://www.geocities.jp/mirrorhenkan/htmltodat/

ループ文とか使わずに一斉置換しているだけなので
元のhtml部分のヘッダとフッタが残ってしまっています。
それとエラーチェックは多分無理そうだなー（スキルが無いし）

考えたのですが、if文を使おうとしても
これの場合、dat2htmlやdat2kajtudatのように一行づつ読み込んでる訳ではないので
「ここが終端だよ」という事が出来ません。
最初に始点と終点の目印を入れてもらうか
変換結果を手動で整形してもらうかしかなさそうです・・。

タイトル部分は<title>タグの中を取り出せばいいですし
最初の１だけ単独変換してタイトルをつけて
残りは一斉置換（Ｇスイッチというのでしょうか）でやれば良さそうです。
アンカータグ削除のチェックボックスも何とかなりそうですし
変換前・変換後それぞれのプレビューもdat2html-1で使ったスクリプトを外部jsにして
ボタンで呼び出せば何とかなりそうな感じです。
あと入力フォームのリセットボタンの設置と
汎用的正規表現一覧の呼び出しくらいでしょうか。
他に考えられるものとして何があるだろう・・。

ごめんなさいごめんなさい。。
273 ：名無しさん＠勉強中 ★：05/09/29 19:08:30 ID:???: 変換する正規表現についてなのですが
この場合はスレそのもののhtmlソースなので
「readcgi 7.00?」を使わせて頂きました。

ただサンプルそのままだと終端把握の為の$6つまり「(<dt>|</dl>)」がちょっかいをして
一つ置きにしか置換されないので省略しました。（でもそのせいで終端認識出来ないんだよなー）

それと、やっていて気付いたのですが
read.cgiが吐き出す書式が少し変わったみたいで
日付の前につくコロンの前の空欄（説明下手だなぁ）が無くなっているみたいです。
htmltodat付属の正規表現そのままでは変換出来なかったので
空欄のまえに「?」を入れてみたら変換出来るようになりました。
（御存知でしたらスルーして下さい）

m#<dt>([0-9]+).+?(?:"mailto:(.+?)">)?(.*?)(?:|</a>) ?：(.*?)<dd> ?(.*?) (<dt>|</dl>)#mi

500KB

掲示板に戻る全部前100 次100 最新50