楽天モバイル[UNLIMITが今なら1円] ECナビでポインと Yahoo 楽天 LINEがデータ消費ゼロで月額500円〜!


無料ホームページ 無料のクレジットカード 海外格安航空券 解約手数料0円【あしたでんき】 海外旅行保険が無料! 海外ホテル
告知欄です


■掲示板に戻る■ 全部 1- 101- 201- 301- 401- 501- 601- 701- 801- 最新50
メモ4

1 :名無しさん@停滞中 ★:08/06/17 20:07:26 ID:???
はてさて思いついた事など

420 :名無しさん@停滞中 ★:10/03/11 19:12:10 ID:???
追記
前処理に下のを追加(※「&」を小文字にして)

s#<>#&lt;&gt;#igk

これやらないとデリミタとしての「<>」との区別が出来なくなるです
たとえば↓の154.481.851等

http://logsoku.com/thread/society6.2ch.net/gline/1193462528/


まあプログラムやhtmlタグ等が出ないようなスレッドでは関係ないですし
>>417-418ではダメな場合だけでもいいかもしれないです

421 :名無しさん@停滞中 ★:10/03/12 18:30:52 ID:???
http://pc12.2ch.net/test/read.cgi/software/1267177119/166,189

どうも見て頂いてるようで。お世話になっております

個人的には>>294でmokume◆Q35xnK/I9LhhTwさんがおやりになられたように
htmltodat機能だけでもあったらなと。

どんなものかという事でいちおう本体を。

www.geocities.jp/mirrorhenkan1/kj/KJ_01122_b053_rc1.rar.zip

422 :名無しさん@停滞中 ★:10/03/12 18:37:41 ID:???
メモ
http://threadic.com/ のsubject.txt化について(by htmltodat)

URL例
http://threadic.com/thread/bbs/read.php/japanese/subback/

正規表現(2行に分けて書いてるので繋げて1行に)
m#<TR align="center"><TD>([0-9]+)</TD><TD class="BBS_List" align="left"><A hre
f="../(\d+)/l50" target="_blank">(.+?)</A></TD><TD>.+?</TD><TD>.+?</TD><TD>(\d+)</TD></TR>()#mi

変換結果式
<>$2.dat<>$3<>($4)<>

後処理
s#^<>(.+?)<>(.+?)<>(.+?)<>.+?(?=\n)#$1<>$2$3#i
s#((?:^|\n))<>(\d+\.dat<>.+?)<>(\([0-9]+\))<>#$1$2$3#ig


これでいちおうsubject化出来るです。
変換結果式で

 $2.dat<>$3($4)

とやろうとしたんですが、何だかエラーが出るので後処理で。



・・・となると
subject.txtという名前で保存出来るようにもなっていたらなと。

423 :koreawatcher ◆Nida.eneRA :10/03/13 00:25:16 ID:4OBODbk1
>>421
いつも見させてもらっています。
ところで、専ブラがみんなこの機能を内蔵してしまうとみみずんの広告を
だれも表示しなくなって、結果的にみみずんがなくなってしまうような気が
するんですが、杞憂でしょうか。

424 :名無しさん@勉強中:10/03/13 00:41:39 ID:rttbkyeE
広告表示してても、なくなっちゃう時はあっさり無くなるものですよ。
専ブラ側で機能持ってなくても、p2porxyのように楽に導入できる外部ツールもあるし。

Styleにはmimizun.jsが標準で添付されてましたしね。

気にし無さ過ぎもどうかと思いますが、気にし過ぎなのもどうかと

425 :名無しさん@停滞中 ★:10/03/13 22:23:05 ID:???
>>423
どうもです。

えーと、>>424さんと同意見です。
# こういう簡にして要を得たような文章書けないな


思い起こすと、例えばdumper.jpさんの所とか しばらく不通になった後にリニューアル復活して
その直後に繋がらなくなって今まで続いてるです。
ページランクやレスアンカー・IDポップアップ付加とかの
結構手の込んだリニューアル直後に不通になったのが実に印象的でした。

http://web.archive.org/web/20050614010755/2ch.dumper.jp/0000013542/

http://web.archive.org/web/20070112001954/http://2ch.dumper.jp/0000017733/



みみずんさんの所ですが・・・まあ何といいますか
どうなんでしょうか。よくわかんないです

http://twitter.com/mimizun/status/10196896542
http://twitter.com/mimizun/status/10366880192



ところで、お名前をレインボー表示させる為にReplaceStr.txtの書式を少し直したです
yykakikoだと<b>と◆の間のスペースが無いみたいですね。

426 :名無しさん@停滞中 ★:10/03/13 22:44:47 ID:???
誤:yykakikoだと<b>と◆の間のスペースが無いみたいですね

正:yykakikoだと</b>と◆の間のスペースが無いみたいですね


それと、Threadic.com読み込みバージョン ありがとうございます。
すごく面白いです。


>>421の件ですが、個人的には
左ペインで外部コマンドが使えるようになればなとも思うです(以前も要望したですが)

そうすれば、スレッド一覧htmlからsubject.txtを作成するようなスクリプトを此方で用意すれば(>>149のsubject.txt版のような)
色んな掲示板を読み込めるようになるのではないかなと。

427 :名無しさん@停滞中 ★:10/03/13 22:49:49 ID:???
http://society6.2ch.net/test/read.cgi/gline/1165245437/660-661n

えーと
どうなのだろう

428 :名無しさん@停滞中 ★:10/03/14 16:52:14 ID:???
>>419-420
後処理に下の一行を追加

s#((?:^|\n).*?</b>\[―{}@{}@{}\-\])<b&gt;#$1$2<b>#igk

これつけないと例えば
http://logsoku.com/thread/yutori7.2ch.net/campus/1264993145/
のレス1の名前がうまく出ないです

まあレアケースかもですが(そうでもないか)

429 :名無しさん@停滞中 ★:10/03/16 12:18:49 ID:???
メモ
スレッドランキング(http://www.bbsnews.jp/)のdat化について

URL例
http://proxy.bbsnews.jp/2ch/mog2/1253115656/

正規表現
m#<a name="\d+"></a><dt.+?>([0-9]+) :<font color=green><b>(?:<a href="mailto:(.+?)">)?(.+?)(?:</a>)?</b></font> :(.+?) <dd .+?>(.+?)<br><br></dd>#mik

430 :名無しさん@停滞中 ★:10/03/16 12:41:46 ID:???
修正
スレッドランキング(http://www.bbsnews.jp/)のdat化について

URL例
http://proxy.bbsnews.jp/2ch/mog2/1253115656/
http://proxy.bbsnews.jp/2ch/avideo/1268682799/

正規表現
m#<a name="\d+"></a><dt.+?>([0-9]+) :<font color=green><b>(?:<a href="mailto:(.+?)">)?(.+?)(?:</a>)?</b></font> :(.+?)<dd .+?>(.+?)<br><br></dd>#mik


>>429の正規表現から<dd>の前のスペースを省いただけです

431 :名無しさん@停滞中 ★:10/03/16 18:12:19 ID:???
>>430追加
「その74」という事で

432 :名無しさん@停滞中 ★:10/03/16 20:05:11 ID:???
ホスト規制で書き込めないのでココにメモ

http://25eo.com/
http://djenadpekzm.nayana.com/sch/bbs/read.php/test/

JaneXenoで上の掲示板が登録出来ないように思うです。
で、スクリプト配布先↓も登録してみたですがやはりダメっぽい。

http://www.sanadake.info/bbs/read.php/support/


調べてみたら、threadic.comと全然htmlが異なっているのが原因のようです。
dat化は下記


URL例
http://www.sanadake.info/bbs/read.php/support/1261898738/
http://djenadpekzm.nayana.com/sch/bbs/read.php/test/1267437116/
http://25eo.com/sch/bbs/read.php/ingyeo/1268484383/

正規表現
m#<DT>([0-9]+).*?:<SPAN ID="G"><B>(?:<a href="mailto:(.+?)">)?(.+?)</B></SPAN> ?:(.+?)<BR><DD>(.+?)<BR><BR>#mi


どうも見たところ、threadic.comさんのところのものはhtmlその他 かなり手を入れておられるのかも。
上で出したように、掲示板スクリプト配布先と同じhtmlを出すところばかりですし。
あと
http://threadic.com/thread/bbs/read.php/japanese/
の最下部を見たら
「Threadic READ.PHP - 2010/03/14 (PHP5) +MySQL5 +Apache2」
とありますが
Schの最新バージョンは2010/1/16のようです。
まだ見てないですがsubbackのhtmlも違っているみたい。



・・・と書いてから
http://www.beacon-tcg.net/bbs/read.php/any/
のhtmlを見たらこれまた少し異なっているようで。
いろいろあるなー。

433 :名無しさん@停滞中 ★:10/03/16 20:14:02 ID:???

今見直したら
http://www.sanadake.info/bbs/read.php/support/
だけは読めたですが
http://25eo.com/sch/bbs/read.php/ingyeo/
http://djenadpekzm.nayana.com/sch/bbs/read.php/test/
の二つはやはり真っ白のままでした


メモ
JP & KR Board
http://jbbs.livedoor.jp/internet/7845/

434 :名無しさん@停滞中 ★:10/03/17 17:43:59 ID:???
メモ
http://otu.sakura.ne.jp/2ch/ のdat化について

URL例
http://otu.sakura.ne.jp/2ch/_bin/view.cgi?board=linux&thread=1231189481&host=pc11.2ch.net

正規表現
m#<dt.+?><a.+?>([0-9]+)</a> : <b>(?:<span title="(.+?)".+?>)?(?:<a.+?>)?(.+?)(?:</a>)?(?:</span>)?</b> : (.+?)</dt><dd.+?>(.+?)<br><br></dd>#mik

前処理
s#(<title.+?)(?: @ \w+?)?(</title>)#$1$2#ik


ここなんですが、よくわからない。
http://otu.sakura.ne.jp/2ch/_bin/ とか見ると「unkar-light.js」とかあるので
unkarさんの所なのかな。
にしてはhtmlの形式が全然違うし。

URL例の元スレッド(http://pc11.2ch.net/test/read.cgi/linux/1231189481/)は閲覧出来なくなっているのに
ミラーでは読めるので
これも追加させてもらおうかなと

435 :名無しさん@停滞中 ★:10/03/17 17:52:07 ID:???
2chのdat落ちしたスレを右クリックで即座に蘇生させられるFirefoxアドオン「fire2chDat」:phpspot開発日誌
http://phpspot.org/blog/archives/2010/03/2chdatfirefoxfi.html

昨日出た記事っぽいのにブックマーク数が凄いですな
にしても、記事の説明文にうちのサイトのリンクも何もないのは一体

・・って 作者さんは↓こっちみたいですね

http://fatalita.sakura.ne.jp/
https://addons.mozilla.org/ja/firefox/addon/97406
https://addons.mozilla.org/ja/firefox/user/5228271

436 :名無しさん@停滞中 ★:10/03/18 17:02:03 ID:???
メモ

Ria Service
http://www.riaservice.com/

http://app.riaservice.com/threadex/?t=2&u=http%3A%2F%2Fyutori7.riaservice.com%2Ftest%2Fread.cgi%2Fnews4vip%2F1268887986%2F

↑これですが
これ↓がdat落ちしても閲覧可能だったら有難いです

http://yutori7.2ch.net/test/read.cgi/news4vip/1268887986/


まあhttp://www.riaservice.com/?page_id=2で説明あるですが
一応メモという事で

437 :名無しさん@停滞中 ★:10/03/18 18:06:04 ID:???
ダメでしたか
いえいいんです


ところで

韓国の姿を見せてくれる! ??? ??? ????!
http://threadic.com/thread/bbs/read.php/japanese/1268644780/

↑このスレッドに貼ってある画像をJaneXenoで展開したいんですが
どうやれば良いのだろう
画像URLは例えば下記

http://image.threadic.com/images/ZqEOH5reFB1
http://image.threadic.com/images/7DD7kbioWY0

どうもURLはこれでないといけないようで、拡張子やスラッシュを入れるとエラーになるです
なのでImageVierUrlReplace.datやReplaceStr.txtでゴニョゴニョという事でもなさそう。

貼られたものを見つける都度
URL右クリック→対象をビューアで開くでやるのも何だかなと

438 :名無しさん@停滞中 ★:10/03/19 19:45:51 ID:???
http://threadic.com/thread/bbs/read.php/japanese/1267451067/72

うほっ
出来たですっ
ありがとうございます
そうか、こういう時に$VIEWERを使うのかと。

ただ ケアレスミスでしょうけど「w」ではなく「\w」ではないかと。

http://image.threadic.com/images/(?:w+)[Tab]$&[Tab][Tab]$VIEWER

http://image.threadic.com/images/(?:\w+)[Tab]$&[Tab][Tab]$VIEWER


あと、グループ処理(?何ていうんだろう・・「(?:〜)」というやつ)を使った理由がわからなくて悩んでるです
いえ別にいいんです
失礼しました
ごめんなさい

439 :名無しさん@停滞中 ★:10/03/19 23:08:57 ID:???
>>411実装(カッケー!)

440 :名無しさん@停滞中 ★:10/03/19 23:22:11 ID:???
補足しとくと

http://adult.threadic.com/thread/bbs/read.php/pervertplus/Cushion/http://www.geocities.jp/mirrorhenkan/
とかからアクセスしてきたらメッセージを出すようにしただけ
ついでに
http://tieba.baidu.com/f?kz=635797320
とかからアクセスがあったら別のメッセージを出すようにしてみたり


まあ大半の方々には関係無いような事で
無意味といわれても別に

441 :名無しさん@停滞中 ★:10/03/20 12:07:55 ID:???
メモ
2ちゃんぬる(http://2chnull.info/)のdat化について

URL例
http://2chnull.info/r/gline/1165245437/1-1001

正規表現
m#<dt>([0-9]+):<em><b>(?:<a href="mailto:(.+?)">)?(.+?)(?:</a>)?</b></em>:(.+?)</dt>\t+<dd>(.+?)</dd>#mik

前処理
s#<title.+?/title>##ik
s#<div id="body">\s+<h2>(.+?)</h2>#<title>$1</title>#ik
s#<a.+?>(h?ttp://\w+?\.(?:2ch\.net|bbspink\.com)/test/read.cgi/\w+?/\d+/?)</a> \[<a href=".+?">cache</a>\]#$1#igk


URL例の場合だと例えばレス3の7行目以降が省略されてるみたい
(元レスはhttp://society6.2ch.net/test/read.cgi/gline/1165245437/3

どういう法則で省略になったのか判りませんが、そういう事があるかもしれないという事で。

442 :名無しさん@停滞中 ★:10/03/20 12:32:13 ID:???
メモ

2chまとめサイトエディター2.0
http://eva-lu-ator.net/~gemma/ktkr2/bbsmenu.html
やったー2chまとめサイトエディター2.0できたよー\(^o^)/ - Gemmaの日記
http://d.hatena.ne.jp/Gemma/20100317/1268812937

443 :名無しさん@停滞中 ★:10/03/21 20:05:32 ID:???
http://threadic.com/thread/bbs/read.php/japanese/1269082122/

上を見て

http://be.threadic.com/thread/bbs-jp/read.php/koreajapan/

を板登録しようとしたらうまくいかないです

とりあえずsubbackの取得先が違うような



http://be.threadic.com/thread/bbs-jp/read.php/koreajapan/subback/
xeno
http://be.threadic.com/thread/bbs/read.php/bbs-jp/subback/

444 :名無しさん@停滞中 ★:10/03/21 20:11:00 ID:???
「bbs」が「bbs-jp」になってるみたい

あと
レス欠番するようにもなってるみたい
下の9・15・17・以下沢山

http://be.threadic.com/thread/bbs-jp/read.php/koreajapan/1269087909/

445 :koreawatcher ◆Nida.eneRA :10/03/21 22:22:28 ID:KAywHbp7
>>437の辺りからここに投稿しようとしてもうまく行かず、IPアドレスを変えてみたら
書き込めるようになったんですが、偶然でしょうか。

それはおいといて、>>438は「\w」ですね。コピペ元も「\w」になっていたのに
なぜそのように投稿してしまったのか謎です。
(?: は$1に結果を格納しないから無駄がなくなるという程度に
理解しています。もしかしたら間違っているかもしれませんが。

>>443
read.phpの前にはbbsが来るという前提でプログラムが作られているので
変更が必要になりますね。
今は、ホスト=threadic.com/thread、板=japaneseとやっていますが、
ホスト=threadic.com/thread/bbs、板=japaneseと変更しなければ
ならない気がします。

446 :名無しさん@停滞中 ★:10/03/22 20:14:46 ID:???
>>445
すみません、スパムがひどいので「http://」をNGワードにしてあるです。ごめんなさい
yykakikoだと、NGワード交じりの文章でも投稿後「投稿完了しました」メッセージが出るみたいで
多分それなのではないかなと思うのですが。
とりあえず「http://」をNGから外してみたです(スパム来るかな)

それはそうと、threadic.comさんの所
htmlがこれまた全然様変わりしてるですね。
今日の昼頃まではXenoでdat化取得出来たのですが
現在ではさっぱりです
レス番も盛大に飛びまくってますし。
たぶんsubbackのhtmlも変わってるのだろうなと。


URL例
http://threadic.com/thread/bbs/read.php/japanese/1268644780/
http://be.threadic.com/thread/bbs-jp/read.php/koreajapan/1269087909/

正規表現
m#<DT>([0-9]+).*?:(?:<font.+?>|<SPAN ID="G">|<a href="mailto:(.+?)">)<b><B>(.+?)</B></b>(?:</SP
AN>|</font>|</a>)? *?:(.+?)(?:<BR>)?<DD>(.+?)<BR><BR>#mi

前処理
s#(<b><B>.+?</B>)( ◆.+?)</b>((?:</font>|</span>))#$1$2<B></b></b>$3#ig


ホストと板に含める範囲もですが、>>432-433の件もあり
やはり簡易的な正規表現置換機能があったら有難いなと思う次第です

447 :名無しさん@停滞中 ★:10/03/23 07:48:43 ID:???
あれれ
上のやつだと下のhtml等でトリップ周りがうまく切り分けられないのか
難しい

http://threadic.com/thread/bbs/read.php/japanese/1269082122/

448 :名無しさん@停滞中 ★:10/03/23 18:39:25 ID:???
ほんとコロコロ変わる

m#<dt>([0-9]+) .+?:(?:<font.+?>|<a href="mailto:(.+?)">)<B>(.+?)</B>(?:</font>|</a>) :(.+?)<dd>(.+?)<BR><BR>#mi

449 :名無しさん@停滞中 ★:10/03/25 18:33:07 ID:???
さて、まだホスト規制されてるですし
長文で尚且つ2chではない所に関する事なのでここで

http://pc12.2ch.net/test/read.cgi/software/1267177119/390

何だかうまくいかないです。
いったん板削除してから板追加したのですが
subbackからして404NotFoundになるです。

どうも指定先が違うみたいに思うのですが。


http://threadic.com/thread/bbs/read.php/japanese/subback/
Xeno
http://threadic.com/thread/bbs/bbs/read.php/japanese/subback/


http://be.threadic.com/thread/bbs-jp/read.php/koreajapan/subback/
Xeno
http://be.threadic.com/thread/bbs-jp/bbs/read.php/koreajapan/subback/


なのでJane2ch.brdを開いて
ホスト=threadic.com/thread/bbs 板=japaneseとなっている箇所を
ホスト=threadic.com/thread/板=japaneseと変更したらsubbackにアクセス出来たです

450 :名無しさん@停滞中 ★:10/03/25 18:51:13 ID:???
次にhtmlの形態ですが
japanese板とkoreajapan板とで全然違うものになっているような。
とりあえずjapanese板のほうはxenoで該当スレッドのhtmlにアクセスしてるようですけど
dat化取得出来ない感じです。

(1)http://threadic.com/thread/bbs/read.php/japanese/
(2)http://be.threadic.com/thread/bbs-jp/read.php/koreajapan/


(1)URL例
http://threadic.com/thread/bbs/read.php/japanese/1269465598/

正規表現
m#<dt>([0-9]+).*?:(?:<font color=green>|<a href="mailto:(.+?)"><b>)<B>(.+?)</B>(?:</font>|</a>) +:(.+?)<dd>(.+)<BR><BR>#mi

前処理
s#(</b> *)(◆.*?)(?:</b>)?((?:</font>|</a>))#$1$2<B></B>$3#ig


(2)URL例
http://be.threadic.com/thread/bbs-jp/read.php/koreajapan/1269258316/

正規表現
m#<dt>([0-9]+).*?:(?:<font.+?>|<SPAN ID="G">|<a href="mailto:(.+?)">)<b><B>(.+?)(?:</B>)?</b>(?:</SP
AN>|</font>|</a>) *?:(.+?)<DD>(.+?)<BR><BR>#mi

前処理
s#(</b> *)(◆.*?)(?:</b>)?((?:</font>|</a>))#$1$2<B></B>$3#ig


どちらにおいても透明あぼーんがあるので
それを補う必要もありそう

451 :名無しさん@停滞中 ★:10/03/25 18:57:48 ID:???
で、>>450のどちらの板のhtmlにも対応するような正規表現を考えると
次のようなものになるかも。
threadic.comの管理人さんが更新したらまた使えなくなるかもですが

URL例
http://be.threadic.com/thread/bbs-jp/read.php/koreajapan/1269258316/
http://threadic.com/thread/bbs/read.php/japanese/1269465598/


正規表現
m#<dt>([0-9]+).*?[::](?:<font.+?>|<SPAN ID="G">|<a href="mailto:(.+?)">)(?:<b>)?<B>(.+?)(?:</B>)?</b>(?:</SP
AN>|</font>|</a>) *?:(.+?)<DD>(.+?)(<BR><BR><dt>)#mi

前処理
s#(</b> *)(◆.*?)(?:</b>)?((?:</font>|</a>))#$1$2<B></B>$3#ig



ここまで書いて思ったですけど
「読めないぞ」という反応が皆無というのは
もしかして読めないのは自分だけなのかもしれないのかな・・
よくわかんないです

452 :koreawatcher ◆Nida.eneRA :10/03/25 19:12:51 ID:bqIcWF5D
>>449
brdconf.iniでBBSType=Sch_BBSなどの記述があれば削除してください。
すでにThreadicとSchは別物として処理しているので、Threadicを
Schであると指定すると不具合が起こります。

453 :名無しさん@停滞中 ★:10/03/25 19:26:17 ID:???
うお!!!

>>452
それでした!
削除したら読めたです!
ありがとうございます!

# うー恥ずかしい・・・

454 :名無しさん@停滞中 ★:10/03/26 19:04:05 ID:???
メモ

2ch_log
http://wmotenailog.x.fc2.com/

455 :名無しさん@停滞中 ★:10/03/29 19:24:59 ID:???
メモ

インスパイヤw - なんとなく◎(http://sunos.saita.ma/inspired/)のdat化について

URL例
http://sunos.saita.ma/inspired/?dubai+actor+1230881341

正規表現
m#<dt>([0-9]+) :(?:<span>|<a href="mailto:(.+?)">)<b>(.+?)</b>(?:</span>|</a>\[.+?\]):(.+?)</dt><dd> (.+?)</dd>#mik

前処理
s#(<title>.+?) - インスパイヤw - なんとなく◎(</title>)#$1$2#ik
s#<br />#<br>#igk



元スレ(http://dubai.2ch.net/test/read.cgi/actor/1230881341)が消えているのに
何故か読めるので。
追加するとしたら「その77」になるのかな

ところで、xhtmlでの改行タグは「<br />」みたいなんでいちおう置換するようにしたですが
これって「<br>」にしなくても専用ブラウザ的(?)にはOKなんでしょうか。

456 :名無しさん@停滞中 ★:10/04/01 18:52:42 ID:???
上のdat化処理ですが
「<br />」→「<br>」に全置換するのは後処理のほうが効率的ですね。
前処理でやると、dat化に必要な部分以外の「<br />」も置換する事になる訳で
時間と電気代とCPU計算その他の消費が冗長になるのではないかと思われ
まあいいか


ところで

2chで落ちた意見を蘇生する方法 | web R25
http://r25.yahoo.co.jp/fushigi/jikenbo_detail/?id=20100324-00001841-r25&vos=nr25mn0000001


そこまで採り上げるほどの記事なんかなと

457 :名無しさん@停滞中 ★:10/04/02 12:19:42 ID:???
メモ
みんくちゃんねるログ(http://log.minkch.com/)のdat化について

URL例
http://log.minkch.com/read.php/801/1267194035/

正規表現
m#<dt.*?>([0-9]+) : <span class="nam">(.+?)</span>\[(.*?)\] : (.+?) </dt><dd>(.+?)<br /> <br /></dd>#mik

前処理
s#<title.+?/title>##ik
s#<h2>(.+?)</h2>#<title>$1</title>#ik
s#(<span class="nam">.+?)</span><span style="color:green;">(◆.+?)</span>#$1</b>$2<b></span>#igk
s#</?(?:div|script|li|select|option).+?(?=\n)##igk

変換結果式
$2<>$3<>$4<>$5<> (←メール欄逆転)

後処理
s#<br />#<br>#igk

458 :名無しさん@停滞中 ★:10/04/02 12:42:24 ID:???
>>457の正規表現って
よく見たら>>315と同じっぽいですね。

ミラー対象の板も似てるですし
もしかしたら同じ方がやっておられるのかも

459 :名無しさん@停滞中 ★:10/04/02 19:10:07 ID:???
とか書いたあとでみてみたら

http://p.loface.com/
http://ch.xmoe.jp/

にアクセスすると

http://news.minkch.com/

に飛ぶですね。
同じ方ですか。

460 :名無しさん@停滞中 ★:10/04/02 19:15:41 ID:???
メモ

z-z-z-z.net 2chブラウザ(http://z-z-z-z.net/)のdat化について

URL例
http://z-z-z-z.net/b/society6.2ch.net/gline/1165245437/

正規表現
m#<dt>([0-9]+)\.<a href=mailto:(.*?)>(.+?)</a>(.+?)</dt><dd>(.+?)<br>(<a name=\d+></a>)#mik

前処理
s#(<a href=mailto:.*?>.*?)(◆.+?)(</a>)#$1</b>$2<b>$3#igk

461 :名無しさん@停滞中 ★:10/04/02 19:22:56 ID:???
ところで>>460の正規表現なのですが
最初

m#<a name=\d+></a><dt>([0-9]+)\.<a href=mailto:(.*?)>(.+?)</a>(.+?)</dt><dd>(.+?)<br>(<a name=\d+></a><dt>)#mik

とやったらレスが一つ飛びになってしまいうまくいかなかったです。
なので頭と$6の部分を少し変えたのですが、
上の正規表現のどこがまずいのかよくわからない。

実際、どこがいけないのでしょう?

462 : ◆/vmukiyuzw :10/04/03 03:16:05 ID:b9qEg+OM
>>461
ご迷惑おかけします。
htmltodatサポスレのほうでレスさせていただきました。

http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/602

463 :名無しさん@停滞中 ★:10/04/04 09:54:42 ID:???
>>463
ありがとうございます。そういう事だったんですか。
という事は、現状ではレスアンカーが要になっている場合は前処理等で何か手心が必要になる訳ですね。
上の場合は<dt>があったのでその辺は何とかなったですが。

というか、>>460だと最終レスがマッチしなかったですね。
まだまだ修行が必要だ

464 :名無しさん@停滞中 ★:10/04/04 09:56:51 ID:???
メモ

z-z-z-z.net 2chブラウザ(http://z-z-z-z.net/)のdat化について

URL例
http://z-z-z-z.net/b/society6.2ch.net/gline/1165245437/

正規表現
m#<dt>([0-9]+)\.<a href=mailto:(.*?)>(.+?)</a>(.+?)</dt><dd>(.+?)<br>(<a name=\d+></a>|</dl>)#mik

前処理
s#(<a href=mailto:.*?>.*?)(◆.+?)(</a>)#$1</b>$2<b>$3#igk


>>460では最終レスの取りこぼしがあったので。

465 :名無しさん@停滞中 ★:10/04/04 10:17:52 ID:???
がっくしメニューはどうかな
dat落ちしてもしばらく読めたら面白いですけど

http://orz4.2ch.io/orz/orz.cgi/*/yutori7.2ch.net/news4vip/1270340527/1-1001
http://orz4.2ch.io/orz/orz.cgi/*/anchorage.2ch.net/musicjg/1267157656/1-1001

466 :名無しさん@停滞中 ★:10/04/05 20:57:45 ID:???
駄目でしたか
いえいいんです


メモ

CSS切り替えJavaScript
http://act.st/etc/css_ss.htm

467 :名無しさん@停滞中 ★:10/04/05 21:00:40 ID:???
外部CSSの切り替え
http://www.din.or.jp/~hagi3/JavaScript/JSTips/Std/csschg.htm

468 :名無しさん@停滞中 ★:10/04/08 18:15:42 ID:???
メモ

何か開発するブログ 「2ちゃんねる全文検索」を公開しました
http://blog.livedoor.jp/slx/archives/51811689.html
2ちゃんねる全文検索
http://app.xrea.jp/search2ch/

469 :名無しさん@停滞中 ★:10/04/08 18:21:37 ID:???
2chセンブラーONLINE(ββ)
http://fatalita.sakura.ne.jp/CGI/2ch/index.html

>>435の方のサイトですが(http://victreal.com/がメインになるかもだそうですが)
それはそれとして

http://fatalita.sakura.ne.jp/CGI/2ch/index.html?text1=http%3A%2F%2Fyutori7.2ch.net%2Ftest%2Fread.cgi%2Fnews4vip%2F1270472109%2F

上のURLが
http://yutori7.2ch.net/test/read.cgi/news4vip/1270472109/
がdat落ちしても閲覧可能だったら
どんなにか嬉しい事でしょうか。

470 :名無しさん@停滞中 ★:10/04/15 19:34:27 ID:???
W2Ch DAT変換機
http://2chdat.soprano-asm.net/

> まぁ http://yellow.ribbon.to/~mirror/ の"url.php"を改変してURLをうんぬんしたり
> 0chのread.cgiをいじってログを見れるようにしたりでw

のけぞったです
検索結果を見て更に海老反りました

結果
http://2chdat.soprano-asm.net/url.php?url=http%3A%2F%2Ftsushima.2ch.net/test/read.cgi/news/1270045997/
閲覧
http://yellow.ribbon.to/~mirror/dat2html/read1.php?url=http://2chdat.soprano-asm.net/2ch.net/news/1270/1270045997.dat
ログ
http://2chdat.soprano-asm.net/2ch.net/news/1270/1270045997.dat


よくわからないですけど、o2onとも連動しておられるみたいで。
後で追加してみるです。「その80」になるのかな。その代わり「その29の17」は不通になってますね。
あと他のW2Ch中間サーバもバージョンアップ等で軒並みURL構造が変わっている予感です


こういうのがあると、ソース(http://yellow.ribbon.to/~mirror/url.php.txt)出しといて良かったなと。
こんなの誰が見るんだ初心者ソースに突っ込まれるだけ損じゃないかとか思ってたですが。
ってこれ出してもう5年経つんですか。

471 :名無しさん@停滞中 ★:10/04/16 19:47:58 ID:???
メモ
web2ch.org(http://web2ch.org/)のdat化について

URL例
http://web2ch.org/PHP/av.php/society6.2ch.net/gline/1165245437/
http://web2ch.org/PHP/av.php/pc12.2ch.net/streaming/1240594588/

正規表現
m#<div.+?><p.+?>([0-9]+) (.+?)\=\=(.*?)\=\=(.+?) </p><p class=mg> (.*?) </p></div>#mik

前処理
s#(<title.+?) \- web2ch\.org\(2chブラウザ\)(</title>)#$1$2#ik
//s#(<div)#\n$1#igk

変換結果式
$2<>$3<>$4<>$5<> (←メール欄逆転)

後処理
s#((?:^|\n).*?)(◆.+?)<>#$1</b>$2<b><>#igk


ソースが改行なしにベターっと出るタイプなので前処理2番目をつけようとしたですが
つけなくてもOKっぽいのでコメントアウトしてるです

472 :名無しさん@停滞中 ★:10/04/16 19:49:16 ID:???
>>471補足

ここ公開したてのホヤホヤみたい。
スレッドは下記

web上から2chを見られるビューアweb2ch.org
http://pc12.2ch.net/test/read.cgi/software/1271203705/


上のスレッドの10で

> dat落ちしたスレでもdat落ち前のキャッシュがあれば●がなくてもキャッシュの表示可能。

との事なので、後日追加させてもらおうかなと思うです
「その81」になるのかな

473 :名無しさん@停滞中 ★:10/04/17 12:59:29 ID:???
メモ
やるにょ(http://www.yarunyo.com/)のdat化について

URL例
http://www.yarunyo.com/kakolog/gline/1165245437/

正規表現(長すぎるので2行に分けてます)
m#<a name=".+?">([0-9]+)</a> 名前:<span class="green"><b>(?:<a href="(.+?)" rel="nof
ollow">)?(.+?)(?:</a>)?</b></span>投稿日:(.+?)<blockquote>(.+?)</blockquote>#mik

前処理
s#<title.+?/title>##ik
s#<h1>(.+?)</h1>#<title>$1</title>#ik
//s#\n<a href.+?(?:\n)##igk



これでdat化出来ますが、dat化直後に「一行が長すぎるか〜」エラーが出るです。
対処するために前処理3番目をつけたら「fatal error」と出たりhtmltodat自体が落ちたりするのでコメントアウトしたです

このエラーが自分の環境でだけ起こるかどうかわかりませんが
汎用的(?)に発生するならまあそういうエラーが起こるという事で。

474 :名無しさん@停滞中 ★:10/04/17 14:16:14 ID:???
>>473
fatal error 又はhtmltodat自体が落ちる件 自分の環境でだけなのかもしれないですね。
自分とこでは再起動したりしてやってみても同じ結果でしたが。

あとtypo

s#\n<a href.+?(?:\n)##igk

s#\n<a href.+?(?=\n)##igk




それと

http://pc12.2ch.net/test/read.cgi/software/1271203705/12
http://society6.2ch.net/test/read.cgi/gline/1165245437/662

自分とこだと、例えば誰かの検索したスレッドURLがタイムリーに出るようにしてありますが
んもう検索結果がやたら大量なので(少ない時でも5秒に1度くらい?)
もはや全然気にする事はないんじゃないかと。
自分が検索したスレッドURLで嗜好がバレる云々とかそういうのも
考え過ぎなのではないかと思うです (てか自分が考え過ぎか?)
検索結果のURLもすぐ流れてしまいますし。

そういう事ではないのかな?
違っていたとしても別にどうでもいいんですが。

475 :名無しさん@停滞中 ★:10/04/17 16:18:31 ID:???
>>473
それだけではなく
ソースの「<h2>2ch過去ログカテゴリ</h2>」から始まる行もネックみたい。
700強ある板名とリンクが改行なしで並んでいるみたいなので。

476 :名無しさん@停滞中 ★:10/04/17 16:25:31 ID:???
http://bbs.yaroze.jp/tantanyakisoba/
http://bbs.yaroze.jp/ye/read.cgi/costco/1092143769/13
http://www.yaroze.jp/i18n/


掲示板下部に

> 0ch BBS 2007-01-24改UTF8(2008-02-02)

とありますが、ソースを見たら自分とこのとは別物みたい。
例えば「Charset="UTF-8"」のUTF-8が小文字になっていたり
その他細かい箇所でも色々と。


ところで





http://yy14.kakiko.com/test/read.cgi/mirror/1014655362/862-871n


ごめんなさいごめんなさい
もう一年経つですか

477 :名無しさん@停滞中 ★:10/04/18 13:16:09 ID:???
メモ

■■速報自動保管庫■■
http://sag.uzo.in/

478 : ◆/vmukiyuzw :10/04/19 03:35:13 ID:ZXTymH+7
>>473
レスデータの前でなく後ににガラガラが付いているので、dat変換は成功するのに
その後ろを変換しに行ってエラーになってるようですね。
とりあえず前処理の3つめを

s#\| <a href.+?</a>##igk

としてやるとエラーは取れるようです。

あと「fatal error」はBREGEXP.DLLが出してるエラーで
まずい(どういうのがと言われると困ってしまうのですが)正規表現を書いてしまうと
割と簡単に出てしまいます。
いったん出てしまうとメモリの状態がおかしくなっている可能性が高いので、
続けて使うとhtmltodatが落ちてしまうのもそれが原因です。
これは現状、正規表現の解析・実行をBREGEXP.DLLに投げっぱなしにしている以上
どうしようもない仕様と言わざるを得ないところです。まことに申し訳ないのですが
そういうもんだと割り切って使っていただくしかないです。

479 :名無しさん@停滞中 ★:10/04/19 18:23:00 ID:???
>>478
ありがとうございます。
という事は、>>475で引っ掛かっていたのですね。
他の行は削らなくても良かったのでしたか。

とりあえず、「| <a href」だと本文中にもありそうなので

s#\| <a href="/kakolog/.+?</a>##igk

とやったら何とかなったのかもです



という事で「その80」〜「その82」まで追加
JavaScriptでのミラー変換速度はまだまだ大丈夫そう

480 :名無しさん@停滞中 ★:10/04/19 18:47:41 ID:???
メモ
よくまとめてあるなーと

実況ニューサロ: 実況板過去ログを効果的に漁る方法
http://jikkyonews.blog109.fc2.com/blog-entry-81.html

481 :名無しさん@停滞中 ★:10/04/20 17:48:07 ID:???
2ちゃんねる一発検索
http://2ch.webcross01.com/

482 :名無しさん@停滞中 ★:10/04/20 18:31:50 ID:???
2chニュースポータル
http://2chtimes.com/

http://2chtimes.com/th.php?sv=society6.2ch.net&b=gline&dat=1165245437
http://2chtimes.com/th.php?sv=tsushima.2ch.net&b=newsplus&dat=1271720084

上ですが

http://tsushima.2ch.net/test/read.cgi/newsplus/1271720084/

がdat落ちしても読み込めたらどんなにか面白い事でしょうか。


ちなみにこのhtmlソース、本文とポップアップするものが全く同一になってるっぽくて
dat化が少し厄介そうな気がするです

483 :名無しさん@停滞中 ★:10/04/20 19:02:16 ID:???
一応やりかけ
2chニュースポータル(http://2chtimes.com/)のdat化について

URL例
http://2chtimes.com/th.php?sv=tsushima.2ch.net&b=newsplus&dat=1271720084
http://mirror.sarashi.com/htmltodat/1271720084.html

正規表現(長いので2行に分けて)
m#<span class="ch2_thread_count">([0-9]+)</span>&n?bsp;<span class="ch2_thread_name">()(.+?)</sp
an>&n?bsp;<span class="ch2_thread_datetime">(.+?)</span><div class="ch2_thread_body">(.+?)</div>#mik

前処理
s#<script[\S\s]+?/script>##igk
s#<div id="pop[\S\s]+?</div>\s+</div>##igk
s#(span class="ch2_thread_name">.*?)(◆.+?)(?:(@.+?))?(</span>)#$1</b>$2<b>$3$4#igk


スレッドタイトルとメール欄がないですが
一応、上で出したURL例のものだとこれでdat化出来るです。


ただし、下のはレス 14-17 の間 と レス 30-36 の間が飛んでしまいます
ちょっと今体調不良につき よく考えられなんだ

http://2chtimes.com/th.php?sv=society6.2ch.net&b=gline&dat=1165245437

484 :名無しさん@停滞中 ★:10/04/21 08:20:24 ID:???
駄目でしたか
いえ別にいいんです
引っ掛かったままだと気持ち悪いので
メモしとくです

とりあえず2chニュースポータル(http://2chtimes.com/)のdat化について

URL例
http://2chtimes.com/th.php?sv=society6.2ch.net&b=gline&dat=1165245437
http://mirror.sarashi.com/htmltodat/2chtimes/1165245437.html

正規表現
m#<span class="ch2_thread_count">([0-9]+)</span>&n?bsp;<span class="ch2_thread_name">()(.+?)</spa
n>&n?bsp;<span class="ch2_thread_datetime">(.+?)</span><div class="ch2_thread_body">(.+?)</div>#mik

前処理
s#<div id="pop.+?>\s+\[レス番が見当たりません\]</div>##igk
s#<div id="pop[\S\s]+?</div>\s+</div>##igk
s#(span class="ch2_thread_name">.*?)(◆.+?)(?:(@.+?))?(</span>)#$1</b>$2<b>$3$4#igk

485 :名無しさん@停滞中 ★:10/04/21 19:11:11 ID:???
メモ
2chビューアーD(http://2ch.uda2.com/)のdat化について

URL例
http://2ch.uda2.com/society6-gline/1165245437/

正規表現
m#<dt.+?><a name=".+?"></a>([0-9]+) <span>(.+?)</span>(.*?)((?:\d{2}|\d{4})/\d+/.+?)</dt><dd>(.+?)</dd>#mik

前処理
s#\n<tr>.+?</tr>##igk
s#<script[\S\s]+?/script>##igk
s#<title.+?/title>##ik
s#<h5>(.+?)\(\d+\)<span>#<title>$1</title>#ik
s#\n<a href="http://2ch.uda2.com.+?>.+?</a><br/>##igk

変換結果式
$2<>$3<>$4<>$5<> (←メール欄逆転)

「透明あぼーんを補う」にチェック



モノによってはメール欄と日付の切り分けがうまくいかないかも。
エイプリルフール仕様の日付なんかあったらひとたまりもありません

486 :名無しさん@停滞中 ★:10/04/21 19:24:28 ID:???
>>485補足

>>385-386でも触れた所ですが
その時は確かdat落ち後は読めなかったような記憶があるです。

で、久しぶりに巡回してみたら

> 各表示はキャッシュされて表示されますのでDAT落ちしたスレッドが読めるかもしれませんが
> 速報系の掲示板は苦手です(板一覧:週一、スレッド一覧:1時間、スレッド内容:15分)

とありましたので。
あと下のとか。

http://uda2.com/blog/tag/2ch/
http://uda2.com/blog/2010/01/%E3%82%B3%E3%83%B3%E3%83%86%E3%83%B3%E3%83%84%E3%81%AE%E8%A6%8B%E7%9B%B4%E3%81%97/


現在、CORE SERVER(CORE-A)を使っておられるとの事なので
15GBまでデータ蓄積出来るみたい↓

http://www.coreserver.jp/?ref=uda2

487 :名無しさん@停滞中 ★:10/04/21 19:53:15 ID:???
>>485
後処理を転記し忘れたです

後処理
s#<br />#<br>#igk
s#((?:^|\n).*?)(◆.+?)(?:(@.+?))?<>#$1</b>$2<b>$3<>#igk

488 :名無しさん@停滞中 ★:10/04/24 17:35:13 ID:???
メモ

【Python Django】で2ch検索 - オラオラ検索
http://pc11.2ch.net/test/read.cgi/php/1202196045/

489 :名無しさん@停滞中 ★:10/04/24 19:17:58 ID:???
実況ニューサロ: いつでも過去ログが見れる「2chログキャッシュ」を作りました
http://jikkyonews.blog109.fc2.com/blog-entry-13.html
実況ニュースサロン 2chログキャッシュ01
http://yy54.60.kg/newsalog01/
実況ニュースサロン 2chログキャッシュ02
http://yy55.60.kg/newsalog02/
chohnanの日記
http://d.hatena.ne.jp/chohnan/

490 :名無しさん@停滞中 ★:10/04/24 19:19:36 ID:???
[を]2ちゃんねるキャッシュ検索
http://chalow.net/2007-03-28-1.html

491 :名無しさん@停滞中 ★:10/04/29 21:33:01 ID:???
ぴーちゃんねる
http://pchannel.net/
http://banba.jp/

採り上げているスレッドの量が物凄いんですが
自動でやっているのか手動なのか気になるです

完全自動だったら各レスの色分けとか画像取得置き換えの問題をクリアされてるんでしょうし
半手動だとしても毎日毎日の量が半端ではない数な感じがしますし。

492 :名無しさん@停滞中 ★:10/04/29 21:44:01 ID:???
よくわからないですが
これ↓も同じページが表示されるです

http://suzuke.jp/
http://218.219.148.59/

493 :名無しさん@停滞中 ★:10/04/30 19:01:02 ID:???
>>435>>469の方ですが
GoogleChromeアドオンでもやっちゃってくれてますね。

http://fatalita.sakura.ne.jp/Download/g2chDat/

自分とこのリンクがどこにも見当たらないです。
いっそ、「url.html」を別の名前にしてみるのも一興ですな。
まあ>>470のサイトやJaneの外部コマンド登録とかしてる人に影響あるでしょうけど。


こういう事やるならやるで
下のとか dat落ち後も読めるようにして頂けないですかね。

2chセンブラーONLINE(ββ)
http://fatalita.sakura.ne.jp/CGI/2ch/index.html

保存容量云々とかいうなら
cron使って一週間だけ保持しとくとか出来るでしょうに。
(というか さくらインターネットってデフォルトでcron使えるんですかね?)
FireFoxやChromeのアドオン拵えられるスキルがあるなら簡単でしょう。

[改行]

・・・代弁してくれてる方がいらっしゃいました。ありがとうございます

選択したテキストを指定したURLに渡すアドオンについて - SASAMI STREET
http://d.hatena.ne.jp/sasamistreet/20100317/nankazurui
(続)選択したテキストを指定したURLに渡すアドオンについて - SASAMI STREET
http://d.hatena.ne.jp/sasamistreet/20100430/renankazurui

494 :名無しさん@停滞中 ★:10/05/01 17:51:52 ID:???
まだ断定は出来ないですけど
どうもコピペした際に、ブラウザによっては半角スペースが付く場合があるみたい。


http://yy14.kakiko.com/test/read.cgi/mirror/1014655362/876

上のURLなんですが、自分の環境だと
コピペしてみるとIEとFirefoxで違う結果を出してしまうみたい。

正規表現をコピペすると、IEではなんでもないんですが
Firefoxでコピペしたものだとマッチしなくなるです。
調べてみると、「\[(.*?) \]」のように
「\]」の前に半角スペースがついてしまうようで。


IE6でコピペ
m#<dt.*?>([0-9]+) :<span.*?>(?:<b>)?(.+?)(?:</b>)?</span>\[(.*?)\]:(.+?)</dt><dd.*?> ?(.+?)(?:<script|</dd>)#mik

Firefox3.0.6でコピペ
m#<dt.*?>([0-9]+) :<span.*?>(?:<b>)?(.+?)(?:</b>)?</span>\[(.*?) \]:(.+?)</dt><dd.*?> ?(.+?)(?:<script|</dd>)#mik


自分の環境だと、再起動してやってみても同じ結果でした。
問題はこれが自分とこだけの事なのかどうか。

検索しても同様の症状が出てこないので心配になるです

495 :名無しさん@停滞中 ★:10/05/02 18:52:07 ID:???
imona.netさん
いつの間にかweb読みを復活されたのですか

http://imona.net/dat.pl/r/society6.2ch.net/test/read.cgi/gline/1165245437/

496 :名無しさん@停滞中 ★:10/05/04 14:33:59 ID:???
>>327でやってたものをメニューに追加してみたです

0chスクリプトQRコード化
http://www7.atpages.jp/mirrorhenkan0/qr0ch/

半年以上前にやってそれっきりだったので
どこをどうしたとかすっかり記憶の彼方ですが
成果物を出しといたほうがいいよなと

497 :名無しさん@停滞中 ★:10/05/04 17:45:59 ID:???
とやってからソース見てみたら
何とも効率の良くない事やってるなーと。
あとデータ渡しにQuery_String使ってるっぽいので
ブラウザによっては表示出来なくなっているかも。

またPerl思い出すの厄介だなぁ・・

498 :名無しさん@停滞中 ★:10/05/06 22:49:51 ID:???
メモ

HikkyWeb 2chブラウザ Version(1.9.2)
http://www.hikkyweb.jp/


http://www.hikkyweb.jp/GetThreadDAT.aspx?URL=http://yutori7.2ch.net/news4vip/&DAT=1273048934.dat

上ですが
http://yutori7.2ch.net/test/read.cgi/news4vip/1273048934/
がdat落ちしても閲覧出来たら
どんなにか嬉しい事でしょうか。

499 :名無しさん@停滞中 ★:10/05/15 09:05:32 ID:???
http://pc12.2ch.net/test/read.cgi/software/1267177119/830

> ・Threadic掲示板関連の修正(スレの取得をofflaw.cgiに変更など)

offlaw.cgiよりもdatread.cgiを読み込んだほうがいいのではと思ったですけど
もしかしたらofflaw.cgiで出ているレス番をキーにしているのかなと思ったですが
所詮素人考えなので以下略

offlaw.cgi
http://threadic.com/thread/bbs/offlaw.cgi/bugreport/1273812769/
datread.cgi
http://threadic.com/thread/bbs/datread.cgi/bugreport/1273812769/


ところでthreadic.comの管理人さんもtwitter始めておられたですね。
プロフィールの現在地を見てあれれどういう方なのかなと思ったり。

http://twitter.com/miyako2_engine/

500 :koreawatcher ◆Nida.eneRA :10/05/15 18:14:15 ID:PgRxx5jJ
>>499
datread.cgiの存在をどこで知りました?
offlaw.cgiに関しては、offlaw.cgiを作ってくれというメール(モデルはまちBBS)
をThreadicの開発陣に送ったからなんですが、datread.cgiに関しては初耳です。

ThreadicのCGIの最大の問題点は透明あぼーんの扱いで、offlaw.cgiでは
例えば2があぼーんされていれば1の次が3になっていますが、datread.cgiでは
2があった痕跡すらありません。
スレ一覧やレスの表示でこれらの矛盾が放置されたままになっています。

501 :名無しさん@停滞中 ★:10/05/15 19:07:06 ID:???
>>500

例えば

http://be.threadic.com/thread/bbs-jp/read.cgi/koreajapan/

↑を、IE等のブラウザで開いて
タイトル右にある「read.cgi ?? ??」(←この板では文字化けしますが)をクリックして
ダイアログが出てOKしてから各スレッドを読み込むとread.jsモードになるです。
そこで読み込んでいるdat代わりのものががdatread.cgiで、そこで知ったです。

で、確かにレス番欠如のものは詰めて表示されているですね。
これではofflaw.cgiのほうしか使えないですね。



以下蛇足の独り言

このread.jsって、2chの流用じゃないですか。
read.htmlにしても行数までぴったり合っているし。
外部jsもざっと見てみましたが、ほぼ同じ。


[threadic.com]
http://be.threadic.com/thread/bbs-jp/js/index.js
http://be.threadic.com/thread/bbs-jp/js/read.js

[2ch]
http://www2.2ch.net/snow/index.js
http://www2.2ch.net/snow/read.js


自分も
http://mirror.s151.xrea.com/0ch_html/
や 
http://mirrorhenkan.hp.infoseek.co.jp/0ch_html/
をやった事がありますが
read.jsの作者リンク(http://sunos.saita.ma/2ch-cgi-lw.htm)を変える事なんか
これっぽっちも思いもしませんでしたよ。



なんで作者表示まで変えたのかなー。
丸パクリじゃないですか。
ずるい。


ここまで2chのスクリプトソースを流用しているというのに
twitterでの↓この発言はどういう事なのかと。(twitterリンクはthreadic.comの板の最下部にあります)

http://twitter.com/miyako2_engine/status/13130287300
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
ジョンジョンスレディックが2chソース盗んで書いたとしている場合がありますが、2chのソースコードは公開されていな
いため、事実上のドロップの書き込みができないだけでなく、エンジンの見た目が似ているが、内部的にも、同じだと
見ることができないため、これは事実ではない。非常に不愉快だ
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

JavaScriptで書かれた2chソースを、作者リンクを変えてまでして使っているのでは
「盗んだ」といってもいいと思いますし
そのくせ「事実ではない」「非常に不愉快だ」などとよくもまあ言えたもんだと。

502 :名無しさん@停滞中 ★:10/05/15 19:32:50 ID:???
メモ

Windows Mobile 2ch過去ログ倉庫
http://2ch.wmusers.net/

503 :koreawatcher ◆Nida.eneRA :10/05/15 20:01:55 ID:PgRxx5jJ
>>501
なるほどリバースエンジニアリング(カッケー!)で知ってわけですか。
ちなみにスレッド一覧はまちBBS+αです。見比べれば明白です。

確かにスクリプトは2chの流用ではないですね。
その代わりSchBBSそのものですが…。
目に見える部分は確かに改造されていますが、内部的にはそのままであることが
こちらからはよく分かります。

実はThreadicは思いつきで頻繁に仕様を変えるのに、Xenoユーザーからは
アクセス出来ないという苦情が全く来ないという不思議(でもないですが)な
状況が続いています。サポートを続けるか撤退するか難しいところです。

504 :名無しさん@停滞中 ★:10/05/16 13:45:44 ID:???
>>503
threadicさんの所、subbackも手を加えてあったんですか。

そうなるとsubbackの仕様が変わったらまたお手上げですね。
では、offlaw.cgiを要望して作ってもらえたとの事なので
subject.cgi(名前は何でもいいですが)を設置してもらえたら、
仕様変更されても影響は無くなるかもですね。


あと冷静な人が結構居て面白い。
個人的にはエロデウス ◆Vv9y7Z38.2さんの書き込みとか面白いですけど
最近見ないです。
下のが最近ぽいですが本スレは無くなってますし。

http://webcache.googleusercontent.com/search?q=cache:73ETpZKQ1VgJ:be.threadic.com/thread/bbs-jp/read.php/koreajapanplus/1269086384/l50




あとあれだ
threadic.comの管理人さん、スクリプトのソース流用の件はおいといて
どの辺りまで狙ってやっているのかなと。
判っていてやっているのか天然なのか。


twitterの自己紹介文とか見てみると

−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
自己紹介文:
独島でスレディクエンジンを開発しているスレディク開発担当です。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

とあるんですが
プロフィール画像がなぜかHITACHIの洗濯機というのが謎。

http://twitter.com/account/profile_image/miyako2_engine?hreflang=en


もしかしたら本当に狙っているのかな?
昔から2chを見ていて、洗濯機御大とかけているのかなとか

http://mimizun.com/log/2ch/gline/1102086638/473
http://blog.livedoor.jp/implst/archives/25350650.html
http://puerutadelsol.seesaa.net/article/4419306.html
http://web.archive.org/web/20051217062449/http://tech.ciao.jp/blog2/archives/2005/07/post_28.html

505 :koreawatcher ◆Nida.eneRA :10/05/17 00:08:29 ID:6V4DCVtS
>>504
仕様変更されたらもう対応しないかもしれません。
メールはある時を境にこちらに一切返事が戻ってこなくなりましたし…。
offlaw.cgiにしても、他の掲示板は以前から対応していたのに、肝心の日韓交流板には
今回のJaneXenoの更新の前日になってやっと予告なしに導入され、それを受けて
JaneXenoをリリースした次第です。

掲示板の内容自体に関しては、韓国人と交流しようとしたにもかかわらず、
いつまでも過去のことを持ち出す先方に激怒して日本人が出ていったのを
何度か目にしました。今や書き込んでいるのは韓国人ばかりですね。

506 :名無しさん@停滞中 ★:10/05/18 00:29:47 ID:???
>>505
そんな事があったんですか。
では仕方ないです。

確かに日本人は居なくなってるですね。
交流もどんどん減っていってつまらなくなっているような。

http://be.threadic.com/thread/bbs-jp/read.cgi/koreajapan/1272186683/60-61
http://be.threadic.com/thread/bbs-jp/read.cgi/koreajapan/1272186683/74
http://be.threadic.com/thread/bbs-jp/read.cgi/koreajapan/1272186683/77


ところで、独り言に近い要望ですが
苺BBS(http://www.ichigobbs.org/)もXenoで読めるようになったら有難いです。
掲示板スクリプトはaround BBS(http://around.at.infoseek.co.jp/)ですが
十分に枯れた(?)スクリプトなので 仕様変更もそう無いでしょうし。

この苺BBSのなかにある経済板(http://www.ichigobbs.org/economy/)は
2chの経済板(http://namidame.2ch.net/eco/)とはこれまた全然雰囲気が違っていて
とても面白いのです。

まあ自分だけの印象かもしれませんが。

[改行]

メモ

EROTRONIKA   
http://blog.naver.com/faceless0.do

(via http://akiakane000.blog37.fc2.com/blog-entry-47.html

507 :名無しさん@停滞中 ★:10/05/18 00:57:48 ID:???
メモ

2ちゃんねるブラウザ
http://www.2003acmr.org/


http://www.2003acmr.org/yutori7.2ch.net/news4vip/1273910010/

上ですが
http://yutori7.2ch.net/test/read.cgi/news4vip/1273910010/
がdat落ちしても閲覧出来ていたら
どんなに素晴らしい事でしょうか。

508 :名無しさん@停滞中 ★:10/05/18 00:59:37 ID:???
メモ

2ちゃんねるブラウザ
http://www.manuflexgroup.com/


http://www.manuflexgroup.com/yutori7.2ch.net/news4vip/1273910010/

上ですが
http://yutori7.2ch.net/test/read.cgi/news4vip/1273910010/
がdat落ちしても閲覧出来ていたら
どんなに素晴らしい事でしょうか。

509 :名無しさん@停滞中 ★:10/05/18 01:01:43 ID:???
メモ

2ちゃんねるブラウザ
http://www.ridenorthtsar.com/


http://www.ridenorthtsar.com/yutori7.2ch.net/news4vip/1273910010/

上ですが
http://yutori7.2ch.net/test/read.cgi/news4vip/1273910010/
がdat落ちしても閲覧出来ていたら
どんなに素晴らしい事でしょうか。

510 :koreawatcher ◆Nida.eneRA :10/05/19 00:03:24 ID:tSKhGYyh
>>506
いちごびびえすに行ってみたんですが、全スレッドのスレッド一覧を取得する方法が
分かりませんでした。それとやはりdat直読みは無理なんでしょうか?
そこら辺の仕様が良くわかりませんでした。

511 :名無しさん@停滞中 ★:10/05/19 19:56:24 ID:???
>>510
とりあえずhttp://around.at.infoseek.co.jp/のスクリプトをDLして
板を置いてみました。

http://mirrorhenkan.hp.infoseek.co.jp/around/cgi-bin/mirror/index.html

で、判った事ですが
一つのスレッドでdatは二つに分かれているみたいです。
例えば下のような感じ。

・例1
スレッド
http://www.ichigobbs.org/cgi/15bbs/economy/1553/
dat
http://www.ichigobbs.org/economy/economy_1553a.txt
http://www.ichigobbs.org/economy/economy_1553b.txt

・例2
スレッド
http://www.ichigobbs.net/cgi/15bbs/2ch/0115/
dat
http://www.ichigobbs.org/2ch/2ch_0115a.txt
http://www.ichigobbs.org/2ch/2ch_0115b.txt

上の例2の場合、レス136が透明消去されてますが
datを見るとhttp://www.ichigobbs.org/2ch/2ch_0115b.txtの135行目が空行になっているです


次にスレッド一覧ですが、datキーだけ一覧があるみたい。
で、読み込みの都度生成しているのではないかなと。


http://www.ichigobbs.org/economy/
スレッド一覧
http://www.ichigobbs.org/economy/economy_new.txt


http://www.ichigobbs.org/2ch/
スレッド一覧
http://www.ichigobbs.org/2ch/2ch_new.txt


あと、ホットゾヌ2の通信状態を以前見てみたですけど
htmlを取得してそれをsubject.txt化したりdat化したりされてるみたいでした。

http://yy14.kakiko.com/test/read.cgi/mirror/1186175383/405

512 :koreawatcher ◆Nida.eneRA :10/05/19 20:55:47 ID:tSKhGYyh
>>511
う〜ん。データのフォーマットの違いくらいならなんとかなりますが、
ここまでファイルの構造が違うと対応は難しいです。
せめて、スレッドとスレッド一覧がそれぞれ1アクセスで取得できれば
よかったんですが…。
わざわざ実験で板を設置までしてもらったのにすみません。

513 :名無しさん@停滞中 ★:10/05/20 19:37:03 ID:???
いえ、こちらこそ長々と申し訳ありませんです。

ところで、>>511で設置したスクリプトを少し見てみたら
aska.cgiの72行目に

-------------------------------------------
#かちゅ〜しゃ(2chブラウザ)に対応させる(0=no 1=yes)
#http://members.jcom.home.ne.jp/katjusha/
#注意!ログを2重にとるので2倍重くなります
$katjusha = 0;
-------------------------------------------

というのがあり、「$katjusha = 1;」として投稿してみたら
subject.txt/****.datとも生成されたです。

subject
http://mirrorhenkan.hp.infoseek.co.jp/around/cgi-bin/mirror/subject.txt
dat
http://mirrorhenkan.hp.infoseek.co.jp/around/cgi-bin/mirror/dat/mirror0002.dat

残念ながらdatは投稿した部分しか記録されないようですが
subject.txtはうまくいってるみたい。(レス数のカッコが「<2>」とかになってますが)


という事で、いちごびびえすがaska_list.cgiの元としてaska.cgiを使っておられるなら
管理人さんにその部分を追加して頂けたらsubject.txtとdatの生成は可能かもです。

ふくやんさん、ブログもtwitterもやっておられますが
そういう場で要望するのと、メールでお願いするのと
さあどちらがいいのかな。
といか、メール生きているのかな

http://twitter.com/fukuyan
http://www.1-5-6.net/blog/
http://www.ichigobbs.org/15file/ichigobbs/about.html


こんなところで(どんなところだ)。

あとメモ

いちごびびえすは2ちゃんねるじゃありません -いちごろく-
http://www.1-5-6.net/archives/2005/08/post-322.html
経済/経済学@いちごびびえすの総目次
http://www.math.tohoku.ac.jp/~kuroki/Readings/ichigo.html
いちごBBSまとめログ
http://ichigobbs.ath.cx/

514 :名無しさん@停滞中 ★:10/05/21 18:58:17 ID:???
メモ
2ちゃんねる過去ログ保管庫(http://b-mark.org/2chlog.html
2ちゃんねる過去ログ保管庫2(http://b-mark.org/2chlog2.html
のdat化について

URL例
http://b-mark.org/view?key=society6_gline_1165245437.dat
http://b-mark.org/view?key=ex3_accuse_1080745274.dat&day=20040401

正規表現
m#<dt><a.+?>([0-9]+)</a>.+?:<font color=green><b>(.+?)</b></font>\[(.*?)\] ?(.+?)<br><dd>(.+?)<br><br>#mik

変換結果式
メール欄逆転


URL例の1番目と2番目では保管先が違うのかも。
例えば2番目の場合
http://b-mark.org/view?key=ex3_accuse_1080745274.dat
だとエラーになるです
逆もまた同じ

これまた新しい形ですなあ。

515 :名無しさん@停滞中 ★:10/05/22 19:13:33 ID:???
>>514追加。「その84」「その84a」という事で
100到達まであと少しですね(←流石に無理だと思いますよ)


ところで、自分とこのプロバイダがまだ規制っぽいのでココで。


Xenoでログ検索するとハングルが出ないです
「・・」ばかりで読めないです

http://image.threadic.com/images/iWDEQN4R58z

あと、デジカメの機種が文字化けしてるです
下の画像のデジカメ画像の「メーカー: チヨ(メニナテ)」って文字化けですよね。

http://image.threadic.com/images/iKgzHMVJofz

どちらも読めるようにして頂けたら嬉しいです




関係ないですけど

http://adult.threadic.com/thread/bbs/read.cgi/pervertplus/1274010479/

どこまで本気なのかなと。
翻訳で見るなら下

http://translate.google.com/translate?js=y&prev=_t&hl=en&ie=UTF-8&layout=1&eotf=1&u=http://adult.threadic.com/thread/bbs/read.cgi/pervertplus/1274010479/&sl=auto&tl=ja


メモ
command.datに下記追加

%GoogleTranslate=http://translate.google.com/translate?js=y&prev=_t&hl=en&ie=UTF-8&layout=1&eotf=1&u=$URL&sl=auto&tl=ja

516 :名無しさん@停滞中 ★:10/05/22 20:02:50 ID:???
メモ

http://mimi.s151.xrea.com/2chp.cgi/yutori7.2ch.net/news4vip/

http://mimi.s151.xrea.com/2chp.cgi/yutori7.2ch.net/test/read.cgi/news4vip/1274357231/
↑これ
dat落ち後も読めたらいいなー

もふもふ
http://mofumofu.tank.jp/

517 :koreawatcher ◆Nida.eneRA :10/05/23 01:52:53 ID:i8sbv2j6
>>515
結論から言うとどちらも無理です。

MS Pゴシックは日本語のみ、MS UI Gothicはハングルも
表示できるのですが、データがシフトJISである2chでは
通常文字をMS Pゴシック、文字参照をMS UI Gothicに
分ける仕組みでMS Pゴシックの中でハングルを表示しています。

Threadic(UTF-8板)ではハングルにも文字参照は使われない
ため、この方法は使えません。
文字を一つ一つ調べてそれがシフトJISに含まれているかどうかを
調べることはできますが、Threadicのためだけに負荷が増えること
になります。そこでUTF-8板ではすべてをMS UI Gothicで表示
するという手抜き処理を行っています。

ログ検索は複数の板から検索できるので、使用するスキンを
ひとつに統一しなければなりません。
MS UI Gothicを使えばハングルを表示できますが、2chの
表示が不自然になります。そこで大多数が利用する2chを
優先してMS Pゴシックを採用したため、結果としてハングルが
表示できなくなっています。

518 :koreawatcher ◆Nida.eneRA :10/05/23 01:53:51 ID:i8sbv2j6
>>515
チヨ(メニナテ)はハングルの文字化けで、コードはEUC-KRです。
Exifの文字列データは非Unicodeですが、エンコード情報があり
ません。仮にエンコードの自動判定を行うとEUC-JPとして
判断されて「爽(寅澱)」と表示されるだけです。

519 :名無しさん@停滞中 ★:10/05/23 18:40:37 ID:???
>>517-518
おお、ありがとうございます。
スキンでフォントをMS UI Gothicに指定したら検索結果が表示できました。

検索結果だけMS UI Gothicにするような事は出来ないものでしょうか。
AAがずれる等のクレームが考えられますが
AA自体を検索するような事自体 レアケースだと思うのですが。


デジカメ情報の件、判りました。
韓国のデジカメだとSamusung/LG cyon/チヨ(ニメナテ)の3つがあるみたいですが
Sony/Pentax/Fujifilm/Nicon/Canon等の日本製のほうが割合として多いなと。

ただ
http://adult.threadic.com/thread/bbs/read.cgi/pervertplus/1274105714/650
で出ている
「PANTECH]
ってなんだろなと。
ペンタックスと紛らわしいではないですか

http://plusd.itmedia.co.jp/mobile/articles/0508/29/news041.html
http://bizmakoto.jp/bizmobile/articles/0702/06/news100.html

520 :名無しさん@停滞中 ★:10/05/24 20:12:42 ID:???
今まで真魚でハングル表示出来ないのがどうにも不思議だったんですが
>>517の書き込みを拝見して 表示フォントをMS UI Gothicに変えてみたらうまくいったです
おめでとうございますありがとうございます。

で、TeraPadでも出来るんじゃーないかと見てみたんですが
使用出来るフォントの中にMS UI Gothicが見当たらないもんで
うまくいかないっぽいです。
使っているバージョンは0.93で、作者さんのサイトを見ると最新版っぽい
残念。

500KB
続きを読む

掲示板に戻る 全部 前100 次100 最新50
名前: E-mail(省略可)

0ch BBS 2006-02-27