Gポイントポイ活 Amazon Yahoo 楽天

無料ホームページ 楽天モバイル[UNLIMITが今なら1円] 海外格安航空券 海外旅行保険が無料!

告知欄です


■掲示板に戻る■ 全部 1- 101- 201- 301- 401- 501- 601- 701- 801- 最新50
メモ4

1 :名無しさん@停滞中 ★:08/06/17 20:07:26 ID:???
はてさて思いついた事など

453 :名無しさん@停滞中 ★:10/03/25 19:26:17 ID:???
うお!!!

>>452
それでした!
削除したら読めたです!
ありがとうございます!

# うー恥ずかしい・・・

454 :名無しさん@停滞中 ★:10/03/26 19:04:05 ID:???
メモ

2ch_log
http://wmotenailog.x.fc2.com/

455 :名無しさん@停滞中 ★:10/03/29 19:24:59 ID:???
メモ

インスパイヤw - なんとなく◎(http://sunos.saita.ma/inspired/)のdat化について

URL例
http://sunos.saita.ma/inspired/?dubai+actor+1230881341

正規表現
m#<dt>([0-9]+) :(?:<span>|<a href="mailto:(.+?)">)<b>(.+?)</b>(?:</span>|</a>\[.+?\]):(.+?)</dt><dd> (.+?)</dd>#mik

前処理
s#(<title>.+?) - インスパイヤw - なんとなく◎(</title>)#$1$2#ik
s#<br />#<br>#igk



元スレ(http://dubai.2ch.net/test/read.cgi/actor/1230881341)が消えているのに
何故か読めるので。
追加するとしたら「その77」になるのかな

ところで、xhtmlでの改行タグは「<br />」みたいなんでいちおう置換するようにしたですが
これって「<br>」にしなくても専用ブラウザ的(?)にはOKなんでしょうか。

456 :名無しさん@停滞中 ★:10/04/01 18:52:42 ID:???
上のdat化処理ですが
「<br />」→「<br>」に全置換するのは後処理のほうが効率的ですね。
前処理でやると、dat化に必要な部分以外の「<br />」も置換する事になる訳で
時間と電気代とCPU計算その他の消費が冗長になるのではないかと思われ
まあいいか


ところで

2chで落ちた意見を蘇生する方法 | web R25
http://r25.yahoo.co.jp/fushigi/jikenbo_detail/?id=20100324-00001841-r25&vos=nr25mn0000001


そこまで採り上げるほどの記事なんかなと

457 :名無しさん@停滞中 ★:10/04/02 12:19:42 ID:???
メモ
みんくちゃんねるログ(http://log.minkch.com/)のdat化について

URL例
http://log.minkch.com/read.php/801/1267194035/

正規表現
m#<dt.*?>([0-9]+) : <span class="nam">(.+?)</span>\[(.*?)\] : (.+?) </dt><dd>(.+?)<br /> <br /></dd>#mik

前処理
s#<title.+?/title>##ik
s#<h2>(.+?)</h2>#<title>$1</title>#ik
s#(<span class="nam">.+?)</span><span style="color:green;">(◆.+?)</span>#$1</b>$2<b></span>#igk
s#</?(?:div|script|li|select|option).+?(?=\n)##igk

変換結果式
$2<>$3<>$4<>$5<> (←メール欄逆転)

後処理
s#<br />#<br>#igk

458 :名無しさん@停滞中 ★:10/04/02 12:42:24 ID:???
>>457の正規表現って
よく見たら>>315と同じっぽいですね。

ミラー対象の板も似てるですし
もしかしたら同じ方がやっておられるのかも

459 :名無しさん@停滞中 ★:10/04/02 19:10:07 ID:???
とか書いたあとでみてみたら

http://p.loface.com/
http://ch.xmoe.jp/

にアクセスすると

http://news.minkch.com/

に飛ぶですね。
同じ方ですか。

460 :名無しさん@停滞中 ★:10/04/02 19:15:41 ID:???
メモ

z-z-z-z.net 2chブラウザ(http://z-z-z-z.net/)のdat化について

URL例
http://z-z-z-z.net/b/society6.2ch.net/gline/1165245437/

正規表現
m#<dt>([0-9]+)\.<a href=mailto:(.*?)>(.+?)</a>(.+?)</dt><dd>(.+?)<br>(<a name=\d+></a>)#mik

前処理
s#(<a href=mailto:.*?>.*?)(◆.+?)(</a>)#$1</b>$2<b>$3#igk

461 :名無しさん@停滞中 ★:10/04/02 19:22:56 ID:???
ところで>>460の正規表現なのですが
最初

m#<a name=\d+></a><dt>([0-9]+)\.<a href=mailto:(.*?)>(.+?)</a>(.+?)</dt><dd>(.+?)<br>(<a name=\d+></a><dt>)#mik

とやったらレスが一つ飛びになってしまいうまくいかなかったです。
なので頭と$6の部分を少し変えたのですが、
上の正規表現のどこがまずいのかよくわからない。

実際、どこがいけないのでしょう?

462 : ◆/vmukiyuzw :10/04/03 03:16:05 ID:b9qEg+OM
>>461
ご迷惑おかけします。
htmltodatサポスレのほうでレスさせていただきました。

http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/602

463 :名無しさん@停滞中 ★:10/04/04 09:54:42 ID:???
>>463
ありがとうございます。そういう事だったんですか。
という事は、現状ではレスアンカーが要になっている場合は前処理等で何か手心が必要になる訳ですね。
上の場合は<dt>があったのでその辺は何とかなったですが。

というか、>>460だと最終レスがマッチしなかったですね。
まだまだ修行が必要だ

464 :名無しさん@停滞中 ★:10/04/04 09:56:51 ID:???
メモ

z-z-z-z.net 2chブラウザ(http://z-z-z-z.net/)のdat化について

URL例
http://z-z-z-z.net/b/society6.2ch.net/gline/1165245437/

正規表現
m#<dt>([0-9]+)\.<a href=mailto:(.*?)>(.+?)</a>(.+?)</dt><dd>(.+?)<br>(<a name=\d+></a>|</dl>)#mik

前処理
s#(<a href=mailto:.*?>.*?)(◆.+?)(</a>)#$1</b>$2<b>$3#igk


>>460では最終レスの取りこぼしがあったので。

465 :名無しさん@停滞中 ★:10/04/04 10:17:52 ID:???
がっくしメニューはどうかな
dat落ちしてもしばらく読めたら面白いですけど

http://orz4.2ch.io/orz/orz.cgi/*/yutori7.2ch.net/news4vip/1270340527/1-1001
http://orz4.2ch.io/orz/orz.cgi/*/anchorage.2ch.net/musicjg/1267157656/1-1001

466 :名無しさん@停滞中 ★:10/04/05 20:57:45 ID:???
駄目でしたか
いえいいんです


メモ

CSS切り替えJavaScript
http://act.st/etc/css_ss.htm

467 :名無しさん@停滞中 ★:10/04/05 21:00:40 ID:???
外部CSSの切り替え
http://www.din.or.jp/~hagi3/JavaScript/JSTips/Std/csschg.htm

468 :名無しさん@停滞中 ★:10/04/08 18:15:42 ID:???
メモ

何か開発するブログ 「2ちゃんねる全文検索」を公開しました
http://blog.livedoor.jp/slx/archives/51811689.html
2ちゃんねる全文検索
http://app.xrea.jp/search2ch/

469 :名無しさん@停滞中 ★:10/04/08 18:21:37 ID:???
2chセンブラーONLINE(ββ)
http://fatalita.sakura.ne.jp/CGI/2ch/index.html

>>435の方のサイトですが(http://victreal.com/がメインになるかもだそうですが)
それはそれとして

http://fatalita.sakura.ne.jp/CGI/2ch/index.html?text1=http%3A%2F%2Fyutori7.2ch.net%2Ftest%2Fread.cgi%2Fnews4vip%2F1270472109%2F

上のURLが
http://yutori7.2ch.net/test/read.cgi/news4vip/1270472109/
がdat落ちしても閲覧可能だったら
どんなにか嬉しい事でしょうか。

470 :名無しさん@停滞中 ★:10/04/15 19:34:27 ID:???
W2Ch DAT変換機
http://2chdat.soprano-asm.net/

> まぁ http://yellow.ribbon.to/~mirror/ の"url.php"を改変してURLをうんぬんしたり
> 0chのread.cgiをいじってログを見れるようにしたりでw

のけぞったです
検索結果を見て更に海老反りました

結果
http://2chdat.soprano-asm.net/url.php?url=http%3A%2F%2Ftsushima.2ch.net/test/read.cgi/news/1270045997/
閲覧
http://yellow.ribbon.to/~mirror/dat2html/read1.php?url=http://2chdat.soprano-asm.net/2ch.net/news/1270/1270045997.dat
ログ
http://2chdat.soprano-asm.net/2ch.net/news/1270/1270045997.dat


よくわからないですけど、o2onとも連動しておられるみたいで。
後で追加してみるです。「その80」になるのかな。その代わり「その29の17」は不通になってますね。
あと他のW2Ch中間サーバもバージョンアップ等で軒並みURL構造が変わっている予感です


こういうのがあると、ソース(http://yellow.ribbon.to/~mirror/url.php.txt)出しといて良かったなと。
こんなの誰が見るんだ初心者ソースに突っ込まれるだけ損じゃないかとか思ってたですが。
ってこれ出してもう5年経つんですか。

471 :名無しさん@停滞中 ★:10/04/16 19:47:58 ID:???
メモ
web2ch.org(http://web2ch.org/)のdat化について

URL例
http://web2ch.org/PHP/av.php/society6.2ch.net/gline/1165245437/
http://web2ch.org/PHP/av.php/pc12.2ch.net/streaming/1240594588/

正規表現
m#<div.+?><p.+?>([0-9]+) (.+?)\=\=(.*?)\=\=(.+?) </p><p class=mg> (.*?) </p></div>#mik

前処理
s#(<title.+?) \- web2ch\.org\(2chブラウザ\)(</title>)#$1$2#ik
//s#(<div)#\n$1#igk

変換結果式
$2<>$3<>$4<>$5<> (←メール欄逆転)

後処理
s#((?:^|\n).*?)(◆.+?)<>#$1</b>$2<b><>#igk


ソースが改行なしにベターっと出るタイプなので前処理2番目をつけようとしたですが
つけなくてもOKっぽいのでコメントアウトしてるです

472 :名無しさん@停滞中 ★:10/04/16 19:49:16 ID:???
>>471補足

ここ公開したてのホヤホヤみたい。
スレッドは下記

web上から2chを見られるビューアweb2ch.org
http://pc12.2ch.net/test/read.cgi/software/1271203705/


上のスレッドの10で

> dat落ちしたスレでもdat落ち前のキャッシュがあれば●がなくてもキャッシュの表示可能。

との事なので、後日追加させてもらおうかなと思うです
「その81」になるのかな

473 :名無しさん@停滞中 ★:10/04/17 12:59:29 ID:???
メモ
やるにょ(http://www.yarunyo.com/)のdat化について

URL例
http://www.yarunyo.com/kakolog/gline/1165245437/

正規表現(長すぎるので2行に分けてます)
m#<a name=".+?">([0-9]+)</a> 名前:<span class="green"><b>(?:<a href="(.+?)" rel="nof
ollow">)?(.+?)(?:</a>)?</b></span>投稿日:(.+?)<blockquote>(.+?)</blockquote>#mik

前処理
s#<title.+?/title>##ik
s#<h1>(.+?)</h1>#<title>$1</title>#ik
//s#\n<a href.+?(?:\n)##igk



これでdat化出来ますが、dat化直後に「一行が長すぎるか〜」エラーが出るです。
対処するために前処理3番目をつけたら「fatal error」と出たりhtmltodat自体が落ちたりするのでコメントアウトしたです

このエラーが自分の環境でだけ起こるかどうかわかりませんが
汎用的(?)に発生するならまあそういうエラーが起こるという事で。

474 :名無しさん@停滞中 ★:10/04/17 14:16:14 ID:???
>>473
fatal error 又はhtmltodat自体が落ちる件 自分の環境でだけなのかもしれないですね。
自分とこでは再起動したりしてやってみても同じ結果でしたが。

あとtypo

s#\n<a href.+?(?:\n)##igk

s#\n<a href.+?(?=\n)##igk




それと

http://pc12.2ch.net/test/read.cgi/software/1271203705/12
http://society6.2ch.net/test/read.cgi/gline/1165245437/662

自分とこだと、例えば誰かの検索したスレッドURLがタイムリーに出るようにしてありますが
んもう検索結果がやたら大量なので(少ない時でも5秒に1度くらい?)
もはや全然気にする事はないんじゃないかと。
自分が検索したスレッドURLで嗜好がバレる云々とかそういうのも
考え過ぎなのではないかと思うです (てか自分が考え過ぎか?)
検索結果のURLもすぐ流れてしまいますし。

そういう事ではないのかな?
違っていたとしても別にどうでもいいんですが。

475 :名無しさん@停滞中 ★:10/04/17 16:18:31 ID:???
>>473
それだけではなく
ソースの「<h2>2ch過去ログカテゴリ</h2>」から始まる行もネックみたい。
700強ある板名とリンクが改行なしで並んでいるみたいなので。

476 :名無しさん@停滞中 ★:10/04/17 16:25:31 ID:???
http://bbs.yaroze.jp/tantanyakisoba/
http://bbs.yaroze.jp/ye/read.cgi/costco/1092143769/13
http://www.yaroze.jp/i18n/


掲示板下部に

> 0ch BBS 2007-01-24改UTF8(2008-02-02)

とありますが、ソースを見たら自分とこのとは別物みたい。
例えば「Charset="UTF-8"」のUTF-8が小文字になっていたり
その他細かい箇所でも色々と。


ところで





http://yy14.kakiko.com/test/read.cgi/mirror/1014655362/862-871n


ごめんなさいごめんなさい
もう一年経つですか

477 :名無しさん@停滞中 ★:10/04/18 13:16:09 ID:???
メモ

■■速報自動保管庫■■
http://sag.uzo.in/

478 : ◆/vmukiyuzw :10/04/19 03:35:13 ID:ZXTymH+7
>>473
レスデータの前でなく後ににガラガラが付いているので、dat変換は成功するのに
その後ろを変換しに行ってエラーになってるようですね。
とりあえず前処理の3つめを

s#\| <a href.+?</a>##igk

としてやるとエラーは取れるようです。

あと「fatal error」はBREGEXP.DLLが出してるエラーで
まずい(どういうのがと言われると困ってしまうのですが)正規表現を書いてしまうと
割と簡単に出てしまいます。
いったん出てしまうとメモリの状態がおかしくなっている可能性が高いので、
続けて使うとhtmltodatが落ちてしまうのもそれが原因です。
これは現状、正規表現の解析・実行をBREGEXP.DLLに投げっぱなしにしている以上
どうしようもない仕様と言わざるを得ないところです。まことに申し訳ないのですが
そういうもんだと割り切って使っていただくしかないです。

479 :名無しさん@停滞中 ★:10/04/19 18:23:00 ID:???
>>478
ありがとうございます。
という事は、>>475で引っ掛かっていたのですね。
他の行は削らなくても良かったのでしたか。

とりあえず、「| <a href」だと本文中にもありそうなので

s#\| <a href="/kakolog/.+?</a>##igk

とやったら何とかなったのかもです



という事で「その80」〜「その82」まで追加
JavaScriptでのミラー変換速度はまだまだ大丈夫そう

480 :名無しさん@停滞中 ★:10/04/19 18:47:41 ID:???
メモ
よくまとめてあるなーと

実況ニューサロ: 実況板過去ログを効果的に漁る方法
http://jikkyonews.blog109.fc2.com/blog-entry-81.html

481 :名無しさん@停滞中 ★:10/04/20 17:48:07 ID:???
2ちゃんねる一発検索
http://2ch.webcross01.com/

482 :名無しさん@停滞中 ★:10/04/20 18:31:50 ID:???
2chニュースポータル
http://2chtimes.com/

http://2chtimes.com/th.php?sv=society6.2ch.net&b=gline&dat=1165245437
http://2chtimes.com/th.php?sv=tsushima.2ch.net&b=newsplus&dat=1271720084

上ですが

http://tsushima.2ch.net/test/read.cgi/newsplus/1271720084/

がdat落ちしても読み込めたらどんなにか面白い事でしょうか。


ちなみにこのhtmlソース、本文とポップアップするものが全く同一になってるっぽくて
dat化が少し厄介そうな気がするです

483 :名無しさん@停滞中 ★:10/04/20 19:02:16 ID:???
一応やりかけ
2chニュースポータル(http://2chtimes.com/)のdat化について

URL例
http://2chtimes.com/th.php?sv=tsushima.2ch.net&b=newsplus&dat=1271720084
http://mirror.sarashi.com/htmltodat/1271720084.html

正規表現(長いので2行に分けて)
m#<span class="ch2_thread_count">([0-9]+)</span>&n?bsp;<span class="ch2_thread_name">()(.+?)</sp
an>&n?bsp;<span class="ch2_thread_datetime">(.+?)</span><div class="ch2_thread_body">(.+?)</div>#mik

前処理
s#<script[\S\s]+?/script>##igk
s#<div id="pop[\S\s]+?</div>\s+</div>##igk
s#(span class="ch2_thread_name">.*?)(◆.+?)(?:(@.+?))?(</span>)#$1</b>$2<b>$3$4#igk


スレッドタイトルとメール欄がないですが
一応、上で出したURL例のものだとこれでdat化出来るです。


ただし、下のはレス 14-17 の間 と レス 30-36 の間が飛んでしまいます
ちょっと今体調不良につき よく考えられなんだ

http://2chtimes.com/th.php?sv=society6.2ch.net&b=gline&dat=1165245437

484 :名無しさん@停滞中 ★:10/04/21 08:20:24 ID:???
駄目でしたか
いえ別にいいんです
引っ掛かったままだと気持ち悪いので
メモしとくです

とりあえず2chニュースポータル(http://2chtimes.com/)のdat化について

URL例
http://2chtimes.com/th.php?sv=society6.2ch.net&b=gline&dat=1165245437
http://mirror.sarashi.com/htmltodat/2chtimes/1165245437.html

正規表現
m#<span class="ch2_thread_count">([0-9]+)</span>&n?bsp;<span class="ch2_thread_name">()(.+?)</spa
n>&n?bsp;<span class="ch2_thread_datetime">(.+?)</span><div class="ch2_thread_body">(.+?)</div>#mik

前処理
s#<div id="pop.+?>\s+\[レス番が見当たりません\]</div>##igk
s#<div id="pop[\S\s]+?</div>\s+</div>##igk
s#(span class="ch2_thread_name">.*?)(◆.+?)(?:(@.+?))?(</span>)#$1</b>$2<b>$3$4#igk

485 :名無しさん@停滞中 ★:10/04/21 19:11:11 ID:???
メモ
2chビューアーD(http://2ch.uda2.com/)のdat化について

URL例
http://2ch.uda2.com/society6-gline/1165245437/

正規表現
m#<dt.+?><a name=".+?"></a>([0-9]+) <span>(.+?)</span>(.*?)((?:\d{2}|\d{4})/\d+/.+?)</dt><dd>(.+?)</dd>#mik

前処理
s#\n<tr>.+?</tr>##igk
s#<script[\S\s]+?/script>##igk
s#<title.+?/title>##ik
s#<h5>(.+?)\(\d+\)<span>#<title>$1</title>#ik
s#\n<a href="http://2ch.uda2.com.+?>.+?</a><br/>##igk

変換結果式
$2<>$3<>$4<>$5<> (←メール欄逆転)

「透明あぼーんを補う」にチェック



モノによってはメール欄と日付の切り分けがうまくいかないかも。
エイプリルフール仕様の日付なんかあったらひとたまりもありません

486 :名無しさん@停滞中 ★:10/04/21 19:24:28 ID:???
>>485補足

>>385-386でも触れた所ですが
その時は確かdat落ち後は読めなかったような記憶があるです。

で、久しぶりに巡回してみたら

> 各表示はキャッシュされて表示されますのでDAT落ちしたスレッドが読めるかもしれませんが
> 速報系の掲示板は苦手です(板一覧:週一、スレッド一覧:1時間、スレッド内容:15分)

とありましたので。
あと下のとか。

http://uda2.com/blog/tag/2ch/
http://uda2.com/blog/2010/01/%E3%82%B3%E3%83%B3%E3%83%86%E3%83%B3%E3%83%84%E3%81%AE%E8%A6%8B%E7%9B%B4%E3%81%97/


現在、CORE SERVER(CORE-A)を使っておられるとの事なので
15GBまでデータ蓄積出来るみたい↓

http://www.coreserver.jp/?ref=uda2

487 :名無しさん@停滞中 ★:10/04/21 19:53:15 ID:???
>>485
後処理を転記し忘れたです

後処理
s#<br />#<br>#igk
s#((?:^|\n).*?)(◆.+?)(?:(@.+?))?<>#$1</b>$2<b>$3<>#igk

488 :名無しさん@停滞中 ★:10/04/24 17:35:13 ID:???
メモ

【Python Django】で2ch検索 - オラオラ検索
http://pc11.2ch.net/test/read.cgi/php/1202196045/

489 :名無しさん@停滞中 ★:10/04/24 19:17:58 ID:???
実況ニューサロ: いつでも過去ログが見れる「2chログキャッシュ」を作りました
http://jikkyonews.blog109.fc2.com/blog-entry-13.html
実況ニュースサロン 2chログキャッシュ01
http://yy54.60.kg/newsalog01/
実況ニュースサロン 2chログキャッシュ02
http://yy55.60.kg/newsalog02/
chohnanの日記
http://d.hatena.ne.jp/chohnan/

490 :名無しさん@停滞中 ★:10/04/24 19:19:36 ID:???
[を]2ちゃんねるキャッシュ検索
http://chalow.net/2007-03-28-1.html

491 :名無しさん@停滞中 ★:10/04/29 21:33:01 ID:???
ぴーちゃんねる
http://pchannel.net/
http://banba.jp/

採り上げているスレッドの量が物凄いんですが
自動でやっているのか手動なのか気になるです

完全自動だったら各レスの色分けとか画像取得置き換えの問題をクリアされてるんでしょうし
半手動だとしても毎日毎日の量が半端ではない数な感じがしますし。

492 :名無しさん@停滞中 ★:10/04/29 21:44:01 ID:???
よくわからないですが
これ↓も同じページが表示されるです

http://suzuke.jp/
http://218.219.148.59/

493 :名無しさん@停滞中 ★:10/04/30 19:01:02 ID:???
>>435>>469の方ですが
GoogleChromeアドオンでもやっちゃってくれてますね。

http://fatalita.sakura.ne.jp/Download/g2chDat/

自分とこのリンクがどこにも見当たらないです。
いっそ、「url.html」を別の名前にしてみるのも一興ですな。
まあ>>470のサイトやJaneの外部コマンド登録とかしてる人に影響あるでしょうけど。


こういう事やるならやるで
下のとか dat落ち後も読めるようにして頂けないですかね。

2chセンブラーONLINE(ββ)
http://fatalita.sakura.ne.jp/CGI/2ch/index.html

保存容量云々とかいうなら
cron使って一週間だけ保持しとくとか出来るでしょうに。
(というか さくらインターネットってデフォルトでcron使えるんですかね?)
FireFoxやChromeのアドオン拵えられるスキルがあるなら簡単でしょう。

[改行]

・・・代弁してくれてる方がいらっしゃいました。ありがとうございます

選択したテキストを指定したURLに渡すアドオンについて - SASAMI STREET
http://d.hatena.ne.jp/sasamistreet/20100317/nankazurui
(続)選択したテキストを指定したURLに渡すアドオンについて - SASAMI STREET
http://d.hatena.ne.jp/sasamistreet/20100430/renankazurui

494 :名無しさん@停滞中 ★:10/05/01 17:51:52 ID:???
まだ断定は出来ないですけど
どうもコピペした際に、ブラウザによっては半角スペースが付く場合があるみたい。


http://yy14.kakiko.com/test/read.cgi/mirror/1014655362/876

上のURLなんですが、自分の環境だと
コピペしてみるとIEとFirefoxで違う結果を出してしまうみたい。

正規表現をコピペすると、IEではなんでもないんですが
Firefoxでコピペしたものだとマッチしなくなるです。
調べてみると、「\[(.*?) \]」のように
「\]」の前に半角スペースがついてしまうようで。


IE6でコピペ
m#<dt.*?>([0-9]+) :<span.*?>(?:<b>)?(.+?)(?:</b>)?</span>\[(.*?)\]:(.+?)</dt><dd.*?> ?(.+?)(?:<script|</dd>)#mik

Firefox3.0.6でコピペ
m#<dt.*?>([0-9]+) :<span.*?>(?:<b>)?(.+?)(?:</b>)?</span>\[(.*?) \]:(.+?)</dt><dd.*?> ?(.+?)(?:<script|</dd>)#mik


自分の環境だと、再起動してやってみても同じ結果でした。
問題はこれが自分とこだけの事なのかどうか。

検索しても同様の症状が出てこないので心配になるです

495 :名無しさん@停滞中 ★:10/05/02 18:52:07 ID:???
imona.netさん
いつの間にかweb読みを復活されたのですか

http://imona.net/dat.pl/r/society6.2ch.net/test/read.cgi/gline/1165245437/

496 :名無しさん@停滞中 ★:10/05/04 14:33:59 ID:???
>>327でやってたものをメニューに追加してみたです

0chスクリプトQRコード化
http://www7.atpages.jp/mirrorhenkan0/qr0ch/

半年以上前にやってそれっきりだったので
どこをどうしたとかすっかり記憶の彼方ですが
成果物を出しといたほうがいいよなと

497 :名無しさん@停滞中 ★:10/05/04 17:45:59 ID:???
とやってからソース見てみたら
何とも効率の良くない事やってるなーと。
あとデータ渡しにQuery_String使ってるっぽいので
ブラウザによっては表示出来なくなっているかも。

またPerl思い出すの厄介だなぁ・・

498 :名無しさん@停滞中 ★:10/05/06 22:49:51 ID:???
メモ

HikkyWeb 2chブラウザ Version(1.9.2)
http://www.hikkyweb.jp/


http://www.hikkyweb.jp/GetThreadDAT.aspx?URL=http://yutori7.2ch.net/news4vip/&DAT=1273048934.dat

上ですが
http://yutori7.2ch.net/test/read.cgi/news4vip/1273048934/
がdat落ちしても閲覧出来たら
どんなにか嬉しい事でしょうか。

499 :名無しさん@停滞中 ★:10/05/15 09:05:32 ID:???
http://pc12.2ch.net/test/read.cgi/software/1267177119/830

> ・Threadic掲示板関連の修正(スレの取得をofflaw.cgiに変更など)

offlaw.cgiよりもdatread.cgiを読み込んだほうがいいのではと思ったですけど
もしかしたらofflaw.cgiで出ているレス番をキーにしているのかなと思ったですが
所詮素人考えなので以下略

offlaw.cgi
http://threadic.com/thread/bbs/offlaw.cgi/bugreport/1273812769/
datread.cgi
http://threadic.com/thread/bbs/datread.cgi/bugreport/1273812769/


ところでthreadic.comの管理人さんもtwitter始めておられたですね。
プロフィールの現在地を見てあれれどういう方なのかなと思ったり。

http://twitter.com/miyako2_engine/

500 :koreawatcher ◆Nida.eneRA :10/05/15 18:14:15 ID:PgRxx5jJ
>>499
datread.cgiの存在をどこで知りました?
offlaw.cgiに関しては、offlaw.cgiを作ってくれというメール(モデルはまちBBS)
をThreadicの開発陣に送ったからなんですが、datread.cgiに関しては初耳です。

ThreadicのCGIの最大の問題点は透明あぼーんの扱いで、offlaw.cgiでは
例えば2があぼーんされていれば1の次が3になっていますが、datread.cgiでは
2があった痕跡すらありません。
スレ一覧やレスの表示でこれらの矛盾が放置されたままになっています。

501 :名無しさん@停滞中 ★:10/05/15 19:07:06 ID:???
>>500

例えば

http://be.threadic.com/thread/bbs-jp/read.cgi/koreajapan/

↑を、IE等のブラウザで開いて
タイトル右にある「read.cgi ?? ??」(←この板では文字化けしますが)をクリックして
ダイアログが出てOKしてから各スレッドを読み込むとread.jsモードになるです。
そこで読み込んでいるdat代わりのものががdatread.cgiで、そこで知ったです。

で、確かにレス番欠如のものは詰めて表示されているですね。
これではofflaw.cgiのほうしか使えないですね。



以下蛇足の独り言

このread.jsって、2chの流用じゃないですか。
read.htmlにしても行数までぴったり合っているし。
外部jsもざっと見てみましたが、ほぼ同じ。


[threadic.com]
http://be.threadic.com/thread/bbs-jp/js/index.js
http://be.threadic.com/thread/bbs-jp/js/read.js

[2ch]
http://www2.2ch.net/snow/index.js
http://www2.2ch.net/snow/read.js


自分も
http://mirror.s151.xrea.com/0ch_html/
や 
http://mirrorhenkan.hp.infoseek.co.jp/0ch_html/
をやった事がありますが
read.jsの作者リンク(http://sunos.saita.ma/2ch-cgi-lw.htm)を変える事なんか
これっぽっちも思いもしませんでしたよ。



なんで作者表示まで変えたのかなー。
丸パクリじゃないですか。
ずるい。


ここまで2chのスクリプトソースを流用しているというのに
twitterでの↓この発言はどういう事なのかと。(twitterリンクはthreadic.comの板の最下部にあります)

http://twitter.com/miyako2_engine/status/13130287300
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
ジョンジョンスレディックが2chソース盗んで書いたとしている場合がありますが、2chのソースコードは公開されていな
いため、事実上のドロップの書き込みができないだけでなく、エンジンの見た目が似ているが、内部的にも、同じだと
見ることができないため、これは事実ではない。非常に不愉快だ
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

JavaScriptで書かれた2chソースを、作者リンクを変えてまでして使っているのでは
「盗んだ」といってもいいと思いますし
そのくせ「事実ではない」「非常に不愉快だ」などとよくもまあ言えたもんだと。

502 :名無しさん@停滞中 ★:10/05/15 19:32:50 ID:???
メモ

Windows Mobile 2ch過去ログ倉庫
http://2ch.wmusers.net/

503 :koreawatcher ◆Nida.eneRA :10/05/15 20:01:55 ID:PgRxx5jJ
>>501
なるほどリバースエンジニアリング(カッケー!)で知ってわけですか。
ちなみにスレッド一覧はまちBBS+αです。見比べれば明白です。

確かにスクリプトは2chの流用ではないですね。
その代わりSchBBSそのものですが…。
目に見える部分は確かに改造されていますが、内部的にはそのままであることが
こちらからはよく分かります。

実はThreadicは思いつきで頻繁に仕様を変えるのに、Xenoユーザーからは
アクセス出来ないという苦情が全く来ないという不思議(でもないですが)な
状況が続いています。サポートを続けるか撤退するか難しいところです。

504 :名無しさん@停滞中 ★:10/05/16 13:45:44 ID:???
>>503
threadicさんの所、subbackも手を加えてあったんですか。

そうなるとsubbackの仕様が変わったらまたお手上げですね。
では、offlaw.cgiを要望して作ってもらえたとの事なので
subject.cgi(名前は何でもいいですが)を設置してもらえたら、
仕様変更されても影響は無くなるかもですね。


あと冷静な人が結構居て面白い。
個人的にはエロデウス ◆Vv9y7Z38.2さんの書き込みとか面白いですけど
最近見ないです。
下のが最近ぽいですが本スレは無くなってますし。

http://webcache.googleusercontent.com/search?q=cache:73ETpZKQ1VgJ:be.threadic.com/thread/bbs-jp/read.php/koreajapanplus/1269086384/l50




あとあれだ
threadic.comの管理人さん、スクリプトのソース流用の件はおいといて
どの辺りまで狙ってやっているのかなと。
判っていてやっているのか天然なのか。


twitterの自己紹介文とか見てみると

−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
自己紹介文:
独島でスレディクエンジンを開発しているスレディク開発担当です。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

とあるんですが
プロフィール画像がなぜかHITACHIの洗濯機というのが謎。

http://twitter.com/account/profile_image/miyako2_engine?hreflang=en


もしかしたら本当に狙っているのかな?
昔から2chを見ていて、洗濯機御大とかけているのかなとか

http://mimizun.com/log/2ch/gline/1102086638/473
http://blog.livedoor.jp/implst/archives/25350650.html
http://puerutadelsol.seesaa.net/article/4419306.html
http://web.archive.org/web/20051217062449/http://tech.ciao.jp/blog2/archives/2005/07/post_28.html

505 :koreawatcher ◆Nida.eneRA :10/05/17 00:08:29 ID:6V4DCVtS
>>504
仕様変更されたらもう対応しないかもしれません。
メールはある時を境にこちらに一切返事が戻ってこなくなりましたし…。
offlaw.cgiにしても、他の掲示板は以前から対応していたのに、肝心の日韓交流板には
今回のJaneXenoの更新の前日になってやっと予告なしに導入され、それを受けて
JaneXenoをリリースした次第です。

掲示板の内容自体に関しては、韓国人と交流しようとしたにもかかわらず、
いつまでも過去のことを持ち出す先方に激怒して日本人が出ていったのを
何度か目にしました。今や書き込んでいるのは韓国人ばかりですね。

506 :名無しさん@停滞中 ★:10/05/18 00:29:47 ID:???
>>505
そんな事があったんですか。
では仕方ないです。

確かに日本人は居なくなってるですね。
交流もどんどん減っていってつまらなくなっているような。

http://be.threadic.com/thread/bbs-jp/read.cgi/koreajapan/1272186683/60-61
http://be.threadic.com/thread/bbs-jp/read.cgi/koreajapan/1272186683/74
http://be.threadic.com/thread/bbs-jp/read.cgi/koreajapan/1272186683/77


ところで、独り言に近い要望ですが
苺BBS(http://www.ichigobbs.org/)もXenoで読めるようになったら有難いです。
掲示板スクリプトはaround BBS(http://around.at.infoseek.co.jp/)ですが
十分に枯れた(?)スクリプトなので 仕様変更もそう無いでしょうし。

この苺BBSのなかにある経済板(http://www.ichigobbs.org/economy/)は
2chの経済板(http://namidame.2ch.net/eco/)とはこれまた全然雰囲気が違っていて
とても面白いのです。

まあ自分だけの印象かもしれませんが。

[改行]

メモ

EROTRONIKA   
http://blog.naver.com/faceless0.do

(via http://akiakane000.blog37.fc2.com/blog-entry-47.html

507 :名無しさん@停滞中 ★:10/05/18 00:57:48 ID:???
メモ

2ちゃんねるブラウザ
http://www.2003acmr.org/


http://www.2003acmr.org/yutori7.2ch.net/news4vip/1273910010/

上ですが
http://yutori7.2ch.net/test/read.cgi/news4vip/1273910010/
がdat落ちしても閲覧出来ていたら
どんなに素晴らしい事でしょうか。

508 :名無しさん@停滞中 ★:10/05/18 00:59:37 ID:???
メモ

2ちゃんねるブラウザ
http://www.manuflexgroup.com/


http://www.manuflexgroup.com/yutori7.2ch.net/news4vip/1273910010/

上ですが
http://yutori7.2ch.net/test/read.cgi/news4vip/1273910010/
がdat落ちしても閲覧出来ていたら
どんなに素晴らしい事でしょうか。

509 :名無しさん@停滞中 ★:10/05/18 01:01:43 ID:???
メモ

2ちゃんねるブラウザ
http://www.ridenorthtsar.com/


http://www.ridenorthtsar.com/yutori7.2ch.net/news4vip/1273910010/

上ですが
http://yutori7.2ch.net/test/read.cgi/news4vip/1273910010/
がdat落ちしても閲覧出来ていたら
どんなに素晴らしい事でしょうか。

510 :koreawatcher ◆Nida.eneRA :10/05/19 00:03:24 ID:tSKhGYyh
>>506
いちごびびえすに行ってみたんですが、全スレッドのスレッド一覧を取得する方法が
分かりませんでした。それとやはりdat直読みは無理なんでしょうか?
そこら辺の仕様が良くわかりませんでした。

511 :名無しさん@停滞中 ★:10/05/19 19:56:24 ID:???
>>510
とりあえずhttp://around.at.infoseek.co.jp/のスクリプトをDLして
板を置いてみました。

http://mirrorhenkan.hp.infoseek.co.jp/around/cgi-bin/mirror/index.html

で、判った事ですが
一つのスレッドでdatは二つに分かれているみたいです。
例えば下のような感じ。

・例1
スレッド
http://www.ichigobbs.org/cgi/15bbs/economy/1553/
dat
http://www.ichigobbs.org/economy/economy_1553a.txt
http://www.ichigobbs.org/economy/economy_1553b.txt

・例2
スレッド
http://www.ichigobbs.net/cgi/15bbs/2ch/0115/
dat
http://www.ichigobbs.org/2ch/2ch_0115a.txt
http://www.ichigobbs.org/2ch/2ch_0115b.txt

上の例2の場合、レス136が透明消去されてますが
datを見るとhttp://www.ichigobbs.org/2ch/2ch_0115b.txtの135行目が空行になっているです


次にスレッド一覧ですが、datキーだけ一覧があるみたい。
で、読み込みの都度生成しているのではないかなと。


http://www.ichigobbs.org/economy/
スレッド一覧
http://www.ichigobbs.org/economy/economy_new.txt


http://www.ichigobbs.org/2ch/
スレッド一覧
http://www.ichigobbs.org/2ch/2ch_new.txt


あと、ホットゾヌ2の通信状態を以前見てみたですけど
htmlを取得してそれをsubject.txt化したりdat化したりされてるみたいでした。

http://yy14.kakiko.com/test/read.cgi/mirror/1186175383/405

512 :koreawatcher ◆Nida.eneRA :10/05/19 20:55:47 ID:tSKhGYyh
>>511
う〜ん。データのフォーマットの違いくらいならなんとかなりますが、
ここまでファイルの構造が違うと対応は難しいです。
せめて、スレッドとスレッド一覧がそれぞれ1アクセスで取得できれば
よかったんですが…。
わざわざ実験で板を設置までしてもらったのにすみません。

513 :名無しさん@停滞中 ★:10/05/20 19:37:03 ID:???
いえ、こちらこそ長々と申し訳ありませんです。

ところで、>>511で設置したスクリプトを少し見てみたら
aska.cgiの72行目に

-------------------------------------------
#かちゅ〜しゃ(2chブラウザ)に対応させる(0=no 1=yes)
#http://members.jcom.home.ne.jp/katjusha/
#注意!ログを2重にとるので2倍重くなります
$katjusha = 0;
-------------------------------------------

というのがあり、「$katjusha = 1;」として投稿してみたら
subject.txt/****.datとも生成されたです。

subject
http://mirrorhenkan.hp.infoseek.co.jp/around/cgi-bin/mirror/subject.txt
dat
http://mirrorhenkan.hp.infoseek.co.jp/around/cgi-bin/mirror/dat/mirror0002.dat

残念ながらdatは投稿した部分しか記録されないようですが
subject.txtはうまくいってるみたい。(レス数のカッコが「<2>」とかになってますが)


という事で、いちごびびえすがaska_list.cgiの元としてaska.cgiを使っておられるなら
管理人さんにその部分を追加して頂けたらsubject.txtとdatの生成は可能かもです。

ふくやんさん、ブログもtwitterもやっておられますが
そういう場で要望するのと、メールでお願いするのと
さあどちらがいいのかな。
といか、メール生きているのかな

http://twitter.com/fukuyan
http://www.1-5-6.net/blog/
http://www.ichigobbs.org/15file/ichigobbs/about.html


こんなところで(どんなところだ)。

あとメモ

いちごびびえすは2ちゃんねるじゃありません -いちごろく-
http://www.1-5-6.net/archives/2005/08/post-322.html
経済/経済学@いちごびびえすの総目次
http://www.math.tohoku.ac.jp/~kuroki/Readings/ichigo.html
いちごBBSまとめログ
http://ichigobbs.ath.cx/

514 :名無しさん@停滞中 ★:10/05/21 18:58:17 ID:???
メモ
2ちゃんねる過去ログ保管庫(http://b-mark.org/2chlog.html
2ちゃんねる過去ログ保管庫2(http://b-mark.org/2chlog2.html
のdat化について

URL例
http://b-mark.org/view?key=society6_gline_1165245437.dat
http://b-mark.org/view?key=ex3_accuse_1080745274.dat&day=20040401

正規表現
m#<dt><a.+?>([0-9]+)</a>.+?:<font color=green><b>(.+?)</b></font>\[(.*?)\] ?(.+?)<br><dd>(.+?)<br><br>#mik

変換結果式
メール欄逆転


URL例の1番目と2番目では保管先が違うのかも。
例えば2番目の場合
http://b-mark.org/view?key=ex3_accuse_1080745274.dat
だとエラーになるです
逆もまた同じ

これまた新しい形ですなあ。

515 :名無しさん@停滞中 ★:10/05/22 19:13:33 ID:???
>>514追加。「その84」「その84a」という事で
100到達まであと少しですね(←流石に無理だと思いますよ)


ところで、自分とこのプロバイダがまだ規制っぽいのでココで。


Xenoでログ検索するとハングルが出ないです
「・・」ばかりで読めないです

http://image.threadic.com/images/iWDEQN4R58z

あと、デジカメの機種が文字化けしてるです
下の画像のデジカメ画像の「メーカー: チヨ(メニナテ)」って文字化けですよね。

http://image.threadic.com/images/iKgzHMVJofz

どちらも読めるようにして頂けたら嬉しいです




関係ないですけど

http://adult.threadic.com/thread/bbs/read.cgi/pervertplus/1274010479/

どこまで本気なのかなと。
翻訳で見るなら下

http://translate.google.com/translate?js=y&prev=_t&hl=en&ie=UTF-8&layout=1&eotf=1&u=http://adult.threadic.com/thread/bbs/read.cgi/pervertplus/1274010479/&sl=auto&tl=ja


メモ
command.datに下記追加

%GoogleTranslate=http://translate.google.com/translate?js=y&prev=_t&hl=en&ie=UTF-8&layout=1&eotf=1&u=$URL&sl=auto&tl=ja

516 :名無しさん@停滞中 ★:10/05/22 20:02:50 ID:???
メモ

http://mimi.s151.xrea.com/2chp.cgi/yutori7.2ch.net/news4vip/

http://mimi.s151.xrea.com/2chp.cgi/yutori7.2ch.net/test/read.cgi/news4vip/1274357231/
↑これ
dat落ち後も読めたらいいなー

もふもふ
http://mofumofu.tank.jp/

517 :koreawatcher ◆Nida.eneRA :10/05/23 01:52:53 ID:i8sbv2j6
>>515
結論から言うとどちらも無理です。

MS Pゴシックは日本語のみ、MS UI Gothicはハングルも
表示できるのですが、データがシフトJISである2chでは
通常文字をMS Pゴシック、文字参照をMS UI Gothicに
分ける仕組みでMS Pゴシックの中でハングルを表示しています。

Threadic(UTF-8板)ではハングルにも文字参照は使われない
ため、この方法は使えません。
文字を一つ一つ調べてそれがシフトJISに含まれているかどうかを
調べることはできますが、Threadicのためだけに負荷が増えること
になります。そこでUTF-8板ではすべてをMS UI Gothicで表示
するという手抜き処理を行っています。

ログ検索は複数の板から検索できるので、使用するスキンを
ひとつに統一しなければなりません。
MS UI Gothicを使えばハングルを表示できますが、2chの
表示が不自然になります。そこで大多数が利用する2chを
優先してMS Pゴシックを採用したため、結果としてハングルが
表示できなくなっています。

518 :koreawatcher ◆Nida.eneRA :10/05/23 01:53:51 ID:i8sbv2j6
>>515
チヨ(メニナテ)はハングルの文字化けで、コードはEUC-KRです。
Exifの文字列データは非Unicodeですが、エンコード情報があり
ません。仮にエンコードの自動判定を行うとEUC-JPとして
判断されて「爽(寅澱)」と表示されるだけです。

519 :名無しさん@停滞中 ★:10/05/23 18:40:37 ID:???
>>517-518
おお、ありがとうございます。
スキンでフォントをMS UI Gothicに指定したら検索結果が表示できました。

検索結果だけMS UI Gothicにするような事は出来ないものでしょうか。
AAがずれる等のクレームが考えられますが
AA自体を検索するような事自体 レアケースだと思うのですが。


デジカメ情報の件、判りました。
韓国のデジカメだとSamusung/LG cyon/チヨ(ニメナテ)の3つがあるみたいですが
Sony/Pentax/Fujifilm/Nicon/Canon等の日本製のほうが割合として多いなと。

ただ
http://adult.threadic.com/thread/bbs/read.cgi/pervertplus/1274105714/650
で出ている
「PANTECH]
ってなんだろなと。
ペンタックスと紛らわしいではないですか

http://plusd.itmedia.co.jp/mobile/articles/0508/29/news041.html
http://bizmakoto.jp/bizmobile/articles/0702/06/news100.html

520 :名無しさん@停滞中 ★:10/05/24 20:12:42 ID:???
今まで真魚でハングル表示出来ないのがどうにも不思議だったんですが
>>517の書き込みを拝見して 表示フォントをMS UI Gothicに変えてみたらうまくいったです
おめでとうございますありがとうございます。

で、TeraPadでも出来るんじゃーないかと見てみたんですが
使用出来るフォントの中にMS UI Gothicが見当たらないもんで
うまくいかないっぽいです。
使っているバージョンは0.93で、作者さんのサイトを見ると最新版っぽい
残念。

521 :koreawatcher ◆Nida.eneRA :10/05/25 00:11:41 ID:+HhL8gA0
>>519
実はMS UI Gothicはひらがなとカタカナのフォントも微妙に違うんです。
MS UI Gothicに変えたりしたら、「他のJaneと見た目が違う」という
不具合報告が殺到します。
板別スキン機能を使って「標準」スキンを
<font face="MS UI Gothic" uface="MS UI Gothic">にして
その他を
<font face="MS Pゴシック" uface="MS UI Gothic">にする
という方法でも、面倒ですが対処できると思います。

「チヨ」 は「株」、「ニメ」は「ペン」、「ナテ」は「テク」のハングルの文字化けです。
だから、(チヨ)ニメナテ=(株)ペンテック=PANTECHです。

>>520
TeraPadは内部は完全にShiftJIS処理で、Unicode文字は"?"に
置き換えられて格納されています。フォントをどのように変えても
表示はできません。さらに、TeraPadでUnicode文字を含む
ファイルを上書き保存するとデータが破壊されるので注意してください。

522 :名無しさん@停滞中 ★:10/05/25 21:25:58 ID:???
余裕がないです

>>521
ありがとうございます。
余裕が出来たら板別スキン機能とはどういうものか見てみるです

てかペンテックと読むですか
どっひゃー


あと、何故か現在消えてるですが
こんなスレッドが立ってたです
どうなるんですかね
読めなくなっても不思議はないですけど

http://be.threadic.com/thread/bbs-jp/read.cgi/koreajapan/1274728115/
-------------------------------------------------------------
1 名前:Developer★[] 投稿日:2010/05/25(?) 04:09:22.85 ID:???
日韓交流掲示板のシステム点検作業によって 5月 26日 0時から 5時まで交流版を利用することができません.

そして, データが遺失されることもできるので, 重要なデータはバックアップしてください.
-------------------------------------------------------------

あとメッセンジャーを出されたり

http://threadic.com/thread/bbs/read.cgi/babo/1274733772/




内部処理がShiftJISとの事、判りました。
痛い思いしたのはそのせいでしたか

523 :名無しさん@停滞中 ★:10/05/26 19:35:43 ID:???
やりかけメモ
http://2chradio.com/ http://2chradio.com/jidou/ のdat化について

URL例
http://2chradio.com/jidou/?dat=news4vip1274753615
http://mirror.sarashi.com/htmltodat/2chradio/1274753615.html

正規表現
m#<dt.+?>([0-9]+) :()<font color=green><b>(.+?)</b></font>:(.+?)<dd>(.+?)<br><br>#mik

前処理
s#(<title.+?) \- 自動速報vip(</title>)#$1$2#ik
s#(ID:)<a.+?>(.+?)</a>(<dd>)#$1$2$3#igk

今現在
元スレ(http://yutori7.2ch.net/test/read.cgi/news4vip/1274753615/)はdat落ちしているのに
何故か読めるので。
いつごろまで閲覧可能なのかな

ただしまだやりかけ。
dat化の漏れはないのですが
何故か空行(でもないけど)がところどころ出てしまうのは何故だろうか。
あと本文中の強調タグ(<font>や<b>等)があちこちにあるのをまだやってないです
それと本文中に「<br></b>」が頻繁にあるですけど「<b>」が見当たらないような。
ってシラミつぶしに見ていないので一方的な決め付けだったらごめんなさいです

524 :名無しさん@勉強中:10/05/27 01:46:45 ID:2AS/hlDS
>>521
板別スキン使わなくても、ちょっと変えたいで
いいんじゃないかね?キムしゃん

525 :名無しさん@停滞中 ★:10/05/29 17:07:22 ID:???
よくわかんないです





メモ

.com-indexドットコムインデックスの2ちゃんねるDATリーダー
http://2chdat.com-index.biz/
dat
http://2chdat.com-index.biz/data/

モナメントみたいなものですかね。
そういえばモナメント繋がらないですね





メダロットを語るスレ過去ログ閲覧システム
http://medarot.jp/2ch/dat/

2ch DAT落ちスレ ミラー変換機 ver.4
http://logsoku.com/thread/yutori7.2ch.net/news4vip/1268668570/

526 :名無しさん@停滞中 ★:10/05/30 18:02:50 ID:???
韓国からアクセスがあった場合、韓国版美人時計を表示するようにして
ついでにぽっぷちゃっとも別のものを表示させるようにしてみたり。

どうなってるか見たい物好きの方は
「スタート」→「設定」→「コントロールパネル」で
「地域と言語のオプション」で韓国語を選択してから閲覧してみたらいいかも。

この振り分け処理ってIE専なんですが
韓国でのIE占有率って95%くらいだと5年くらい前に見たので(って5年前では意味ないじゃん)
まあいいかなと。
無意味だけどまあいいかなと

527 :名無しさん@停滞中 ★:10/05/31 20:42:51 ID:???
IE専からクロスプラットフォーム化(カッケー!)にしたつもり
ついでに台湾からアクセスがあった場合、台湾版美人時計を表示するようにしてみたり。

どうなってるか見たい物好きの方は
「スタート」→「設定」→「コントロールパネル」で
「地域と言語のオプション」で「中国語(台湾)」を選択してから閲覧してみたらいいかも。

この振り分け処理ってクロスプラットフォーム化したつもりなんですが
IEの時は従前のもので、
IE以外のブラウザ、例えばFireFox等では
「window.navigator.language;」ってので使用言語を見て振り分けてるんですが
これが自分とこのではどこに設定があるのかわかんない。
FireFoxでは何やっても「ja」って出てしまうです。

という事は、たぶん韓国や台湾からのFireFox等では
それぞれ「ko」「zh-tw」と出て順当に振り分けられるのではないかなと。

うまくいってるかどうかわかんないんですが
こればかりは現地の人から教えてもらうしかないのかな。
にしても、OSの使用言語の変更ってどこにあるのでしょうか。
それをやって取り返しのつかない事になっても困るんで何なんですが。



ちなみに試してみた判別スクリプトはこちら
IEと非IEで表示が異なるです

http://mirrorhenkan.hp.infoseek.co.jp/ltest.html

528 :名無しさん@停滞中 ★:10/06/02 07:02:20 ID:???
堂ちゃん 過去ログ倉庫 - フォルダ一覧
http://www.uu.dnsdojo.net/~dou-log/logs/index.html

529 :名無しさん@停滞中 ★:10/06/07 19:05:37 ID:???
メモ

クイック2ch
http://quick2ch.ddo.jp/

レスアンカーがあるレスだけ自動抽出表示してるのかな

530 :名無しさん@停滞中 ★:10/06/10 17:21:01 ID:???
メモ

doja 2channel Browser
http://2chbrowser.moe.hm/
ExtVipCacheBrowser
http://2chbrowser.moe.hm/vip_archive/


Ajaxバリバリですな
追いかける気力が今は無さそう。
URLを見るとDDNSでやっておられる所みたい




ところで、下のURLがhtmltodatでは文字化けしてしまうんですが
何か対処法はないものでしょうか。

http://2chbrowser.moe.hm/vip_archive/ajax/el/1275777995?ita=dat&_dc=1023696648967

「文字コード自動判別」チェックボックスをオフにして
「UTF-8 -> SJIS変換」にしても文字化けしたままなのです

531 :名無しさん@停滞中 ★:10/06/10 20:21:58 ID:???
いちおうメモ
2channel archives(http://2chbrowser.moe.hm/vip_archive/)のdat化について

URL例
http://2chbrowser.moe.hm/vip_archive/ajax/el/1275777995?ita=dat&_dc=1023696648967

正規表現
m#<DT.+?>([0-9]+) : <FONT color="lightgrey">()<B>(.+?)</B></FONT> : (.+?)<DD.+?>(.+?)</DD></DT><BR>(?:<DT.+?>|</DIV>)#mik

前処理
s#^(.+?)<>#<title>$1</title><>#ik

Ajaxでデータ取得表示しているみたいなので
ブラウザで表示しているhtmlを指定しても何も出てこないです

html表示
http://2chbrowser.moe.hm/vip_archives/index.html?id=1275777995&ita=dat
dat化用データ
http://2chbrowser.moe.hm/vip_archive/ajax/el/1275777995?ita=dat&_dc=1023696648967


532 : ◆/vmukiyuzw :10/06/10 23:33:03 ID:wQWXw+0U
>>530
んーと、文字化けする根本原因(文字コードを自動判別できない理由)を調べないといけないのでしょうが
時間があんまり取れないのでとりあえず。

> 「文字コード自動判別」チェックボックスをオフにして
> 「UTF-8 -> SJIS変換」にしても文字化けしたままなのです

この方法でこちらでは変換できちゃったのですが・・・。

533 :名無しさん@停滞中 ★:10/06/11 07:42:46 ID:???
おはようございます


>>532
XP Home / XP Pro / 98無印 の3環境で試してみたですが
自分の環境ではどれでも文字化けしているです
うーむ

534 :名無しさん@停滞中 ★:10/06/11 19:39:16 ID:???
>>531の正規表現はこうですな

m#<DT.+?>([0-9]+) : <FONT color="lightgrey">()<B>(.+?)</B></FONT> : (.+?)<DD.+?>(.+?)</DD></DT><BR>#mik

535 :名無しさん@停滞中 ★:10/06/12 15:40:37 ID:???
やっと判った

「->SJIS変換(J)」というのはボタンになっていたのですね。
今まで全然気付かなかった。うかつ

http://image.threadic.com/images/f1ecaf0cad0fc765ce3f61c5a8090af26f3fd89a.PNG

536 :名無しさん@停滞中 ★:10/06/12 16:14:17 ID:???
ついでに
http://2chbrowser.moe.hm/
のリバースエンジニアリング(カッケー!)

ソースで提示されているcssとjsファイルを落として試すつがめすしてみたんですが
どうにも構造が判り難かった理由は二つあったです

(1) 拡張子不在

通常のものだと、例えばread.cgi等のように拡張子である程度判別出来るんですが
今回のものは「api」と「sesmng」というように拡張子が無かった事

(2) データ送信方法

通常だとGETを使うものがほとんどなんですが(なのでURLのあとの「?bbs=xxxx&key=xxxx」で判る)
今回のものはPOSTを使っているので判り辛かった事


以上の二点でした
まだまだ修行が足りない。




で、幸いPOST送信するものがGETでも受け入れてくれたので
下記のようになるです

掲示板一覧データ取得
http://2chbrowser.moe.hm/api?mode=ita
掲示板データ取得
http://2chbrowser.moe.hm/api?key=ita_rireki&url=http%3A%2F%2Fgimpo.2ch.net%2Fevent%2F&value=%5B%5B%22http%3A%2F%2Fgimpo.2ch.net%2Fevent%2F%22%2C%22%E3%82%A4%E3%83%99%&mode=threads
スレッドデータ取得
http://2chbrowser.moe.hm/api?mode=thread&url=http%3A%2F%2Fgimpo.2ch.net%2Fevent%2Fdat%2F1272060777.dat



なので一応

http://2chbrowser.moe.hm/api?mode=thread&url=http://live28.2ch.net/news4vip/dat/1276083782.dat

上のデータですが
http://live28.2ch.net/test/read.cgi/news4vip/1276083782/
がdat落ちしても閲覧可能だったら
どんなにか嬉しい事でしょうか。

537 :名無しさん@停滞中 ★:10/06/12 16:17:26 ID:???
あともうひとつ

http://2chbrowser.moe.hm/
のソースを見たら

<meta http-equiv="Content-Type" content="text/html; charset=windows-31j">

とあり
「charset=windows-31j」
って何なのかあれこれ調べたですよ
まだまだ修行が足りない

http://www.site-cooler.com/java/j2ee/07_01.htm

538 :名無しさん@停滞中 ★:10/06/13 12:01:37 ID:???
メモ

lalalach.com 2chブラウザ(http://lalalach.com/)のdat化について

URL例
http://lalalach.com/b/society6.2ch.net/gline/1165245437/

正規表現
m#<dt>([0-9]+)\.<a href=mailto:(.*?)>(.+?)</a>(.+?)</dt><dd>(.+?)<br>(<a name=\d+></a>|</dl>)#mik

前処理
s#(<a href=mailto:.*?>.*?)(◆.+?)(</a>)#$1</b>$2<b>$3#igk



z-z-z-z.netさん 引越しなさったのかな


539 :名無しさん@停滞中 ★:10/06/13 17:54:55 ID:???
メモ
2channel archives(http://chara.moe.hm/arc/)のdat化について

URL例
http://2chbrowser.moe.hm/vip_archive/ajax/el/1276347471?ita=dat

正規表現
m#<DT.+?>([0-9]+) : <FONT color="lightgrey">()<B>(.+?)</B></FONT> : (.+?)<DD.+?>(.+?)</DD></DT><BR>#mik

前処理
s#^(.+?)<>#<title>$1</title><>#ik


Ajaxでデータ取得表示しているみたいなので
ブラウザで表示しているhtmlを指定しても何も出てこないです

html表示
http://chara.moe.hm/arc/thread/1276347471?ita=dat
dat化用データ
http://2chbrowser.moe.hm/vip_archive/ajax/el/1276347471?ita=dat

dat化用データですが、呼び出し当初は文字化けしますが
htmltodatのURL欄に「その86」のdat用のURLを入力して
「文字コード自動判別」チェックボックスをオフにして「HTML取得」をクリックして呼び出してから
「UTF-8 -> SJIS変換」にして
「->SJIS変換(J)」のボタンをクリックすれば文字化けがなくなるので
その後で上の正規表現と前処理でdat化するです。

540 :名無しさん@停滞中 ★:10/06/13 18:02:33 ID:???
上二つ追加
「その85」「その86」という事で

あと>>536はdat落ち後は読めないみたい
残念

541 :名無しさん@停滞中 ★:10/06/13 18:31:30 ID:???
>>539ですが
URLがあると前後にspanタグがついてその中でOnmouseover処理をしてるので
それを取り払う為に

前処理
s#<DT>#\n<DT>#igk
s#</?span.*?>##igk

としてみたら
ものすごく処理に時間がかかるようになってしまったんですが
さてどんな書き方すれば時間が短縮出来るのだろうなーと

542 :名無しさん@停滞中 ★:10/06/14 12:27:59 ID:???
これで良さそう

前処理
s#<span.+?>(h?ttp://.+?)</span>#$1#igk

テスト用URL
http://2chbrowser.moe.hm/vip_archive/ajax/el/1276373020?ita=dat
ちなみにhtml
http://chara.moe.hm/arc/thread/1276373020?ita=dat

たぶん、たぶんですが
画像をポップアップ表示する為にspanタグを入れていると思うので
もっと厳密にやるなら下のとかかな

s#<span.+?>(h?ttp://.+?\.(?:jpe?g|png|gif|bmp))</span>#$1#igk

・・って
上のテスト用URLだとこれうまくいかないのは何でなのだろう

543 :名無しさん@停滞中 ★:10/06/14 19:15:28 ID:???
やりかけメモ

URL例
http://2chradio.com/?dat=newsplus1276445128

正規表現
m#<dt id=\d+>([0-9]+) :()<font color=green><b>(.+?)</b></font>:(.+?)<dd>(.+?)(?:<br><br>|</td></tr><tr><td.+?><small>|<br></b>)(<dt.+?>)#mik

前処理
s#(<title.+?) \- 2chradio(</title>)#$1$2#ik
s#(ID:)<a.+?>(.+?)</a>(<dd>)#$1$2$3#igk
s#<script[\s\S]+?/script>##igk
s#\n(?: |\t|<meta|<div|<img).+?(?=\n)##igk
s#<object.+?><param.+?></param><param.+?></param><param.+?></param><embed src="(http://.+?)".+?></embed></object>#$1#igk


ほんとに自動作成なのかな
すごい

544 :名無しさん@停滞中 ★:10/06/14 20:18:16 ID:???
上のを追加(http://2chradio.com/ http://2chradio.com/jidou/
「その87」「その87a」という事で

dat化はちょい億劫
そこにしか残っていないスレッドがある可能性もゼロという事は無いので
まあ今後の課題ですな

545 :名無しさん@停滞中 ★:10/06/16 19:30:17 ID:???
>>538
最近閲覧したスレッドを見ると全然連動してないような。

http://z-z-z-z.net/
http://lalalach.com/


546 :名無しさん@停滞中 ★:10/06/17 21:42:59 ID:???
メモ

レスピク(http://respic.net/)のdat化について

URL例
http://respic.net/log/http://yutori7.2ch.net/news4vip/dat/1275300174.dat

正規表現
m#<p class="res-ttl"><span class="no.*?">([0-9]+)</span> 名前:<span class="name">(.+?)</span> \[(.*?)\] 投稿日:(.+?)</p>\t+?<div class="res-body">(.+?)</div>#mik

前処理
s#(<title.+?) \(\d+\) レスピク スレビュアー(</title>)#$1$2#ik

変換結果式
$2<>$3<>$4<>$5<> (←メール欄逆転)

後処理
s#(^.+?)<>.*?<>#$1<><>#ik
s#(^|\n.*?)(◆.+?)<>(.*?)<>#$1</b>$2<b><>$3<>#igk




後処理で消すようにしたですが、スレッドのタイトルがレス1のメール欄に出ているです

547 :名無しさん@停滞中 ★:10/06/18 08:17:25 ID:???
http://be.threadic.com/thread/bbs-jp/koreajapan/
http://be.threadic.com/thread/bbs-jp/koreajapanplus/

offlaw.cgiが404ですな


http://be.threadic.com/hread/bbs-jp/offlaw.cgi/koreajapan/1276616652


他の板はOKなんですがねえ・・

http://adult.threadic.com/thread/bbs/offlaw.cgi/pervertplus/1275930255/234-


あと不具合報告板も消えてるっぽい

http://threadic.com/thread/bbs/bugreport/


で、管理人さん
twitterも退会なさったみたいで

https://twitter.com/miyako2_engine/
http://webcache.googleusercontent.com/search?q=cache:http://twitter.com/miyako2_engine


これはダメかもわからんですね

548 :名無しさん@停滞中 ★:10/06/18 19:32:05 ID:???
>>546追加
「その88」という事で


ニュース速報板のランダム名無しの</b><b>もつけるとしたら
後処理に下のを追加ですかね

s#(^|\n) ?([^<>]+)<>#$1</b>$2<b><>#igk

ただこれだとトリップの無い名前(例えば数字とか)にもついてしまいそうなので
もっとやるとしたら

s#(^|\n) ?([^<>]+\([^<>]+\))<>#$1</b>$2<b><>#igk

とかでしょうか。
何かやってて不毛な感じだけど

549 :名無しさん@停滞中 ★:10/06/19 11:47:29 ID:???
>>546
後処理これだとレス1のトリップにタグ付加できなそう

s#(^|\n.*?)(◆.+?)<>(.*?)<>#$1</b>$2<b><>$3<>#igk



s#((?:^|\n).*?)(◆.+?)<>(.*?)<>#$1</b>$2<b><>$3<>#igk

550 :名無しさん@停滞中 ★:10/06/19 11:51:18 ID:???
零 Channel
http://pleiades.vs.land.to/

551 :名無しさん@停滞中 ★:10/06/20 20:03:13 ID:???
http://jbbs.shitaraba.com/bbs/read.cgi/computer/1929/1038588508/604

ありがとうございます
文字化けしなくなったみたいです

552 :名無しさん@停滞中 ★:10/06/20 20:04:51 ID:???
メモ

ログ保管庫1(http://ranma.biz/2chlog/index.php)のdat化について

URL例
http://ranma.biz/2chlog/index.php/1215736765.dat

正規表現
m#<dt><a.+?>([0-9]+)</a> 名前:<font color="forestgreen">(?:<a href="mailto:(.+?)">)?<b> ?(.+?)</b>(?:</a>)?</b></font> 投稿日:(.+?)<dd>(.+?)<br><br>#mik


553 :名無しさん@停滞中 ★:10/06/23 18:40:26 ID:???
メモ

実験サイト 神の目
http://god.martian.se/2ch/

URL例
http://god.martian.se/2ch/dat/20100622/newsplus/1277199943.html

正規表現
・・・って何それ食えるのおいしいの
ええとてもおいしいのよ

500KB
続きを読む

掲示板に戻る 全部 前100 次100 最新50
名前: E-mail(省略可)

0ch BBS 2006-02-27