テレワークならECナビ Yahoo 楽天 LINEがデータ消費ゼロで月額500円〜!
無料ホームページ 無料のクレジットカード 海外格安航空券 海外旅行保険が無料! 海外ホテル


告知欄です

■掲示板に戻る■ 全部 1- 101- 201- 301- 401- 501- 601- 701- 801- 最新50
メモ4

1 :名無しさん@停滞中 ★:08/06/17 20:07:26 ID:???
はてさて思いついた事など

385 :名無しさん@停滞中 ★:09/12/06 19:51:56 ID:???
メモ

2chビューアー
http://uda2.com/2ch/


ところで

http://uda2.com/2ch/?sid=759&dat=1259998115

上のスレッドですが

http://yutori7.2ch.net/test/read.cgi/news4vip/1259998115/

がdat落ち後も閲覧出来ていたら
どんなにか素晴らしいことでしょうか。

386 :名無しさん@停滞中 ★:09/12/06 20:16:34 ID:???
いちおうメモ
2chビューアー(http://uda2.com/2ch/)のdat化について

URL例
http://uda2.com/2ch/?sid=759&dat=1259998115

正規表現
m#<dt><a.+?></a>([0-9]+) ()<span>(.+?)</span>(.+?)</dt><dd> (.+?)</dd>#mik

前処理
s#\n<tr>.+?(?=\n)##igk
s#\n<a.+?(?=\n)##igk
s#<title.+?/title>##ik
s#<div id="thredview"><h5>(.+?) \(\d+\)<\!--.+?</h5><dl>#<title>$1</title>#ik

「透明あぼーんを補う」にチェックを入れる


dat落ち後も読めるようだったらこんな感じかなと

387 :名無しさん@停滞中 ★:09/12/08 12:37:46 ID:???
http://ds.bbmov.com/index.php

もしかしたら非日本語圏における2chミラーサイトなのかも

388 :名無しさん@停滞中 ★:09/12/09 20:50:55 ID:???
何となくClustrMap付けてみたです

http://www3.clustrmaps.com/counter/maps.php?url=http://www.geocities.jp/mirrorhenkan/


世界地図だと一目瞭然ですな。
日本語オンリーで画像も何もない静的サイトなのに
結構ワールドワイドにアクセスあるんだなーと。
世界中に晒されてるなんて怖ろしい事だ
これが映像系だったらもっとすごい事になってたかもですね。

389 :名無しさん@停滞中 ★:09/12/31 18:14:43 ID:???
メモ

■c8ch BBS
http://www.c8ch.net/


どこで知ったかというと下記スレッド

島国で 、 現在行われているスレ...
http://www.c8ch.net/thread/bbs/read.php/bt/1261574586/970-978n


翻訳経由で読んでみたですけど
徹頭徹尾日本の半角板や女神板のイメピタ画像ばかりですな
966でJaneNidaも出てるですし


で、残念なのが使用している掲示板スクリプトで。
どうもsubject.txtやdatを開放しておられないみたい
残念

http://www.teporaji.info/php/sch/manual4.html
http://www.teporaji.info/php/sch/bbs/bbs/read.php/sample/1231745422/5-6

390 :名無しさん@停滞中 ★:10/01/07 16:58:09 ID:???
メモ
[xi:] - 2ちゃんねるの検索と閲覧(http://read2ch.com/)のdat化について

URL例
http://read2ch.com/r/news4vip/1262609235/
http://mirror.sarashi.com/htmltodat/read2ch_com/1262609235.html

正規表現
m#<dt id="t([0-9]+)">(?:<a.+?>)?.+?:(?:</a>)?<b>(.+?)</b>\[(.*?)\] (.+?)</dt><dd.+?>(.*?)</dd>#mik

前処理
s#<title.+?\n.+?/title>##ik
s#<h3>(.+?)\(\d+\)</h3>#<title>$1</title>#ik
//s#(?:<a.+?>)?(ID:[^\(]+?)\(\d\)(?:</a>)?#$1#igk

変換結果式
メール欄逆転

後処理
s#(?:<a.+?>)?(ID:[^\(]+?)\(\d\)(?:</a>)?(<>)#$1$2#igk



前処理3番目はIDリンクやID出現回数表示除去のもののつもりなのですが
これつけると何故かレス番が飛ぶのでやむなくコメントアウトして後処理にしたです
どこがまずいのだろう
まだまだ修行が足りない

391 :名無しさん@停滞中 ★:10/01/08 19:50:34 ID:???
2ちゃんねるスレッドランキング | 2番街.net
http://2bangai.net/

392 :名無しさん@停滞中 ★:10/01/10 19:18:32 ID:???
Index of /dat
http://sb.phial.org/dat/

393 :名無しさん@停滞中 ★:10/01/17 18:52:04 ID:???
ゲームパッチ ミラーサーバ(仮)
http://g-mirror.gptwm.com/
過去ログ倉庫@東方シリーズ板
http://g-mirror.gptwm.com/monita_6306/index2.html

外部板なんでしょうか
よくわかんない

394 :名無しさん@停滞中 ★:10/01/20 17:17:33 ID:???
メモ

RomEx
http://app.riaservice.com/romex/

395 :名無しさん@停滞中 ★:10/02/08 17:54:28 ID:???
メモ
2番街.net(http://2bangai.net/log/)のdat化について

URL例
http://2bangai.net/read/39fc0a9971ffd83fef0e6740eaa7313dfea148f09905fcfdbcd5f80a9ae302ca/
http://mirror.sarashi.com/htmltodat/1265109702.html

正規表現
m#<dl><dt><em>([0-9]+)\.</em> ()<span class="name">(.+?)</span> (.+?)</dt><dd><blockquote class="res_text">(.+?)</blockquote></dd></dl>#mik

前処理
s#<title.+?/title>##ik
s#<h1 class="font_family_2">(.+?)\n#<title>$1</title>#ik
s#(?=\n)<(?:meta|link|/?div|li|\!).+?(?=\n)##igk
s#<a.+?>find</a>##igk

後処理
s#((?:^|\n))(.*?)◆(.+?)<>#$1$2</b>◆$3<b><>#igk


メール欄がないです。
あとミラーキャッシュのURLが64文字のハッシュ(?)で表現されていて
元スレから飛ぶ事がかなわない。
スレタイ検索(http://2bangai.net/search_th/)から突き止めるくらいしかなさそう。
元スレURLから行けるようになってないのかな。

396 :名無しさん@停滞中 ★:10/02/08 19:33:56 ID:???
正規表現久しぶりにやったら忘れかけてた(^^;

それはそうと、色々いじっていると
クロスブラウザのサイトって難しいものだなとつくづく感じ入る次第。
あれこれ見慣れないタグを追加したりしてたら
IEとFireFoxで全然違う表示になってしまったので
さあどうしようかなと

397 :名無しさん@停滞中 ★:10/02/11 14:33:02 ID:???
http://2bangai.net/info/

ありがとうございます。(ってココ見てるかどうかわかりませんが)

という事で>>395追加
「その69」という事で。
ミラーキャッシュのページにdatファイルへのリンクもあるので
dat化用正規表現とかつけないほうが良さそう

398 :名無しさん@停滞中 ★:10/02/12 17:42:38 ID:???
メモ

http://ktk-reader.appspot.com/ktkr.html?board=http://dubai.2ch.net/morningcoffee/&thread=1265361614

上ですが

http://dubai.2ch.net/test/read.cgi/morningcoffee/1265361614/

がdat落ちしても閲覧可能だったら
どんなにか嬉しい事でしょうか

399 :名無しさん@停滞中 ★:10/02/12 17:58:53 ID:???
http://d.hatena.ne.jp/Gemma/searchdiary?word=2ch&.submit=%B8%A1%BA%F7&type=detail

面白そう
後で読ませてもらうです

400 :名無しさん@停滞中 ★:10/02/13 12:24:23 ID:???
http://society6.2ch.net/test/read.cgi/gline/1193462528/889-891n

携帯からですか
下の記事とか見つつ
まあおいおいと


http://japan.cnet.com/marketing/story/0,3800080523,20383084,00.htm
http://d.hatena.ne.jp/yukky2001/20100212/p1
http://twitter.com/tatiuo/status/9030851266
http://www.itmedia.co.jp/news/articles/0904/14/news088.html


にしてもhtml化されたスレッドってべっかんこでは読み込んでもくれないんですか
あとあれだ
前見た時は公式p2への登録って携帯からは不可だったけど
今もそうなのかな

401 :名無しさん@停滞中 ★:10/02/13 13:52:17 ID:???
メモ

2ch log 保管庫
http://2chlog.emoticon.jp/
http://2chlog.utf8art.com/

URL例
http://2chlog.emoticon.jp/archives/myanmar_1146980083.html
http://2chlog.utf8art.com/archives/wmotenai_1232650438.html
http://2chlog.emoticon.jp/archives/yahoo_1114688189.html
http://2chlog.emoticon.jp/archives/alone_1258490975.html


うーむ
どれもこれもhtmltodatで読み込めないのは何故だろう
ちゃんとmetaタグではcharset=UTF-8"となっているというのに
という事で伺ってみたです

http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/590


あと
ソースを見てもログが記載されてないっぽいのが面白い(単に見逃してるだけかもしれないけど)
>>398と同様にhmlhttpとかで引っ張っているのかな

402 :名無しさん@停滞中 ★:10/02/13 16:52:20 ID:???
たまたま見たんですが

http://pc12.2ch.net/test/read.cgi/tech/1224449899/125-138n
http://gimpo.2ch.net/test/read.cgi/qa/1175630835/635-637n

◆MaMiRaoFSwbBさんってクラシックメニューの現在の管理人さんですか。



◆EA.clAssIcさんとは別の方なのかな。

http://gimpo.2ch.net/test/read.cgi/anniversary/1160268481/
http://pc11.2ch.net/test/read.cgi/tech/1057329161/19-
http://ja.wikipedia.org/wiki/2%E3%81%A1%E3%82%83%E3%82%93%E3%81%AD%E3%82%8B%E3%83%96%E3%83%A9%E3%82%A6%E3%82%B6
http://www.giko-makuri.org/old_log/1054903418/1054903418_02.html#R169


と検索したら
別の方なんですね。

http://qb5.2ch.net/test/read.cgi/operate/1250579952/851
http://www.unkar.org/read/qb5.2ch.net/operate/1250579952#l851

403 :名無しさん@停滞中 ★:10/02/14 13:59:42 ID:???
>>401の件


(1) typo(カッケー!)

 s/hmlhttp/xm.http/


(2) CookieやUser-Agent等の送信ヘッダが原因ではなさそう

 ime.nu経由からhtmlをDLしたものを開こうとしても同様の表示が出る
 それを別の所に上げ直したものからも読み込めない

 http://mirror.sarashi.com/htmltodat/wmotenai_1232650438.html


(3) またTeraPadで開いても文字化けする

 xyzzyや真魚では普通にファイルは開く事が出来、保存も可能
 それをweb上に上げたものならhtmltodatでも読み込み可能

 http://mirror.sarashi.com/htmltodat/wmotenai_1232650438a.html


(4) ログは別ファイルではなくhtml内に存在した

 但し1412行ある中で1248行目にあり、改行も何もされてなさそう



以上を踏まえて、送信ヘッダ等の付随的なものが原因ではなく
純粋に文字コードを解釈する際の何かが原因ではないかと素人は考えます。

ちなみにTeraPadで開いた際の文字化けはShift_Jisで開こうとしていたからのようで
読み込みコード指定をUTF-8にして開き直したら文字化けが解消しました。
ただ、htmltodatではどの文字コードを指定してもエラーが出てしまい、読み込めないです

バイナリエディタでそれぞれのファイルを開いて見てみましたが、自分のスキルではよくわかりませんでした。
まだまだ修行が必要なようです
 
 

404 :名無しさん@停滞中 ★:10/02/14 19:14:28 ID:???
更にtypo
s/xm.http/xmlhttp/

いちおうメモ
2ch log 保管庫(http://2chlog.emoticon.jp/ http://2chlog.utf8art.com/)のdat化について

URL例
http://2chlog.utf8art.com/archives/wmotenai_1232650438.html
html例
http://mirror.sarashi.com/htmltodat/wmotenai_1232650438a.html

正規表現(長すぎるので2行で)
m#<p class="tdt"><a.+?>([0-9]+)</a> :(?:<a class="tml" href="mailto:(.+?)"></a>)?<b cla
ss="tb">(.+?)</b>:(?:</a>)?(.+?)</p><p class="tdd">(.+?)</p>#mik

前処理
s#\n\t+(<title.+?)\| 2ch log 保管庫(</title>)#\n$1$2#ik
s#\n\t+<table#\n#igk
s#\n\t.+?(?=\n)##igk
s#\n<(?:a|meta|/?li|/?div|/?ul|/?script).+?(?=\n)##igk
s#\n(?:google|\#|src).+?(?=\n)##igk
s#<br />#<br>#igk


後処理
s#((?:^|\n).+?)(◆.+?)&l?t;b&g?t;(<>)#$1</b>$2<b>$3#igk


現状のhtmltodatではURL例のアドレスでは読み込めないのですが
html例からやったらこんなものかなと。
例ではbeを出しているログが無いっぽいのでその辺りはどうなるのかは判らないです



あと
http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/591-592n

これ
http://yy14.kakiko.com/test/read.cgi/mirror/1213700846/260
で行けそうな感じだったけどタイトル部とか少し変わったようで。
あとレス893からリンクが付いてしまってるですが
その部分のアンカータグとかどうなってるのかな

405 :名無しさん@停滞中 ★:10/02/15 21:04:57 ID:???
http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/593,597

とりあえず待っているだけなのも何なので
コード変換するスクリプトを設置してみたです

http://mirror.s151.xrea.com/code_change/?url=http://2chlog.utf8art.com/archives/wmotenai_1232650438.html&to=UTF-8
http://mirror.s151.xrea.com/code_change/?url=http://2chlog.emoticon.jp/archives/myanmar_1146980083.html&to=UTF-8

これで混在した文字コードが統一されるので
htmltodatでも読み込めるようになるのではないかなと
ソースは下記
phpってすごいや

<?
$url = $_GET['url'];
$code_to = $_GET['to'];
$str = file_get_contents($url);
$str = mb_convert_encoding($str, $code_to, "auto");
echo $str;
?>


という事で
暫定的にdat化はこれでいくかな

406 :名無しさん@停滞中 ★:10/02/17 19:58:41 ID:???
http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/599

ありがとうございます。
では「その71a」「その71b」という事で。


ちなみに「その70」は
いちおうdatは公開なさっているみたいなのですが
文字コードがUTF-8になってるみたい
どうしよう

407 :名無しさん@停滞中 ★:10/02/17 19:58:55 ID:???
メモ
2ch log 保管庫(http://2chlog.emoticon.jp/ http://2chlog.utf8art.com/)のdat化について

URL例
http://2chlog.emoticon.jp/archives/myanmar_1146980083.html
http://2chlog.utf8art.com/archives/wmotenai_1232650438.html
http://2chlog.emoticon.jp/archives/yahoo_1114688189.html
http://2chlog.emoticon.jp/archives/alone_1258490975.html

正規表現(長すぎるので2行で)
m#<p class="tdt"><a.+?>([0-9]+)</a> :(?:<a class="tml" href="mailto:(.+?)"></a>)?<b cla
ss="tb">(.+?)</b>:(?:</a>)?(.+?)</p><p class="tdd">(.+?)</p>#mik

前処理
s#\n\t+(<title.+?)\| 2ch log 保管庫(</title>)#\n$1$2#ik
s#\n\t+<table#\n#igk
s#\n\t.+?(?=\n)##igk
s#\n<(?:a|meta|/?li|/?div|/?ul|/?script).+?(?=\n)##igk
s#\n(?:google|\#|src).+?(?=\n)##igk
s#<br />#<br>#igk


後処理
s#((?:^|\n).+?)(◆.+?)&l?t;b&g?t;(<>)#$1</b>$2<b>$3#igk


htmltodatは0.8.17以上のもので。
http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/599

408 :名無しさん@停滞中 ★:10/02/18 18:11:20 ID:???
メモ
Monachrome
http://www.monachrome.net/


http://www.monachrome.net/r/news4vip/1266396664/

上記URLですが
http://yutori7.2ch.net/test/read.cgi/news4vip/1266396664/
がdat落ちしても閲覧可能だったら
どんなにか嬉しい事でしょうか

409 :名無しさん@停滞中 ★:10/02/25 19:39:57 ID:???
メモ

http://www2.atpages.jp/mirror/2ch/javascript/read-light.php/1259636243/
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
959 :Name_Not_Found:2010/01/22(金) 11:09:20 ID:??? ID:
指定時間毎に画像が変わるスクリプトなんだけど
<body onload=

を使わずに変える方法がサンプルでもいいから何処かに転がってないか?
blogで使いたいんだ。

962 :Name_Not_Found:2010/01/22(金) 12:21:10 ID:??? ID:
ファイル名が erogazou00.jpg - erogazou99.jpg とする。

<img src="erogazou00.jpg" id="image">

function setAnotherNumber(origin) {
var number = Math.floor(Math.random() * 100);
if (number < 10)
number = "0" + number;
return (number != origin) ? number : setAnotherNumber(origin);
}

function setRandomImage() {
var img = document.getElementByID("image");
var fileNumber = img.src.slice(8,10);
img.src = "erogazou" + setAnotherNumber(fileNumber) + ".jpg";
}

function changeImage() {
setInterval(setRandomImage, 4000);
}

if (window.addEventListener) {
window.addEventListener("load", changeImage, false);
} else {
window.attachEvent("onload", changeImage);
}

脳内でエロ画像のスライドはじまった
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


上記URL更新されてて仰天
これAV時計に使えますな

410 :名無しさん@停滞中 ★:10/03/02 17:12:51 ID:???
メモ
う゛ぁるす(http://www.varusu.com/)のdat化について

URL例
http://www.varusu.com/thread/gline/1165245437/

正規表現(長すぎるので改行してあります)
m#<a name="R\d+">([0-9]+)</a> 名前:<span class="green"><b>(?:<a href="(.+?)" rel="nofollo
w">)?(.+?)(?:</a>)?</b></span>投稿日:(.+?)<blockquote>(.+?)</blockquote><BR>#mik

前処理
s#(<title>.+?) - varusu.com(</title>)#$1$2#ik
s#(<a href=")mailto:#$1#igk

411 :名無しさん@停滞中 ★:10/03/02 17:40:44 ID:???
ところで、サイバー攻撃の影響か何だかわかんないですけど
http://be.threadic.com/thread/bbs/read.php/test/Cushion/http://www.geocities.jp/mirrorhenkan/
からのリファラがもんのすんごいですがどうしましょうか。

これって>>389の移転先なんですが
相手からは見れて自分からは閲覧不能って何だか図々しい感じだよなー。
JavaScriptで上記だったらのリファラ弾くようにとかしてみようかな。
(Perlやphp使えないサーバなのでJavaScript使うしかない訳で)

412 :名無しさん@停滞中 ★:10/03/06 11:52:00 ID:???
何か落ち着いたようで。


メモ

てくまくまやこん
http://d.hatena.ne.jp/xacty/

413 :名無しさん@停滞中 ★:10/03/06 12:14:37 ID:???
>>411のサイトも設定戻されたようで。

リファラがクッションURLになってるので元URL探すのが面倒だ
これ以外にもある筈

http://adult.threadic.com/thread/bbs/read.php/babo/1267455823/3


で、掲示板スクリプトの配布先の方
やはりdat直読みはされないようで。

http://www.sanadake.info/bbs/read.php/support/1261898738/34-35n

.htaccess同梱しなければいいだけなのになー

414 :名無しさん@停滞中 ★:10/03/08 17:56:28 ID:???
という訳でもないようで


メモ
http://threadic.comのdat化について

URL例
http://threadic.com/thread/bbs/read.php/japanese/1267450779/

正規表現
m#<DT>(\d+) .+?:(?:<SPAN.+?>|<A HREF="mailto:(.+?)">)<B>(.+?(?:</B>)?.+?)(?:</b>)?(?:</SPAN>|</a>) :(.+?)<BR><DD>(.+?)</DD></DT>#mik

前処理
s#(<b>.+?</b>)( ◆.+?)(</span>)#$1$2<B></B>$3#igk


名前欄のトリップ周りが少し特殊でした。
正規表現をあれこれやってから「あー前処理でいいじゃないか」と。
まだ修行が足りない事を痛感

あとハングルが化けますな。
Unicode版の鬼車を用いたhtmltodatを開発して頂けたら嬉しいのですが(私が)

415 :名無しさん@停滞中 ★:10/03/09 19:22:07 ID:???
メモ

http://beetools2.trustbee.com/read/yutori7.2ch.net/news4vip/1267889250/

上ですが
http://yutori7.2ch.net/test/read.cgi/news4vip/1267889250/
がdat落ちしても読めたら
どんなに嬉しい事でしょう

416 :名無しさん@停滞中 ★:10/03/09 21:33:11 ID:???
駄目でしたか
いえいいんです

http://society6.2ch.net/test/read.cgi/gline/1165245437/659

直したです
ホスト規制で書き込めないのでここで。
ありがとうございます


ところで、これって
下のどれでもOKみたいですね。

http://logsoku.com/thread/namidame.2ch.net/eco/1261218731.html
http://logsoku.com/thread/namidame.2ch.net/eco/1261218731/
http://2c.okawari.net/thread/namidame.2ch.net/eco/1261218731.html
http://2c.okawari.net/thread/namidame.2ch.net/eco/1261218731/


それと共に、htmlが微妙に変わっているみたいで
>>278の正規表現ではdat化出来なくなってるみたいなので
次レスにて

417 :名無しさん@停滞中 ★:10/03/09 21:40:34 ID:???
メモ
ログ速(http://logsoku.com/ http://2c.okawari.net/)のdat化について

URL例
http://logsoku.com/thread/namidame.2ch.net/eco/1261218731.html
http://logsoku.com/thread/namidame.2ch.net/eco/1261218731/
http://2c.okawari.net/thread/namidame.2ch.net/eco/1261218731.html
http://2c.okawari.net/thread/namidame.2ch.net/eco/1261218731/

正規表現(長すぎるとの事なので2行に分けてます)
m#<a name="\d+"></a><dt>([0-9]+) :(?:<a href="mailto:(.+?)">|<font color=gre
en>)<b>(.+?)</b>(?:</a>|</font>) :(.*?)<br/><dd>(.*?)<br><br></dd></dt>#mik


タイトルそのままになったので前処理が要らなくなったみたい。
あと正規表現中にある「<br/>」は元htmlでもそうなっているので。

418 :名無しさん@停滞中 ★:10/03/09 22:27:50 ID:???
と思ったらIDの発言回数が付加されているので
下のを追加


前処理
s#(ID:)<span.+?><a href='/thread/.+?>(.+?)</a></span> \(\d+ 回発言\)(<br/><dd>)#$1$2$3#igk

419 :名無しさん@停滞中 ★:10/03/10 19:28:35 ID:???
うー
そんな生易しいものではないな
どうもそれだけでは無かったようだ
というか結構ややこしいぞこれ
まだ未解決
というか自分が出来る事はこのくらいか

URL例
http://logsoku.com/thread/society6.2ch.net/gline/1165245437/

正規表現(※改行してるので繋げて一行に)
m#<a name="\d+"></a><dt>([0-9]+) :(?:<a href="mailto:(.+?)">|<font color=gr
een>)<b>(.+?)</b>(?:</a>|</font>) :(.*?)<br/><dd>(.*?)<br><br></dd></dt>#mik

前処理
s#(ID:)<span.+?><a href='/thread/.+?>(.+?)</a></span>(?:( .+?))? \(\d+ 回発言\)(<br/><dd>)#$1$2$3$4#igk
s#<img src="http://(img.2ch.net/ico/.+?)>#sssp://$1#igk

後処理(※下の全部の「&」を半角に)
s#([^<r])>#$1&gt;#igk
s#<([^b>])#&lt;$1#igk
s#((?:^|\n).*?)&lt;/b&gt;(.+?)<b&gt;(<>)#$1</b>$2<b>$3#igk

「透明あぼーんを補う」にチェックを入れる


これでいちおうdat化出来るのですが、途中で
「Internet Explorer スクリプトエラー」
というポップアップが出ますが気にせず「いいえ」を選択して最後までdat化と。

このエラーの原因なんですが
本文中の「&gt;」「&lt;」が全部
「>」「<」になっちゃっているからで。
だもんでスクリプトやタグと認識されてしまっていると。
サニタイズの逆ですな

いちおう後処理でそれらを戻すようにしたつもりなんですが
本文中に書かれた「<br>」を「&lt;br&gt;」にさせる方法がどうにもお手上げです。
あとはもうログ速の管理人さんに何とかしてもらうしかなさそうな。

レス番が飛んでる箇所が結構あったので「透明あぼーんを補う」チェックも必要です。
それと何故かトリップがみんな削られてるですね。
下のスレとか 名前が1以外空欄になってますし。

http://logsoku.com/thread/tsushima.2ch.net/news/1267611558/


というくらいでしょうか。

420 :名無しさん@停滞中 ★:10/03/11 19:12:10 ID:???
追記
前処理に下のを追加(※「&」を小文字にして)

s#<>#&lt;&gt;#igk

これやらないとデリミタとしての「<>」との区別が出来なくなるです
たとえば↓の154.481.851等

http://logsoku.com/thread/society6.2ch.net/gline/1193462528/


まあプログラムやhtmlタグ等が出ないようなスレッドでは関係ないですし
>>417-418ではダメな場合だけでもいいかもしれないです

421 :名無しさん@停滞中 ★:10/03/12 18:30:52 ID:???
http://pc12.2ch.net/test/read.cgi/software/1267177119/166,189

どうも見て頂いてるようで。お世話になっております

個人的には>>294でmokume◆Q35xnK/I9LhhTwさんがおやりになられたように
htmltodat機能だけでもあったらなと。

どんなものかという事でいちおう本体を。

www.geocities.jp/mirrorhenkan1/kj/KJ_01122_b053_rc1.rar.zip

422 :名無しさん@停滞中 ★:10/03/12 18:37:41 ID:???
メモ
http://threadic.com/ のsubject.txt化について(by htmltodat)

URL例
http://threadic.com/thread/bbs/read.php/japanese/subback/

正規表現(2行に分けて書いてるので繋げて1行に)
m#<TR align="center"><TD>([0-9]+)</TD><TD class="BBS_List" align="left"><A hre
f="../(\d+)/l50" target="_blank">(.+?)</A></TD><TD>.+?</TD><TD>.+?</TD><TD>(\d+)</TD></TR>()#mi

変換結果式
<>$2.dat<>$3<>($4)<>

後処理
s#^<>(.+?)<>(.+?)<>(.+?)<>.+?(?=\n)#$1<>$2$3#i
s#((?:^|\n))<>(\d+\.dat<>.+?)<>(\([0-9]+\))<>#$1$2$3#ig


これでいちおうsubject化出来るです。
変換結果式で

 $2.dat<>$3($4)

とやろうとしたんですが、何だかエラーが出るので後処理で。



・・・となると
subject.txtという名前で保存出来るようにもなっていたらなと。

423 :koreawatcher ◆Nida.eneRA :10/03/13 00:25:16 ID:4OBODbk1
>>421
いつも見させてもらっています。
ところで、専ブラがみんなこの機能を内蔵してしまうとみみずんの広告を
だれも表示しなくなって、結果的にみみずんがなくなってしまうような気が
するんですが、杞憂でしょうか。

424 :名無しさん@勉強中:10/03/13 00:41:39 ID:rttbkyeE
広告表示してても、なくなっちゃう時はあっさり無くなるものですよ。
専ブラ側で機能持ってなくても、p2porxyのように楽に導入できる外部ツールもあるし。

Styleにはmimizun.jsが標準で添付されてましたしね。

気にし無さ過ぎもどうかと思いますが、気にし過ぎなのもどうかと

425 :名無しさん@停滞中 ★:10/03/13 22:23:05 ID:???
>>423
どうもです。

えーと、>>424さんと同意見です。
# こういう簡にして要を得たような文章書けないな


思い起こすと、例えばdumper.jpさんの所とか しばらく不通になった後にリニューアル復活して
その直後に繋がらなくなって今まで続いてるです。
ページランクやレスアンカー・IDポップアップ付加とかの
結構手の込んだリニューアル直後に不通になったのが実に印象的でした。

http://web.archive.org/web/20050614010755/2ch.dumper.jp/0000013542/

http://web.archive.org/web/20070112001954/http://2ch.dumper.jp/0000017733/



みみずんさんの所ですが・・・まあ何といいますか
どうなんでしょうか。よくわかんないです

http://twitter.com/mimizun/status/10196896542
http://twitter.com/mimizun/status/10366880192



ところで、お名前をレインボー表示させる為にReplaceStr.txtの書式を少し直したです
yykakikoだと<b>と◆の間のスペースが無いみたいですね。

426 :名無しさん@停滞中 ★:10/03/13 22:44:47 ID:???
誤:yykakikoだと<b>と◆の間のスペースが無いみたいですね

正:yykakikoだと</b>と◆の間のスペースが無いみたいですね


それと、Threadic.com読み込みバージョン ありがとうございます。
すごく面白いです。


>>421の件ですが、個人的には
左ペインで外部コマンドが使えるようになればなとも思うです(以前も要望したですが)

そうすれば、スレッド一覧htmlからsubject.txtを作成するようなスクリプトを此方で用意すれば(>>149のsubject.txt版のような)
色んな掲示板を読み込めるようになるのではないかなと。

427 :名無しさん@停滞中 ★:10/03/13 22:49:49 ID:???
http://society6.2ch.net/test/read.cgi/gline/1165245437/660-661n

えーと
どうなのだろう

428 :名無しさん@停滞中 ★:10/03/14 16:52:14 ID:???
>>419-420
後処理に下の一行を追加

s#((?:^|\n).*?</b>\[―{}@{}@{}\-\])<b&gt;#$1$2<b>#igk

これつけないと例えば
http://logsoku.com/thread/yutori7.2ch.net/campus/1264993145/
のレス1の名前がうまく出ないです

まあレアケースかもですが(そうでもないか)

429 :名無しさん@停滞中 ★:10/03/16 12:18:49 ID:???
メモ
スレッドランキング(http://www.bbsnews.jp/)のdat化について

URL例
http://proxy.bbsnews.jp/2ch/mog2/1253115656/

正規表現
m#<a name="\d+"></a><dt.+?>([0-9]+) :<font color=green><b>(?:<a href="mailto:(.+?)">)?(.+?)(?:</a>)?</b></font> :(.+?) <dd .+?>(.+?)<br><br></dd>#mik

430 :名無しさん@停滞中 ★:10/03/16 12:41:46 ID:???
修正
スレッドランキング(http://www.bbsnews.jp/)のdat化について

URL例
http://proxy.bbsnews.jp/2ch/mog2/1253115656/
http://proxy.bbsnews.jp/2ch/avideo/1268682799/

正規表現
m#<a name="\d+"></a><dt.+?>([0-9]+) :<font color=green><b>(?:<a href="mailto:(.+?)">)?(.+?)(?:</a>)?</b></font> :(.+?)<dd .+?>(.+?)<br><br></dd>#mik


>>429の正規表現から<dd>の前のスペースを省いただけです

431 :名無しさん@停滞中 ★:10/03/16 18:12:19 ID:???
>>430追加
「その74」という事で

432 :名無しさん@停滞中 ★:10/03/16 20:05:11 ID:???
ホスト規制で書き込めないのでココにメモ

http://25eo.com/
http://djenadpekzm.nayana.com/sch/bbs/read.php/test/

JaneXenoで上の掲示板が登録出来ないように思うです。
で、スクリプト配布先↓も登録してみたですがやはりダメっぽい。

http://www.sanadake.info/bbs/read.php/support/


調べてみたら、threadic.comと全然htmlが異なっているのが原因のようです。
dat化は下記


URL例
http://www.sanadake.info/bbs/read.php/support/1261898738/
http://djenadpekzm.nayana.com/sch/bbs/read.php/test/1267437116/
http://25eo.com/sch/bbs/read.php/ingyeo/1268484383/

正規表現
m#<DT>([0-9]+).*?:<SPAN ID="G"><B>(?:<a href="mailto:(.+?)">)?(.+?)</B></SPAN> ?:(.+?)<BR><DD>(.+?)<BR><BR>#mi


どうも見たところ、threadic.comさんのところのものはhtmlその他 かなり手を入れておられるのかも。
上で出したように、掲示板スクリプト配布先と同じhtmlを出すところばかりですし。
あと
http://threadic.com/thread/bbs/read.php/japanese/
の最下部を見たら
「Threadic READ.PHP - 2010/03/14 (PHP5) +MySQL5 +Apache2」
とありますが
Schの最新バージョンは2010/1/16のようです。
まだ見てないですがsubbackのhtmlも違っているみたい。



・・・と書いてから
http://www.beacon-tcg.net/bbs/read.php/any/
のhtmlを見たらこれまた少し異なっているようで。
いろいろあるなー。

433 :名無しさん@停滞中 ★:10/03/16 20:14:02 ID:???

今見直したら
http://www.sanadake.info/bbs/read.php/support/
だけは読めたですが
http://25eo.com/sch/bbs/read.php/ingyeo/
http://djenadpekzm.nayana.com/sch/bbs/read.php/test/
の二つはやはり真っ白のままでした


メモ
JP & KR Board
http://jbbs.livedoor.jp/internet/7845/

434 :名無しさん@停滞中 ★:10/03/17 17:43:59 ID:???
メモ
http://otu.sakura.ne.jp/2ch/ のdat化について

URL例
http://otu.sakura.ne.jp/2ch/_bin/view.cgi?board=linux&thread=1231189481&host=pc11.2ch.net

正規表現
m#<dt.+?><a.+?>([0-9]+)</a> : <b>(?:<span title="(.+?)".+?>)?(?:<a.+?>)?(.+?)(?:</a>)?(?:</span>)?</b> : (.+?)</dt><dd.+?>(.+?)<br><br></dd>#mik

前処理
s#(<title.+?)(?: @ \w+?)?(</title>)#$1$2#ik


ここなんですが、よくわからない。
http://otu.sakura.ne.jp/2ch/_bin/ とか見ると「unkar-light.js」とかあるので
unkarさんの所なのかな。
にしてはhtmlの形式が全然違うし。

URL例の元スレッド(http://pc11.2ch.net/test/read.cgi/linux/1231189481/)は閲覧出来なくなっているのに
ミラーでは読めるので
これも追加させてもらおうかなと

435 :名無しさん@停滞中 ★:10/03/17 17:52:07 ID:???
2chのdat落ちしたスレを右クリックで即座に蘇生させられるFirefoxアドオン「fire2chDat」:phpspot開発日誌
http://phpspot.org/blog/archives/2010/03/2chdatfirefoxfi.html

昨日出た記事っぽいのにブックマーク数が凄いですな
にしても、記事の説明文にうちのサイトのリンクも何もないのは一体

・・って 作者さんは↓こっちみたいですね

http://fatalita.sakura.ne.jp/
https://addons.mozilla.org/ja/firefox/addon/97406
https://addons.mozilla.org/ja/firefox/user/5228271

436 :名無しさん@停滞中 ★:10/03/18 17:02:03 ID:???
メモ

Ria Service
http://www.riaservice.com/

http://app.riaservice.com/threadex/?t=2&u=http%3A%2F%2Fyutori7.riaservice.com%2Ftest%2Fread.cgi%2Fnews4vip%2F1268887986%2F

↑これですが
これ↓がdat落ちしても閲覧可能だったら有難いです

http://yutori7.2ch.net/test/read.cgi/news4vip/1268887986/


まあhttp://www.riaservice.com/?page_id=2で説明あるですが
一応メモという事で

437 :名無しさん@停滞中 ★:10/03/18 18:06:04 ID:???
ダメでしたか
いえいいんです


ところで

韓国の姿を見せてくれる! ??? ??? ????!
http://threadic.com/thread/bbs/read.php/japanese/1268644780/

↑このスレッドに貼ってある画像をJaneXenoで展開したいんですが
どうやれば良いのだろう
画像URLは例えば下記

http://image.threadic.com/images/ZqEOH5reFB1
http://image.threadic.com/images/7DD7kbioWY0

どうもURLはこれでないといけないようで、拡張子やスラッシュを入れるとエラーになるです
なのでImageVierUrlReplace.datやReplaceStr.txtでゴニョゴニョという事でもなさそう。

貼られたものを見つける都度
URL右クリック→対象をビューアで開くでやるのも何だかなと

438 :名無しさん@停滞中 ★:10/03/19 19:45:51 ID:???
http://threadic.com/thread/bbs/read.php/japanese/1267451067/72

うほっ
出来たですっ
ありがとうございます
そうか、こういう時に$VIEWERを使うのかと。

ただ ケアレスミスでしょうけど「w」ではなく「\w」ではないかと。

http://image.threadic.com/images/(?:w+)[Tab]$&[Tab][Tab]$VIEWER

http://image.threadic.com/images/(?:\w+)[Tab]$&[Tab][Tab]$VIEWER


あと、グループ処理(?何ていうんだろう・・「(?:〜)」というやつ)を使った理由がわからなくて悩んでるです
いえ別にいいんです
失礼しました
ごめんなさい

439 :名無しさん@停滞中 ★:10/03/19 23:08:57 ID:???
>>411実装(カッケー!)

440 :名無しさん@停滞中 ★:10/03/19 23:22:11 ID:???
補足しとくと

http://adult.threadic.com/thread/bbs/read.php/pervertplus/Cushion/http://www.geocities.jp/mirrorhenkan/
とかからアクセスしてきたらメッセージを出すようにしただけ
ついでに
http://tieba.baidu.com/f?kz=635797320
とかからアクセスがあったら別のメッセージを出すようにしてみたり


まあ大半の方々には関係無いような事で
無意味といわれても別に

441 :名無しさん@停滞中 ★:10/03/20 12:07:55 ID:???
メモ
2ちゃんぬる(http://2chnull.info/)のdat化について

URL例
http://2chnull.info/r/gline/1165245437/1-1001

正規表現
m#<dt>([0-9]+):<em><b>(?:<a href="mailto:(.+?)">)?(.+?)(?:</a>)?</b></em>:(.+?)</dt>\t+<dd>(.+?)</dd>#mik

前処理
s#<title.+?/title>##ik
s#<div id="body">\s+<h2>(.+?)</h2>#<title>$1</title>#ik
s#<a.+?>(h?ttp://\w+?\.(?:2ch\.net|bbspink\.com)/test/read.cgi/\w+?/\d+/?)</a> \[<a href=".+?">cache</a>\]#$1#igk


URL例の場合だと例えばレス3の7行目以降が省略されてるみたい
(元レスはhttp://society6.2ch.net/test/read.cgi/gline/1165245437/3

どういう法則で省略になったのか判りませんが、そういう事があるかもしれないという事で。

442 :名無しさん@停滞中 ★:10/03/20 12:32:13 ID:???
メモ

2chまとめサイトエディター2.0
http://eva-lu-ator.net/~gemma/ktkr2/bbsmenu.html
やったー2chまとめサイトエディター2.0できたよー\(^o^)/ - Gemmaの日記
http://d.hatena.ne.jp/Gemma/20100317/1268812937

443 :名無しさん@停滞中 ★:10/03/21 20:05:32 ID:???
http://threadic.com/thread/bbs/read.php/japanese/1269082122/

上を見て

http://be.threadic.com/thread/bbs-jp/read.php/koreajapan/

を板登録しようとしたらうまくいかないです

とりあえずsubbackの取得先が違うような



http://be.threadic.com/thread/bbs-jp/read.php/koreajapan/subback/
xeno
http://be.threadic.com/thread/bbs/read.php/bbs-jp/subback/

444 :名無しさん@停滞中 ★:10/03/21 20:11:00 ID:???
「bbs」が「bbs-jp」になってるみたい

あと
レス欠番するようにもなってるみたい
下の9・15・17・以下沢山

http://be.threadic.com/thread/bbs-jp/read.php/koreajapan/1269087909/

445 :koreawatcher ◆Nida.eneRA :10/03/21 22:22:28 ID:KAywHbp7
>>437の辺りからここに投稿しようとしてもうまく行かず、IPアドレスを変えてみたら
書き込めるようになったんですが、偶然でしょうか。

それはおいといて、>>438は「\w」ですね。コピペ元も「\w」になっていたのに
なぜそのように投稿してしまったのか謎です。
(?: は$1に結果を格納しないから無駄がなくなるという程度に
理解しています。もしかしたら間違っているかもしれませんが。

>>443
read.phpの前にはbbsが来るという前提でプログラムが作られているので
変更が必要になりますね。
今は、ホスト=threadic.com/thread、板=japaneseとやっていますが、
ホスト=threadic.com/thread/bbs、板=japaneseと変更しなければ
ならない気がします。

446 :名無しさん@停滞中 ★:10/03/22 20:14:46 ID:???
>>445
すみません、スパムがひどいので「http://」をNGワードにしてあるです。ごめんなさい
yykakikoだと、NGワード交じりの文章でも投稿後「投稿完了しました」メッセージが出るみたいで
多分それなのではないかなと思うのですが。
とりあえず「http://」をNGから外してみたです(スパム来るかな)

それはそうと、threadic.comさんの所
htmlがこれまた全然様変わりしてるですね。
今日の昼頃まではXenoでdat化取得出来たのですが
現在ではさっぱりです
レス番も盛大に飛びまくってますし。
たぶんsubbackのhtmlも変わってるのだろうなと。


URL例
http://threadic.com/thread/bbs/read.php/japanese/1268644780/
http://be.threadic.com/thread/bbs-jp/read.php/koreajapan/1269087909/

正規表現
m#<DT>([0-9]+).*?:(?:<font.+?>|<SPAN ID="G">|<a href="mailto:(.+?)">)<b><B>(.+?)</B></b>(?:</SP
AN>|</font>|</a>)? *?:(.+?)(?:<BR>)?<DD>(.+?)<BR><BR>#mi

前処理
s#(<b><B>.+?</B>)( ◆.+?)</b>((?:</font>|</span>))#$1$2<B></b></b>$3#ig


ホストと板に含める範囲もですが、>>432-433の件もあり
やはり簡易的な正規表現置換機能があったら有難いなと思う次第です

447 :名無しさん@停滞中 ★:10/03/23 07:48:43 ID:???
あれれ
上のやつだと下のhtml等でトリップ周りがうまく切り分けられないのか
難しい

http://threadic.com/thread/bbs/read.php/japanese/1269082122/

448 :名無しさん@停滞中 ★:10/03/23 18:39:25 ID:???
ほんとコロコロ変わる

m#<dt>([0-9]+) .+?:(?:<font.+?>|<a href="mailto:(.+?)">)<B>(.+?)</B>(?:</font>|</a>) :(.+?)<dd>(.+?)<BR><BR>#mi

449 :名無しさん@停滞中 ★:10/03/25 18:33:07 ID:???
さて、まだホスト規制されてるですし
長文で尚且つ2chではない所に関する事なのでここで

http://pc12.2ch.net/test/read.cgi/software/1267177119/390

何だかうまくいかないです。
いったん板削除してから板追加したのですが
subbackからして404NotFoundになるです。

どうも指定先が違うみたいに思うのですが。


http://threadic.com/thread/bbs/read.php/japanese/subback/
Xeno
http://threadic.com/thread/bbs/bbs/read.php/japanese/subback/


http://be.threadic.com/thread/bbs-jp/read.php/koreajapan/subback/
Xeno
http://be.threadic.com/thread/bbs-jp/bbs/read.php/koreajapan/subback/


なのでJane2ch.brdを開いて
ホスト=threadic.com/thread/bbs 板=japaneseとなっている箇所を
ホスト=threadic.com/thread/板=japaneseと変更したらsubbackにアクセス出来たです

450 :名無しさん@停滞中 ★:10/03/25 18:51:13 ID:???
次にhtmlの形態ですが
japanese板とkoreajapan板とで全然違うものになっているような。
とりあえずjapanese板のほうはxenoで該当スレッドのhtmlにアクセスしてるようですけど
dat化取得出来ない感じです。

(1)http://threadic.com/thread/bbs/read.php/japanese/
(2)http://be.threadic.com/thread/bbs-jp/read.php/koreajapan/


(1)URL例
http://threadic.com/thread/bbs/read.php/japanese/1269465598/

正規表現
m#<dt>([0-9]+).*?:(?:<font color=green>|<a href="mailto:(.+?)"><b>)<B>(.+?)</B>(?:</font>|</a>) +:(.+?)<dd>(.+)<BR><BR>#mi

前処理
s#(</b> *)(◆.*?)(?:</b>)?((?:</font>|</a>))#$1$2<B></B>$3#ig


(2)URL例
http://be.threadic.com/thread/bbs-jp/read.php/koreajapan/1269258316/

正規表現
m#<dt>([0-9]+).*?:(?:<font.+?>|<SPAN ID="G">|<a href="mailto:(.+?)">)<b><B>(.+?)(?:</B>)?</b>(?:</SP
AN>|</font>|</a>) *?:(.+?)<DD>(.+?)<BR><BR>#mi

前処理
s#(</b> *)(◆.*?)(?:</b>)?((?:</font>|</a>))#$1$2<B></B>$3#ig


どちらにおいても透明あぼーんがあるので
それを補う必要もありそう

451 :名無しさん@停滞中 ★:10/03/25 18:57:48 ID:???
で、>>450のどちらの板のhtmlにも対応するような正規表現を考えると
次のようなものになるかも。
threadic.comの管理人さんが更新したらまた使えなくなるかもですが

URL例
http://be.threadic.com/thread/bbs-jp/read.php/koreajapan/1269258316/
http://threadic.com/thread/bbs/read.php/japanese/1269465598/


正規表現
m#<dt>([0-9]+).*?[::](?:<font.+?>|<SPAN ID="G">|<a href="mailto:(.+?)">)(?:<b>)?<B>(.+?)(?:</B>)?</b>(?:</SP
AN>|</font>|</a>) *?:(.+?)<DD>(.+?)(<BR><BR><dt>)#mi

前処理
s#(</b> *)(◆.*?)(?:</b>)?((?:</font>|</a>))#$1$2<B></B>$3#ig



ここまで書いて思ったですけど
「読めないぞ」という反応が皆無というのは
もしかして読めないのは自分だけなのかもしれないのかな・・
よくわかんないです

452 :koreawatcher ◆Nida.eneRA :10/03/25 19:12:51 ID:bqIcWF5D
>>449
brdconf.iniでBBSType=Sch_BBSなどの記述があれば削除してください。
すでにThreadicとSchは別物として処理しているので、Threadicを
Schであると指定すると不具合が起こります。

453 :名無しさん@停滞中 ★:10/03/25 19:26:17 ID:???
うお!!!

>>452
それでした!
削除したら読めたです!
ありがとうございます!

# うー恥ずかしい・・・

454 :名無しさん@停滞中 ★:10/03/26 19:04:05 ID:???
メモ

2ch_log
http://wmotenailog.x.fc2.com/

455 :名無しさん@停滞中 ★:10/03/29 19:24:59 ID:???
メモ

インスパイヤw - なんとなく◎(http://sunos.saita.ma/inspired/)のdat化について

URL例
http://sunos.saita.ma/inspired/?dubai+actor+1230881341

正規表現
m#<dt>([0-9]+) :(?:<span>|<a href="mailto:(.+?)">)<b>(.+?)</b>(?:</span>|</a>\[.+?\]):(.+?)</dt><dd> (.+?)</dd>#mik

前処理
s#(<title>.+?) - インスパイヤw - なんとなく◎(</title>)#$1$2#ik
s#<br />#<br>#igk



元スレ(http://dubai.2ch.net/test/read.cgi/actor/1230881341)が消えているのに
何故か読めるので。
追加するとしたら「その77」になるのかな

ところで、xhtmlでの改行タグは「<br />」みたいなんでいちおう置換するようにしたですが
これって「<br>」にしなくても専用ブラウザ的(?)にはOKなんでしょうか。

456 :名無しさん@停滞中 ★:10/04/01 18:52:42 ID:???
上のdat化処理ですが
「<br />」→「<br>」に全置換するのは後処理のほうが効率的ですね。
前処理でやると、dat化に必要な部分以外の「<br />」も置換する事になる訳で
時間と電気代とCPU計算その他の消費が冗長になるのではないかと思われ
まあいいか


ところで

2chで落ちた意見を蘇生する方法 | web R25
http://r25.yahoo.co.jp/fushigi/jikenbo_detail/?id=20100324-00001841-r25&vos=nr25mn0000001


そこまで採り上げるほどの記事なんかなと

457 :名無しさん@停滞中 ★:10/04/02 12:19:42 ID:???
メモ
みんくちゃんねるログ(http://log.minkch.com/)のdat化について

URL例
http://log.minkch.com/read.php/801/1267194035/

正規表現
m#<dt.*?>([0-9]+) : <span class="nam">(.+?)</span>\[(.*?)\] : (.+?) </dt><dd>(.+?)<br /> <br /></dd>#mik

前処理
s#<title.+?/title>##ik
s#<h2>(.+?)</h2>#<title>$1</title>#ik
s#(<span class="nam">.+?)</span><span style="color:green;">(◆.+?)</span>#$1</b>$2<b></span>#igk
s#</?(?:div|script|li|select|option).+?(?=\n)##igk

変換結果式
$2<>$3<>$4<>$5<> (←メール欄逆転)

後処理
s#<br />#<br>#igk

458 :名無しさん@停滞中 ★:10/04/02 12:42:24 ID:???
>>457の正規表現って
よく見たら>>315と同じっぽいですね。

ミラー対象の板も似てるですし
もしかしたら同じ方がやっておられるのかも

459 :名無しさん@停滞中 ★:10/04/02 19:10:07 ID:???
とか書いたあとでみてみたら

http://p.loface.com/
http://ch.xmoe.jp/

にアクセスすると

http://news.minkch.com/

に飛ぶですね。
同じ方ですか。

460 :名無しさん@停滞中 ★:10/04/02 19:15:41 ID:???
メモ

z-z-z-z.net 2chブラウザ(http://z-z-z-z.net/)のdat化について

URL例
http://z-z-z-z.net/b/society6.2ch.net/gline/1165245437/

正規表現
m#<dt>([0-9]+)\.<a href=mailto:(.*?)>(.+?)</a>(.+?)</dt><dd>(.+?)<br>(<a name=\d+></a>)#mik

前処理
s#(<a href=mailto:.*?>.*?)(◆.+?)(</a>)#$1</b>$2<b>$3#igk

461 :名無しさん@停滞中 ★:10/04/02 19:22:56 ID:???
ところで>>460の正規表現なのですが
最初

m#<a name=\d+></a><dt>([0-9]+)\.<a href=mailto:(.*?)>(.+?)</a>(.+?)</dt><dd>(.+?)<br>(<a name=\d+></a><dt>)#mik

とやったらレスが一つ飛びになってしまいうまくいかなかったです。
なので頭と$6の部分を少し変えたのですが、
上の正規表現のどこがまずいのかよくわからない。

実際、どこがいけないのでしょう?

462 : ◆/vmukiyuzw :10/04/03 03:16:05 ID:b9qEg+OM
>>461
ご迷惑おかけします。
htmltodatサポスレのほうでレスさせていただきました。

http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/602

463 :名無しさん@停滞中 ★:10/04/04 09:54:42 ID:???
>>463
ありがとうございます。そういう事だったんですか。
という事は、現状ではレスアンカーが要になっている場合は前処理等で何か手心が必要になる訳ですね。
上の場合は<dt>があったのでその辺は何とかなったですが。

というか、>>460だと最終レスがマッチしなかったですね。
まだまだ修行が必要だ

464 :名無しさん@停滞中 ★:10/04/04 09:56:51 ID:???
メモ

z-z-z-z.net 2chブラウザ(http://z-z-z-z.net/)のdat化について

URL例
http://z-z-z-z.net/b/society6.2ch.net/gline/1165245437/

正規表現
m#<dt>([0-9]+)\.<a href=mailto:(.*?)>(.+?)</a>(.+?)</dt><dd>(.+?)<br>(<a name=\d+></a>|</dl>)#mik

前処理
s#(<a href=mailto:.*?>.*?)(◆.+?)(</a>)#$1</b>$2<b>$3#igk


>>460では最終レスの取りこぼしがあったので。

465 :名無しさん@停滞中 ★:10/04/04 10:17:52 ID:???
がっくしメニューはどうかな
dat落ちしてもしばらく読めたら面白いですけど

http://orz4.2ch.io/orz/orz.cgi/*/yutori7.2ch.net/news4vip/1270340527/1-1001
http://orz4.2ch.io/orz/orz.cgi/*/anchorage.2ch.net/musicjg/1267157656/1-1001

466 :名無しさん@停滞中 ★:10/04/05 20:57:45 ID:???
駄目でしたか
いえいいんです


メモ

CSS切り替えJavaScript
http://act.st/etc/css_ss.htm

467 :名無しさん@停滞中 ★:10/04/05 21:00:40 ID:???
外部CSSの切り替え
http://www.din.or.jp/~hagi3/JavaScript/JSTips/Std/csschg.htm

468 :名無しさん@停滞中 ★:10/04/08 18:15:42 ID:???
メモ

何か開発するブログ 「2ちゃんねる全文検索」を公開しました
http://blog.livedoor.jp/slx/archives/51811689.html
2ちゃんねる全文検索
http://app.xrea.jp/search2ch/

469 :名無しさん@停滞中 ★:10/04/08 18:21:37 ID:???
2chセンブラーONLINE(ββ)
http://fatalita.sakura.ne.jp/CGI/2ch/index.html

>>435の方のサイトですが(http://victreal.com/がメインになるかもだそうですが)
それはそれとして

http://fatalita.sakura.ne.jp/CGI/2ch/index.html?text1=http%3A%2F%2Fyutori7.2ch.net%2Ftest%2Fread.cgi%2Fnews4vip%2F1270472109%2F

上のURLが
http://yutori7.2ch.net/test/read.cgi/news4vip/1270472109/
がdat落ちしても閲覧可能だったら
どんなにか嬉しい事でしょうか。

470 :名無しさん@停滞中 ★:10/04/15 19:34:27 ID:???
W2Ch DAT変換機
http://2chdat.soprano-asm.net/

> まぁ http://yellow.ribbon.to/~mirror/ の"url.php"を改変してURLをうんぬんしたり
> 0chのread.cgiをいじってログを見れるようにしたりでw

のけぞったです
検索結果を見て更に海老反りました

結果
http://2chdat.soprano-asm.net/url.php?url=http%3A%2F%2Ftsushima.2ch.net/test/read.cgi/news/1270045997/
閲覧
http://yellow.ribbon.to/~mirror/dat2html/read1.php?url=http://2chdat.soprano-asm.net/2ch.net/news/1270/1270045997.dat
ログ
http://2chdat.soprano-asm.net/2ch.net/news/1270/1270045997.dat


よくわからないですけど、o2onとも連動しておられるみたいで。
後で追加してみるです。「その80」になるのかな。その代わり「その29の17」は不通になってますね。
あと他のW2Ch中間サーバもバージョンアップ等で軒並みURL構造が変わっている予感です


こういうのがあると、ソース(http://yellow.ribbon.to/~mirror/url.php.txt)出しといて良かったなと。
こんなの誰が見るんだ初心者ソースに突っ込まれるだけ損じゃないかとか思ってたですが。
ってこれ出してもう5年経つんですか。

471 :名無しさん@停滞中 ★:10/04/16 19:47:58 ID:???
メモ
web2ch.org(http://web2ch.org/)のdat化について

URL例
http://web2ch.org/PHP/av.php/society6.2ch.net/gline/1165245437/
http://web2ch.org/PHP/av.php/pc12.2ch.net/streaming/1240594588/

正規表現
m#<div.+?><p.+?>([0-9]+) (.+?)\=\=(.*?)\=\=(.+?) </p><p class=mg> (.*?) </p></div>#mik

前処理
s#(<title.+?) \- web2ch\.org\(2chブラウザ\)(</title>)#$1$2#ik
//s#(<div)#\n$1#igk

変換結果式
$2<>$3<>$4<>$5<> (←メール欄逆転)

後処理
s#((?:^|\n).*?)(◆.+?)<>#$1</b>$2<b><>#igk


ソースが改行なしにベターっと出るタイプなので前処理2番目をつけようとしたですが
つけなくてもOKっぽいのでコメントアウトしてるです

472 :名無しさん@停滞中 ★:10/04/16 19:49:16 ID:???
>>471補足

ここ公開したてのホヤホヤみたい。
スレッドは下記

web上から2chを見られるビューアweb2ch.org
http://pc12.2ch.net/test/read.cgi/software/1271203705/


上のスレッドの10で

> dat落ちしたスレでもdat落ち前のキャッシュがあれば●がなくてもキャッシュの表示可能。

との事なので、後日追加させてもらおうかなと思うです
「その81」になるのかな

473 :名無しさん@停滞中 ★:10/04/17 12:59:29 ID:???
メモ
やるにょ(http://www.yarunyo.com/)のdat化について

URL例
http://www.yarunyo.com/kakolog/gline/1165245437/

正規表現(長すぎるので2行に分けてます)
m#<a name=".+?">([0-9]+)</a> 名前:<span class="green"><b>(?:<a href="(.+?)" rel="nof
ollow">)?(.+?)(?:</a>)?</b></span>投稿日:(.+?)<blockquote>(.+?)</blockquote>#mik

前処理
s#<title.+?/title>##ik
s#<h1>(.+?)</h1>#<title>$1</title>#ik
//s#\n<a href.+?(?:\n)##igk



これでdat化出来ますが、dat化直後に「一行が長すぎるか〜」エラーが出るです。
対処するために前処理3番目をつけたら「fatal error」と出たりhtmltodat自体が落ちたりするのでコメントアウトしたです

このエラーが自分の環境でだけ起こるかどうかわかりませんが
汎用的(?)に発生するならまあそういうエラーが起こるという事で。

474 :名無しさん@停滞中 ★:10/04/17 14:16:14 ID:???
>>473
fatal error 又はhtmltodat自体が落ちる件 自分の環境でだけなのかもしれないですね。
自分とこでは再起動したりしてやってみても同じ結果でしたが。

あとtypo

s#\n<a href.+?(?:\n)##igk

s#\n<a href.+?(?=\n)##igk




それと

http://pc12.2ch.net/test/read.cgi/software/1271203705/12
http://society6.2ch.net/test/read.cgi/gline/1165245437/662

自分とこだと、例えば誰かの検索したスレッドURLがタイムリーに出るようにしてありますが
んもう検索結果がやたら大量なので(少ない時でも5秒に1度くらい?)
もはや全然気にする事はないんじゃないかと。
自分が検索したスレッドURLで嗜好がバレる云々とかそういうのも
考え過ぎなのではないかと思うです (てか自分が考え過ぎか?)
検索結果のURLもすぐ流れてしまいますし。

そういう事ではないのかな?
違っていたとしても別にどうでもいいんですが。

475 :名無しさん@停滞中 ★:10/04/17 16:18:31 ID:???
>>473
それだけではなく
ソースの「<h2>2ch過去ログカテゴリ</h2>」から始まる行もネックみたい。
700強ある板名とリンクが改行なしで並んでいるみたいなので。

476 :名無しさん@停滞中 ★:10/04/17 16:25:31 ID:???
http://bbs.yaroze.jp/tantanyakisoba/
http://bbs.yaroze.jp/ye/read.cgi/costco/1092143769/13
http://www.yaroze.jp/i18n/


掲示板下部に

> 0ch BBS 2007-01-24改UTF8(2008-02-02)

とありますが、ソースを見たら自分とこのとは別物みたい。
例えば「Charset="UTF-8"」のUTF-8が小文字になっていたり
その他細かい箇所でも色々と。


ところで





http://yy14.kakiko.com/test/read.cgi/mirror/1014655362/862-871n


ごめんなさいごめんなさい
もう一年経つですか

477 :名無しさん@停滞中 ★:10/04/18 13:16:09 ID:???
メモ

■■速報自動保管庫■■
http://sag.uzo.in/

478 : ◆/vmukiyuzw :10/04/19 03:35:13 ID:ZXTymH+7
>>473
レスデータの前でなく後ににガラガラが付いているので、dat変換は成功するのに
その後ろを変換しに行ってエラーになってるようですね。
とりあえず前処理の3つめを

s#\| <a href.+?</a>##igk

としてやるとエラーは取れるようです。

あと「fatal error」はBREGEXP.DLLが出してるエラーで
まずい(どういうのがと言われると困ってしまうのですが)正規表現を書いてしまうと
割と簡単に出てしまいます。
いったん出てしまうとメモリの状態がおかしくなっている可能性が高いので、
続けて使うとhtmltodatが落ちてしまうのもそれが原因です。
これは現状、正規表現の解析・実行をBREGEXP.DLLに投げっぱなしにしている以上
どうしようもない仕様と言わざるを得ないところです。まことに申し訳ないのですが
そういうもんだと割り切って使っていただくしかないです。

479 :名無しさん@停滞中 ★:10/04/19 18:23:00 ID:???
>>478
ありがとうございます。
という事は、>>475で引っ掛かっていたのですね。
他の行は削らなくても良かったのでしたか。

とりあえず、「| <a href」だと本文中にもありそうなので

s#\| <a href="/kakolog/.+?</a>##igk

とやったら何とかなったのかもです



という事で「その80」〜「その82」まで追加
JavaScriptでのミラー変換速度はまだまだ大丈夫そう

480 :名無しさん@停滞中 ★:10/04/19 18:47:41 ID:???
メモ
よくまとめてあるなーと

実況ニューサロ: 実況板過去ログを効果的に漁る方法
http://jikkyonews.blog109.fc2.com/blog-entry-81.html

481 :名無しさん@停滞中 ★:10/04/20 17:48:07 ID:???
2ちゃんねる一発検索
http://2ch.webcross01.com/

482 :名無しさん@停滞中 ★:10/04/20 18:31:50 ID:???
2chニュースポータル
http://2chtimes.com/

http://2chtimes.com/th.php?sv=society6.2ch.net&b=gline&dat=1165245437
http://2chtimes.com/th.php?sv=tsushima.2ch.net&b=newsplus&dat=1271720084

上ですが

http://tsushima.2ch.net/test/read.cgi/newsplus/1271720084/

がdat落ちしても読み込めたらどんなにか面白い事でしょうか。


ちなみにこのhtmlソース、本文とポップアップするものが全く同一になってるっぽくて
dat化が少し厄介そうな気がするです

483 :名無しさん@停滞中 ★:10/04/20 19:02:16 ID:???
一応やりかけ
2chニュースポータル(http://2chtimes.com/)のdat化について

URL例
http://2chtimes.com/th.php?sv=tsushima.2ch.net&b=newsplus&dat=1271720084
http://mirror.sarashi.com/htmltodat/1271720084.html

正規表現(長いので2行に分けて)
m#<span class="ch2_thread_count">([0-9]+)</span>&n?bsp;<span class="ch2_thread_name">()(.+?)</sp
an>&n?bsp;<span class="ch2_thread_datetime">(.+?)</span><div class="ch2_thread_body">(.+?)</div>#mik

前処理
s#<script[\S\s]+?/script>##igk
s#<div id="pop[\S\s]+?</div>\s+</div>##igk
s#(span class="ch2_thread_name">.*?)(◆.+?)(?:(@.+?))?(</span>)#$1</b>$2<b>$3$4#igk


スレッドタイトルとメール欄がないですが
一応、上で出したURL例のものだとこれでdat化出来るです。


ただし、下のはレス 14-17 の間 と レス 30-36 の間が飛んでしまいます
ちょっと今体調不良につき よく考えられなんだ

http://2chtimes.com/th.php?sv=society6.2ch.net&b=gline&dat=1165245437

484 :名無しさん@停滞中 ★:10/04/21 08:20:24 ID:???
駄目でしたか
いえ別にいいんです
引っ掛かったままだと気持ち悪いので
メモしとくです

とりあえず2chニュースポータル(http://2chtimes.com/)のdat化について

URL例
http://2chtimes.com/th.php?sv=society6.2ch.net&b=gline&dat=1165245437
http://mirror.sarashi.com/htmltodat/2chtimes/1165245437.html

正規表現
m#<span class="ch2_thread_count">([0-9]+)</span>&n?bsp;<span class="ch2_thread_name">()(.+?)</spa
n>&n?bsp;<span class="ch2_thread_datetime">(.+?)</span><div class="ch2_thread_body">(.+?)</div>#mik

前処理
s#<div id="pop.+?>\s+\[レス番が見当たりません\]</div>##igk
s#<div id="pop[\S\s]+?</div>\s+</div>##igk
s#(span class="ch2_thread_name">.*?)(◆.+?)(?:(@.+?))?(</span>)#$1</b>$2<b>$3$4#igk

485 :名無しさん@停滞中 ★:10/04/21 19:11:11 ID:???
メモ
2chビューアーD(http://2ch.uda2.com/)のdat化について

URL例
http://2ch.uda2.com/society6-gline/1165245437/

正規表現
m#<dt.+?><a name=".+?"></a>([0-9]+) <span>(.+?)</span>(.*?)((?:\d{2}|\d{4})/\d+/.+?)</dt><dd>(.+?)</dd>#mik

前処理
s#\n<tr>.+?</tr>##igk
s#<script[\S\s]+?/script>##igk
s#<title.+?/title>##ik
s#<h5>(.+?)\(\d+\)<span>#<title>$1</title>#ik
s#\n<a href="http://2ch.uda2.com.+?>.+?</a><br/>##igk

変換結果式
$2<>$3<>$4<>$5<> (←メール欄逆転)

「透明あぼーんを補う」にチェック



モノによってはメール欄と日付の切り分けがうまくいかないかも。
エイプリルフール仕様の日付なんかあったらひとたまりもありません

500KB
続きを読む

掲示板に戻る 全部 前100 次100 最新50
名前: E-mail(省略可)

0ch BBS 2006-02-27