Gポイントポイ活 Amazon Yahoo 楽天
無料ホームページ 楽天モバイル[UNLIMITが今なら1円]
海外格安航空券 海外旅行保険が無料!
■掲示板に戻る■ 全部 1- 101- 201- 301- 401- 501- 601- 701- 801- 最新50
メモ4
- 1 :名無しさん@停滞中 ★:08/06/17 20:07:26 ID:???
- はてさて思いついた事など
- 400 :名無しさん@停滞中 ★:10/02/13 12:24:23 ID:???
- http://society6.2ch.net/test/read.cgi/gline/1193462528/889-891n
携帯からですか
下の記事とか見つつ
まあおいおいと
http://japan.cnet.com/marketing/story/0,3800080523,20383084,00.htm
http://d.hatena.ne.jp/yukky2001/20100212/p1
http://twitter.com/tatiuo/status/9030851266
http://www.itmedia.co.jp/news/articles/0904/14/news088.html
にしてもhtml化されたスレッドってべっかんこでは読み込んでもくれないんですか
あとあれだ
前見た時は公式p2への登録って携帯からは不可だったけど
今もそうなのかな
- 401 :名無しさん@停滞中 ★:10/02/13 13:52:17 ID:???
- メモ
2ch log 保管庫
http://2chlog.emoticon.jp/
http://2chlog.utf8art.com/
URL例
http://2chlog.emoticon.jp/archives/myanmar_1146980083.html
http://2chlog.utf8art.com/archives/wmotenai_1232650438.html
http://2chlog.emoticon.jp/archives/yahoo_1114688189.html
http://2chlog.emoticon.jp/archives/alone_1258490975.html
うーむ
どれもこれもhtmltodatで読み込めないのは何故だろう
ちゃんとmetaタグではcharset=UTF-8"となっているというのに
という事で伺ってみたです
http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/590
あと
ソースを見てもログが記載されてないっぽいのが面白い(単に見逃してるだけかもしれないけど)
>>398と同様にhmlhttpとかで引っ張っているのかな
- 402 :名無しさん@停滞中 ★:10/02/13 16:52:20 ID:???
- たまたま見たんですが
http://pc12.2ch.net/test/read.cgi/tech/1224449899/125-138n
http://gimpo.2ch.net/test/read.cgi/qa/1175630835/635-637n
◆MaMiRaoFSwbBさんってクラシックメニューの現在の管理人さんですか。
◆EA.clAssIcさんとは別の方なのかな。
http://gimpo.2ch.net/test/read.cgi/anniversary/1160268481/
http://pc11.2ch.net/test/read.cgi/tech/1057329161/19-
http://ja.wikipedia.org/wiki/2%E3%81%A1%E3%82%83%E3%82%93%E3%81%AD%E3%82%8B%E3%83%96%E3%83%A9%E3%82%A6%E3%82%B6
http://www.giko-makuri.org/old_log/1054903418/1054903418_02.html#R169
と検索したら
別の方なんですね。
http://qb5.2ch.net/test/read.cgi/operate/1250579952/851
http://www.unkar.org/read/qb5.2ch.net/operate/1250579952#l851
- 403 :名無しさん@停滞中 ★:10/02/14 13:59:42 ID:???
- >>401の件
(1) typo(カッケー!)
s/hmlhttp/xm.http/
(2) CookieやUser-Agent等の送信ヘッダが原因ではなさそう
ime.nu経由からhtmlをDLしたものを開こうとしても同様の表示が出る
それを別の所に上げ直したものからも読み込めない
http://mirror.sarashi.com/htmltodat/wmotenai_1232650438.html
(3) またTeraPadで開いても文字化けする
xyzzyや真魚では普通にファイルは開く事が出来、保存も可能
それをweb上に上げたものならhtmltodatでも読み込み可能
http://mirror.sarashi.com/htmltodat/wmotenai_1232650438a.html
(4) ログは別ファイルではなくhtml内に存在した
但し1412行ある中で1248行目にあり、改行も何もされてなさそう
以上を踏まえて、送信ヘッダ等の付随的なものが原因ではなく
純粋に文字コードを解釈する際の何かが原因ではないかと素人は考えます。
ちなみにTeraPadで開いた際の文字化けはShift_Jisで開こうとしていたからのようで
読み込みコード指定をUTF-8にして開き直したら文字化けが解消しました。
ただ、htmltodatではどの文字コードを指定してもエラーが出てしまい、読み込めないです
バイナリエディタでそれぞれのファイルを開いて見てみましたが、自分のスキルではよくわかりませんでした。
まだまだ修行が必要なようです
- 404 :名無しさん@停滞中 ★:10/02/14 19:14:28 ID:???
- 更にtypo
s/xm.http/xmlhttp/
いちおうメモ
2ch log 保管庫(http://2chlog.emoticon.jp/ http://2chlog.utf8art.com/)のdat化について
URL例
http://2chlog.utf8art.com/archives/wmotenai_1232650438.html
html例
http://mirror.sarashi.com/htmltodat/wmotenai_1232650438a.html
正規表現(長すぎるので2行で)
m#<p class="tdt"><a.+?>([0-9]+)</a> :(?:<a class="tml" href="mailto:(.+?)"></a>)?<b cla
ss="tb">(.+?)</b>:(?:</a>)?(.+?)</p><p class="tdd">(.+?)</p>#mik
前処理
s#\n\t+(<title.+?)\| 2ch log 保管庫(</title>)#\n$1$2#ik
s#\n\t+<table#\n#igk
s#\n\t.+?(?=\n)##igk
s#\n<(?:a|meta|/?li|/?div|/?ul|/?script).+?(?=\n)##igk
s#\n(?:google|\#|src).+?(?=\n)##igk
s#<br />#<br>#igk
後処理
s#((?:^|\n).+?)(◆.+?)&l?t;b&g?t;(<>)#$1</b>$2<b>$3#igk
現状のhtmltodatではURL例のアドレスでは読み込めないのですが
html例からやったらこんなものかなと。
例ではbeを出しているログが無いっぽいのでその辺りはどうなるのかは判らないです
あと
http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/591-592n
これ
http://yy14.kakiko.com/test/read.cgi/mirror/1213700846/260
で行けそうな感じだったけどタイトル部とか少し変わったようで。
あとレス893からリンクが付いてしまってるですが
その部分のアンカータグとかどうなってるのかな
- 405 :名無しさん@停滞中 ★:10/02/15 21:04:57 ID:???
- http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/593,597
とりあえず待っているだけなのも何なので
コード変換するスクリプトを設置してみたです
http://mirror.s151.xrea.com/code_change/?url=http://2chlog.utf8art.com/archives/wmotenai_1232650438.html&to=UTF-8
http://mirror.s151.xrea.com/code_change/?url=http://2chlog.emoticon.jp/archives/myanmar_1146980083.html&to=UTF-8
これで混在した文字コードが統一されるので
htmltodatでも読み込めるようになるのではないかなと
ソースは下記
phpってすごいや
<?
$url = $_GET['url'];
$code_to = $_GET['to'];
$str = file_get_contents($url);
$str = mb_convert_encoding($str, $code_to, "auto");
echo $str;
?>
という事で
暫定的にdat化はこれでいくかな
- 406 :名無しさん@停滞中 ★:10/02/17 19:58:41 ID:???
- http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/599
ありがとうございます。
では「その71a」「その71b」という事で。
ちなみに「その70」は
いちおうdatは公開なさっているみたいなのですが
文字コードがUTF-8になってるみたい
どうしよう
- 407 :名無しさん@停滞中 ★:10/02/17 19:58:55 ID:???
- メモ
2ch log 保管庫(http://2chlog.emoticon.jp/ http://2chlog.utf8art.com/)のdat化について
URL例
http://2chlog.emoticon.jp/archives/myanmar_1146980083.html
http://2chlog.utf8art.com/archives/wmotenai_1232650438.html
http://2chlog.emoticon.jp/archives/yahoo_1114688189.html
http://2chlog.emoticon.jp/archives/alone_1258490975.html
正規表現(長すぎるので2行で)
m#<p class="tdt"><a.+?>([0-9]+)</a> :(?:<a class="tml" href="mailto:(.+?)"></a>)?<b cla
ss="tb">(.+?)</b>:(?:</a>)?(.+?)</p><p class="tdd">(.+?)</p>#mik
前処理
s#\n\t+(<title.+?)\| 2ch log 保管庫(</title>)#\n$1$2#ik
s#\n\t+<table#\n#igk
s#\n\t.+?(?=\n)##igk
s#\n<(?:a|meta|/?li|/?div|/?ul|/?script).+?(?=\n)##igk
s#\n(?:google|\#|src).+?(?=\n)##igk
s#<br />#<br>#igk
後処理
s#((?:^|\n).+?)(◆.+?)&l?t;b&g?t;(<>)#$1</b>$2<b>$3#igk
htmltodatは0.8.17以上のもので。
http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/599
- 408 :名無しさん@停滞中 ★:10/02/18 18:11:20 ID:???
- メモ
Monachrome
http://www.monachrome.net/
http://www.monachrome.net/r/news4vip/1266396664/
上記URLですが
http://yutori7.2ch.net/test/read.cgi/news4vip/1266396664/
がdat落ちしても閲覧可能だったら
どんなにか嬉しい事でしょうか
- 409 :名無しさん@停滞中 ★:10/02/25 19:39:57 ID:???
- メモ
http://www2.atpages.jp/mirror/2ch/javascript/read-light.php/1259636243/
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
959 :Name_Not_Found:2010/01/22(金) 11:09:20 ID:??? ID:
指定時間毎に画像が変わるスクリプトなんだけど
<body onload=
を使わずに変える方法がサンプルでもいいから何処かに転がってないか?
blogで使いたいんだ。
962 :Name_Not_Found:2010/01/22(金) 12:21:10 ID:??? ID:
ファイル名が erogazou00.jpg - erogazou99.jpg とする。
<img src="erogazou00.jpg" id="image">
function setAnotherNumber(origin) {
var number = Math.floor(Math.random() * 100);
if (number < 10)
number = "0" + number;
return (number != origin) ? number : setAnotherNumber(origin);
}
function setRandomImage() {
var img = document.getElementByID("image");
var fileNumber = img.src.slice(8,10);
img.src = "erogazou" + setAnotherNumber(fileNumber) + ".jpg";
}
function changeImage() {
setInterval(setRandomImage, 4000);
}
if (window.addEventListener) {
window.addEventListener("load", changeImage, false);
} else {
window.attachEvent("onload", changeImage);
}
脳内でエロ画像のスライドはじまった
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
上記URL更新されてて仰天
これAV時計に使えますな
- 410 :名無しさん@停滞中 ★:10/03/02 17:12:51 ID:???
- メモ
う゛ぁるす(http://www.varusu.com/)のdat化について
URL例
http://www.varusu.com/thread/gline/1165245437/
正規表現(長すぎるので改行してあります)
m#<a name="R\d+">([0-9]+)</a> 名前:<span class="green"><b>(?:<a href="(.+?)" rel="nofollo
w">)?(.+?)(?:</a>)?</b></span>投稿日:(.+?)<blockquote>(.+?)</blockquote><BR>#mik
前処理
s#(<title>.+?) - varusu.com(</title>)#$1$2#ik
s#(<a href=")mailto:#$1#igk
- 411 :名無しさん@停滞中 ★:10/03/02 17:40:44 ID:???
- ところで、サイバー攻撃の影響か何だかわかんないですけど
http://be.threadic.com/thread/bbs/read.php/test/Cushion/http://www.geocities.jp/mirrorhenkan/
からのリファラがもんのすんごいですがどうしましょうか。
これって>>389の移転先なんですが
相手からは見れて自分からは閲覧不能って何だか図々しい感じだよなー。
JavaScriptで上記だったらのリファラ弾くようにとかしてみようかな。
(Perlやphp使えないサーバなのでJavaScript使うしかない訳で)
- 412 :名無しさん@停滞中 ★:10/03/06 11:52:00 ID:???
- 何か落ち着いたようで。
メモ
てくまくまやこん
http://d.hatena.ne.jp/xacty/
- 413 :名無しさん@停滞中 ★:10/03/06 12:14:37 ID:???
- >>411のサイトも設定戻されたようで。
リファラがクッションURLになってるので元URL探すのが面倒だ
これ以外にもある筈
http://adult.threadic.com/thread/bbs/read.php/babo/1267455823/3
で、掲示板スクリプトの配布先の方
やはりdat直読みはされないようで。
http://www.sanadake.info/bbs/read.php/support/1261898738/34-35n
.htaccess同梱しなければいいだけなのになー
- 414 :名無しさん@停滞中 ★:10/03/08 17:56:28 ID:???
- という訳でもないようで
メモ
http://threadic.comのdat化について
URL例
http://threadic.com/thread/bbs/read.php/japanese/1267450779/
正規表現
m#<DT>(\d+) .+?:(?:<SPAN.+?>|<A HREF="mailto:(.+?)">)<B>(.+?(?:</B>)?.+?)(?:</b>)?(?:</SPAN>|</a>) :(.+?)<BR><DD>(.+?)</DD></DT>#mik
前処理
s#(<b>.+?</b>)( ◆.+?)(</span>)#$1$2<B></B>$3#igk
名前欄のトリップ周りが少し特殊でした。
正規表現をあれこれやってから「あー前処理でいいじゃないか」と。
まだ修行が足りない事を痛感
あとハングルが化けますな。
Unicode版の鬼車を用いたhtmltodatを開発して頂けたら嬉しいのですが(私が)
- 415 :名無しさん@停滞中 ★:10/03/09 19:22:07 ID:???
- メモ
http://beetools2.trustbee.com/read/yutori7.2ch.net/news4vip/1267889250/
上ですが
http://yutori7.2ch.net/test/read.cgi/news4vip/1267889250/
がdat落ちしても読めたら
どんなに嬉しい事でしょう
- 416 :名無しさん@停滞中 ★:10/03/09 21:33:11 ID:???
- 駄目でしたか
いえいいんです
http://society6.2ch.net/test/read.cgi/gline/1165245437/659
直したです
ホスト規制で書き込めないのでここで。
ありがとうございます
ところで、これって
下のどれでもOKみたいですね。
http://logsoku.com/thread/namidame.2ch.net/eco/1261218731.html
http://logsoku.com/thread/namidame.2ch.net/eco/1261218731/
http://2c.okawari.net/thread/namidame.2ch.net/eco/1261218731.html
http://2c.okawari.net/thread/namidame.2ch.net/eco/1261218731/
それと共に、htmlが微妙に変わっているみたいで
>>278の正規表現ではdat化出来なくなってるみたいなので
次レスにて
- 417 :名無しさん@停滞中 ★:10/03/09 21:40:34 ID:???
- メモ
ログ速(http://logsoku.com/ http://2c.okawari.net/)のdat化について
URL例
http://logsoku.com/thread/namidame.2ch.net/eco/1261218731.html
http://logsoku.com/thread/namidame.2ch.net/eco/1261218731/
http://2c.okawari.net/thread/namidame.2ch.net/eco/1261218731.html
http://2c.okawari.net/thread/namidame.2ch.net/eco/1261218731/
正規表現(長すぎるとの事なので2行に分けてます)
m#<a name="\d+"></a><dt>([0-9]+) :(?:<a href="mailto:(.+?)">|<font color=gre
en>)<b>(.+?)</b>(?:</a>|</font>) :(.*?)<br/><dd>(.*?)<br><br></dd></dt>#mik
タイトルそのままになったので前処理が要らなくなったみたい。
あと正規表現中にある「<br/>」は元htmlでもそうなっているので。
- 418 :名無しさん@停滞中 ★:10/03/09 22:27:50 ID:???
- と思ったらIDの発言回数が付加されているので
下のを追加
前処理
s#(ID:)<span.+?><a href='/thread/.+?>(.+?)</a></span> \(\d+ 回発言\)(<br/><dd>)#$1$2$3#igk
- 419 :名無しさん@停滞中 ★:10/03/10 19:28:35 ID:???
- うー
そんな生易しいものではないな
どうもそれだけでは無かったようだ
というか結構ややこしいぞこれ
まだ未解決
というか自分が出来る事はこのくらいか
URL例
http://logsoku.com/thread/society6.2ch.net/gline/1165245437/
正規表現(※改行してるので繋げて一行に)
m#<a name="\d+"></a><dt>([0-9]+) :(?:<a href="mailto:(.+?)">|<font color=gr
een>)<b>(.+?)</b>(?:</a>|</font>) :(.*?)<br/><dd>(.*?)<br><br></dd></dt>#mik
前処理
s#(ID:)<span.+?><a href='/thread/.+?>(.+?)</a></span>(?:( .+?))? \(\d+ 回発言\)(<br/><dd>)#$1$2$3$4#igk
s#<img src="http://(img.2ch.net/ico/.+?)>#sssp://$1#igk
後処理(※下の全部の「&」を半角に)
s#([^<r])>#$1&gt;#igk
s#<([^b>])#&lt;$1#igk
s#((?:^|\n).*?)&lt;/b&gt;(.+?)<b&gt;(<>)#$1</b>$2<b>$3#igk
「透明あぼーんを補う」にチェックを入れる
これでいちおうdat化出来るのですが、途中で
「Internet Explorer スクリプトエラー」
というポップアップが出ますが気にせず「いいえ」を選択して最後までdat化と。
このエラーの原因なんですが
本文中の「&gt;」「&lt;」が全部
「>」「<」になっちゃっているからで。
だもんでスクリプトやタグと認識されてしまっていると。
サニタイズの逆ですな
いちおう後処理でそれらを戻すようにしたつもりなんですが
本文中に書かれた「<br>」を「&lt;br&gt;」にさせる方法がどうにもお手上げです。
あとはもうログ速の管理人さんに何とかしてもらうしかなさそうな。
レス番が飛んでる箇所が結構あったので「透明あぼーんを補う」チェックも必要です。
それと何故かトリップがみんな削られてるですね。
下のスレとか 名前が1以外空欄になってますし。
http://logsoku.com/thread/tsushima.2ch.net/news/1267611558/
というくらいでしょうか。
- 420 :名無しさん@停滞中 ★:10/03/11 19:12:10 ID:???
- 追記
前処理に下のを追加(※「&」を小文字にして)
s#<>#&lt;&gt;#igk
これやらないとデリミタとしての「<>」との区別が出来なくなるです
たとえば↓の154.481.851等
http://logsoku.com/thread/society6.2ch.net/gline/1193462528/
まあプログラムやhtmlタグ等が出ないようなスレッドでは関係ないですし
>>417-418ではダメな場合だけでもいいかもしれないです
- 421 :名無しさん@停滞中 ★:10/03/12 18:30:52 ID:???
- http://pc12.2ch.net/test/read.cgi/software/1267177119/166,189
どうも見て頂いてるようで。お世話になっております
個人的には>>294でmokume◆Q35xnK/I9LhhTwさんがおやりになられたように
htmltodat機能だけでもあったらなと。
どんなものかという事でいちおう本体を。
www.geocities.jp/mirrorhenkan1/kj/KJ_01122_b053_rc1.rar.zip
- 422 :名無しさん@停滞中 ★:10/03/12 18:37:41 ID:???
- メモ
http://threadic.com/ のsubject.txt化について(by htmltodat)
URL例
http://threadic.com/thread/bbs/read.php/japanese/subback/
正規表現(2行に分けて書いてるので繋げて1行に)
m#<TR align="center"><TD>([0-9]+)</TD><TD class="BBS_List" align="left"><A hre
f="../(\d+)/l50" target="_blank">(.+?)</A></TD><TD>.+?</TD><TD>.+?</TD><TD>(\d+)</TD></TR>()#mi
変換結果式
<>$2.dat<>$3<>($4)<>
後処理
s#^<>(.+?)<>(.+?)<>(.+?)<>.+?(?=\n)#$1<>$2$3#i
s#((?:^|\n))<>(\d+\.dat<>.+?)<>(\([0-9]+\))<>#$1$2$3#ig
これでいちおうsubject化出来るです。
変換結果式で
$2.dat<>$3($4)
とやろうとしたんですが、何だかエラーが出るので後処理で。
・・・となると
subject.txtという名前で保存出来るようにもなっていたらなと。
- 423 :koreawatcher ◆Nida.eneRA :10/03/13 00:25:16 ID:4OBODbk1
- >>421
いつも見させてもらっています。
ところで、専ブラがみんなこの機能を内蔵してしまうとみみずんの広告を
だれも表示しなくなって、結果的にみみずんがなくなってしまうような気が
するんですが、杞憂でしょうか。
- 424 :名無しさん@勉強中:10/03/13 00:41:39 ID:rttbkyeE
- 広告表示してても、なくなっちゃう時はあっさり無くなるものですよ。
専ブラ側で機能持ってなくても、p2porxyのように楽に導入できる外部ツールもあるし。
Styleにはmimizun.jsが標準で添付されてましたしね。
気にし無さ過ぎもどうかと思いますが、気にし過ぎなのもどうかと
- 425 :名無しさん@停滞中 ★:10/03/13 22:23:05 ID:???
- >>423
どうもです。
えーと、>>424さんと同意見です。
# こういう簡にして要を得たような文章書けないな
思い起こすと、例えばdumper.jpさんの所とか しばらく不通になった後にリニューアル復活して
その直後に繋がらなくなって今まで続いてるです。
ページランクやレスアンカー・IDポップアップ付加とかの
結構手の込んだリニューアル直後に不通になったのが実に印象的でした。
旧 http://web.archive.org/web/20050614010755/2ch.dumper.jp/0000013542/
↓
新 http://web.archive.org/web/20070112001954/http://2ch.dumper.jp/0000017733/
みみずんさんの所ですが・・・まあ何といいますか
どうなんでしょうか。よくわかんないです
http://twitter.com/mimizun/status/10196896542
http://twitter.com/mimizun/status/10366880192
ところで、お名前をレインボー表示させる為にReplaceStr.txtの書式を少し直したです
yykakikoだと<b>と◆の間のスペースが無いみたいですね。
- 426 :名無しさん@停滞中 ★:10/03/13 22:44:47 ID:???
- 誤:yykakikoだと<b>と◆の間のスペースが無いみたいですね
↓
正:yykakikoだと</b>と◆の間のスペースが無いみたいですね
それと、Threadic.com読み込みバージョン ありがとうございます。
すごく面白いです。
>>421の件ですが、個人的には
左ペインで外部コマンドが使えるようになればなとも思うです(以前も要望したですが)
そうすれば、スレッド一覧htmlからsubject.txtを作成するようなスクリプトを此方で用意すれば(>>149のsubject.txt版のような)
色んな掲示板を読み込めるようになるのではないかなと。
- 427 :名無しさん@停滞中 ★:10/03/13 22:49:49 ID:???
- http://society6.2ch.net/test/read.cgi/gline/1165245437/660-661n
えーと
どうなのだろう
- 428 :名無しさん@停滞中 ★:10/03/14 16:52:14 ID:???
- >>419-420
後処理に下の一行を追加
s#((?:^|\n).*?</b>\[―{}@{}@{}\-\])<b&gt;#$1$2<b>#igk
これつけないと例えば
http://logsoku.com/thread/yutori7.2ch.net/campus/1264993145/
のレス1の名前がうまく出ないです
まあレアケースかもですが(そうでもないか)
- 429 :名無しさん@停滞中 ★:10/03/16 12:18:49 ID:???
- メモ
スレッドランキング(http://www.bbsnews.jp/)のdat化について
URL例
http://proxy.bbsnews.jp/2ch/mog2/1253115656/
正規表現
m#<a name="\d+"></a><dt.+?>([0-9]+) :<font color=green><b>(?:<a href="mailto:(.+?)">)?(.+?)(?:</a>)?</b></font> :(.+?) <dd .+?>(.+?)<br><br></dd>#mik
- 430 :名無しさん@停滞中 ★:10/03/16 12:41:46 ID:???
- 修正
スレッドランキング(http://www.bbsnews.jp/)のdat化について
URL例
http://proxy.bbsnews.jp/2ch/mog2/1253115656/
http://proxy.bbsnews.jp/2ch/avideo/1268682799/
正規表現
m#<a name="\d+"></a><dt.+?>([0-9]+) :<font color=green><b>(?:<a href="mailto:(.+?)">)?(.+?)(?:</a>)?</b></font> :(.+?)<dd .+?>(.+?)<br><br></dd>#mik
>>429の正規表現から<dd>の前のスペースを省いただけです
- 431 :名無しさん@停滞中 ★:10/03/16 18:12:19 ID:???
- >>430追加
「その74」という事で
- 432 :名無しさん@停滞中 ★:10/03/16 20:05:11 ID:???
- ホスト規制で書き込めないのでココにメモ
http://25eo.com/
http://djenadpekzm.nayana.com/sch/bbs/read.php/test/
JaneXenoで上の掲示板が登録出来ないように思うです。
で、スクリプト配布先↓も登録してみたですがやはりダメっぽい。
http://www.sanadake.info/bbs/read.php/support/
調べてみたら、threadic.comと全然htmlが異なっているのが原因のようです。
dat化は下記
URL例
http://www.sanadake.info/bbs/read.php/support/1261898738/
http://djenadpekzm.nayana.com/sch/bbs/read.php/test/1267437116/
http://25eo.com/sch/bbs/read.php/ingyeo/1268484383/
正規表現
m#<DT>([0-9]+).*?:<SPAN ID="G"><B>(?:<a href="mailto:(.+?)">)?(.+?)</B></SPAN> ?:(.+?)<BR><DD>(.+?)<BR><BR>#mi
どうも見たところ、threadic.comさんのところのものはhtmlその他 かなり手を入れておられるのかも。
上で出したように、掲示板スクリプト配布先と同じhtmlを出すところばかりですし。
あと
http://threadic.com/thread/bbs/read.php/japanese/
の最下部を見たら
「Threadic READ.PHP - 2010/03/14 (PHP5) +MySQL5 +Apache2」
とありますが
Schの最新バージョンは2010/1/16のようです。
まだ見てないですがsubbackのhtmlも違っているみたい。
・・・と書いてから
http://www.beacon-tcg.net/bbs/read.php/any/
のhtmlを見たらこれまた少し異なっているようで。
いろいろあるなー。
- 433 :名無しさん@停滞中 ★:10/03/16 20:14:02 ID:???
- あ
今見直したら
http://www.sanadake.info/bbs/read.php/support/
だけは読めたですが
http://25eo.com/sch/bbs/read.php/ingyeo/
http://djenadpekzm.nayana.com/sch/bbs/read.php/test/
の二つはやはり真っ白のままでした
メモ
JP & KR Board
http://jbbs.livedoor.jp/internet/7845/
- 434 :名無しさん@停滞中 ★:10/03/17 17:43:59 ID:???
- メモ
http://otu.sakura.ne.jp/2ch/ のdat化について
URL例
http://otu.sakura.ne.jp/2ch/_bin/view.cgi?board=linux&thread=1231189481&host=pc11.2ch.net
正規表現
m#<dt.+?><a.+?>([0-9]+)</a> : <b>(?:<span title="(.+?)".+?>)?(?:<a.+?>)?(.+?)(?:</a>)?(?:</span>)?</b> : (.+?)</dt><dd.+?>(.+?)<br><br></dd>#mik
前処理
s#(<title.+?)(?: @ \w+?)?(</title>)#$1$2#ik
ここなんですが、よくわからない。
http://otu.sakura.ne.jp/2ch/_bin/ とか見ると「unkar-light.js」とかあるので
unkarさんの所なのかな。
にしてはhtmlの形式が全然違うし。
URL例の元スレッド(http://pc11.2ch.net/test/read.cgi/linux/1231189481/)は閲覧出来なくなっているのに
ミラーでは読めるので
これも追加させてもらおうかなと
- 435 :名無しさん@停滞中 ★:10/03/17 17:52:07 ID:???
- 2chのdat落ちしたスレを右クリックで即座に蘇生させられるFirefoxアドオン「fire2chDat」:phpspot開発日誌
http://phpspot.org/blog/archives/2010/03/2chdatfirefoxfi.html
昨日出た記事っぽいのにブックマーク数が凄いですな
にしても、記事の説明文にうちのサイトのリンクも何もないのは一体
・・って 作者さんは↓こっちみたいですね
http://fatalita.sakura.ne.jp/
https://addons.mozilla.org/ja/firefox/addon/97406
https://addons.mozilla.org/ja/firefox/user/5228271
- 436 :名無しさん@停滞中 ★:10/03/18 17:02:03 ID:???
- メモ
Ria Service
http://www.riaservice.com/
http://app.riaservice.com/threadex/?t=2&u=http%3A%2F%2Fyutori7.riaservice.com%2Ftest%2Fread.cgi%2Fnews4vip%2F1268887986%2F
↑これですが
これ↓がdat落ちしても閲覧可能だったら有難いです
http://yutori7.2ch.net/test/read.cgi/news4vip/1268887986/
まあhttp://www.riaservice.com/?page_id=2で説明あるですが
一応メモという事で
- 437 :名無しさん@停滞中 ★:10/03/18 18:06:04 ID:???
- ダメでしたか
いえいいんです
ところで
韓国の姿を見せてくれる! ??? ??? ????!
http://threadic.com/thread/bbs/read.php/japanese/1268644780/
↑このスレッドに貼ってある画像をJaneXenoで展開したいんですが
どうやれば良いのだろう
画像URLは例えば下記
http://image.threadic.com/images/ZqEOH5reFB1
http://image.threadic.com/images/7DD7kbioWY0
どうもURLはこれでないといけないようで、拡張子やスラッシュを入れるとエラーになるです
なのでImageVierUrlReplace.datやReplaceStr.txtでゴニョゴニョという事でもなさそう。
貼られたものを見つける都度
URL右クリック→対象をビューアで開くでやるのも何だかなと
- 438 :名無しさん@停滞中 ★:10/03/19 19:45:51 ID:???
- http://threadic.com/thread/bbs/read.php/japanese/1267451067/72
うほっ
出来たですっ
ありがとうございます
そうか、こういう時に$VIEWERを使うのかと。
ただ ケアレスミスでしょうけど「w」ではなく「\w」ではないかと。
http://image.threadic.com/images/(?:w+)[Tab]$&[Tab][Tab]$VIEWER
↓
http://image.threadic.com/images/(?:\w+)[Tab]$&[Tab][Tab]$VIEWER
あと、グループ処理(?何ていうんだろう・・「(?:〜)」というやつ)を使った理由がわからなくて悩んでるです
いえ別にいいんです
失礼しました
ごめんなさい
- 439 :名無しさん@停滞中 ★:10/03/19 23:08:57 ID:???
- >>411実装(カッケー!)
- 440 :名無しさん@停滞中 ★:10/03/19 23:22:11 ID:???
- 補足しとくと
http://adult.threadic.com/thread/bbs/read.php/pervertplus/Cushion/http://www.geocities.jp/mirrorhenkan/
とかからアクセスしてきたらメッセージを出すようにしただけ
ついでに
http://tieba.baidu.com/f?kz=635797320
とかからアクセスがあったら別のメッセージを出すようにしてみたり
まあ大半の方々には関係無いような事で
無意味といわれても別に
- 441 :名無しさん@停滞中 ★:10/03/20 12:07:55 ID:???
- メモ
2ちゃんぬる(http://2chnull.info/)のdat化について
URL例
http://2chnull.info/r/gline/1165245437/1-1001
正規表現
m#<dt>([0-9]+):<em><b>(?:<a href="mailto:(.+?)">)?(.+?)(?:</a>)?</b></em>:(.+?)</dt>\t+<dd>(.+?)</dd>#mik
前処理
s#<title.+?/title>##ik
s#<div id="body">\s+<h2>(.+?)</h2>#<title>$1</title>#ik
s#<a.+?>(h?ttp://\w+?\.(?:2ch\.net|bbspink\.com)/test/read.cgi/\w+?/\d+/?)</a> \[<a href=".+?">cache</a>\]#$1#igk
URL例の場合だと例えばレス3の7行目以降が省略されてるみたい
(元レスはhttp://society6.2ch.net/test/read.cgi/gline/1165245437/3)
どういう法則で省略になったのか判りませんが、そういう事があるかもしれないという事で。
- 442 :名無しさん@停滞中 ★:10/03/20 12:32:13 ID:???
- メモ
2chまとめサイトエディター2.0
http://eva-lu-ator.net/~gemma/ktkr2/bbsmenu.html
やったー2chまとめサイトエディター2.0できたよー\(^o^)/ - Gemmaの日記
http://d.hatena.ne.jp/Gemma/20100317/1268812937
- 443 :名無しさん@停滞中 ★:10/03/21 20:05:32 ID:???
- http://threadic.com/thread/bbs/read.php/japanese/1269082122/
上を見て
http://be.threadic.com/thread/bbs-jp/read.php/koreajapan/
を板登録しようとしたらうまくいかないです
とりあえずsubbackの取得先が違うような
元
http://be.threadic.com/thread/bbs-jp/read.php/koreajapan/subback/
xeno
http://be.threadic.com/thread/bbs/read.php/bbs-jp/subback/
- 444 :名無しさん@停滞中 ★:10/03/21 20:11:00 ID:???
- 「bbs」が「bbs-jp」になってるみたい
あと
レス欠番するようにもなってるみたい
下の9・15・17・以下沢山
http://be.threadic.com/thread/bbs-jp/read.php/koreajapan/1269087909/
- 445 :koreawatcher ◆Nida.eneRA :10/03/21 22:22:28 ID:KAywHbp7
- >>437の辺りからここに投稿しようとしてもうまく行かず、IPアドレスを変えてみたら
書き込めるようになったんですが、偶然でしょうか。
それはおいといて、>>438は「\w」ですね。コピペ元も「\w」になっていたのに
なぜそのように投稿してしまったのか謎です。
(?: は$1に結果を格納しないから無駄がなくなるという程度に
理解しています。もしかしたら間違っているかもしれませんが。
>>443
read.phpの前にはbbsが来るという前提でプログラムが作られているので
変更が必要になりますね。
今は、ホスト=threadic.com/thread、板=japaneseとやっていますが、
ホスト=threadic.com/thread/bbs、板=japaneseと変更しなければ
ならない気がします。
- 446 :名無しさん@停滞中 ★:10/03/22 20:14:46 ID:???
- >>445
すみません、スパムがひどいので「http://」をNGワードにしてあるです。ごめんなさい
yykakikoだと、NGワード交じりの文章でも投稿後「投稿完了しました」メッセージが出るみたいで
多分それなのではないかなと思うのですが。
とりあえず「http://」をNGから外してみたです(スパム来るかな)
それはそうと、threadic.comさんの所
htmlがこれまた全然様変わりしてるですね。
今日の昼頃まではXenoでdat化取得出来たのですが
現在ではさっぱりです
レス番も盛大に飛びまくってますし。
たぶんsubbackのhtmlも変わってるのだろうなと。
URL例
http://threadic.com/thread/bbs/read.php/japanese/1268644780/
http://be.threadic.com/thread/bbs-jp/read.php/koreajapan/1269087909/
正規表現
m#<DT>([0-9]+).*?:(?:<font.+?>|<SPAN ID="G">|<a href="mailto:(.+?)">)<b><B>(.+?)</B></b>(?:</SP
AN>|</font>|</a>)? *?:(.+?)(?:<BR>)?<DD>(.+?)<BR><BR>#mi
前処理
s#(<b><B>.+?</B>)( ◆.+?)</b>((?:</font>|</span>))#$1$2<B></b></b>$3#ig
ホストと板に含める範囲もですが、>>432-433の件もあり
やはり簡易的な正規表現置換機能があったら有難いなと思う次第です
- 447 :名無しさん@停滞中 ★:10/03/23 07:48:43 ID:???
- あれれ
上のやつだと下のhtml等でトリップ周りがうまく切り分けられないのか
難しい
http://threadic.com/thread/bbs/read.php/japanese/1269082122/
- 448 :名無しさん@停滞中 ★:10/03/23 18:39:25 ID:???
- ほんとコロコロ変わる
m#<dt>([0-9]+) .+?:(?:<font.+?>|<a href="mailto:(.+?)">)<B>(.+?)</B>(?:</font>|</a>) :(.+?)<dd>(.+?)<BR><BR>#mi
- 449 :名無しさん@停滞中 ★:10/03/25 18:33:07 ID:???
- さて、まだホスト規制されてるですし
長文で尚且つ2chではない所に関する事なのでここで
http://pc12.2ch.net/test/read.cgi/software/1267177119/390
何だかうまくいかないです。
いったん板削除してから板追加したのですが
subbackからして404NotFoundになるです。
どうも指定先が違うみたいに思うのですが。
元
http://threadic.com/thread/bbs/read.php/japanese/subback/
Xeno
http://threadic.com/thread/bbs/bbs/read.php/japanese/subback/
元
http://be.threadic.com/thread/bbs-jp/read.php/koreajapan/subback/
Xeno
http://be.threadic.com/thread/bbs-jp/bbs/read.php/koreajapan/subback/
なのでJane2ch.brdを開いて
ホスト=threadic.com/thread/bbs 板=japaneseとなっている箇所を
ホスト=threadic.com/thread/板=japaneseと変更したらsubbackにアクセス出来たです
- 450 :名無しさん@停滞中 ★:10/03/25 18:51:13 ID:???
- 次にhtmlの形態ですが
japanese板とkoreajapan板とで全然違うものになっているような。
とりあえずjapanese板のほうはxenoで該当スレッドのhtmlにアクセスしてるようですけど
dat化取得出来ない感じです。
(1)http://threadic.com/thread/bbs/read.php/japanese/
(2)http://be.threadic.com/thread/bbs-jp/read.php/koreajapan/
(1)URL例
http://threadic.com/thread/bbs/read.php/japanese/1269465598/
正規表現
m#<dt>([0-9]+).*?:(?:<font color=green>|<a href="mailto:(.+?)"><b>)<B>(.+?)</B>(?:</font>|</a>) +:(.+?)<dd>(.+)<BR><BR>#mi
前処理
s#(</b> *)(◆.*?)(?:</b>)?((?:</font>|</a>))#$1$2<B></B>$3#ig
(2)URL例
http://be.threadic.com/thread/bbs-jp/read.php/koreajapan/1269258316/
正規表現
m#<dt>([0-9]+).*?:(?:<font.+?>|<SPAN ID="G">|<a href="mailto:(.+?)">)<b><B>(.+?)(?:</B>)?</b>(?:</SP
AN>|</font>|</a>) *?:(.+?)<DD>(.+?)<BR><BR>#mi
前処理
s#(</b> *)(◆.*?)(?:</b>)?((?:</font>|</a>))#$1$2<B></B>$3#ig
どちらにおいても透明あぼーんがあるので
それを補う必要もありそう
- 451 :名無しさん@停滞中 ★:10/03/25 18:57:48 ID:???
- で、>>450のどちらの板のhtmlにも対応するような正規表現を考えると
次のようなものになるかも。
threadic.comの管理人さんが更新したらまた使えなくなるかもですが
URL例
http://be.threadic.com/thread/bbs-jp/read.php/koreajapan/1269258316/
http://threadic.com/thread/bbs/read.php/japanese/1269465598/
正規表現
m#<dt>([0-9]+).*?[::](?:<font.+?>|<SPAN ID="G">|<a href="mailto:(.+?)">)(?:<b>)?<B>(.+?)(?:</B>)?</b>(?:</SP
AN>|</font>|</a>) *?:(.+?)<DD>(.+?)(<BR><BR><dt>)#mi
前処理
s#(</b> *)(◆.*?)(?:</b>)?((?:</font>|</a>))#$1$2<B></B>$3#ig
ここまで書いて思ったですけど
「読めないぞ」という反応が皆無というのは
もしかして読めないのは自分だけなのかもしれないのかな・・
よくわかんないです
- 452 :koreawatcher ◆Nida.eneRA :10/03/25 19:12:51 ID:bqIcWF5D
- >>449
brdconf.iniでBBSType=Sch_BBSなどの記述があれば削除してください。
すでにThreadicとSchは別物として処理しているので、Threadicを
Schであると指定すると不具合が起こります。
- 453 :名無しさん@停滞中 ★:10/03/25 19:26:17 ID:???
- うお!!!
>>452
それでした!
削除したら読めたです!
ありがとうございます!
# うー恥ずかしい・・・
- 454 :名無しさん@停滞中 ★:10/03/26 19:04:05 ID:???
- メモ
2ch_log
http://wmotenailog.x.fc2.com/
- 455 :名無しさん@停滞中 ★:10/03/29 19:24:59 ID:???
- メモ
インスパイヤw - なんとなく◎(http://sunos.saita.ma/inspired/)のdat化について
URL例
http://sunos.saita.ma/inspired/?dubai+actor+1230881341
正規表現
m#<dt>([0-9]+) :(?:<span>|<a href="mailto:(.+?)">)<b>(.+?)</b>(?:</span>|</a>\[.+?\]):(.+?)</dt><dd> (.+?)</dd>#mik
前処理
s#(<title>.+?) - インスパイヤw - なんとなく◎(</title>)#$1$2#ik
s#<br />#<br>#igk
元スレ(http://dubai.2ch.net/test/read.cgi/actor/1230881341)が消えているのに
何故か読めるので。
追加するとしたら「その77」になるのかな
ところで、xhtmlでの改行タグは「<br />」みたいなんでいちおう置換するようにしたですが
これって「<br>」にしなくても専用ブラウザ的(?)にはOKなんでしょうか。
- 456 :名無しさん@停滞中 ★:10/04/01 18:52:42 ID:???
- 上のdat化処理ですが
「<br />」→「<br>」に全置換するのは後処理のほうが効率的ですね。
前処理でやると、dat化に必要な部分以外の「<br />」も置換する事になる訳で
時間と電気代とCPU計算その他の消費が冗長になるのではないかと思われ
まあいいか
ところで
2chで落ちた意見を蘇生する方法 | web R25
http://r25.yahoo.co.jp/fushigi/jikenbo_detail/?id=20100324-00001841-r25&vos=nr25mn0000001
そこまで採り上げるほどの記事なんかなと
- 457 :名無しさん@停滞中 ★:10/04/02 12:19:42 ID:???
- メモ
みんくちゃんねるログ(http://log.minkch.com/)のdat化について
URL例
http://log.minkch.com/read.php/801/1267194035/
正規表現
m#<dt.*?>([0-9]+) : <span class="nam">(.+?)</span>\[(.*?)\] : (.+?) </dt><dd>(.+?)<br /> <br /></dd>#mik
前処理
s#<title.+?/title>##ik
s#<h2>(.+?)</h2>#<title>$1</title>#ik
s#(<span class="nam">.+?)</span><span style="color:green;">(◆.+?)</span>#$1</b>$2<b></span>#igk
s#</?(?:div|script|li|select|option).+?(?=\n)##igk
変換結果式
$2<>$3<>$4<>$5<> (←メール欄逆転)
後処理
s#<br />#<br>#igk
- 458 :名無しさん@停滞中 ★:10/04/02 12:42:24 ID:???
- >>457の正規表現って
よく見たら>>315と同じっぽいですね。
ミラー対象の板も似てるですし
もしかしたら同じ方がやっておられるのかも
- 459 :名無しさん@停滞中 ★:10/04/02 19:10:07 ID:???
- とか書いたあとでみてみたら
http://p.loface.com/
http://ch.xmoe.jp/
にアクセスすると
http://news.minkch.com/
に飛ぶですね。
同じ方ですか。
- 460 :名無しさん@停滞中 ★:10/04/02 19:15:41 ID:???
- メモ
z-z-z-z.net 2chブラウザ(http://z-z-z-z.net/)のdat化について
URL例
http://z-z-z-z.net/b/society6.2ch.net/gline/1165245437/
正規表現
m#<dt>([0-9]+)\.<a href=mailto:(.*?)>(.+?)</a>(.+?)</dt><dd>(.+?)<br>(<a name=\d+></a>)#mik
前処理
s#(<a href=mailto:.*?>.*?)(◆.+?)(</a>)#$1</b>$2<b>$3#igk
- 461 :名無しさん@停滞中 ★:10/04/02 19:22:56 ID:???
- ところで>>460の正規表現なのですが
最初
m#<a name=\d+></a><dt>([0-9]+)\.<a href=mailto:(.*?)>(.+?)</a>(.+?)</dt><dd>(.+?)<br>(<a name=\d+></a><dt>)#mik
とやったらレスが一つ飛びになってしまいうまくいかなかったです。
なので頭と$6の部分を少し変えたのですが、
上の正規表現のどこがまずいのかよくわからない。
実際、どこがいけないのでしょう?
- 462 : ◆/vmukiyuzw :10/04/03 03:16:05 ID:b9qEg+OM
- >>461
ご迷惑おかけします。
htmltodatサポスレのほうでレスさせていただきました。
http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/602
- 463 :名無しさん@停滞中 ★:10/04/04 09:54:42 ID:???
- >>463
ありがとうございます。そういう事だったんですか。
という事は、現状ではレスアンカーが要になっている場合は前処理等で何か手心が必要になる訳ですね。
上の場合は<dt>があったのでその辺は何とかなったですが。
というか、>>460だと最終レスがマッチしなかったですね。
まだまだ修行が必要だ
- 464 :名無しさん@停滞中 ★:10/04/04 09:56:51 ID:???
- メモ
z-z-z-z.net 2chブラウザ(http://z-z-z-z.net/)のdat化について
URL例
http://z-z-z-z.net/b/society6.2ch.net/gline/1165245437/
正規表現
m#<dt>([0-9]+)\.<a href=mailto:(.*?)>(.+?)</a>(.+?)</dt><dd>(.+?)<br>(<a name=\d+></a>|</dl>)#mik
前処理
s#(<a href=mailto:.*?>.*?)(◆.+?)(</a>)#$1</b>$2<b>$3#igk
>>460では最終レスの取りこぼしがあったので。
- 465 :名無しさん@停滞中 ★:10/04/04 10:17:52 ID:???
- がっくしメニューはどうかな
dat落ちしてもしばらく読めたら面白いですけど
http://orz4.2ch.io/orz/orz.cgi/*/yutori7.2ch.net/news4vip/1270340527/1-1001
http://orz4.2ch.io/orz/orz.cgi/*/anchorage.2ch.net/musicjg/1267157656/1-1001
- 466 :名無しさん@停滞中 ★:10/04/05 20:57:45 ID:???
- 駄目でしたか
いえいいんです
メモ
CSS切り替えJavaScript
http://act.st/etc/css_ss.htm
- 467 :名無しさん@停滞中 ★:10/04/05 21:00:40 ID:???
- 外部CSSの切り替え
http://www.din.or.jp/~hagi3/JavaScript/JSTips/Std/csschg.htm
- 468 :名無しさん@停滞中 ★:10/04/08 18:15:42 ID:???
- メモ
何か開発するブログ 「2ちゃんねる全文検索」を公開しました
http://blog.livedoor.jp/slx/archives/51811689.html
2ちゃんねる全文検索
http://app.xrea.jp/search2ch/
- 469 :名無しさん@停滞中 ★:10/04/08 18:21:37 ID:???
- 2chセンブラーONLINE(ββ)
http://fatalita.sakura.ne.jp/CGI/2ch/index.html
>>435の方のサイトですが(http://victreal.com/がメインになるかもだそうですが)
それはそれとして
http://fatalita.sakura.ne.jp/CGI/2ch/index.html?text1=http%3A%2F%2Fyutori7.2ch.net%2Ftest%2Fread.cgi%2Fnews4vip%2F1270472109%2F
上のURLが
http://yutori7.2ch.net/test/read.cgi/news4vip/1270472109/
がdat落ちしても閲覧可能だったら
どんなにか嬉しい事でしょうか。
- 470 :名無しさん@停滞中 ★:10/04/15 19:34:27 ID:???
- W2Ch DAT変換機
http://2chdat.soprano-asm.net/
> まぁ http://yellow.ribbon.to/~mirror/ の"url.php"を改変してURLをうんぬんしたり
> 0chのread.cgiをいじってログを見れるようにしたりでw
のけぞったです
検索結果を見て更に海老反りました
結果
http://2chdat.soprano-asm.net/url.php?url=http%3A%2F%2Ftsushima.2ch.net/test/read.cgi/news/1270045997/
閲覧
http://yellow.ribbon.to/~mirror/dat2html/read1.php?url=http://2chdat.soprano-asm.net/2ch.net/news/1270/1270045997.dat
ログ
http://2chdat.soprano-asm.net/2ch.net/news/1270/1270045997.dat
よくわからないですけど、o2onとも連動しておられるみたいで。
後で追加してみるです。「その80」になるのかな。その代わり「その29の17」は不通になってますね。
あと他のW2Ch中間サーバもバージョンアップ等で軒並みURL構造が変わっている予感です
こういうのがあると、ソース(http://yellow.ribbon.to/~mirror/url.php.txt)出しといて良かったなと。
こんなの誰が見るんだ初心者ソースに突っ込まれるだけ損じゃないかとか思ってたですが。
ってこれ出してもう5年経つんですか。
- 471 :名無しさん@停滞中 ★:10/04/16 19:47:58 ID:???
- メモ
web2ch.org(http://web2ch.org/)のdat化について
URL例
http://web2ch.org/PHP/av.php/society6.2ch.net/gline/1165245437/
http://web2ch.org/PHP/av.php/pc12.2ch.net/streaming/1240594588/
正規表現
m#<div.+?><p.+?>([0-9]+) (.+?)\=\=(.*?)\=\=(.+?) </p><p class=mg> (.*?) </p></div>#mik
前処理
s#(<title.+?) \- web2ch\.org\(2chブラウザ\)(</title>)#$1$2#ik
//s#(<div)#\n$1#igk
変換結果式
$2<>$3<>$4<>$5<> (←メール欄逆転)
後処理
s#((?:^|\n).*?)(◆.+?)<>#$1</b>$2<b><>#igk
ソースが改行なしにベターっと出るタイプなので前処理2番目をつけようとしたですが
つけなくてもOKっぽいのでコメントアウトしてるです
- 472 :名無しさん@停滞中 ★:10/04/16 19:49:16 ID:???
- >>471補足
ここ公開したてのホヤホヤみたい。
スレッドは下記
web上から2chを見られるビューアweb2ch.org
http://pc12.2ch.net/test/read.cgi/software/1271203705/
上のスレッドの10で
> dat落ちしたスレでもdat落ち前のキャッシュがあれば●がなくてもキャッシュの表示可能。
との事なので、後日追加させてもらおうかなと思うです
「その81」になるのかな
- 473 :名無しさん@停滞中 ★:10/04/17 12:59:29 ID:???
- メモ
やるにょ(http://www.yarunyo.com/)のdat化について
URL例
http://www.yarunyo.com/kakolog/gline/1165245437/
正規表現(長すぎるので2行に分けてます)
m#<a name=".+?">([0-9]+)</a> 名前:<span class="green"><b>(?:<a href="(.+?)" rel="nof
ollow">)?(.+?)(?:</a>)?</b></span>投稿日:(.+?)<blockquote>(.+?)</blockquote>#mik
前処理
s#<title.+?/title>##ik
s#<h1>(.+?)</h1>#<title>$1</title>#ik
//s#\n<a href.+?(?:\n)##igk
これでdat化出来ますが、dat化直後に「一行が長すぎるか〜」エラーが出るです。
対処するために前処理3番目をつけたら「fatal error」と出たりhtmltodat自体が落ちたりするのでコメントアウトしたです
このエラーが自分の環境でだけ起こるかどうかわかりませんが
汎用的(?)に発生するならまあそういうエラーが起こるという事で。
- 474 :名無しさん@停滞中 ★:10/04/17 14:16:14 ID:???
- >>473
fatal error 又はhtmltodat自体が落ちる件 自分の環境でだけなのかもしれないですね。
自分とこでは再起動したりしてやってみても同じ結果でしたが。
あとtypo
s#\n<a href.+?(?:\n)##igk
↓
s#\n<a href.+?(?=\n)##igk
それと
http://pc12.2ch.net/test/read.cgi/software/1271203705/12
http://society6.2ch.net/test/read.cgi/gline/1165245437/662
自分とこだと、例えば誰かの検索したスレッドURLがタイムリーに出るようにしてありますが
んもう検索結果がやたら大量なので(少ない時でも5秒に1度くらい?)
もはや全然気にする事はないんじゃないかと。
自分が検索したスレッドURLで嗜好がバレる云々とかそういうのも
考え過ぎなのではないかと思うです (てか自分が考え過ぎか?)
検索結果のURLもすぐ流れてしまいますし。
そういう事ではないのかな?
違っていたとしても別にどうでもいいんですが。
- 475 :名無しさん@停滞中 ★:10/04/17 16:18:31 ID:???
- >>473
それだけではなく
ソースの「<h2>2ch過去ログカテゴリ</h2>」から始まる行もネックみたい。
700強ある板名とリンクが改行なしで並んでいるみたいなので。
- 476 :名無しさん@停滞中 ★:10/04/17 16:25:31 ID:???
- http://bbs.yaroze.jp/tantanyakisoba/
http://bbs.yaroze.jp/ye/read.cgi/costco/1092143769/13
http://www.yaroze.jp/i18n/
掲示板下部に
> 0ch BBS 2007-01-24改UTF8(2008-02-02)
とありますが、ソースを見たら自分とこのとは別物みたい。
例えば「Charset="UTF-8"」のUTF-8が小文字になっていたり
その他細かい箇所でも色々と。
ところで
http://yy14.kakiko.com/test/read.cgi/mirror/1014655362/862-871n
ごめんなさいごめんなさい
もう一年経つですか
- 477 :名無しさん@停滞中 ★:10/04/18 13:16:09 ID:???
- メモ
■■速報自動保管庫■■
http://sag.uzo.in/
- 478 : ◆/vmukiyuzw :10/04/19 03:35:13 ID:ZXTymH+7
- >>473
レスデータの前でなく後ににガラガラが付いているので、dat変換は成功するのに
その後ろを変換しに行ってエラーになってるようですね。
とりあえず前処理の3つめを
s#\| <a href.+?</a>##igk
としてやるとエラーは取れるようです。
あと「fatal error」はBREGEXP.DLLが出してるエラーで
まずい(どういうのがと言われると困ってしまうのですが)正規表現を書いてしまうと
割と簡単に出てしまいます。
いったん出てしまうとメモリの状態がおかしくなっている可能性が高いので、
続けて使うとhtmltodatが落ちてしまうのもそれが原因です。
これは現状、正規表現の解析・実行をBREGEXP.DLLに投げっぱなしにしている以上
どうしようもない仕様と言わざるを得ないところです。まことに申し訳ないのですが
そういうもんだと割り切って使っていただくしかないです。
- 479 :名無しさん@停滞中 ★:10/04/19 18:23:00 ID:???
- >>478
ありがとうございます。
という事は、>>475で引っ掛かっていたのですね。
他の行は削らなくても良かったのでしたか。
とりあえず、「| <a href」だと本文中にもありそうなので
s#\| <a href="/kakolog/.+?</a>##igk
とやったら何とかなったのかもです
という事で「その80」〜「その82」まで追加
JavaScriptでのミラー変換速度はまだまだ大丈夫そう
- 480 :名無しさん@停滞中 ★:10/04/19 18:47:41 ID:???
- メモ
よくまとめてあるなーと
実況ニューサロ: 実況板過去ログを効果的に漁る方法
http://jikkyonews.blog109.fc2.com/blog-entry-81.html
- 481 :名無しさん@停滞中 ★:10/04/20 17:48:07 ID:???
- 2ちゃんねる一発検索
http://2ch.webcross01.com/
- 482 :名無しさん@停滞中 ★:10/04/20 18:31:50 ID:???
- 2chニュースポータル
http://2chtimes.com/
http://2chtimes.com/th.php?sv=society6.2ch.net&b=gline&dat=1165245437
http://2chtimes.com/th.php?sv=tsushima.2ch.net&b=newsplus&dat=1271720084
上ですが
http://tsushima.2ch.net/test/read.cgi/newsplus/1271720084/
がdat落ちしても読み込めたらどんなにか面白い事でしょうか。
ちなみにこのhtmlソース、本文とポップアップするものが全く同一になってるっぽくて
dat化が少し厄介そうな気がするです
- 483 :名無しさん@停滞中 ★:10/04/20 19:02:16 ID:???
- 一応やりかけ
2chニュースポータル(http://2chtimes.com/)のdat化について
URL例
http://2chtimes.com/th.php?sv=tsushima.2ch.net&b=newsplus&dat=1271720084
http://mirror.sarashi.com/htmltodat/1271720084.html
正規表現(長いので2行に分けて)
m#<span class="ch2_thread_count">([0-9]+)</span>&n?bsp;<span class="ch2_thread_name">()(.+?)</sp
an>&n?bsp;<span class="ch2_thread_datetime">(.+?)</span><div class="ch2_thread_body">(.+?)</div>#mik
前処理
s#<script[\S\s]+?/script>##igk
s#<div id="pop[\S\s]+?</div>\s+</div>##igk
s#(span class="ch2_thread_name">.*?)(◆.+?)(?:(@.+?))?(</span>)#$1</b>$2<b>$3$4#igk
スレッドタイトルとメール欄がないですが
一応、上で出したURL例のものだとこれでdat化出来るです。
ただし、下のはレス 14-17 の間 と レス 30-36 の間が飛んでしまいます
ちょっと今体調不良につき よく考えられなんだ
http://2chtimes.com/th.php?sv=society6.2ch.net&b=gline&dat=1165245437
- 484 :名無しさん@停滞中 ★:10/04/21 08:20:24 ID:???
- 駄目でしたか
いえ別にいいんです
引っ掛かったままだと気持ち悪いので
メモしとくです
とりあえず2chニュースポータル(http://2chtimes.com/)のdat化について
URL例
http://2chtimes.com/th.php?sv=society6.2ch.net&b=gline&dat=1165245437
http://mirror.sarashi.com/htmltodat/2chtimes/1165245437.html
正規表現
m#<span class="ch2_thread_count">([0-9]+)</span>&n?bsp;<span class="ch2_thread_name">()(.+?)</spa
n>&n?bsp;<span class="ch2_thread_datetime">(.+?)</span><div class="ch2_thread_body">(.+?)</div>#mik
前処理
s#<div id="pop.+?>\s+\[レス番が見当たりません\]</div>##igk
s#<div id="pop[\S\s]+?</div>\s+</div>##igk
s#(span class="ch2_thread_name">.*?)(◆.+?)(?:(@.+?))?(</span>)#$1</b>$2<b>$3$4#igk
- 485 :名無しさん@停滞中 ★:10/04/21 19:11:11 ID:???
- メモ
2chビューアーD(http://2ch.uda2.com/)のdat化について
URL例
http://2ch.uda2.com/society6-gline/1165245437/
正規表現
m#<dt.+?><a name=".+?"></a>([0-9]+) <span>(.+?)</span>(.*?)((?:\d{2}|\d{4})/\d+/.+?)</dt><dd>(.+?)</dd>#mik
前処理
s#\n<tr>.+?</tr>##igk
s#<script[\S\s]+?/script>##igk
s#<title.+?/title>##ik
s#<h5>(.+?)\(\d+\)<span>#<title>$1</title>#ik
s#\n<a href="http://2ch.uda2.com.+?>.+?</a><br/>##igk
変換結果式
$2<>$3<>$4<>$5<> (←メール欄逆転)
「透明あぼーんを補う」にチェック
モノによってはメール欄と日付の切り分けがうまくいかないかも。
エイプリルフール仕様の日付なんかあったらひとたまりもありません
- 486 :名無しさん@停滞中 ★:10/04/21 19:24:28 ID:???
- >>485補足
>>385-386でも触れた所ですが
その時は確かdat落ち後は読めなかったような記憶があるです。
で、久しぶりに巡回してみたら
> 各表示はキャッシュされて表示されますのでDAT落ちしたスレッドが読めるかもしれませんが
> 速報系の掲示板は苦手です(板一覧:週一、スレッド一覧:1時間、スレッド内容:15分)
とありましたので。
あと下のとか。
http://uda2.com/blog/tag/2ch/
http://uda2.com/blog/2010/01/%E3%82%B3%E3%83%B3%E3%83%86%E3%83%B3%E3%83%84%E3%81%AE%E8%A6%8B%E7%9B%B4%E3%81%97/
現在、CORE SERVER(CORE-A)を使っておられるとの事なので
15GBまでデータ蓄積出来るみたい↓
http://www.coreserver.jp/?ref=uda2
- 487 :名無しさん@停滞中 ★:10/04/21 19:53:15 ID:???
- >>485
後処理を転記し忘れたです
後処理
s#<br />#<br>#igk
s#((?:^|\n).*?)(◆.+?)(?:(@.+?))?<>#$1</b>$2<b>$3<>#igk
- 488 :名無しさん@停滞中 ★:10/04/24 17:35:13 ID:???
- メモ
【Python Django】で2ch検索 - オラオラ検索
http://pc11.2ch.net/test/read.cgi/php/1202196045/
- 489 :名無しさん@停滞中 ★:10/04/24 19:17:58 ID:???
- 実況ニューサロ: いつでも過去ログが見れる「2chログキャッシュ」を作りました
http://jikkyonews.blog109.fc2.com/blog-entry-13.html
実況ニュースサロン 2chログキャッシュ01
http://yy54.60.kg/newsalog01/
実況ニュースサロン 2chログキャッシュ02
http://yy55.60.kg/newsalog02/
chohnanの日記
http://d.hatena.ne.jp/chohnan/
- 490 :名無しさん@停滞中 ★:10/04/24 19:19:36 ID:???
- [を]2ちゃんねるキャッシュ検索
http://chalow.net/2007-03-28-1.html
- 491 :名無しさん@停滞中 ★:10/04/29 21:33:01 ID:???
- ぴーちゃんねる
http://pchannel.net/
http://banba.jp/
採り上げているスレッドの量が物凄いんですが
自動でやっているのか手動なのか気になるです
完全自動だったら各レスの色分けとか画像取得置き換えの問題をクリアされてるんでしょうし
半手動だとしても毎日毎日の量が半端ではない数な感じがしますし。
- 492 :名無しさん@停滞中 ★:10/04/29 21:44:01 ID:???
- よくわからないですが
これ↓も同じページが表示されるです
http://suzuke.jp/
http://218.219.148.59/
- 493 :名無しさん@停滞中 ★:10/04/30 19:01:02 ID:???
- >>435>>469の方ですが
GoogleChromeアドオンでもやっちゃってくれてますね。
http://fatalita.sakura.ne.jp/Download/g2chDat/
自分とこのリンクがどこにも見当たらないです。
いっそ、「url.html」を別の名前にしてみるのも一興ですな。
まあ>>470のサイトやJaneの外部コマンド登録とかしてる人に影響あるでしょうけど。
こういう事やるならやるで
下のとか dat落ち後も読めるようにして頂けないですかね。
2chセンブラーONLINE(ββ)
http://fatalita.sakura.ne.jp/CGI/2ch/index.html
保存容量云々とかいうなら
cron使って一週間だけ保持しとくとか出来るでしょうに。
(というか さくらインターネットってデフォルトでcron使えるんですかね?)
FireFoxやChromeのアドオン拵えられるスキルがあるなら簡単でしょう。
[改行]
・・・代弁してくれてる方がいらっしゃいました。ありがとうございます
選択したテキストを指定したURLに渡すアドオンについて - SASAMI STREET
http://d.hatena.ne.jp/sasamistreet/20100317/nankazurui
(続)選択したテキストを指定したURLに渡すアドオンについて - SASAMI STREET
http://d.hatena.ne.jp/sasamistreet/20100430/renankazurui
- 494 :名無しさん@停滞中 ★:10/05/01 17:51:52 ID:???
- まだ断定は出来ないですけど
どうもコピペした際に、ブラウザによっては半角スペースが付く場合があるみたい。
http://yy14.kakiko.com/test/read.cgi/mirror/1014655362/876
上のURLなんですが、自分の環境だと
コピペしてみるとIEとFirefoxで違う結果を出してしまうみたい。
正規表現をコピペすると、IEではなんでもないんですが
Firefoxでコピペしたものだとマッチしなくなるです。
調べてみると、「\[(.*?) \]」のように
「\]」の前に半角スペースがついてしまうようで。
IE6でコピペ
m#<dt.*?>([0-9]+) :<span.*?>(?:<b>)?(.+?)(?:</b>)?</span>\[(.*?)\]:(.+?)</dt><dd.*?> ?(.+?)(?:<script|</dd>)#mik
Firefox3.0.6でコピペ
m#<dt.*?>([0-9]+) :<span.*?>(?:<b>)?(.+?)(?:</b>)?</span>\[(.*?) \]:(.+?)</dt><dd.*?> ?(.+?)(?:<script|</dd>)#mik
自分の環境だと、再起動してやってみても同じ結果でした。
問題はこれが自分とこだけの事なのかどうか。
検索しても同様の症状が出てこないので心配になるです
- 495 :名無しさん@停滞中 ★:10/05/02 18:52:07 ID:???
- imona.netさん
いつの間にかweb読みを復活されたのですか
http://imona.net/dat.pl/r/society6.2ch.net/test/read.cgi/gline/1165245437/
- 496 :名無しさん@停滞中 ★:10/05/04 14:33:59 ID:???
- >>327でやってたものをメニューに追加してみたです
0chスクリプトQRコード化
http://www7.atpages.jp/mirrorhenkan0/qr0ch/
半年以上前にやってそれっきりだったので
どこをどうしたとかすっかり記憶の彼方ですが
成果物を出しといたほうがいいよなと
- 497 :名無しさん@停滞中 ★:10/05/04 17:45:59 ID:???
- とやってからソース見てみたら
何とも効率の良くない事やってるなーと。
あとデータ渡しにQuery_String使ってるっぽいので
ブラウザによっては表示出来なくなっているかも。
またPerl思い出すの厄介だなぁ・・
- 498 :名無しさん@停滞中 ★:10/05/06 22:49:51 ID:???
- メモ
HikkyWeb 2chブラウザ Version(1.9.2)
http://www.hikkyweb.jp/
http://www.hikkyweb.jp/GetThreadDAT.aspx?URL=http://yutori7.2ch.net/news4vip/&DAT=1273048934.dat
上ですが
http://yutori7.2ch.net/test/read.cgi/news4vip/1273048934/
がdat落ちしても閲覧出来たら
どんなにか嬉しい事でしょうか。
- 499 :名無しさん@停滞中 ★:10/05/15 09:05:32 ID:???
- http://pc12.2ch.net/test/read.cgi/software/1267177119/830
> ・Threadic掲示板関連の修正(スレの取得をofflaw.cgiに変更など)
offlaw.cgiよりもdatread.cgiを読み込んだほうがいいのではと思ったですけど
もしかしたらofflaw.cgiで出ているレス番をキーにしているのかなと思ったですが
所詮素人考えなので以下略
offlaw.cgi
http://threadic.com/thread/bbs/offlaw.cgi/bugreport/1273812769/
datread.cgi
http://threadic.com/thread/bbs/datread.cgi/bugreport/1273812769/
ところでthreadic.comの管理人さんもtwitter始めておられたですね。
プロフィールの現在地を見てあれれどういう方なのかなと思ったり。
http://twitter.com/miyako2_engine/
- 500 :koreawatcher ◆Nida.eneRA :10/05/15 18:14:15 ID:PgRxx5jJ
- >>499
datread.cgiの存在をどこで知りました?
offlaw.cgiに関しては、offlaw.cgiを作ってくれというメール(モデルはまちBBS)
をThreadicの開発陣に送ったからなんですが、datread.cgiに関しては初耳です。
ThreadicのCGIの最大の問題点は透明あぼーんの扱いで、offlaw.cgiでは
例えば2があぼーんされていれば1の次が3になっていますが、datread.cgiでは
2があった痕跡すらありません。
スレ一覧やレスの表示でこれらの矛盾が放置されたままになっています。
500KB
続きを読む
掲示板に戻る 全部 前100 次100 最新50