楽天モバイル[UNLIMITが今なら1円]
ECナビでポインと Yahoo 楽天
LINEがデータ消費ゼロで月額500円〜!
無料ホームページ 無料のクレジットカード 海外格安航空券 解約手数料0円【あしたでんき】
海外旅行保険が無料! 海外ホテル
■掲示板に戻る■ 全部 1- 101- 201- 301- 401- 501- 601- 701- 801- 最新50
メモ2
- 1 :名無しさん@勉強中 ★:06/09/16 19:36:34 ID:???
- これまた思いついた事など
- 154 :名無しさん@勉強中 ★:06/11/25 16:08:41 ID:???
- >>152-153
> 保管しているdatですが、いまのところ削除とかは考えてないです。
御返事ありがとうございます。
変換スクリプトに追加してみてもいいですか?
http://www.geocities.jp/mirrorhenkan/ なのですが。
ところで
http://com-nika.osask.jp/bbs/
の下部
> 2ちゃんねる専用ブラウザについて
> 今現在対応しておりません。
ですが、subject.txtを生成すれば対応出来るのではないかと思うですが。
上の
http://com-nika.osask.jp/news4vip/dat/1163222472.dat
だと
http://com-nika.osask.jp/news4vip/subject.txt
があればいいのかなと。
news4vip/のディレクトリに
news4vip/dat/以下にあるdatから生成するスクリプトを置けば
釈迦に説法ですが
そういうスクリプトも出してる方も居られるです
perlだと
http://shutdown.jp/index.php?script%2F2ch#content_1_2
PHPだと(って自分とこですが)
http://user.ftth100.net/mirrorhenkan/javascript/readdir.phps
で、subject.txtを生成しておけば
専用ブラウザ対応になると思うです。
クッキー・・・勉強しようにもとっかかりがない・・。
- 155 :名無しさん@勉強中 ★:06/11/25 16:14:55 ID:???
- メモ
2chSpider
http://www.ne.jp/asahi/p2p2ch/spider/
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
指定した板のミラーを作成できる簡易2ちゃんねるブラウザです。
所得したsubject.txt、datファイルを公開出来る形で保存出来ます。
ログの公開にはWebサーバを別途準備する必要があります
・2ちゃんねる、及び2ちゃん型掲示板の巡回(ROM専用)
・差分取り込み対応
・板一覧URL複数指定可(100個まで)
・HTML自動生成
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
すごい。
これと同じようなものってwshでも出来るかな。
dat2htmlとdat2subjectは以前作ったものがありますし。
まあスクリーンショットを見ると
専用ブラウザも兼ねているみたいなのでそこまでは無理そうですが。
http://www.ne.jp/asahi/p2p2ch/spider/gamen1.gif
- 156 :名無しさん@勉強中 ★:06/11/25 17:49:24 ID:???
- ふと思ったですけど
倉庫の分散しているsubject.txtを一つに結合して
ピタハハさんのgetlogのようなソフトを作って
●を持っている人に頼んで
dat落ちしたdatを一括DLしてもらう とか
やろうと思えば出来そうですね。
別に法には触れないですし。
ピタハハさんのソフト、ソースも同梱されておられるので
どなたかチャレンジして頂けると嬉しいかも。
- 157 :名無しさん@勉強中 ★:06/11/25 18:32:31 ID:???
- 狼板より
http://ex11.2ch.net/test/read.cgi/morningcoffee/1164165217/
http://user.ftth100.net/mirrorhenkan/morningcoffee2/read.php/1164165217/
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
18 :名無し募集中。。。:2006/11/22(水) 13:31:28.41 0
●買ってやるから過去ログ検索(スレタイ/URL)を作って欲しい
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
スレタイ/URLでの過去ログ検索なら何とかできそうです
「●のパス教えて」みたいな無理は言いませんので
ぜひ協力して頂けると嬉しいですけど
ってもうdat落ちしてますか。
で
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
20 :名無し募集中。。。:2006/11/22(水) 13:40:58.39 O
2ch全体じゃなくて狼だけだったら俺が作るかもしれない
22 :名無し募集中。。。:2006/11/22(水) 14:23:12.22 0
>>20
勇者よ頼んだぞ
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
本気だったらいいな と。
- 158 :名無しさん@勉強中 ★:06/11/25 20:12:17 ID:???
- メモ
2ch Ajax Browser
http://www.tagajo.tv/2ch/
これ、かなり前に見た
http://xfujdkqv.japan.webmatrixhosting.net/DatBrowser/
と関係あるのでしょうか。
ちなみにwebmatrixhosting.netさん
私も入ってたですけど
もうやめられたそうです
- 159 :名無しさん@勉強中 ★:06/11/25 20:42:33 ID:???
- >>156
わからないなりにmain.pasのソースを見てるんですけど
http://kage.monazilla.org/system_DOLIB100.htmlと突き合わせると
やっておられる事とか何となくわかる感じです
makimo.toさんの休止前に
Delphi過去スレを集めてみようかな
- 160 : ◆nika/si95E :06/11/26 00:15:48 ID:Av4YbIIB
- >>154
dat保管は掲示板のおまけ的な機能ですので、
専用ブラウザはhttp://com-nika.osask.jp/bbs/subject.txtに
存在するスレッド以外に対応させるつもりはないです。
変換スクリプトと言うかこれ自体が専用ブラウザみたいなものですが、
よければスクリプトとして追加してもいいです。
- 161 :名無しさん@勉強中 ★:06/11/26 11:15:31 ID:???
- >>160
ありがとうございます
追加させて頂きますです
- 162 :名無しさん@勉強中 ★:06/11/26 11:59:00 ID:???
- メモ
subject.txtの一行を
2ch形式のURLに変更
s#([0-9]+)\.dat<>.+#http://server.2ch.net/test/read.cgi/board/$1/#ig
w test.txt
- 163 :名無しさん@勉強中 ★:06/11/26 12:07:13 ID:???
- あと
getlogのmain.pas236-237行目
dat2html(DAT, HTML);
HTML.SaveToFile(IncludeTrailingBackslash(folder_dir) + thnum + '.html');
この2行をコメントアウトすれば
htmlを作らなくなるのかなと
- 164 :名無しさん@勉強中 ★:06/11/26 12:26:10 ID:???
- または
http://user.ftth100.net/mirrorhenkan/wsh/read.php/1009175619/528n
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
528 117(WSH見習いの3倍) [ 02/02/27 15:38 ]
指定したフォルダのサブフォルダにReleaseフォルダ、Debugフォルダが存在するとき、
その中のファイルで拡張子が exe、dll以外のものを削除してくれます。
めっちゃ便利なんだけど需要ないかも。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
VBScriptではなくJScriptなので、拡張子「js」で保存するみたい
これを少し書き換えて
指定したフォルダ内を検索して、拡張子.dat以外のものを削除するような
ものを作れば、ハックしないでいいかも。
- 165 :名無しさん@勉強中 ★:06/11/26 19:32:16 ID:???
- 迷走し始めた時は
過去でも振り返ってみようかと
2ch閉鎖の危機なんだと
http://cocoa.2ch.net/unix/kako/998/998695422.html
http://fun.poosan.net/mirrorhenkan/2chscript/read.php/998695422/
久しぶりに読み返してみたら面白い面白い。
5から>>108で紹介したPerler ◆GSi39OA6 さんが出ておられます。
こういう経緯があって>>108のスレッドがあった訳なのかと。
「dat落ちして見られないからミラーを作る」のではなく
「2chのサーバ負荷を分散させる為にミラーを作る」という
発想、というか出発点が全く違う。
- 166 :名無しさん@勉強中 ★:06/11/26 19:37:32 ID:???
- それにしても色んな所で何度も紹介されているスレッドですが
やはり何というか全く凄い。
度重なる悪戯書き込みにも関わらず
粛々と作業が進行していくさまは もう何というか。
で、転送量がもう爆発的に縮小される と。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
466 :369 ◆3XTuRnAc :2001/08/25(土) 23:30 ID:
とりあえず、read5.cで手動で試してみたところ、問題の転送量に関しては
32483 Aug 25 23:30 998695422.html
2261 Aug 25 22:58 998695422.html.gz
てかんじ。すげー、1/16・・・。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
- 167 :名無しさん@勉強中 ★:06/11/26 22:08:13 ID:???
- メモ
○ADO Streamオブジェクトを使ってみる
2001年 10月 14日 19時 35分 39秒
http://www.roy.hi-ho.ne.jp/mutaguchi/bbs/list48.shtml
- 168 :名無しさん@勉強中 ★:06/11/26 22:35:20 ID:???
- さて
板の過去ログ倉庫のsubject.txtを頼りに
存在するdat落ちしたdat(変な表現)を
丸ごとローカル保存する方法を考えたですが
●がないので試せない・・。
使うもの
・getlog(http://pita.paffy.ac/top/getlog.lzh)
・htmltodat(http://mukiyu.hp.infoseek.co.jp/)
・Div(http://www.vector.co.jp/soft/win95/util/se088352.html)
・>>97で作ったwsh
・>>164を参考に作ったwsh
●と上記のものがあれば
だいたい1000datづつ取得出来る・・と思う。
getlogのURL貼りつけがそれ以上だと何か変になるので。
書くのは厄介です・・。
板の全datをDLしておられる人というと
バイク板のピタハハさんと
http://ex13.2ch.net/test/read.cgi/gline/1118753283/454
の格闘技板の方とか居られるですが
やはり人力ではなくて 半自動的な方法をとられたのでしょうね。
- 169 :名無しさん@勉強中 ★:06/11/27 00:29:07 ID:???
- http://ex13.2ch.net/test/read.cgi/gline/1118753283/942-947n
945-946はどこの誤爆なんじゃいオラオラオラ
ってー件はおいといてですな
ループし続けるスクリプトを スマートに終了させる方法として
とりあえず3つほど思いついたのでメモしとくです
(1) 最初にループ回数を入力するダイアログを出し
その回数だけループしたら終了する
(2) ループ直前に
「5秒後に開始します やめる場合は[いいえ]をクリックして下さい」
というダイアログを出す
(3) 別にstop.vbsを作り、それを実行したら終了させるようにする
/*
それにしても どこの誤爆だったのだろうか。。
*/
- 170 :名無しさん@勉強中 ★:06/11/27 00:38:37 ID:???
- 煩わしいとかいう点はおいといて
(2)は実装出来たです。
(1)ですが、逆に無限にループさせたい場合は
どうすればいいのでしょう。
回数入力で「10000」とか入力すればいいのでしょうけど
別の方法とか ないかな。
ただ、上の二つの方法のどちらも
一巡した次のループ箇所でしか効かないので
「今この場で止めたい」場合には使えないです。
- 171 :名無しさん@勉強中 ★:06/11/27 00:44:48 ID:???
- という事で、(3)かなと。
考えられる方法としては
何かフラグになるファイルを指定しておいて
そのファイルに働きかける事で終了させるようにする とか。
例えばsubject.txtを削除すればreadfile出来ないので
ループを抜けて終了ダイアログを出すとか。
そんな感じでしょうか。
- 172 : ◆/vmukiyuzw :06/11/27 01:09:42 ID:9NL6xccS
- UNIXでのdaemonスクリプトなんて大抵無限ループなんで
別に気にする必要ないじゃねーのと思うのは私だけかな
- 173 :名無しさん@勉強中 ★:06/11/27 19:19:46 ID:???
- >>172
ですよね
ですよね
まあ何とかなりそうなので
そのうちやってみますか。
それと
検索で引っかかったですけど
http://pc8.2ch.net/test/read.cgi/win/1152843217/818
あたしゃ
Meよりも古い機種使ってるんですけど
- 174 :名無しさん@勉強中 ★:06/11/27 19:21:41 ID:???
- さて
思い立ったら吉日という事で
とりあえず初心者スレをまとめたです
http://user.ftth100.net/mirrorhenkan/delphi/
http://user.ftth100.net/mirrorhenkan/ruby/
今はまださっぱりわからんですけど
そのうち理解出来るに違いない・・と思っておこう。
JavaScriptもPHPもPERLもWSHも まとめた当初は訳わからなかったですし。
それにしても
過去ログを探しても
下記3つは本家に見当たらない感じです
09:http://pc5.2ch.net/test/read.cgi/tech/1071294733/
10:http://pc5.2ch.net/test/read.cgi/tech/1074523803/
11:http://pc5.2ch.net/test/read.cgi/tech/1076609666/
サーバ移転してるかも と色々見てみたですけど
どうもうまくいかない。
makimo.toさんの所もみみずんさんの所にも存在していない。
という事で
dumper.jpさん、ありがとうございます。
- 175 :名無しさん@勉強中 ★:06/11/27 19:39:29 ID:???
- それと
dumper.jpさんの所
様変わりしているです
http://2ch.dumper.jp/0001382261/
htmltodatの正規表現はそのままで変換出来るのですが
タイトルにつく言葉が
「dumper.jp」から「2ちゃんねるみらー」に変わっているです。
なので
> s#(<title.*?) - DUMPER.JP(</title>)#$1$2#
を
> s#(<title.*?) - 2ちゃんねるみらー(</title>)#$1$2#
に変えるとマッチしない。なんでだ・・。。
仕方ないので
> s#(<title.*?) - 2.+?(</title>)#$1$2#
とやったらマッチしたです。
でも何で
最初のだと駄目なのでしょうか。
- 176 : ◆/vmukiyuzw :06/11/27 23:53:41 ID:9NL6xccS
- >>175
ちょっとサポート向けの問題を含んでいるので
htmltodatサポ板のほうでレスさせていただきました。
http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/353
- 177 :名無しさん@勉強中 ★:06/11/28 18:24:19 ID:???
- >>176
レスありがとうです
勉強になりますです
すごいや兄さんです
ドロンジョの言葉を借りると
「ながれいしだね さすがだね」です
それにしても
調べれば調べるほど わからない事が増えていきます。
「うんうんわかるわかる」と思いながら進んでゆくと
すぐ ここはどこ私は誰状態になってしまうです。
タイムボカン風にいえば
「あっという間に知らない世界」です
- 178 :名無しさん@勉強中 ★:06/11/28 18:38:38 ID:???
- いや、ほんとに勉強になりました。
kオプションとか こういう事が無ければ一生知らなかったでしょう。
ただ惜しむらくは
実生活に役立つような生活をしてない事で
今までやってきているどれもこれも
何ら 実生活に寄与していないなあ と。
というような考え方は
あまりにも功利主義的かつ軽佻浮薄だなあ
- 179 :名無しさん@勉強中 ★:06/11/28 18:57:51 ID:???
- さて
あちこちに にくちゃんねる休止スレが立ってますが
その中の一つ
ダウンロード板より
「にくちゃんねる」休止のおしらせ
http://tmp6.2ch.net/test/read.cgi/download/1164164363/l50
流石ダウンロード板(って何が流石なのか)
とはいえ
●でも実況スレが見れないという書き込みが多いのは何故なのか
−−−−−−−−−−−−−−−−−−−−−−−−−−−
17 :[名無し]さん(bin+cue).rar:2006/11/22(水) 14:02:15 ID:bBQXvDIL0
>>7ではああいったけど
●は実況系の過去ログ見れないから正直なくなると不便です
57 :[名無し]さん(bin+cue).rar:2006/11/23(木) 08:59:47 ID:qtCSI0pU0
マジでなんとかしろよ
●買えってレベルじゃ…
実況スレ見れねーし
128 :[名無し]さん(bin+cue).rar:2006/11/26(日) 16:03:43 ID:dt77QoPt0
にくちゃんねるないと困る・・・
特に実況
129 :[名無し]さん(bin+cue).rar:2006/11/26(日) 16:36:32 ID:GIjeUJ5U0
なんでそんなに実況が見たいの?
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
あと
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
81 :[名無し]さん(bin+cue).rar:2006/11/24(金) 03:24:16 ID:AXijsvC50
>75
だが、にくちゃんの変換用正規表現が良く分らんので困る
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
dat化しようとしてるのかな
- 180 :名無しさん@勉強中 ★:06/11/28 19:07:39 ID:???
- 自分とこも出てますがそれはおいといて
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
38 :[名無し]さん(bin+cue).rar:2006/11/22(水) 20:16:18 ID:NL9sAICj0
誰かにくちゃんの全データをコピーしたHDDをnyに流してくれ
70 :[名無し]さん(bin+cue).rar:2006/11/23(木) 19:42:27 ID:GmF3wrqh0
洒落かnyでダウンロード板のJaneで使えるログ
流してくださいお願いします。
91 :[名無し]さん(bin+cue).rar:2006/11/24(金) 11:48:42 ID:GiDgZZtC0
ダウソ板だけで結構なのでJaneで使える過去ログをnyか洒落に放流してください
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
流石ダウンロード板
- 181 :名無しさん@勉強中 ★:06/11/28 19:18:29 ID:???
- で
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
140 :[名無し]さん(bin+cue).rar:2006/11/27(月) 17:56:42 ID:67uYNAUkO
にくちゃんねるのログをまとめて一気に保存する良い方法ないですか?ダウンロードソフトを使ってもうまく落とせません
141 :[名無し]さん(bin+cue).rar:2006/11/27(月) 17:58:20 ID:yKv4SAJu0
そーゆーことするから回線パンクすんじゃねーの
145 :[名無し]さん(bin+cue).rar:2006/11/27(月) 23:56:31 ID:jHWPqKqB0
にくちゃんねるのログをぶっこ抜くのってどうすればいいの?
146 :[名無し]さん(bin+cue).rar:2006/11/28(火) 00:49:13 ID:JuPlfqp60
ぶっこ抜くとか言う奴ってネトラン厨っぽくて厭
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
やらないけど
ちょっと考えてみたです。
過去ログ墓場をJavaScriptオンで開いて
http://makimo.to/2ch/tmp6_download/index.html
適当なスレを選んで
http://makimo.to/2ch/tmp6_download/1164/1164624670.html --(1)
それの右上にあるdatのURL
http://makimo.to/cgi-bin/html2dat/html2dat.cgi?tmp6_download/1164/1164624670.html --(2)
この(1)と(2)のURLの相違点を調べて
正規表現か何かでdatURLに一括変換して
(2)なら保存名を「1164624670.dat」にするように設定して
あとは適当に保存すればいいかなと。
個別に保存名を変えるのはwshならわかるですけど
他のツールだと どうやるんだろうなー。
- 182 :名無しさん@勉強中 ★:06/11/29 06:02:52 ID:???
- −−−−−−−−−−−−−−−−−−−−−−−−−−−−
[1004] (無題) 投稿者:ぴ 投稿日:2006/11/28(Tue) 21:50
(中略)
>>1002-1003
削除というよりは「見えなくなる」と言うほうが適切かもしれません。
今のうちに必要分を落としておくしかないと思います。
休止後にアクセスがあった場合は以下のような感じで他サイトへ誘導するようになります。
●があれば大半は読めると思います。
http://makimo.to/cgi-bin/ffind/ffind2.cgi?news20_news/1164/1164162822.html
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
うむ
やはりもう少し考えてみようかな
- 183 :名無しさん@勉強中 ★:06/11/29 07:32:34 ID:???
- メモ
・ダイアログから板URL入力(例http://ex13.2ch.net/gline/)
↓
・サーバ名・板名抽出(ex13・gline)
makimo.toURL変換(http://makimo.to/2ch/ex13_gline/index.html)
↓
・http://makimo.to/2ch/ex13_gline/index.htmlをダウンロード
↓
・一行づつ読み込む
正規表現によるマッチング−−−−−−−−--(1)
マッチしたらURLを組み立ててダウンロード
以下最終行まで繰り返し
※(1)
・datキーの場合→半角数字9or10文字のマッチング→「\d{9,10}」とか
・タイトルの場合→まんまやないけ
- 184 :名無しさん@勉強中 ★:06/11/29 08:59:41 ID:???
- 考えたら
板のdatを全取得するwshとか出してみても
それほど反応は無かったので
makimo.toさんの所からdatを取得するwshを出しても
そう反応も無いだろうなと。
「何仕込んであるかわかんねーし怖くて使えねー」
という人とか多いでしょうし。
- 185 :名無しさん@勉強中 ★:06/11/29 17:54:13 ID:???
- はい出来たですよ
http://www.geocities.jp/mirrorhenkan/others/makimotoforever/makimoto_datget.zip
説明のindexもつけて
後で書いときますかね
- 186 :名無しさん@勉強中 ★:06/11/29 18:08:12 ID:???
- さて
どうしようか
避難所に書いて
mirrorhenkanのindexにつけて
あとはどうしたものか。
>>179のスレにも書こうかな
でも「ウイルス」とか言われても何ですし
うーむ
- 187 :名無しさん@勉強中 ★:06/11/29 19:46:01 ID:???
- はい完成
http://www.geocities.jp/mirrorhenkan/others/makimotoforever/
作ってから気付いたですけど
datキー9桁の場合 うまくいかんかもです
一応正規表現でつけたつもりですけど
実際に試してないもんで
- 188 :名無しさん@勉強中 ★:06/11/29 19:57:07 ID:???
- http://jbbs.livedoor.jp/bbs/read.cgi/computer/21256/1116159529/l50
>>992
参考にさせて頂くです
ただ つくづく思うですけど
「こんな事出来ないですか」とか書いてあって
こうやったら出来るよ とか書いても
無反応なのは なんだかなあ
もう慣れたですけど。
あと私 動けばいいと思ってるので
「きたねーソースだなー」とか言われても
やはり なんだかなあと。
まあそれだけの話なんですが
>>993
私のPCは残容量200メガかそこらだもんで
372メガをDLする再現とか出来んです
ただ news4vip板のブーンスレとか
自分の環境ではエラーもなく丸一日過ごせたもんで
どうしたものでしょうか。
ほんと
新しいPC 欲しいなあ
- 189 :名無しさん@勉強中 ★:06/11/29 20:22:49 ID:???
- 追記
http://makimo.to/2ch/pc8_prog/index.html
の 230件79.8メガで無問題だったですが
- 190 :名無しさん@勉強中 ★:06/11/29 20:44:27 ID:???
- とりあえず
UNIX板とDownload板に書いてみたです
マルチポストと言われればそれまでですが
板だけでも800以上ありますし
サーバ毎に分かれているので
実質 2000〜5000くらい分岐しているのかなと。
makimo.toさんには悪いですが
かなり動員しても さてどんなもんでしょうという感じです
- 191 :名無しさん@勉強中 ★:06/11/30 09:01:16 ID:???
- http://tmp6.2ch.net/test/read.cgi/download/1164164363/174
言い訳じみていますが
(1)「12/31まで」と期限が限られている事
(2)>>182のmakimo.toさんの書き込み
「今のうちに必要分を落としておくしかないと思います」
この2点を勘案して上のスクリプトを出したです。
まあしかしDownload板のほうには書かないほうが良かったかな
あと
http://makimo.to/cgi-bin/bbs/Bbs.cgi
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
1007] 長い間お世話になりました 投稿者:名無しさん 投稿日:2006/11/30(Thu) 00:46
出先や会社などの●を使えない環境から時々使わせていただいていました。
出来る限り負担をかけないようにgeoのhenkanとかは最低限しか利用せずに共存共栄を目指していたのですが残念です。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
> geoのhenkan
どう考えてもここの事だよなあ
しばらく静観
- 192 :名無しさん@勉強中 ★:06/11/30 18:41:07 ID:???
- http://tmp6.2ch.net/test/read.cgi/download/1164164363/176n-
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
176 :[名無し]さん(bin+cue).rar:2006/11/30(木) 14:54:42 ID:q1e8wQ340
>174
大丈夫じゃね?
オレもそれでログ掘ったけどいくつかやって即飽きた。
だって一度に落とせるわけじゃなく一つ終わったら次のURLを指定って
すげーめんどくさいもん。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
複数の板を設定して自動クロール取得とか
改造すれば可能ですハイ
埋もれてますが下のスクリプトと合わせて
改造すれば可能ですハイ
http://www.geocities.jp/mirrorhenkan/others/mirrorserve/
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
177 :[名無し]さん(bin+cue).rar:2006/11/30(木) 15:43:02 ID:AIStFLjH0
>>176
いやお前みたいなのは普通に読んでるのと変わらんからいいんだけどな。
俺みたいにスクリプトで一回設定したらあとは一括で全ダウソとかやるヤツが
増えたらあっという間に破綻するぞ。既に期限付きだしな。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
これだけではわからんのですが
177さんはそういうスクリプトを作って一括DLされたのでしょうか。
makimo.toさんの過去ログ墓場のページを見てみると
一括クロールされないようにという配慮なのか
ソースだけ見てもスレのURLとかわかんないようにされてるみたいですけど。
さてさて
改造は可能なんですが
177さんの仰られる事も御尤もだもんで
どうしたものか。
makimo.toさんの所に過度な迷惑をかけられないですし
かといって
makimo.toさんの所にしか残ってないログも多いでしょうし
うーむ
そういう風にプチハック(カッケー!)したwshを
欲しい人とか居たら連絡下さいです
(↑そんな人誰も居ないだろうとタカをくくっているのかな)
- 193 :名無しさん@勉強中 ★:06/11/30 18:54:27 ID:???
- というか
>>192の176さんが使ってみて
問題なく動いた由
いやー嬉しいなあ
- 194 :名無しさん@勉強中 ★:06/11/30 21:09:07 ID:???
- さて
スレタイ検索とかやるとして
perlやphpのデータベース検索スクリプトとか結構ありますが
例えばnews4vipとかだと
subject.txtだけで150メガとか200メガあるいはもっともっと
という事になる訳ですよ。
レンタルサーバではとてもとてもな状態です。
makimo.toさんのスレタイ検索とかでも
300メガくらいのデータベースを一括検索されておられると
以前お書きになられてましたし。
で データベース板に行ってみたんですが
http://pc8.2ch.net/db/
Mysqlをphpで運用すれば何とかなるのでしょうか。
データベースに100万行とか書けるのでしょうか。
Mysqlを使えるサーバとか結構あるですが 使えるのでしょうか。
というか 私 使えるのでしょうか。
- 195 :名無しさん@勉強中 ★:06/12/01 00:30:40 ID:???
- へたった頭で考えた世迷い言かもですが
>>192の改造したものを出しておいたら
全ログを拾って公開して下さる方とか
もしかしたら 出てこられるかもです
出してみまs
この場合
賛成する人と反対する人
拮抗するんだろうなあ
ほんと どうしようか
- 196 :名無しさん@勉強中 ★:06/12/01 09:55:17 ID:???
- メモ
http://blog.yuhisa.com/2ch_dat.php?ita=operate
よくわかんないんですが
現在進行形の所みたいです
http://blog.yuhisa.com/2ch_dat.php?ita=news4vip&p=43&t=&s=
左上に「DATファイル追加」という項目があるので
datをアップロード出来るみたい。
ルートを辿ってブログを見せて頂くと
7/24の項目に
http://blog.yuhisa.com/archives/2channel.php
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
ついでに今までfopenで行ってた読み込みをfileで行うようにしたので快速に。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
そうなんですか。
fopenよりfileのほうが速いんですか。
fileって一行づつ読み込む関数だったっけかな
file_get_contentsが一括読み込みだったっけかな
あと
http://2se.dyndns.org/
- 197 :名無しさん@勉強中 ★:06/12/01 19:40:23 ID:???
- http://tmp6.2ch.net/test/read.cgi/download/1164164363/194-195n
さあ書くだけは書いた
叩かれるかな
もうどうでもいいけど。
それにしても
態度や口調がコロリと変わりますな
相手によって態度が変わるのはある程度仕方ないですが
私も気をつけなければ。
- 198 :名無しさん@勉強中 ★:06/12/01 19:42:43 ID:???
- と書き込んだ自分の文章を見て
さらに鬱になったりして
- 199 :名無しさん@勉強中 ★:06/12/01 19:49:46 ID:???
- さらにさらに
まだ改造してないもんで
何か反応があればあったら
まいっちんぐマチコ先生だったりして
- 200 :名無しさん@勉強中 ★:06/12/01 20:02:43 ID:???
- さらにさらにさらに
反応が無ければないで
まあそんなもんやね
というか打たれ弱いもんで
煽られるよりは
無反応なほうがよっぽどいいです
- 201 :名無しさん@勉強中:06/12/02 03:45:49 ID:4JoD/kho
- 検索したら出てきたので>>127に返信w
以前(xrea.comから戻る前)までは一定期間datを保持していましたが、容量不足により現在は長時間のdat保管は行っていません。
近日中にdatを分散させる形でdat落ち後のdatを表示する又は、●等に対応させようと思っています。
- 202 :名無しさん@勉強中 ★:06/12/02 08:08:03 ID:???
- >>201さん
御返信ありがとうございます
楽しみにしていますです
さて
makimo.toさんのhtml2dat.cgiが真っ白画面だ・・・。
いろいろ書かれているなあ
でも他に方法は無かったですし
まあ仕方ない
もしこのままの状態だとしたら
htmlをDLするように作り替えて
htmltodatに一括変換させるようにするですかね。
とりあえず
ごめんなさい
- 203 :名無しさん@勉強中 ★:06/12/02 08:23:48 ID:???
- それにしても
後付けオプションだから仕方ないんでしょうけど
何でhtml2cgi.cgi経由なのでしょうか。
みみずんさんやDinoswiftさんのところのように
datを静的にDL出来るようにされておられれば嬉しいのですが。
そもそも どのような形式でログ保存されているのか
教えて頂きたく思うです
古いスレッドのdatとかをDLしても
本家ではカンマ(「,」)区切りになっているのに
makimo.toさんの所では「<>」区切りになっておられますし
2chのdat形式では保存してないのかな
- 204 :名無しさん@勉強中 ★:06/12/02 08:38:55 ID:???
- ずっとこのままだとしたら
方法は2つ
(1)あきらめて静観する
(2)htmlをダウンロードするようにしてdat化する
(1)ですが、のちのち後悔しそうです。
あの時にああしとけば良かったこうしとけば良かったとか
あれこれ思いそう。
となると(2)ですかね。
あと
公開したのを後悔してないですが
縁もゆかりも興味もないDownload板に書いたのは後悔してたりして。
# 関係ないですが
# 47さんもこんな心境だったのかな
# 今はどう思っておられるのかな とか思ったりして
- 205 :名無しさん@勉強中 ★:06/12/02 08:54:36 ID:???
- # ↑随分大きく出たもんだ・・
という訳で
htmlを保存するように作り替えて
あとは静観かな
htmlをダウンロードして
dat化してdat保存
その後 htmlを削除とか
wsh単独でも やって出来なくはないですね。
ただスキルが追いつかないだけで。
(↑一番駄目なパターン)
- 206 :名無しさん@勉強中 ★:06/12/02 11:19:04 ID:???
- とりあえず
htmlファイルをローカル保存するものを出しておくです
http://www.geocities.jp/mirrorhenkan/others/makimotoforever/html.html
dat落ち避難所スレにだけ書いておこう
- 207 :名無しさん@勉強中 ★:06/12/02 12:21:32 ID:???
- メモ
正規表現(このBBS 改行規制何とかならないものか)
m#<dt>([0-9]+) 名前:<span .*?>(?:<span title="(.*?)" cl
ass=sage>|<a href="mailto:(.*?)" class=mailto>)? ?(.*) (?
:</a>|</span>)?</span> ?(.*?) <br><dd> *?(.*?) <br> *?<br
> *?(<a name.*?>|</tl>|</dl>)#mi
変換結果式
$4<>$2$3<>$5<>$6<>
これでいけるですが
問題点をあげると
・be関係を入れてない
・「あぼーん」や「sage」等
プレーンテキストになる可能性のある前処理をつけてない
・他スレのリンクが
「../../be_be/1107/1107809637.html 」
「../../qb5_operate/1106/1106061017.html#249」
となっている
3番目は前処理で何とかしたいなぁ。
1・2番目も前処理でごまかせればいいなぁ。
という訳で
htmltodatのバージョンアップされたものを使う時がきたかもです
(すみませんスルーしたみたいになってしまって>mukiyuさん)
- 208 :名無しさん@勉強中 ★:06/12/02 12:37:33 ID:???
- http://pc8.2ch.net/test/read.cgi/tech/1143262686/676n-
・・いよいよ始動したようです。
- 209 :名無しさん@勉強中 ★:06/12/02 12:56:08 ID:???
- (1)be部分
ID:Zpu0G/4N <a href="JavaScript:be(486461748)">?</a>BRZ(1113) <br>
(2)他スレリンク
・同サーバ・同板の場合
<a href="../1127/1127911361.html">../1127/1127911361.html</a> <br>
・別板の場合
<a href="../../be_be/1106/1106239080.html">../../be_be/1106/1106239080.html</a>
- 210 :名無しさん@勉強中 ★:06/12/02 13:10:59 ID:???
- s#<a href="JavaScript:be\((\d+)\)">\?(\#*)</a>(.+?)( <br>)#BE:$1-$2$3$4#gi
- 211 :名無しさん@勉強中 ★:06/12/02 13:52:49 ID:???
- 上の駄目
これでOKっぽい
s#<a href="JavaScript:be\((\d+)\)">\?(\#*)</a>#BE:$1-$2$3#gi
- 212 :名無しさん@勉強中 ★:06/12/02 14:03:40 ID:???
- 次
同サーバ・同板の場合
s#(>)\.\./\d+?/(\d+?)\.html(</a>)#$1http://server.2ch.net/test/read\.cgi/board/$2/$3#ig
これで何とか変換出来ました。
問題は「server」「board」で入力した箇所。
自動変換出来るようにはならないものか。
- 213 :名無しさん@勉強中 ★:06/12/02 14:19:19 ID:???
- 別サーバ・別板の場合
s#(>)\.\./\.\./(.+?)_(.+?)/\d+?/(\d+?)\.html(</a>)#$1http://$2\.2ch\.net/test/read\.cgi/$3/$4/$5#ig
これで何とかなったかな
- 214 :名無しさん@勉強中 ★:06/12/02 14:24:15 ID:???
- >>208のスレッド
楽しそうだなー。
でも
この方と同様 私には関係ない話みたいです
http://pc8.2ch.net/test/read.cgi/tech/1143262686/938n
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
938 :デフォルトの名無しさん :sage :2006/12/02(土) 14:11:28
Win98の俺には関係ない話だったのか(´・ω・`)
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
read.txtの通りにインストールして何度再起動しても
MSXML3.0エラーのままです
- 215 :名無しさん@勉強中 ★:06/12/02 15:18:29 ID:???
- という訳で
http://makimo.to/2ch/qa_nandemo/index.html
にある10スレのhtmlをローカル保存して
さっきまで延々やっていたhtmltodatの正規表現・結果式・前処理
で一括変換したものを
http://user.ftth100.com/mirrorhenkan/xml/
に上げてみました。
beと他スレのURLはうまくいっているようです。
- 216 :名無しさん@勉強中 ★:06/12/02 15:36:09 ID:???
- さてと
私がとっておきたいのは
下の各板でしょうか。
Webプログラミング板
プログラミング板
Windows板
ビジネスソフト板
Web製作板
ソフトウェア板
どれもこれも住民でも何でもないですが
調べるのにはとても重宝するので。
- 217 :名無しさん@勉強中 ★:06/12/02 16:15:23 ID:???
- 要望を出させて頂いたです
http://jbbs.shitaraba.com/bbs/read.cgi/computer/1929/1038588508/355-356n
それにしても
スレッドを一つdat変換するのに3分くらいかかってるみたい・・。
もっと短縮出来ないかな。
これよりも もっとスマートな変換書式を書いたら少しは違うのかな。
- 218 :名無しさん@勉強中 ★:06/12/02 16:57:50 ID:???
- ・・よし
htmlをローカル保存して
どこかに上げておこうか。
- 219 :名無しさん@勉強中:06/12/02 23:50:21 ID:KUK6YJ5a
- 2chdatgetを不在時に実況板で便利に使わせてもらってます。
livefoot (実況せんかいゴルァ!@さっかーch)
で使用すると必ずエラー表示が出ます。(他の板でもたまに出ます)
dat取得は成功してますが、取得のたびに画面に出て溜まる一方です。
Windows2000sp4使用です。表示内容は以下の通りです。
Windows Script Host
スクリプト: E\2ch\livefoot\2chdatget.vbs
行: 142
文字: 1
エラー: ファイルが見つかりません。
コード: 800A0035
ソース: Microsoft VBScript 実行時エラー
- 220 :名無しさん@勉強中 ★:06/12/03 18:04:38 ID:???
- >>219さん
どうもです。
えーと
お書きになられてますけど
livefootでは必ず出るのですか?
他の所ではそうエラーにならないと
うーん。。
ノートン等のアンチウイルスソフトや
何か常駐させるものとかお使いでしょうか。
もしそうなら、いったんそれらを切って試してみて下さい。
関連かもしれないですが(って勝手に出してごめんなさいですが)
こんな場合もありますし。↓
http://jbbs.livedoor.jp/bbs/read.cgi/computer/21256/1164941934/11
もしそれで駄目な場合は・・どうしよう。
人によっては負荷増大・サーバ攻撃ツールと捉える人も居るので
(その側面がある事は否定出来ませんし)
誰かに聞くのも はばかられるんだよなあ(って私がですけど)
とりあえず試してみて下さい。
- 221 :名無しさん@勉強中 ★:06/12/03 18:34:35 ID:???
- さて
http://ex13.2ch.net/test/read.cgi/gline/1118753283/982
↑で書いたものを
出せるようにしないとです
「マダー(AA略)」とか言われる前に。
生成するindexのヘッダとフッタをどうするかという事を
ちょっと思いあぐねているです
- 222 :名無しさん@勉強中 ★:06/12/03 21:35:35 ID:???
- http://ex13.2ch.net/test/read.cgi/gline/1118753283/986
やる事はやったです
あとは野となれ山となれ
- 223 :名無しさん@勉強中 ★:06/12/03 21:42:16 ID:???
- 作ってて思ったですけど
本家dat2htmlと同じようなものも
wshでできそうですね。
- 224 :名無しさん@勉強中 ★:06/12/04 08:22:59 ID:???
- makimo.toさんの掲示板に
どなたかhtml2dat.cgiの復活依頼をされておられるので
障害にならないように
makimoto_datget2のページのリンクを変えたです
index.html→index0.html
html2dat.cgi 復活して欲しいです。
- 225 :DinoSwift ◆m7TsEz1c5. :06/12/04 18:43:43 ID:kPk4kKs/
- (へ´ω`) ここのBBS見て、とりあえずこんなの書きました。
http://wannabe.fam.cx/service/2ch_get/index.html
- 226 :名無しさん@勉強中 ★:06/12/04 20:18:36 ID:???
- >>225
あ、どうもです。
御連絡ありがとうございます。
・・・素晴らしい。
自分にはとても書く事の出来ないような文章だ・・。
cronではなく、タスク管理を使っておられたのですか。
(ってタスク管理という機能 知らなかったですが)
そういえばmakimo.toさんやみみずんさんの所もwindowsサーバみたいですが
どちらをお使いになっておられるのかな。
ファイルのヘッダを取得して更新してるかどうか見る方法とかも
と〜く2ちゃんねるとかで見ていたのですが
wshでもそういう事をすれば 負荷軽減になるかもですね
余裕が出来たら見てみよう。
これを見て
ログ保管庫とか設置される方も居られるかもですね。
私も perlやphpで作ったクローラーがあるので
負荷分散(?)の為に公開しようかな
でも今見たら何書いてるのか訳わからん・・
ここを見ている方々へ(ってどれくらい居るんだか)
DinoSwiftさんは私の不躾なマイミク申請を快諾して下さった方です
そういえば、みみずんさんやルクダルさんひろゆきさんも
mixi内でお見かけしてるです(それだけです)
- 227 :名無しさん@勉強中 ★:06/12/04 23:04:44 ID:???
- ちょうどいい話題があったのでメモ
http://qb5.2ch.net/test/read.cgi/operate/1164201063/528n-
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
528 : ◆TWARamEjuA :2006/12/04(月) 22:08:18 ID:Zww3h5Cn0 ?BRZ(6677)
Q「Windowsアプリケーションを自動で操作し、cronしたいけれどもperl(ActivePerl)のみで実現出来るのかしら?」
530 :桶屋 :2006/12/04(月) 22:21:27 ID:G1WR0r6C0
Windowsのタスクは、バッチファイルなども起動させられるけど、
それを使わない/使えない理由は何?
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
wshも起動できるみたいなので
1時間毎に巡回クロールとか可能ですね。
- 228 :名無しさん@勉強中 ★:06/12/05 09:00:27 ID:???
- # 公私ともに嫌な事ばかり起こる・・・
>>224にした奴を元に戻しました。
下を見たもので。
蜷局を巻いて逃亡したと思われても何なので。
http://tmp6.2ch.net/test/read.cgi/download/1164164363/286
もう使えないツールですが
誰かが同様のものを作る際に参考になるかもなので。
私もあちこちのwshを見て参考にしたですし。
かえすがえすも
download板とUNIX板に書き込んだ事が悔やまれてなりません。
- 229 :名無しさん@勉強中 ★:06/12/05 09:10:41 ID:???
- # 上のレス番は269でしたな
そういう意味では
自分がやってるのはどれもこれも
色々なスクリプトのソースを参考にしてツギハギしたものばかりなので
さて どこからがオリジナルと言えるのか・・・。
なので、↓こう仰られる方とか尊敬するです。
ゼロから書けるなんて すごいなあと。
http://udon.be/test/read.cgi/rainbow/1112995210/901
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
ってゆーか、他のソースをコピーして使ったら
その時点で配布しづらくなるので、搭載するとしても自分で書きます。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
- 230 :名無しさん@勉強中 ★:06/12/05 13:06:23 ID:???
- http://ex13.2ch.net/test/read.cgi/gline/1118753283/997の件ですが
やってみたら
なかなか難しいですよ
入れ子構造にすればいいのかなと思うですが
慣れてないもので。
- 231 :名無しさん@勉強中 ★:06/12/05 14:57:20 ID:???
- http://jbbs.shitaraba.com/bbs/read.cgi/computer/1929/1038588508/367-368n
やってみようとしたけど
すんげー微妙にどこもかも違うんだなこれが
・「投稿日:」という文字がついている
・メール欄のタグが
<a class=mailto href="mailto:(.*?)">
となっている
通常は下記
<a href="mailto:(.*?)" class="?mailto"?>
・他のmakimo.to形式htmlの日付の後についていた<br>がない
あと一歩なのでしょうか。
- 232 :名無しさん@勉強中 ★:06/12/05 16:40:06 ID:???
- メモ
http://oshiete1.goo.ne.jp/kotaeru.php3?q=801858&rev=1
- 233 :名無しさん@勉強中 ★:06/12/05 18:17:51 ID:???
- うう
For Each in 〜 Next
へのパラメータ渡しの方法がわかんない
- 234 :名無しさん@勉強中 ★:06/12/05 19:37:45 ID:???
- ・・よし、出来た。
- 235 :名無しさん@勉強中 ★:06/12/05 20:01:17 ID:???
- 書いたです
http://ex13.2ch.net/test/read.cgi/gline/1165245437/14
何かもう
どうでもよくなってきた
- 236 :名無しさん@勉強中 ★:06/12/05 20:49:43 ID:???
- という訳でこの件
もうそろそろ お開きという事に。
いやー勉強になったっけやー。
- 237 :名無しさん@勉強中 ★:06/12/05 21:32:08 ID:???
- さて
後はソフトウェア板とWeb製作板でしょうか
どちらも1ギガ以上あるみたいです
とても自分のPCでは
って お開きって書いたくせに
自分から再開してら
- 238 :名無しさん@勉強中 ★:06/12/06 18:05:36 ID:???
- 差し障りのない範囲でメモ
自分のマシン、ハードディスクの残り容量が200メガかそこらなので
適当な量ダウンロードしたら即ftpでサーバにアップロードして
削除しての繰り返しをしなければならない訳ですが
そのようにしてアップした850メガくらいのプログラム板ログが
一つだけでは実に心許ない。
かといっていったんDLしてアップするにしても容量不足で
という事で
サーバ間転送というものを使ってみようかと。(FXPともいうらしい)
http://www.smartftp.com/
http://www.smartftp.com/localization/projects/japanese/documentation.html
http://akky.cjb.net/exploit.html
http://members.tripod.com/ks2000/sorce_code/fxp/fxp.txt
smartftpというソフトがFXP対応しているそうです。
ただ、ソフトウェア板のスレッドを見ると
レジストリをいじるみたいでどうしよう。
それにしても5年前のスレッドなのに現役だ・・。
http://pc7.2ch.net/test/read.cgi/software/1008611176/88-89n
まあ、メモ止まりかもしれないですけど。
- 239 :名無しさん@勉強中 ★:06/12/06 18:27:54 ID:???
- o2onスレより
http://tmp6.2ch.net/test/read.cgi/download/1165212097/540
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
540 :[名無し]さん(bin+cue).rar:2006/12/06(水) 01:39:02 ID:VDUG/zCz0
http://tmp6.2ch.net/download/subject.txt
http://anime.2ch.net/asong/subject.txt
http://ex17.2ch.net/news4vip/subject.txt
http://news19.2ch.net/newsplus/subject.txt
http://news20.2ch.net/news/subject.txt
http://anime.2ch.net/anime/subject.txt
http://live22x.2ch.net/livewkwest/subject.txt
http://live23.2ch.net/livenhk/subject.txt
http://live23.2ch.net/liveetv/subject.txt
http://live23.2ch.net/liventv/subject.txt
http://live23.2ch.net/livetbs/subject.txt
http://live23.2ch.net/livecx/subject.txt
http://live23.2ch.net/liveanb/subject.txt
今↑を定期巡回して1000レスのスレを保存するようにしてるが、
他に押さえるべきスレはあるかのぉ?
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
どのような方法で保存されておられるのか教えて頂きたい所ですが
datsearchget(という名前でいいのか?)でも同様の事が出来ますね。
http://www.geocities.jp/mirrorhenkan/others/datsearchget/
subject.txtを一行づつ読み込んで
それが入力した検索ワードにを含んでいたらDLするだけの事なので
1001行ったスレッドだけ抽出してDLしたいなら
行の終わりが「(1001)」にマッチすればいいと思うので
> .+\(1001\)$
または単に
> \(1001\)$
でいいのかも。
ただ、文末を示す「$」が使えるのかどうかわかんない
- 240 :名無しさん@勉強中 ★:06/12/06 18:35:02 ID:???
- 同様に
例えば800レス以上のスレだけ保存したいなら
> \([89]\d\d\)$
950レス以上なら
> \(9[5-9]\d\)$
かなと。
ただ、これだと1000や1001にマッチしないので
それぞれ
> \((?:[89]\d\d|100[01])\)$
> \((?:9[5-9]\d\|100[01]))$
で良いのでしょうか。
試してみる気力が無いので間違っているのかも。
- 241 :名無しさん@勉強中 ★:06/12/06 18:43:36 ID:???
- それと
>>233-235で作ったものがあるので
これを使いまわして
複数板を巡回クロールor巡回抽出クロールするwshも出来そうです。
それが出来たら
>>239で出した方と全く同じような事が出来るかもしれない。
windows標準(ほぼ)の付属機能も
なかなか侮れないもんだなぁ とか思ったりして。
奥が深いです。
- 242 :名無しさん@勉強中 ★:06/12/06 19:45:48 ID:???
- さらに押し進めれば
http://menu.2ch.net/bbsmenu.htmlをDLして
正規表現で各掲示板のURLおよび板名を取得
しかる後に巡回クロール or 巡回抽出クロールすれば
全てのログをバックアップするような事も夢ではなさそうですね。
datの保管先もDinoswiftさんやみみずんさんみたいに
それぞれ分類分けする事も可能でしょうし
ヘッダだかステータスコードだかを見て
未更新ならスルーするようにすれば
負荷も減るでしょうし。
でも差分取得とか出来るのかな。
- 243 :名無しさん@勉強中 ★:06/12/06 20:49:44 ID:???
- さて
makimo.toさんの所
復活された訳ですが
どうやら
各板のリストを表示しないようにされたようです。
過去ログ墓場から入って
http://makimo.to/2ch/index.html
ここまでは表示されますが
http://makimo.to/2ch/bbs1.html
それ以降のページに行こうとしても
エラーページが表示されます
http://makimo.to/2ch/news18_namazuplus/index.html
ふむ。
これが答えか。
- 244 :名無しさん@勉強中 ★:06/12/06 21:06:15 ID:???
- これ
意図的に表示させないようにされておられるのでしょう。
スレタイ検索等から行くと ちゃんと表示されますし。
半日ほど繋がらなかったのはその作業をされていたのかも。
ここから私のとる道は三つ。
(1)諦める
(2)makimo.toさんの意向を汲んで静観する
(3)諦めずに模索する
さて
(1)ですが、まだ私が出来る事はまだありそうですし
前にも書いたように 後悔の種を残しておきたくないので
これはなしという事で。
(2)ですが、連絡も何も頂いていませんし
掲示板[1004]でお書きになられた
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
今のうちに必要分を落としておくしかないと思います。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
これはまだ生きていると思います。
過剰アクセスが原因だろうという事は理解しているつもりですが
連絡も何も頂いていないので
(3)を採択させて頂こうかと。
何というか 逆に奮い立ってくるですよ。
出来るか出来ないかはわかんないですけど。
- 245 :名無しさん@勉強中 ★:06/12/06 21:27:40 ID:???
- # きゅうにIMEがきかなくなった・・
というわけで
やることをやってみようかなと。
アイデアはあるので
それをかたちにしてみますか。
できなかったらごめんねということで。
- 246 :名無しさん@勉強中 ★:06/12/07 10:08:02 ID:???
- で その前に
消すのも何なので
遊んでおこうかなと
http://www.geocities.jp/mirrorhenkan/others/makimotoforever/
http://www.geocities.jp/mirrorhenkan/others/makimotoforever/html.html
- 247 :名無しさん@勉強中 ★:06/12/07 12:29:04 ID:???
- ・・よし、出来た。
- 248 :名無しさん@勉強中 ★:06/12/07 12:50:47 ID:???
- ・・よし、書いた。
http://ex13.2ch.net/test/read.cgi/gline/1165245437/24-25n
- 249 :名無しさん@勉強中 ★:06/12/07 17:25:51 ID:???
- ・・今makimo.toさんのhtmlを見てみたら
http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/362
http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/367
http://makimo.to/2ch/pc7_affiliate/1161/1161168474.html
http://makimo.to/2ch/log_musicj/959/959833697.html
全部テキスト表示に変わっている・・・。
半日休んでこれをやっていたのか・・・。
html2dat.cgiは公開されないそうですし
何をお考えなのだろうか・・・。
このプレーンテキストをdat化させるのは事だぞ。
もうmakimo.toさん大嫌い!
- 250 :名無しさん@勉強中 ★:06/12/07 17:56:04 ID:???
- 上のは大嘘
バーカバーカ(←自分)
それはそうと
http://tmp6.2ch.net/test/read.cgi/download/1164164363/326
立場は違えど
苦労されてますね・・・お察しします
- 251 :名無しさん@勉強中 ★:06/12/07 21:15:29 ID:???
- いろいろ対策されておられるのだなあ
もう疲れたです
まだやるとしたら
ターゲットのhtmlを整形抽出列挙して
インターバルとランダムプロキシを設定できる
DLツールを用いるくらいですか。
あんまり根気が無いほうなのでこのへんで。
大変勉強になりました。
- 252 :名無しさん@勉強中 ★:06/12/08 08:18:18 ID:???
- メモ
javascript:document.body.innerHTML=document.body.innerHTML.replace(/(<A class=bbs href=\")(.+?)(\/index\.html\"\>.+?\<\/A\><\/TD>)/ig,"$1$2$3 <td>$2.html</td>");void(0);
- 253 :名無しさん@勉強中 ★:06/12/08 19:14:18 ID:???
- kage板総合雑談スレッドより
http://kage.monazilla.org/test/read.cgi/kage/037005742/334-339n
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
334 名前:名無しさん@お腹いっぱい。 投稿日:2006/12/01(金) 01:50:36 ID:???
書けない…
http://azlucky.s31.xrea.com/katjusha/
335 名前:名無しさん@お腹いっぱい。 投稿日:2006/12/03(日) 07:07:19 ID:eVKoo/UY
>>334
同じく・・・何度書きこもうとしてもエラーが出ます。新・かちゅーしゃ板の管理者の方
ここみてたら確認お願いします
336 名前:◆KAGESsh/NQ 投稿日:2006/12/03(日) 09:34:28 ID:???
>>334-335
あ〜書けないね。「Script Error」とか吐いてる。
Firefox から書いてみても同じで、HTTP のレスポンスみると 500 が帰ってきてるね。
何か cgi が逝ってるか、規制関連でミスってるか、そんな雰囲気。
339 名前:◆YaAzLuckyc 投稿日:2006/12/08(金) 19:02:11 ID:???
こちらにも気付きませんで大変ご迷惑をおかけしました。m(__)m
かちゅ板、なんでも板 ともに復旧しております。
どうもNGワードにカタカナの「ー」が含まれているとScriptErrorが出るみたいです。
面倒なのでNGワードから省くだけで対処しました。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
> どうもNGワードにカタカナの「ー」が含まれているとScriptErrorが出るみたいです
下の件が事前にあった事もあり
どこかで見たぞ んうんなるほどなるほど と(←えっらそーに)
http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/353-354n
それにしても、何でかちゅ〜しゃ絡みの件だと
デジャヴが多発するのでしょうか。
- 254 :名無しさん@勉強中 ★:06/12/08 21:07:52 ID:???
- UNIX板でいろいろ書かれてますが
もう現状 そのままでは使えないのでいいかなと
それはともかく
http://pc8.2ch.net/test/read.cgi/unix/1164200330/194-196n
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
194 :名無しさん@お腹いっぱい。:2006/12/07(木) 02:15:38
●とやらを買えば過去ログ見れると言うのは知ってるが、
きちんと過去のスレのリンク張ってあればたどれるが、そうでないとこも結構あるんでない?
195 :名無しさん@お腹いっぱい。:2006/12/07(木) 03:09:41
>>194
倉庫見ればindexあるよ
196 :名無しさん@お腹いっぱい。:2006/12/07(木) 06:49:48
倉庫のindexから探すのは大変だぉ
OpenJaneがヘタレなだけ?
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
>>168で書いたように考えてみたですが
そういうのを出しても批判されるだけでしょうね。
いったいどうすりゃいいんだか。
501KB
続きを読む
掲示板に戻る 全部 前100 次100 最新50