■掲示板に戻る■
全部
1-
101-
201-
301-
401-
501-
601-
701-
801-
最新50
サイズが 480KB を超えています。500KB を超えると書きこめなくなるよ。
メモ2
1 :
名無しさん@勉強中 ★
: 06/09/16 19:36:34 ID:???
これまた思いついた事など
201 :
名無しさん@勉強中
: 06/12/02 03:45:49 ID:4JoD/kho
検索したら出てきたので
>>127
に返信w
以前(xrea.comから戻る前)までは一定期間datを保持していましたが、容量不足により現在は長時間のdat保管は行っていません。
近日中にdatを分散させる形でdat落ち後のdatを表示する又は、●等に対応させようと思っています。
202 :
名無しさん@勉強中 ★
: 06/12/02 08:08:03 ID:???
>>201
さん
御返信ありがとうございます
楽しみにしていますです
さて
makimo.toさんのhtml2dat.cgiが真っ白画面だ・・・。
いろいろ書かれているなあ
でも他に方法は無かったですし
まあ仕方ない
もしこのままの状態だとしたら
htmlをDLするように作り替えて
htmltodatに一括変換させるようにするですかね。
とりあえず
ごめんなさい
203 :
名無しさん@勉強中 ★
: 06/12/02 08:23:48 ID:???
それにしても
後付けオプションだから仕方ないんでしょうけど
何でhtml2cgi.cgi経由なのでしょうか。
みみずんさんやDinoswiftさんのところのように
datを静的にDL出来るようにされておられれば嬉しいのですが。
そもそも どのような形式でログ保存されているのか
教えて頂きたく思うです
古いスレッドのdatとかをDLしても
本家ではカンマ(「,」)区切りになっているのに
makimo.toさんの所では「<>」区切りになっておられますし
2chのdat形式では保存してないのかな
204 :
名無しさん@勉強中 ★
: 06/12/02 08:38:55 ID:???
ずっとこのままだとしたら
方法は2つ
(1)あきらめて静観する
(2)htmlをダウンロードするようにしてdat化する
(1)ですが、のちのち後悔しそうです。
あの時にああしとけば良かったこうしとけば良かったとか
あれこれ思いそう。
となると(2)ですかね。
あと
公開したのを後悔してないですが
縁もゆかりも興味もないDownload板に書いたのは後悔してたりして。
# 関係ないですが
# 47さんもこんな心境だったのかな
# 今はどう思っておられるのかな とか思ったりして
205 :
名無しさん@勉強中 ★
: 06/12/02 08:54:36 ID:???
# ↑随分大きく出たもんだ・・
という訳で
htmlを保存するように作り替えて
あとは静観かな
htmlをダウンロードして
dat化してdat保存
その後 htmlを削除とか
wsh単独でも やって出来なくはないですね。
ただスキルが追いつかないだけで。
(↑一番駄目なパターン)
206 :
名無しさん@勉強中 ★
: 06/12/02 11:19:04 ID:???
とりあえず
htmlファイルをローカル保存するものを出しておくです
http://www.geocities.jp/mirrorhenkan/others/makimotoforever/html.html
dat落ち避難所スレにだけ書いておこう
207 :
名無しさん@勉強中 ★
: 06/12/02 12:21:32 ID:???
メモ
正規表現(このBBS 改行規制何とかならないものか)
m#<dt>([0-9]+) 名前:<span .*?>(?:<span title="(.*?)" cl
ass=sage>|<a href="mailto:(.*?)" class=mailto>)? ?(.*) (?
:</a>|</span>)?</span> ?(.*?) <br><dd> *?(.*?) <br> *?<br
> *?(<a name.*?>|</tl>|</dl>)#mi
変換結果式
$4<>$2$3<>$5<>$6<>
これでいけるですが
問題点をあげると
・be関係を入れてない
・「あぼーん」や「sage」等
プレーンテキストになる可能性のある前処理をつけてない
・他スレのリンクが
「../../be_be/1107/1107809637.html 」
「../../qb5_operate/1106/1106061017.html#249」
となっている
3番目は前処理で何とかしたいなぁ。
1・2番目も前処理でごまかせればいいなぁ。
という訳で
htmltodatのバージョンアップされたものを使う時がきたかもです
(すみませんスルーしたみたいになってしまって>mukiyuさん)
208 :
名無しさん@勉強中 ★
: 06/12/02 12:37:33 ID:???
http://pc8.2ch.net/test/read.cgi/tech/1143262686/676n-
・・いよいよ始動したようです。
209 :
名無しさん@勉強中 ★
: 06/12/02 12:56:08 ID:???
(1)be部分
ID:Zpu0G/4N <a href="JavaScript:be(486461748)">?</a>BRZ(1113) <br>
(2)他スレリンク
・同サーバ・同板の場合
<a href="../1127/1127911361.html">../1127/1127911361.html</a> <br>
・別板の場合
<a href="../../be_be/1106/1106239080.html">../../be_be/1106/1106239080.html</a>
210 :
名無しさん@勉強中 ★
: 06/12/02 13:10:59 ID:???
s#<a href="JavaScript:be\((\d+)\)">\?(\#*)</a>(.+?)( <br>)#BE:$1-$2$3$4#gi
211 :
名無しさん@勉強中 ★
: 06/12/02 13:52:49 ID:???
上の駄目
これでOKっぽい
s#<a href="JavaScript:be\((\d+)\)">\?(\#*)</a>#BE:$1-$2$3#gi
212 :
名無しさん@勉強中 ★
: 06/12/02 14:03:40 ID:???
次
同サーバ・同板の場合
s#(>)\.\./\d+?/(\d+?)\.html(</a>)#$1
http://server.2ch.net/test/read
\.cgi/board/$2/$3#ig
これで何とか変換出来ました。
問題は「server」「board」で入力した箇所。
自動変換出来るようにはならないものか。
213 :
名無しさん@勉強中 ★
: 06/12/02 14:19:19 ID:???
別サーバ・別板の場合
s#(>)\.\./\.\./(.+?)_(.+?)/\d+?/(\d+?)\.html(</a>)#$1
http://$2
\.2ch\.net/test/read\.cgi/$3/$4/$5#ig
これで何とかなったかな
214 :
名無しさん@勉強中 ★
: 06/12/02 14:24:15 ID:???
>>208
のスレッド
楽しそうだなー。
でも
この方と同様 私には関係ない話みたいです
http://pc8.2ch.net/test/read.cgi/tech/1143262686/938n
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
938 :デフォルトの名無しさん :sage :2006/12/02(土) 14:11:28
Win98の俺には関係ない話だったのか(´・ω・`)
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
read.txtの通りにインストールして何度再起動しても
MSXML3.0エラーのままです
215 :
名無しさん@勉強中 ★
: 06/12/02 15:18:29 ID:???
という訳で
http://makimo.to/2ch/qa_nandemo/index.html
にある10スレのhtmlをローカル保存して
さっきまで延々やっていたhtmltodatの正規表現・結果式・前処理
で一括変換したものを
http://user.ftth100.com/mirrorhenkan/xml/
に上げてみました。
beと他スレのURLはうまくいっているようです。
216 :
名無しさん@勉強中 ★
: 06/12/02 15:36:09 ID:???
さてと
私がとっておきたいのは
下の各板でしょうか。
Webプログラミング板
プログラミング板
Windows板
ビジネスソフト板
Web製作板
ソフトウェア板
どれもこれも住民でも何でもないですが
調べるのにはとても重宝するので。
217 :
名無しさん@勉強中 ★
: 06/12/02 16:15:23 ID:???
要望を出させて頂いたです
http://jbbs.shitaraba.com/bbs/read.cgi/computer/1929/1038588508/355-356n
それにしても
スレッドを一つdat変換するのに3分くらいかかってるみたい・・。
もっと短縮出来ないかな。
これよりも もっとスマートな変換書式を書いたら少しは違うのかな。
218 :
名無しさん@勉強中 ★
: 06/12/02 16:57:50 ID:???
・・よし
htmlをローカル保存して
どこかに上げておこうか。
219 :
名無しさん@勉強中
: 06/12/02 23:50:21 ID:KUK6YJ5a
2chdatgetを不在時に実況板で便利に使わせてもらってます。
livefoot (実況せんかいゴルァ!@さっかーch)
で使用すると必ずエラー表示が出ます。(他の板でもたまに出ます)
dat取得は成功してますが、取得のたびに画面に出て溜まる一方です。
Windows2000sp4使用です。表示内容は以下の通りです。
Windows Script Host
スクリプト: E\2ch\livefoot\2chdatget.vbs
行: 142
文字: 1
エラー: ファイルが見つかりません。
コード: 800A0035
ソース: Microsoft VBScript 実行時エラー
220 :
名無しさん@勉強中 ★
: 06/12/03 18:04:38 ID:???
>>219
さん
どうもです。
えーと
お書きになられてますけど
livefootでは必ず出るのですか?
他の所ではそうエラーにならないと
うーん。。
ノートン等のアンチウイルスソフトや
何か常駐させるものとかお使いでしょうか。
もしそうなら、いったんそれらを切って試してみて下さい。
関連かもしれないですが(って勝手に出してごめんなさいですが)
こんな場合もありますし。↓
http://jbbs.livedoor.jp/bbs/read.cgi/computer/21256/1164941934/11
もしそれで駄目な場合は・・どうしよう。
人によっては負荷増大・サーバ攻撃ツールと捉える人も居るので
(その側面がある事は否定出来ませんし)
誰かに聞くのも はばかられるんだよなあ(って私がですけど)
とりあえず試してみて下さい。
221 :
名無しさん@勉強中 ★
: 06/12/03 18:34:35 ID:???
さて
http://ex13.2ch.net/test/read.cgi/gline/1118753283/982
↑で書いたものを
出せるようにしないとです
「マダー(AA略)」とか言われる前に。
生成するindexのヘッダとフッタをどうするかという事を
ちょっと思いあぐねているです
222 :
名無しさん@勉強中 ★
: 06/12/03 21:35:35 ID:???
http://ex13.2ch.net/test/read.cgi/gline/1118753283/986
やる事はやったです
あとは野となれ山となれ
223 :
名無しさん@勉強中 ★
: 06/12/03 21:42:16 ID:???
作ってて思ったですけど
本家dat2htmlと同じようなものも
wshでできそうですね。
224 :
名無しさん@勉強中 ★
: 06/12/04 08:22:59 ID:???
makimo.toさんの掲示板に
どなたかhtml2dat.cgiの復活依頼をされておられるので
障害にならないように
makimoto_datget2のページのリンクを変えたです
index.html→index0.html
html2dat.cgi 復活して欲しいです。
225 :
DinoSwift
◆m7TsEz1c5.
: 06/12/04 18:43:43 ID:kPk4kKs/
(へ´ω`) ここのBBS見て、とりあえずこんなの書きました。
http://wannabe.fam.cx/service/2ch_get/index.html
226 :
名無しさん@勉強中 ★
: 06/12/04 20:18:36 ID:???
>>225
あ、どうもです。
御連絡ありがとうございます。
・・・素晴らしい。
自分にはとても書く事の出来ないような文章だ・・。
cronではなく、タスク管理を使っておられたのですか。
(ってタスク管理という機能 知らなかったですが)
そういえばmakimo.toさんやみみずんさんの所もwindowsサーバみたいですが
どちらをお使いになっておられるのかな。
ファイルのヘッダを取得して更新してるかどうか見る方法とかも
と〜く2ちゃんねるとかで見ていたのですが
wshでもそういう事をすれば 負荷軽減になるかもですね
余裕が出来たら見てみよう。
これを見て
ログ保管庫とか設置される方も居られるかもですね。
私も perlやphpで作ったクローラーがあるので
負荷分散(?)の為に公開しようかな
でも今見たら何書いてるのか訳わからん・・
ここを見ている方々へ(ってどれくらい居るんだか)
DinoSwiftさんは私の不躾なマイミク申請を快諾して下さった方です
そういえば、みみずんさんやルクダルさんひろゆきさんも
mixi内でお見かけしてるです(それだけです)
227 :
名無しさん@勉強中 ★
: 06/12/04 23:04:44 ID:???
ちょうどいい話題があったのでメモ
http://qb5.2ch.net/test/read.cgi/operate/1164201063/528n-
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
528 : ◆TWARamEjuA :2006/12/04(月) 22:08:18 ID:Zww3h5Cn0 ?BRZ(6677)
Q「Windowsアプリケーションを自動で操作し、cronしたいけれどもperl(ActivePerl)のみで実現出来るのかしら?」
530 :桶屋 :2006/12/04(月) 22:21:27 ID:G1WR0r6C0
Windowsのタスクは、バッチファイルなども起動させられるけど、
それを使わない/使えない理由は何?
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
wshも起動できるみたいなので
1時間毎に巡回クロールとか可能ですね。
228 :
名無しさん@勉強中 ★
: 06/12/05 09:00:27 ID:???
# 公私ともに嫌な事ばかり起こる・・・
>>224
にした奴を元に戻しました。
下を見たもので。
蜷局を巻いて逃亡したと思われても何なので。
http://tmp6.2ch.net/test/read.cgi/download/1164164363/286
もう使えないツールですが
誰かが同様のものを作る際に参考になるかもなので。
私もあちこちのwshを見て参考にしたですし。
かえすがえすも
download板とUNIX板に書き込んだ事が悔やまれてなりません。
229 :
名無しさん@勉強中 ★
: 06/12/05 09:10:41 ID:???
# 上のレス番は269でしたな
そういう意味では
自分がやってるのはどれもこれも
色々なスクリプトのソースを参考にしてツギハギしたものばかりなので
さて どこからがオリジナルと言えるのか・・・。
なので、↓こう仰られる方とか尊敬するです。
ゼロから書けるなんて すごいなあと。
http://udon.be/test/read.cgi/rainbow/1112995210/901
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
ってゆーか、他のソースをコピーして使ったら
その時点で配布しづらくなるので、搭載するとしても自分で書きます。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
230 :
名無しさん@勉強中 ★
: 06/12/05 13:06:23 ID:???
http://ex13.2ch.net/test/read.cgi/gline/1118753283/997
の件ですが
やってみたら
なかなか難しいですよ
入れ子構造にすればいいのかなと思うですが
慣れてないもので。
231 :
名無しさん@勉強中 ★
: 06/12/05 14:57:20 ID:???
http://jbbs.shitaraba.com/bbs/read.cgi/computer/1929/1038588508/367-368n
やってみようとしたけど
すんげー微妙にどこもかも違うんだなこれが
・「投稿日:」という文字がついている
・メール欄のタグが
<a class=mailto href="mailto:(.*?)">
となっている
通常は下記
<a href="mailto:(.*?)" class="?mailto"?>
・他のmakimo.to形式htmlの日付の後についていた<br>がない
あと一歩なのでしょうか。
232 :
名無しさん@勉強中 ★
: 06/12/05 16:40:06 ID:???
メモ
http://oshiete1.goo.ne.jp/kotaeru.php3?q=801858&rev=1
233 :
名無しさん@勉強中 ★
: 06/12/05 18:17:51 ID:???
うう
For Each in 〜 Next
へのパラメータ渡しの方法がわかんない
234 :
名無しさん@勉強中 ★
: 06/12/05 19:37:45 ID:???
・・よし、出来た。
235 :
名無しさん@勉強中 ★
: 06/12/05 20:01:17 ID:???
書いたです
http://ex13.2ch.net/test/read.cgi/gline/1165245437/14
何かもう
どうでもよくなってきた
236 :
名無しさん@勉強中 ★
: 06/12/05 20:49:43 ID:???
という訳でこの件
もうそろそろ お開きという事に。
いやー勉強になったっけやー。
237 :
名無しさん@勉強中 ★
: 06/12/05 21:32:08 ID:???
さて
後はソフトウェア板とWeb製作板でしょうか
どちらも1ギガ以上あるみたいです
とても自分のPCでは
って お開きって書いたくせに
自分から再開してら
238 :
名無しさん@勉強中 ★
: 06/12/06 18:05:36 ID:???
差し障りのない範囲でメモ
自分のマシン、ハードディスクの残り容量が200メガかそこらなので
適当な量ダウンロードしたら即ftpでサーバにアップロードして
削除しての繰り返しをしなければならない訳ですが
そのようにしてアップした850メガくらいのプログラム板ログが
一つだけでは実に心許ない。
かといっていったんDLしてアップするにしても容量不足で
という事で
サーバ間転送というものを使ってみようかと。(FXPともいうらしい)
http://www.smartftp.com/
http://www.smartftp.com/localization/projects/japanese/documentation.html
http://akky.cjb.net/exploit.html
http://members.tripod.com/ks2000/sorce_code/fxp/fxp.txt
smartftpというソフトがFXP対応しているそうです。
ただ、ソフトウェア板のスレッドを見ると
レジストリをいじるみたいでどうしよう。
それにしても5年前のスレッドなのに現役だ・・。
http://pc7.2ch.net/test/read.cgi/software/1008611176/88-89n
まあ、メモ止まりかもしれないですけど。
239 :
名無しさん@勉強中 ★
: 06/12/06 18:27:54 ID:???
o2onスレより
http://tmp6.2ch.net/test/read.cgi/download/1165212097/540
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
540 :[名無し]さん(bin+cue).rar:2006/12/06(水) 01:39:02 ID:VDUG/zCz0
http://tmp6.2ch.net/download/subject.txt
http://anime.2ch.net/asong/subject.txt
http://ex17.2ch.net/news4vip/subject.txt
http://news19.2ch.net/newsplus/subject.txt
http://news20.2ch.net/news/subject.txt
http://anime.2ch.net/anime/subject.txt
http://live22x.2ch.net/livewkwest/subject.txt
http://live23.2ch.net/livenhk/subject.txt
http://live23.2ch.net/liveetv/subject.txt
http://live23.2ch.net/liventv/subject.txt
http://live23.2ch.net/livetbs/subject.txt
http://live23.2ch.net/livecx/subject.txt
http://live23.2ch.net/liveanb/subject.txt
今↑を定期巡回して1000レスのスレを保存するようにしてるが、
他に押さえるべきスレはあるかのぉ?
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
どのような方法で保存されておられるのか教えて頂きたい所ですが
datsearchget(という名前でいいのか?)でも同様の事が出来ますね。
http://www.geocities.jp/mirrorhenkan/others/datsearchget/
subject.txtを一行づつ読み込んで
それが入力した検索ワードにを含んでいたらDLするだけの事なので
1001行ったスレッドだけ抽出してDLしたいなら
行の終わりが「(1001)」にマッチすればいいと思うので
> .+\(1001\)$
または単に
> \(1001\)$
でいいのかも。
ただ、文末を示す「$」が使えるのかどうかわかんない
240 :
名無しさん@勉強中 ★
: 06/12/06 18:35:02 ID:???
同様に
例えば800レス以上のスレだけ保存したいなら
> \([89]\d\d\)$
950レス以上なら
> \(9[5-9]\d\)$
かなと。
ただ、これだと1000や1001にマッチしないので
それぞれ
> \((?:[89]\d\d|100[01])\)$
> \((?:9[5-9]\d\|100[01]))$
で良いのでしょうか。
試してみる気力が無いので間違っているのかも。
241 :
名無しさん@勉強中 ★
: 06/12/06 18:43:36 ID:???
それと
>>233-235
で作ったものがあるので
これを使いまわして
複数板を巡回クロールor巡回抽出クロールするwshも出来そうです。
それが出来たら
>>239
で出した方と全く同じような事が出来るかもしれない。
windows標準(ほぼ)の付属機能も
なかなか侮れないもんだなぁ とか思ったりして。
奥が深いです。
242 :
名無しさん@勉強中 ★
: 06/12/06 19:45:48 ID:???
さらに押し進めれば
http://menu.2ch.net/bbsmenu.html
をDLして
正規表現で各掲示板のURLおよび板名を取得
しかる後に巡回クロール or 巡回抽出クロールすれば
全てのログをバックアップするような事も夢ではなさそうですね。
datの保管先もDinoswiftさんやみみずんさんみたいに
それぞれ分類分けする事も可能でしょうし
ヘッダだかステータスコードだかを見て
未更新ならスルーするようにすれば
負荷も減るでしょうし。
でも差分取得とか出来るのかな。
243 :
名無しさん@勉強中 ★
: 06/12/06 20:49:44 ID:???
さて
makimo.toさんの所
復活された訳ですが
どうやら
各板のリストを表示しないようにされたようです。
過去ログ墓場から入って
http://makimo.to/2ch/index.html
ここまでは表示されますが
http://makimo.to/2ch/bbs1.html
それ以降のページに行こうとしても
エラーページが表示されます
http://makimo.to/2ch/news18_namazuplus/index.html
ふむ。
これが答えか。
244 :
名無しさん@勉強中 ★
: 06/12/06 21:06:15 ID:???
これ
意図的に表示させないようにされておられるのでしょう。
スレタイ検索等から行くと ちゃんと表示されますし。
半日ほど繋がらなかったのはその作業をされていたのかも。
ここから私のとる道は三つ。
(1)諦める
(2)makimo.toさんの意向を汲んで静観する
(3)諦めずに模索する
さて
(1)ですが、まだ私が出来る事はまだありそうですし
前にも書いたように 後悔の種を残しておきたくないので
これはなしという事で。
(2)ですが、連絡も何も頂いていませんし
掲示板[1004]でお書きになられた
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
今のうちに必要分を落としておくしかないと思います。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
これはまだ生きていると思います。
過剰アクセスが原因だろうという事は理解しているつもりですが
連絡も何も頂いていないので
(3)を採択させて頂こうかと。
何というか 逆に奮い立ってくるですよ。
出来るか出来ないかはわかんないですけど。
245 :
名無しさん@勉強中 ★
: 06/12/06 21:27:40 ID:???
# きゅうにIMEがきかなくなった・・
というわけで
やることをやってみようかなと。
アイデアはあるので
それをかたちにしてみますか。
できなかったらごめんねということで。
246 :
名無しさん@勉強中 ★
: 06/12/07 10:08:02 ID:???
で その前に
消すのも何なので
遊んでおこうかなと
http://www.geocities.jp/mirrorhenkan/others/makimotoforever/
http://www.geocities.jp/mirrorhenkan/others/makimotoforever/html.html
247 :
名無しさん@勉強中 ★
: 06/12/07 12:29:04 ID:???
・・よし、出来た。
248 :
名無しさん@勉強中 ★
: 06/12/07 12:50:47 ID:???
・・よし、書いた。
http://ex13.2ch.net/test/read.cgi/gline/1165245437/24-25n
249 :
名無しさん@勉強中 ★
: 06/12/07 17:25:51 ID:???
・・今makimo.toさんのhtmlを見てみたら
http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/362
http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/367
http://makimo.to/2ch/pc7_affiliate/1161/1161168474.html
http://makimo.to/2ch/log_musicj/959/959833697.html
全部テキスト表示に変わっている・・・。
半日休んでこれをやっていたのか・・・。
html2dat.cgiは公開されないそうですし
何をお考えなのだろうか・・・。
このプレーンテキストをdat化させるのは事だぞ。
もうmakimo.toさん大嫌い!
250 :
名無しさん@勉強中 ★
: 06/12/07 17:56:04 ID:???
上のは大嘘
バーカバーカ(←自分)
それはそうと
http://tmp6.2ch.net/test/read.cgi/download/1164164363/326
立場は違えど
苦労されてますね・・・お察しします
251 :
名無しさん@勉強中 ★
: 06/12/07 21:15:29 ID:???
いろいろ対策されておられるのだなあ
もう疲れたです
まだやるとしたら
ターゲットのhtmlを整形抽出列挙して
インターバルとランダムプロキシを設定できる
DLツールを用いるくらいですか。
あんまり根気が無いほうなのでこのへんで。
大変勉強になりました。
252 :
名無しさん@勉強中 ★
: 06/12/08 08:18:18 ID:???
メモ
javascript:document.body.innerHTML=document.body.innerHTML.replace(/(<A class=bbs href=\")(.+?)(\/index\.html\"\>.+?\<\/A\><\/TD>)/ig,"$1$2$3 <td>$2.html</td>");void(0);
253 :
名無しさん@勉強中 ★
: 06/12/08 19:14:18 ID:???
kage板総合雑談スレッドより
http://kage.monazilla.org/test/read.cgi/kage/037005742/334-339n
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
334 名前:名無しさん@お腹いっぱい。 投稿日:2006/12/01(金) 01:50:36 ID:???
書けない…
http://azlucky.s31.xrea.com/katjusha/
335 名前:名無しさん@お腹いっぱい。 投稿日:2006/12/03(日) 07:07:19 ID:eVKoo/UY
>>334
同じく・・・何度書きこもうとしてもエラーが出ます。新・かちゅーしゃ板の管理者の方
ここみてたら確認お願いします
336 名前:◆KAGESsh/NQ 投稿日:2006/12/03(日) 09:34:28 ID:???
>>334-335
あ〜書けないね。「Script Error」とか吐いてる。
Firefox から書いてみても同じで、HTTP のレスポンスみると 500 が帰ってきてるね。
何か cgi が逝ってるか、規制関連でミスってるか、そんな雰囲気。
339 名前:◆YaAzLuckyc 投稿日:2006/12/08(金) 19:02:11 ID:???
こちらにも気付きませんで大変ご迷惑をおかけしました。m(__)m
かちゅ板、なんでも板 ともに復旧しております。
どうもNGワードにカタカナの「ー」が含まれているとScriptErrorが出るみたいです。
面倒なのでNGワードから省くだけで対処しました。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
> どうもNGワードにカタカナの「ー」が含まれているとScriptErrorが出るみたいです
下の件が事前にあった事もあり
どこかで見たぞ んうんなるほどなるほど と(←えっらそーに)
http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/353-354n
それにしても、何でかちゅ〜しゃ絡みの件だと
デジャヴが多発するのでしょうか。
254 :
名無しさん@勉強中 ★
: 06/12/08 21:07:52 ID:???
UNIX板でいろいろ書かれてますが
もう現状 そのままでは使えないのでいいかなと
それはともかく
http://pc8.2ch.net/test/read.cgi/unix/1164200330/194-196n
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
194 :名無しさん@お腹いっぱい。:2006/12/07(木) 02:15:38
●とやらを買えば過去ログ見れると言うのは知ってるが、
きちんと過去のスレのリンク張ってあればたどれるが、そうでないとこも結構あるんでない?
195 :名無しさん@お腹いっぱい。:2006/12/07(木) 03:09:41
>>194
倉庫見ればindexあるよ
196 :名無しさん@お腹いっぱい。:2006/12/07(木) 06:49:48
倉庫のindexから探すのは大変だぉ
OpenJaneがヘタレなだけ?
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
>>168
で書いたように考えてみたですが
そういうのを出しても批判されるだけでしょうね。
いったいどうすりゃいいんだか。
255 :
名無しさん@勉強中 ★
: 06/12/09 16:18:59 ID:???
とりあえず
sports2サーバの板のログをのんびりと落とさせて頂かせております
本家に残ってないログなので落としている訳ですが
行った事なかったですけど結構面白い所なんですね。
そうそう
過剰アクセスでdenyされた時は
IEの設定でプロキシを付けるor変更すればいいです
万々一makimo.toさんが此方を見ておられたら
色々御迷惑をおかけしておりますと私が申しております。
悪意も何もありませんです
# ↑思い上がっているような書き方で何ですが
# もし自分がmakimo.toさんの立場だったら
# 見ているだろうなあと思いましたので。
256 :
名無しさん@勉強中 ★
: 06/12/09 17:01:44 ID:???
で
IEのプロキシ変換を自動的に変換させるように出来ないかと
少し調べてみたら
どうもプロキシ情報(というかIEの設定情報)はレジストリに保存されているようで
もし何かあったらこまわりくん八丈島のキョンなので
やめとくです。
「IEプロキシチェンジャー」みたいなのって結構ありそうですが
実は怖い事やってるみたいですね。
257 :
名無しさん@勉強中 ★
: 06/12/10 04:59:50 ID:???
・・今
http://makimo.to/2ch/cookie.html
の表示モード選択で「dat」を選んだら
datファイルが落ちてきた・・。
サイズもhtmlより少ないですが
負荷とかどうなのでしょうか・・
258 :
名無しさん@勉強中 ★
: 06/12/10 05:16:20 ID:???
「※古いログはdatが存在しません。」
とあるので
html2dat.cgi経由ではないのかも。
だとしたら負荷も少ないかもです
259 :
名無しさん@勉強中 ★
: 06/12/10 05:44:34 ID:???
なのでスクリプト中の
work=GetHTMLDocument(out,sRoot & "/html/" & dat_folder & "/" & datkey & ".html")
を
work=GetHTMLDocument(out,sRoot & "/html/" & dat_folder & "/" & datkey & ".dat")
に変更して作動させたです
それにしても
ウェイト時間を1分とっているのですが
それでも気が付くとバーボン行きになっている事が多いのです
まあアクセス集中しているでしょうから仕方ないのかもなのですが
人力で右クリック保存してもそうなるのかな
1分で1datなので
計算ではあと20時間くらいですか。
ごめんなさいごめんなさい
260 :
名無しさん@勉強中 ★
: 06/12/10 05:58:55 ID:???
さて
on2on(オニオン?)も実用段階に入っているみたいで
http://tmp6.2ch.net/test/read.cgi/download/1165212097/994-995n
−−−−−−−−−−−−−−−−−−−−−−−−−−−
994 :[名無し]さん(bin+cue).rar :sage :2006/12/09(土) 23:53:54 (p)ID:zV0N4Jgf0(17)
すげぇ
ログ削除して将棋スレを検索したらこれまでにはありえないスピードで落ちてきた
しかも直接見れるし。なかなか回りがよくなってきたな
995 :[名無し]さん(bin+cue).rar :sage :2006/12/09(土) 23:53:54 (p)ID:vkzoFNjh0(3)
ちょっと興味あった落ちたスレが読めた!
ありがとー!
−−−−−−−−−−−−−−−−−−−−−−−−−−−
でも私のPCでは
蚊帳の外の宇宙の話なので
寂しいです
261 :
名無しさん@勉強中 ★
: 06/12/10 11:19:49 ID:???
実況系とニュース系のdat落ちスレの
1とラストを見る事が出来るようにして下さったのですけど
まあそのままでも別に問題ないですよね。
いえ、最近wshを作るのでVBScriptばかり見てたもんで
逆にJavaScriptのほうを忘れているという
ああ付け焼き刃
逆さに読めば
バキヤケツああ
262 :
名無しさん@勉強中 ★
: 06/12/10 13:23:19 ID:???
# 上の文訂正
# まあそのままでも → まあ自分の所はそのままでも
さて
久しぶりに
http://6419.net/
に行ってみたです。
sports2サーバのラウンジクラシック板が揃っているので。
・・いやー、凄い。
263 :
名無しさん@勉強中
: 06/12/10 17:15:38 ID:22J8A3k3
んー、バーボンに入ってやり直すとまた最初のDATから取得・・・。
重複チェックで取得済みはスルーできないかのぉ。スクリプトむずかすぃw
264 :
名無しさん@勉強中 ★
: 06/12/10 17:46:52 ID:???
>>263
えーと
http://ex13.2ch.net/test/read.cgi/gline/1165245437/39-40n
で書いたようにやればいいのですが。
あと
>>257-258
のクッキー変更もやったほうがよいかも。
で
とりあえず今
自分が使ってる奴をそのまま出しときます
http://www.geocities.jp/mirrorhenkan/others/makimotoforever/makimoto_htmlget_4_20061210.vbs.txt
バーボン入りしたら
エクスプローラで時間でソートして
最終取得dat(html)を開いてスレタイをコピーして
リスト(server_board.html)をエディタで開いて
さっきのスレタイのあった行まで消して上書き保存
しかる後に
上のスクリプトを走らせればいいと思うです。
また叩かれても何なのでコピペ拡散は控えて頂きたく。(>見てる方々)
それにしても
1分間隔でやってみてるのですが
気がつくとdenyされている事が多いです
それだけ駆け込み需要が増えているんだなと。
という訳で他言無用に。
265 :
名無しさん@勉強中 ★
: 06/12/10 17:57:00 ID:???
download板より
http://tmp6.2ch.net/test/read.cgi/download/1164164363/339-348n
−−−−−−−−−−−−−−−−−−−−−
339 :[名無し]さん(bin+cue).rar:2006/12/09(土) 23:39:03 ID:1L7uzLnE0
設定すればdat落とせるみたいだけど
http://makimo.to/2ch/cookie.html
347 :[名無し]さん(bin+cue).rar:2006/12/10(日) 12:56:56 ID:y2+rR8JL0
>>339
Proximitron経由してCookie送ればJaneでもdat取得できるね
348 :[名無し]さん(bin+cue).rar:2006/12/10(日) 13:56:00 ID:71ojeTpF0
>>347
クッキーの設定がよくわからないんだけど、これでいいのかな?
text=dat<>1<>0<>false<>mycss=<>0<>0<>3000<><><><>;
−−−−−−−−−−−−−−−−−−−−−
これ見て
proxomitronの勉強をしてみようかなと。
うまくやれば
dumper.jpさんとかのhtmlファイルをdat化してDL出来るかも。
266 :
名無しさん@勉強中 ★
: 06/12/10 20:44:38 ID:???
メモ
http://php.dori-mu.net/
267 :
名無しさん@勉強中
: 06/12/11 12:07:16 ID:NL76Neo7
どうやらバーボンに入ったままDATかhtml取得してるとダミーファイル掴まされる・・・。
ご丁寧にサイズもランダムでw
268 :
名無しさん@勉強中
: 06/12/11 12:50:58 ID:Pk+XrS3F
結局IP変えないと駄目だよね。
269 :
昼休み@名無しさん@勉強中 ★
: 06/12/11 13:13:25 ID:???
何だか最近書き込みが増えている・・
>>267
自分とこも以前はそうでしたけど
おととい辺りから一定のサイズのエラーページになったですよ
>バーボン行きの場合
>>268
IEのプロキシを変えればいいです
自動プロキシ変換させるようなソフトを検索すると
例えばこれがヒットしたです
http://www.vector.co.jp/soft/win95/net/se168304.html
試してませんが、一定時間毎のプロキシ変換とかできそうな感じ。
(まあ「できねーぞコラ」とか言われても困るんですが)
これで無理でもまだ他にありそうな。
http://www.vector.co.jp/vpack/filearea/win/net/dialup/
で
http://ex13.2ch.net/test/read.cgi/gline/1165245437/43-44n
実現するとしたら、リストファイルからURL一覧生成ればいいので
できなくはなさそうですが
迷惑をさらにかけるのは誠にしのびないので
やめときますです
人間、あきらめが肝心です
本当に。(自分に言い聞かせています)
270 :
昼休み@名無しさん@勉強中 ★
: 06/12/11 13:16:01 ID:???
ちなみにバーボン入りすると
こういうファイルが落ちてきます
194kb
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
BBQ<>kunio@makimo.to<>2006/12/08(金) 00:00<>しばらく時間を置いてからアクセスしてください。<>BBQ
他サイトで探してみる<><>2006/12/08(金) 00:00<>ttp://makimo.to/cgi-bin/ffind/ffind2.cgi?referer<>
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
271 :
名無しさん@勉強中 ★
: 06/12/11 19:36:53 ID:???
うーん
makimo.toさんの所
スレタイ検索結果からひとつづつ右クリックDLしても
バーボン行きになりますね。
きついなー
272 :
名無しさん@勉強中 ★
: 06/12/11 19:53:35 ID:???
ふと考えてみれば
>>263
> 重複チェックで取得済みはスルーできないかのぉ
ファイルの存在の可否を調べればいいので
−−−−−−−−−−−−−−−−−−−−−−−−−−−
work=GetHTMLDocument(out,sRoot & "/html/" & dat_folder & "/" & datkey & ".dat")
−−−−−−−−−−−−−−−−−−−−−−−−−−−
を
−−−−−−−−−−−−−−−−−−−−−−−−−−−
If Fs.FileExists(sRoot & "/html/" & dat_folder & "/" & datkey & ".dat")
Then '存在したので何もしない
Else work=GetHTMLDocument(out,sRoot & "/html/" & dat_folder & "/" & datkey & ".dat")
End If
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
とかすればいいのかなあと思ったりした初冬の暮れ
試してないのでこれでいいのかどうかわかんない
273 :
名無しさん@勉強中 ★
: 06/12/11 21:37:23 ID:???
ふむ
Iria ver1.07s9aを見てみると
オプション→オプション設定→速度制限
で速度を制限出来るんですな。
これやると
400kbのdatをDLするのに40秒くらいかかるです
274 :
名無しさん@勉強中 ★
: 06/12/11 21:42:39 ID:???
ただ問題は
クッキー送信がわかんないもんで
htmlで降りてくることです
どなたかproxomitronで
クッキー送信と
ベーシック認証の自動送信方法を教えて下さい
いろいろ見たけどよくわかんないdす
275 :
名無しさん@勉強中 ★
: 06/12/11 21:50:22 ID:???
メモです(流れてしまう掲示板仕様なので)
http://makimo.to/cgi-bin/bbs/Bbs.cgi
−−−−−−−−−−−−−−−−−−−−−−−−−−
[1024] (無題) 投稿者:makimo.to 投稿日:2006/12/11(Mon) 21:35
>>1020
詳細は非公開ですが、規模はみみずんさんより小さいです。
OS以外は普通のパソコンとあまり変わりません。
04Webserverをカスタマイズしてgzip転送やアクセス制御を行っています。
トラフィックとデータ量の推移は以下の通りです。
http://www.alexa.com/data/details/traffic_details?url=makimo.to
http://makimo.to/2ch/ssilog.txt
>>1023
アクセスがあるごとにカウンターが+1されていき、一定数(現在は300)を超えるとしばらくアクセスできなくなります。
カウンターは通常、数十分〜数時間アクセスがなければリセットされます。
慌てて実装したので、現在試行錯誤中です。
−−−−−−−−−−−−−−−−−−−−−−−−−−
ふむ。。
276 :
名無しさん@勉強中 ★
: 06/12/12 00:16:00 ID:???
たぶんやらない(というより出来ない)と思いますが
いざやろうとするなら
次のようなものが考えられるかな
makimo.toさんの御返事を見ると
300アクセスでバーボン行きにされておられるので
300個DLしたらIPを変更すればよいのかなと。
となると
ループ文に変数を置いて
300に達したらいったんsleep
↓
IEのプロキシ変更
↓
DL再開
この繰り返しでOKかも
277 :
名無しさん@勉強中
: 06/12/12 14:13:13 ID:muY/+Bqb
>274
なんか書いてあたーよ。
ttp://tmp6.2ch.net/test/read.cgi/download/1164164363/368
368 名前:[名無し]さん(bin+cue).rar[sage] 投稿日:2006/12/12(火) 12:13:26 ID:ER6udlPO0
[HTTP headers]
In = FALSE
Out = TRUE
Key = "Cookie: 29ch html2dat (out)"
URL = "$OHDR(User-Agent: Monazilla/1.00)"
Replace = "text=dat<>1<>0<>false<>mycss=<>0<>-1<>3000<><><><>"
In = FALSE
Out = TRUE
Key = "URL: 2ch - 29ch kakolog Redirect (Out)"
URL = "$OHDR(User-Agent: Monazilla/1.00)"
Match = "
http://((
[^.]+)\2.2ch.net|(www(2|)\0$SET(2=bbspink\0)|([^.]+)\0$SET(2=bbspink-\0)).bbspink.com)(:80|)/([^/]+)\3/((kako/([0-9]+{4})\4/\4([0-9])\5/
\4\5([0-9]+{5})\6|dat/([0-9]+{4})\4([0-9])\5([0-9]+{5})\6)$SET(7=\4\5\6)|(kako/([0-9]+{3})\4/\4([0-9]+{6})\5|dat/([0-9]+{3})\4([0-9]+{6})\5)$SET(7=\4\5)).dat"
Replace = "$RDIR(
http://makimo.to/2ch/
\2_\3/\4/\7.html)$FILTER(false)"
行が長すぎるから改行一個入ってる
278 :
名無しさん@勉強中 ★
: 06/12/12 18:44:49 ID:???
>>277
おぉう素晴らしい
でけたでとっつぁん
で、これ 専用ブラウザ用みたいなので
通常用のもやってみたです
[HTTP headers]
In = FALSE
Out = TRUE
Key = "Cookie: 29ch html2dat (out)"
URL = ".+makimo.to.+"
Match = "*"
Replace = "text=dat<>1<>0<>false<>mycss=<>0<>-1<>3000<><><><>"
[HTTP headers]
In = FALSE
Out = FALSE
Key = "Cookie: Fake a cookie (out)"
Replace = "monster"
これでhtmltodat経由で呼び出したら
dat形式で呼び出されたよママン。
ついでなので
http://contents-factory.net/remix2ch/
の階層状のものもクッキーを調べてやってみたら
[HTTP headers]
In = FALSE
Out = TRUE
Key = "Cookie: remix2ch (out)"
URL = ".+contents-factory.net.+"
Match = "*"
Replace = "preview_limit=zero; design=2ch; normal_view=on"
[HTTP headers]
In = FALSE
Out = FALSE
Key = "Cookie: Fake a cookie (out)"
Replace = "monster"
うまくいったぜベイビー
ヒューヒュー
279 :
名無しさん@勉強中 ★
: 06/12/12 18:58:53 ID:???
という事で
iriaをproxomitron経由にして帯域制限をつけてDLして
まとめたです
http://user.ftth100.net/mirrorhenkan/proxomitron/
いやー先人の方々の知恵の宝庫だなこれぁ
ベーシック認証についてもとか
ググってもさっぱりわからんかったですけど
スレ内検索で何とかなったですよはい
[HTTP headers]
In = FALSE
Out = TRUE
Key = "Authorization: p2"
URL = ".+xbb.jp.+"
Replace = "Basic *****************"
ちなみにこれ
公式p2サポスレ等で盛んに宣伝されている会員制●p2で
dat落ちしたスレをproxomitron経由のhtmltodatで読み出して
そのままdat化させるテストに使ったです。
テスト成功やったぜ母ちゃん
まあそれだけなんですけど。
280 :
名無しさん@勉強中 ★
: 06/12/12 19:25:44 ID:???
さて
sports2サーバのラウンジクラシック板を
ひーこらしながら落とさせて頂いたのですが
120個くらい欠けてるみたいですが
ごめん、何だか疲れちゃって
どうでもよくなってきちゃったです
どうしたものか。
281 :
名無しさん@勉強中 ★
: 06/12/13 18:51:52 ID:???
えーと
proxomitronのフィルタインポートがわかんないという方は
例えば↓こちらとか見たらいいと思うです
http://pasokon-yugi.cool.ne.jp/proxomitron/export_and_import.html
例えば
>>277
の奴だと
この場合は改行されてるのでどこかにコピペして
改行を取り払ってから右クリックコピーして
「HTTPヘッダフィルタ」の項目で右クリックして
「フィルタをクリップボードからインポート」で生成されるです
あとはブラウザや各種ツールのプロキシ設定を
「localhost:8080」に設定すればいいです
とにかく上で上げた所とか図入りで判りやすかったです
作るのはともかく
フィルタを取り入れる(インポート)にはコピペするだけ
実に簡単(・・だと思うです)
282 :
名無しさん@勉強中 ★
: 06/12/13 19:04:34 ID:???
ちなみに自分がproxomitronを入れたのはだいぶ前ですが
「レジストリはいじりません」とどこかに書いてあったので入れたです
もし「レジストリを汚します」とかあったら入れなかったろうなと。
Janeを入れたのも同様の理由だったっけなあと
ヘルプを見てもはっきり書いてある所とか無かったですが
http://moewe.xrea.jp/
のソフトレビューの項で「レジストリは使いません」とあったもので。
283 :
名無しさん@勉強中
: 06/12/13 19:55:03 ID:AMch42DN
>>281
大変あほな質問で済みませんが、
>>277
の改行を消すというのは、
[HTTP headers]
In = FALSE
Out = TRUE
Key = "Cookie: 29ch html2dat (out)"
URL = "$OHDR(User-Agent: Monazilla/1.00)"
Replace = "text=dat<>1<>0<>false<>mycss=<>0<>-1<>3000<><><><>"
In = FALSE
Out = TRUE
Key = "URL: 2ch - 29ch kakolog Redirect (Out)"
URL = "$OHDR(User-Agent: Monazilla/1.00)"
Match = "
http://((
[^.]+)\2.2ch.net|(www(2|)\0$SET(2=bbspink\0)|([^.]+)\0$SET(2=bbspink-\0)).bbspink.com)(:80|)/([^/]+)\3/((kako/([0-9]+{4})\4/\4([0-9])\5/
\4\5([0-9]+{5})\6|dat/([0-9]+{4})\4([0-9])\5([0-9]+{5})\6)$SET(7=\4\5\6)|(kako/([0-9]+{3})\4/\4([0-9]+{6})\5|dat/([0-9]+{3})\4([0-9]+{6})\5)$SET(7=\4\5)).dat"
Replace = "$RDIR(
http://makimo.to/2ch/
\2_\3/\4/\7.html)$FILTER(false)"
を
[HTTP headers]
In = FALSE
Out = TRUE
Key = "Cookie: 29ch html2dat (out)"
URL = "$OHDR(User-Agent: Monazilla/1.00)"
Replace = "text=dat<>1<>0<>false<>mycss=<>0<>-1<>3000<><><><>"
In = FALSE
Out = TRUE
Key = "URL: 2ch - 29ch kakolog Redirect (Out)"
URL = "$OHDR(User-Agent: Monazilla/1.00)"
Match = "
http://((
[^.]+)\2.2ch.net|(www(2|)\0$SET(2=bbspink\0)|([^.]+)\0$SET(2=bbspink-\0)).bbspink.com)(:80|)/([^/]+)\3/((kako/([0-9]+{4})\4/\4([0-9])\5/
\4\5([0-9]+{5})\6|dat/([0-9]+{4})\4([0-9])\5([0-9]+{5})\6)$SET(7=\4\5\6)|(kako/([0-9]+{3})\4/\4([0-9]+{6})\5|dat/([0-9]+{3})\4([0-9]+{6})\5)$SET(7=\4\5)).dat"
Replace = "$RDIR(
http://makimo.to/2ch/
\2_\3/\4/\7.html)$FILTER(false)"
というふうにすることなんでしょうか?
こうすると、英語でフィルターじゃないといわれるんですが。
それと、フィルターを設定したら、どのようにして、
専ブラ用のdatを手に入れることが出来るのでしょうか。
どうか宜しくお願いします。
284 :
名無しさん@勉強中 ★
: 06/12/13 20:14:31 ID:???
えと
私も初心者なんですけど(^^;
>>283
改行というのは
「Match=」から延々とやってる所の「\5/」のところだけみたい。
えーとですね
間違ってるかもなんですけど
これって
フィルタが二つあるみたいな感じなんですよ
いっぺんにインポート出来るかもなんですけど
とりあえず次の事をやってみて下さい
(1)クッキー送信用フィルタ
[HTTP headers]
In = FALSE
Out = TRUE
Key = "Cookie: 29ch html2dat (out)"
URL = "$OHDR(User-Agent: Monazilla/1.00)"
Replace = "text=dat<>1<>0<>false<>mycss=<>0<>-1<>3000<><><><>"
(2)リダイレクト用フィルタ
[HTTP headers]
In = FALSE
Out = TRUE
Key = "URL: 2ch - 29chtest kakolog Redirect (Out)"
URL = "$OHDR(User-Agent: Monazilla/1.00)"
Match = "
http://((
[^.]+)\2.2ch.net|(www(2|)\0$SET(2=bbspink\0)|([^.]+)\0$SET(2=bbspink-\0)).bbspink.com)(:80|)/([^/]+)\3/((kako/([0-9]+{4})\4/\4([0-9])\5/
\4\5([0-9]+{5})\6|dat/([0-9]+{4})\4([0-9])\5([0-9]+{5})\6)$SET(7=\4\5\6)|(kako/([0-9]+{3})\4/\4([0-9]+{6})\5|dat/([0-9]+{3})\4([0-9]+{6})\5)$SET(7=\4\5)).dat"
Replace = "$RDIR(
http://makimo.to/2ch/
\2_\3/\4/\7.html)$FILTER(false)"
285 :
名無しさん@勉強中 ★
: 06/12/13 20:20:39 ID:???
まず(1)をコピーしてインポートするです(やり方は
>>281
)
すると
「Cookie: 29ch html2dat (out)」というフィルタが登録されると思います。
Outにチェックが入っている状態なのを確認して下さい
次に
(2)をメモ帳等にコピペして
Match文の「\5/」の右の改行を消して
(あと空白スペースがついてたらそれも消して)
また選択してインポートして下さい。
「URL: 2ch - 29chtest kakolog Redirect (Out)」というフィルタが出来ます。
Outにチェックが入っているかどうか確認します
これでフィルタ登録完了
286 :
名無しさん@勉強中 ★
: 06/12/13 20:29:23 ID:???
で、上のは専用ブラウザ用のフィルタだもので
専用ブラウザを立ち上げてプロキシをlocalhost:8080に設定して
dat落ちしたスレッドを呼び出せば
makimo.toさんの所から呼び出せると思うです。
ただ、
>>264
で自分が出したスクリプトでは
別にproxomitronを使わないでもいいと思うですけど。
どうしてもproxomitron経由にしたいなら
>>278
で書いたフィルタをインポートして
ブラウザか何かのツールのプロキシを
localhost:8080にすればいいのかなと思うですが
よくわかんないです
いやー疲れた・・・。
287 :
名無しさん@勉強中
: 06/12/13 21:33:40 ID:AMch42DN
【Proxomitron】Jane用内部Proxy設定スレ【Privoxy】
http://jane.s28.xrea.com/test/read.cgi/bbs/1156092349/20
20 名前:Jane使いの名無しさん[sage] 投稿日:2006/08/23(水) 09:49:39 ID:17lRCPiJ
スレの流れとは違うんだけど昔、外部コマンドスレにあったフィルタ。
かなり便利。
で、フィルタ貼ろうとしたんだが長すぎで改行しないと貼れないので
興味ある人は
http://vamp.s9.xrea.com/updata2/888.zip
これの中の「(2) 599」ってフォルダの中のreadmeを読んでくれ。
内容は↓
■みみずんにリダイレクトさせるProximitron用フィルタ
2chブラウザでShiftキーを押しながらスレを読ませると、みみずん(/kako)からdatを取得します。
2chブラウザでCtrlキーを押しながらスレを読ませると、みみずん(/dat)からdatを取得します。
■にくちゃんねるのhtml2dat.cgiにリダイレクトさせるProximitron用フィルタ
2chブラウザでCtrl+Shiftキーを押しながらスレを読ませると、にくちゃんねるからdatを取得します。
288 :
名無しさん@勉強中
: 06/12/13 21:41:26 ID:AMch42DN
>>287
■みみずんにリダイレクトさせるProximitron用フィルタ
2chブラウザでShiftキーを押しながらスレを読ませると、みみずん(/kako)からdatを取得します。
〃 Ctrl 〃 (/dat)
みみずんのdatは/dat(Live)→/kako(dat落ち後)という流れで移動します。
dat落ち直後で/kako送り前はCtrlキーの方でないと取得できませんので、
ShiftがダメならCtrlという具合に試してみてください。
なお、みみずんのdatは末尾のレスが欠けてる事が少なくないので、過去ログ倉庫の
レス数を見て、みみずんが欠けてるのか落ちスレなのか確認するといいでしょう。
※下のフィルタをコピー →「フィルタをクリップボードからインポート」で簡単に登録できます。
[HTTP headers]
In = FALSE
Out = TRUE
Key = "URL: mimizun Cache Redirect (Out)"
URL = "$OHDR(User-Agent: Monazilla/1.00)"
Match = "
http://(
[^.]+.(2ch.net|bbspink.com))\0(:80|)/([^/]+)\1/((kako/([0-9]+{4})\2/\2([0-9])\3/\2\3([0-9]+{5}.dat)\4|dat/([0-9]+{4})\2([0-9])\3([0-9]+{5}.dat)\4)
$SET(5=\2/\2\3)$SET(6=\2\3\4)|(kako/([0-9]+{3})\2/\2([0-9]+{6}.dat)\3|dat/([0-9]+{3})\2([0-9]+{6}.dat)\3)$SET(5=\2)$SET(6=\2\3))($KEYCHK(^S)
(^$KEYCHK(^C))$SET(7=kako/\5/\6)|(^$KEYCHK(^S))$KEYCHK(^C)$SET(7=dat/\6))"
Replace = "$RDIR(
http://mimizun.com:81/log/2ch/
\1/\0/\1/\7)"
289 :
名無しさん@勉強中
: 06/12/13 21:42:30 ID:AMch42DN
>>288
■にくちゃんねるのhtml2dat.cgiにリダイレクトさせるProximitron用フィルタ
2chブラウザでCtrl+Shiftキーを押しながらスレを読ませると、にくちゃんねるからdatを取得します。
※注意
取得済の既存のレスがある&にくちゃんねるでミラーされてないスレを読み込むと
既存のレスが消えてしまいますので、にくちゃんねるでミラーされてる事を確認
した上で読み込んで下さい。
外部コマンド29view.jsを使って確認するといいです。
これは、cgiがログの有無に関わらずHTTPレスポンス200を返すため、これを受けた
2chブラウザがログを上書きするためです。
にくちゃんねるは今Over 1000 Threadしかミラーしてないそうですし、移転情報入手
→ミラー先変更の設定も手でやられてるようで、移転後にOver 1000 Threadになった
スレは割と抜けてますので要注意です。
[HTTP headers]
In = FALSE
Out = TRUE
Key = "URL: 29ch kakolog Redirect (Out)"
URL = "$OHDR(User-Agent: Monazilla/1.00)"
Match = "
http://((
[^.]+)\2.2ch.net|(www(2|)\0$SET(2=bbspink\0)|([^.]+)\0$SET(2=bbspink-\0)).bbspink.com)(:80|)/([^/]+)\3/((kako/([0-9]+{4})\4/\4([0-9])\5/\4\5([0-9]+{5})\6|dat/([0-9]+{4})\4([0-9])\5([0-9]+{5})\6)
$SET(7=\4\5\6)|(kako/([0-9]+{3})\4/\4([0-9]+{6})\5|dat/([0-9]+{3})\4([0-9]+{6})\5)$SET(7=\4\5)).dat$KEYCHK(^C^S)"
Replace = "$RDIR(
http://makimo.to/cgi-bin/html2dat/html2dat.cgi?
\2_\3/\4/\7.html)$FILTER(true)"
290 :
名無しさん@勉強中
: 06/12/13 22:17:23 ID:AMch42DN
>>284-285
たいへんありがとうございます。
最初
>>283
の質問したように考えたのですが
あとから、フィルターが2つあるのではないかと考え
空白の前半と、後半に分けて
インポートしたのですが、前半は登録できたのですが
後半がフィルターとして認められず途方に暮れました。
アドバイスにしたがって、2つのフィルターとも
登録がうまく出来ました。
291 :
名無しさん@勉強中
: 06/12/13 22:17:27 ID:MBOKfJ9H
>>286
どうも、メールにてmakimoto_htmlget_4を配付してもらった者の一人ですが
>>264
にある
http://www.geocities.jp/mirrorhenkan/others/makimotoforever/makimoto_htmlget_4_20061210.vbs.txt
の.txtを削って適当なフォルダに入れ
http://makimo.to/2ch/aa5_aasaloon/index.html
を入力してみたのですが
倉庫リストのリンクURLが見つかりませんというメッセージが出て使えません
http://makimo.to/2ch/cookie.html
にて表示モードをtxtにしたりdatにしたりもしてみたのですが・・・
http://makimo.to/2ch/index.html
から適当にログを開いてみたのですが
バーボンにはされていないようです。
馬鹿な、質問かも知れませんが教授願います。
292 :
名無しさん@勉強中 ★
: 06/12/13 22:51:42 ID:???
最近書き込みが多いなー
まあ年内いっぱいでしょうけど
>>287-289
どもです
変換スクリプトをこしらえる時
そのフィルタでとても勉強させて頂いたです
>>290
出来たですか
良かったです
>>291
リストファイル(server_board.html)をDLしないように改造したからです。
以前のスクリプトでリストファイルをDLしてから使えばいいです。
ちなみにリストをDLしないようにした理由ですが
途中でバーボン行きになった場合 再実行すると
また最初からやり直しになってしまうからなので
元リストのDL済みの所まで消してからやれば
そこから再開出来るからです
・・・何てまわりくどい文章だ
もっと簡潔に論理的に書けないのか
ああ寂しいなあ(←ロンリー的)
293 :
名無しさん@勉強中
: 06/12/13 23:10:40 ID:AMch42DN
>>286
わからないことが多すぎて
過去ログを検索しながら、この文章をかいているのですが
自分の知りたいレスがなくて、途方に暮れています。
> dat落ちしたスレッドを呼び出せば
呼び出すという表現がよく分かりません。
> ただ、
>>264
で自分が出したスクリプトでは
このスプリクトは、どうやったら使えるようになるのでしょうか。
> 別にproxomitronを使わないでもいいと思うですけど。
proxomitronにこだわってはいません。
とにかく、専用ブラウザ用のdatファイルが欲しいのです。
htmltodatを使ってひとつひとつ、にくちゃんねるのhtmlファイルを
datファイルに変換させているのですが
どうにもこうにも手間がかかって
proxomitronなら、もっと楽にできるのかどうか、試行錯誤しているところです。
> よくわかんないです
> いやー疲れた・・・。
大変申し訳ありません。
それにしても、stlyeのプロキシ設定が全然わからない。
294 :
名無しさん@勉強中 ★
: 06/12/13 23:29:06 ID:???
えーと・・・
proxomitronを出された事から思うのですが
download板から来られたのでしたら
あちらで私が出した(そして叩かれた)スクリプトで
リストファイルをDLしてから
>>264
で出したものを使えばいいと思います。
それでもわからなければ
あとは・・申し訳ないですが
他の方にあたって下さい。
というか
他の方(
>>291
さんとか) 宜しくお願いしますです
それにしても
>>269
でも書いたですが
人間、あきらめが肝心だと心底思うですよ
295 :
名無しさん@勉強中 ★
: 06/12/14 00:04:53 ID:???
メモ
各種p2(公式p2 or 公開p2)のhtmlをdat化させる為の前処理
−−−−−−−−−−−−−−−−−−−−−−−−−−−
s#\n(?:\t| +).+?\n##g
s#(<a )target=_top (href=)#$1$2#ig
s#(</a> )\[<a href="subject\.php\?host=.+?target="subject">板をp2で開く</a>\] #$1#ig
s#<title.*?>(.*?)/(.*?)</title>#<title>$2</title>#
s#\(<a href="read.php\?bbs=([^:]+?)ID:([^<]+?)(</a>(?:\(\d+\))?)#ID:$2#g
s#(\(p\))(h?ttp://)#$2#
s#(<><>)(.*?)( :)#<>$2<>#
s#\(<a href="
http://be.2ch.net/test/p.php
\?i=(\d+)&u=(.+?)\?(\#*)</a> *?</dt>#BE:$1-$3</dt>#g
s#<dd id=.*?\n##ig
s#</i></dd>##ig
s#<b>(.*?) </b>(.*):(.*?) :#<a href=\"mailto:$3\"><b>$1</b></a> :#g
s#\(<a(.+?)\">p</a>\)##g
s#<b>(.*?) </b>#<b>$1</b>#g
s#<a href="read.php\?host=.+?>(\d+)</a>#$1#g
−−−−−−−−−−−−−−−−−−−−−−−−−−−
正規表現はsnapshotで使ったのと同じものでOKみたい
m#<dt.*?>([0-9]+).+?(?:"mailto:\.?(.+?)">)?<b>(.*)</b>.*?:(.*?)</dt>.*<dd> ?(.*)<br><br></dd>#mi
296 :
291
: 06/12/14 03:22:39 ID:zHp90MPZ
>>292
makimoto_htmlget_3にて作成されたindex.htmlに
htmlフォルダーと世界史板のacademy4_whisフォルダー
そしてacademy4_whisフォルダー内にあったacademy4_whis.htmlを
makimoto_htmlget_4_20061210.vbsの入ったフォルダーに入れて動かしたところ
Find.txtが作成され.txt内には
http://makimo.to/2ch/academy4_whis/index.html
と書き込まれていて
特にエラーのダイアログも無くWscriptもタスクマネジャーで確認が取れました
その後30分ほど動かしてみましたがdatがたまる気配がありません
makimoto_htmlget_3を使っていたときにバーボンに弾かれていて
その時作成されたserver_board.htmlを利用したのですがそれが問題なのでしょうか?
ためしにmakimoto_datget_2で作られたserver_board.htmlにて試してみましたが
エラーのダイアログが出てWscriptも動かない状況です。
ひょっとしてバーボンにまた弾かれたのかとおもいましたが
世界史板のログを読むことが出来たのでアク禁にはなっていないようです
どうぞアドバイスをお願いいたします。
297 :
291
: 06/12/14 03:30:11 ID:zHp90MPZ
>>294
いやいや、更新は大切ですね・・・
僕に振られても困りますなぁ
サポートは大変ですね・・・
298 :
名無しさん@勉強中 ★
: 06/12/14 08:29:45 ID:???
出がけに
>>296-297
makimoto_htmlget_4_20061210.vbsをメモ帳等のエディタで開いて
(1)
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
'/////////////////ループ処理/////////////////////////
For Each url In urlList
wscript.sleep 60000
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
を検索したら
wscript.sleep 60000の行を削除
(2)
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
work=GetHTMLDocument(out,sRoot & "/html/" & dat_folder & "/" & datkey & ".dat")
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
を検索して
下記に変更
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
work=GetHTMLDocument(out,sRoot & "/html/" & dat_folder & "/" & datkey & ".dat")
wscript.sleep 60000
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
これでいけるかなと。
(1)ではacademy4_whis.htmlを1行読みとり毎に
1分づつウェイトをおいていたので
1行〜29行まではヒットしないまま1分づつ待っておったです
従って最初の29分は溜まらなかったと。
(2)ではヒットしてログを保存してから1分待つようにしたので
ヒットしない行でのロス時間は無くなったのではないかと思います。
(現に今試してうまくいってますし)
あとは300DL毎にバーボン行きになる件ですが
・・どうしたもんですかね。
自分にはお手上げです
299 :
名無しさん@勉強中 ★
: 06/12/14 08:43:29 ID:???
それと
>>293
> それにしても、stlyeのプロキシ設定が全然わからない。
もう気付かれたのかもですが
>>287
で御自身が出されたjaneスレにあるみたいですよ。
http://jane.s28.xrea.com/test/read.cgi/bbs/1156092349/6
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
6 :Jane使いの名無しさん :2006/08/21(月) 12:42:40 ID:3VPqFj9P
tp://pc7.2ch.net/test/read.cgi/software/1152479379/1
ここの日本語化を使ってる前提でProxomitron側の設定
ヘッダ→新規→key以降の"の内側をコピペ→ok→trueをチェック(この場合out)
jane側の設定
ツール→設定→通信→proxyを使う→鯖:localhost、ポート:8080
終了
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
あと独り言ですが
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
15 :10 :2006/08/22(火) 20:07:01 ID:v7vez/85
どなたか分かりませんか?
ttp://jane.s28.xrea.com/test/read.cgi/bbs/1143250698/353-362から来ました
16 :Jane使いの名無しさん :2006/08/22(火) 20:22:45 ID:E+f77ppJ
>>15
わかるよ。
でも教えちゃうと、俺には害しか無いんだよな。
ここで教えると皆が使い出して、そこの負荷が増えて重くなって・・・・・
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
心の底から同感・・
300 :
名無しさん@勉強中 ★
: 06/12/14 19:41:57 ID:???
>>296
のセットをしたまま放置して
さっき見たら158個のdatがローカル保存されてたです。
もったいないのであげときます
http://user.ftth100.net/mirrorhenkan/whis/
・・今度はサーバのphp設定が変わったようで
未定義変数の警告が出るようになったみたい。
emptyかissetをかませればいいみたいなんですが
phpってどういうものだか忘れてしまってるー。
まあ冗談はおいといて
$st = $_GET[st];
を
if(isset($_GET[st])){$st = $_GET[st];}
とかやっとけばいいのかな
でもひとつひとつやるのか・・
501 KB
続きを読む
掲示板に戻る
全部
前100
次100
最新50
名前:
E-mail
(省略可)
:
read.php ver2.4 2005/04/13