テレワークならECナビ Yahoo 楽天
LINEがデータ消費ゼロで月額500円〜!
無料ホームページ 無料のクレジットカード 海外格安航空券 海外旅行保険が無料! 海外ホテル
■掲示板に戻る■ 全部 1- 101- 201- 301- 401- 501- 601- 701- 801- 最新50
メモ2
- 1 :名無しさん@勉強中 ★:06/09/16 19:36:34 ID:???
- これまた思いついた事など
- 179 :名無しさん@勉強中 ★:06/11/28 18:57:51 ID:???
- さて
あちこちに にくちゃんねる休止スレが立ってますが
その中の一つ
ダウンロード板より
「にくちゃんねる」休止のおしらせ
http://tmp6.2ch.net/test/read.cgi/download/1164164363/l50
流石ダウンロード板(って何が流石なのか)
とはいえ
●でも実況スレが見れないという書き込みが多いのは何故なのか
−−−−−−−−−−−−−−−−−−−−−−−−−−−
17 :[名無し]さん(bin+cue).rar:2006/11/22(水) 14:02:15 ID:bBQXvDIL0
>>7ではああいったけど
●は実況系の過去ログ見れないから正直なくなると不便です
57 :[名無し]さん(bin+cue).rar:2006/11/23(木) 08:59:47 ID:qtCSI0pU0
マジでなんとかしろよ
●買えってレベルじゃ…
実況スレ見れねーし
128 :[名無し]さん(bin+cue).rar:2006/11/26(日) 16:03:43 ID:dt77QoPt0
にくちゃんねるないと困る・・・
特に実況
129 :[名無し]さん(bin+cue).rar:2006/11/26(日) 16:36:32 ID:GIjeUJ5U0
なんでそんなに実況が見たいの?
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
あと
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
81 :[名無し]さん(bin+cue).rar:2006/11/24(金) 03:24:16 ID:AXijsvC50
>75
だが、にくちゃんの変換用正規表現が良く分らんので困る
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
dat化しようとしてるのかな
- 180 :名無しさん@勉強中 ★:06/11/28 19:07:39 ID:???
- 自分とこも出てますがそれはおいといて
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
38 :[名無し]さん(bin+cue).rar:2006/11/22(水) 20:16:18 ID:NL9sAICj0
誰かにくちゃんの全データをコピーしたHDDをnyに流してくれ
70 :[名無し]さん(bin+cue).rar:2006/11/23(木) 19:42:27 ID:GmF3wrqh0
洒落かnyでダウンロード板のJaneで使えるログ
流してくださいお願いします。
91 :[名無し]さん(bin+cue).rar:2006/11/24(金) 11:48:42 ID:GiDgZZtC0
ダウソ板だけで結構なのでJaneで使える過去ログをnyか洒落に放流してください
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
流石ダウンロード板
- 181 :名無しさん@勉強中 ★:06/11/28 19:18:29 ID:???
- で
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
140 :[名無し]さん(bin+cue).rar:2006/11/27(月) 17:56:42 ID:67uYNAUkO
にくちゃんねるのログをまとめて一気に保存する良い方法ないですか?ダウンロードソフトを使ってもうまく落とせません
141 :[名無し]さん(bin+cue).rar:2006/11/27(月) 17:58:20 ID:yKv4SAJu0
そーゆーことするから回線パンクすんじゃねーの
145 :[名無し]さん(bin+cue).rar:2006/11/27(月) 23:56:31 ID:jHWPqKqB0
にくちゃんねるのログをぶっこ抜くのってどうすればいいの?
146 :[名無し]さん(bin+cue).rar:2006/11/28(火) 00:49:13 ID:JuPlfqp60
ぶっこ抜くとか言う奴ってネトラン厨っぽくて厭
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
やらないけど
ちょっと考えてみたです。
過去ログ墓場をJavaScriptオンで開いて
http://makimo.to/2ch/tmp6_download/index.html
適当なスレを選んで
http://makimo.to/2ch/tmp6_download/1164/1164624670.html --(1)
それの右上にあるdatのURL
http://makimo.to/cgi-bin/html2dat/html2dat.cgi?tmp6_download/1164/1164624670.html --(2)
この(1)と(2)のURLの相違点を調べて
正規表現か何かでdatURLに一括変換して
(2)なら保存名を「1164624670.dat」にするように設定して
あとは適当に保存すればいいかなと。
個別に保存名を変えるのはwshならわかるですけど
他のツールだと どうやるんだろうなー。
- 182 :名無しさん@勉強中 ★:06/11/29 06:02:52 ID:???
- −−−−−−−−−−−−−−−−−−−−−−−−−−−−
[1004] (無題) 投稿者:ぴ 投稿日:2006/11/28(Tue) 21:50
(中略)
>>1002-1003
削除というよりは「見えなくなる」と言うほうが適切かもしれません。
今のうちに必要分を落としておくしかないと思います。
休止後にアクセスがあった場合は以下のような感じで他サイトへ誘導するようになります。
●があれば大半は読めると思います。
http://makimo.to/cgi-bin/ffind/ffind2.cgi?news20_news/1164/1164162822.html
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
うむ
やはりもう少し考えてみようかな
- 183 :名無しさん@勉強中 ★:06/11/29 07:32:34 ID:???
- メモ
・ダイアログから板URL入力(例http://ex13.2ch.net/gline/)
↓
・サーバ名・板名抽出(ex13・gline)
makimo.toURL変換(http://makimo.to/2ch/ex13_gline/index.html)
↓
・http://makimo.to/2ch/ex13_gline/index.htmlをダウンロード
↓
・一行づつ読み込む
正規表現によるマッチング−−−−−−−−--(1)
マッチしたらURLを組み立ててダウンロード
以下最終行まで繰り返し
※(1)
・datキーの場合→半角数字9or10文字のマッチング→「\d{9,10}」とか
・タイトルの場合→まんまやないけ
- 184 :名無しさん@勉強中 ★:06/11/29 08:59:41 ID:???
- 考えたら
板のdatを全取得するwshとか出してみても
それほど反応は無かったので
makimo.toさんの所からdatを取得するwshを出しても
そう反応も無いだろうなと。
「何仕込んであるかわかんねーし怖くて使えねー」
という人とか多いでしょうし。
- 185 :名無しさん@勉強中 ★:06/11/29 17:54:13 ID:???
- はい出来たですよ
http://www.geocities.jp/mirrorhenkan/others/makimotoforever/makimoto_datget.zip
説明のindexもつけて
後で書いときますかね
- 186 :名無しさん@勉強中 ★:06/11/29 18:08:12 ID:???
- さて
どうしようか
避難所に書いて
mirrorhenkanのindexにつけて
あとはどうしたものか。
>>179のスレにも書こうかな
でも「ウイルス」とか言われても何ですし
うーむ
- 187 :名無しさん@勉強中 ★:06/11/29 19:46:01 ID:???
- はい完成
http://www.geocities.jp/mirrorhenkan/others/makimotoforever/
作ってから気付いたですけど
datキー9桁の場合 うまくいかんかもです
一応正規表現でつけたつもりですけど
実際に試してないもんで
- 188 :名無しさん@勉強中 ★:06/11/29 19:57:07 ID:???
- http://jbbs.livedoor.jp/bbs/read.cgi/computer/21256/1116159529/l50
>>992
参考にさせて頂くです
ただ つくづく思うですけど
「こんな事出来ないですか」とか書いてあって
こうやったら出来るよ とか書いても
無反応なのは なんだかなあ
もう慣れたですけど。
あと私 動けばいいと思ってるので
「きたねーソースだなー」とか言われても
やはり なんだかなあと。
まあそれだけの話なんですが
>>993
私のPCは残容量200メガかそこらだもんで
372メガをDLする再現とか出来んです
ただ news4vip板のブーンスレとか
自分の環境ではエラーもなく丸一日過ごせたもんで
どうしたものでしょうか。
ほんと
新しいPC 欲しいなあ
- 189 :名無しさん@勉強中 ★:06/11/29 20:22:49 ID:???
- 追記
http://makimo.to/2ch/pc8_prog/index.html
の 230件79.8メガで無問題だったですが
- 190 :名無しさん@勉強中 ★:06/11/29 20:44:27 ID:???
- とりあえず
UNIX板とDownload板に書いてみたです
マルチポストと言われればそれまでですが
板だけでも800以上ありますし
サーバ毎に分かれているので
実質 2000〜5000くらい分岐しているのかなと。
makimo.toさんには悪いですが
かなり動員しても さてどんなもんでしょうという感じです
- 191 :名無しさん@勉強中 ★:06/11/30 09:01:16 ID:???
- http://tmp6.2ch.net/test/read.cgi/download/1164164363/174
言い訳じみていますが
(1)「12/31まで」と期限が限られている事
(2)>>182のmakimo.toさんの書き込み
「今のうちに必要分を落としておくしかないと思います」
この2点を勘案して上のスクリプトを出したです。
まあしかしDownload板のほうには書かないほうが良かったかな
あと
http://makimo.to/cgi-bin/bbs/Bbs.cgi
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
1007] 長い間お世話になりました 投稿者:名無しさん 投稿日:2006/11/30(Thu) 00:46
出先や会社などの●を使えない環境から時々使わせていただいていました。
出来る限り負担をかけないようにgeoのhenkanとかは最低限しか利用せずに共存共栄を目指していたのですが残念です。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
> geoのhenkan
どう考えてもここの事だよなあ
しばらく静観
- 192 :名無しさん@勉強中 ★:06/11/30 18:41:07 ID:???
- http://tmp6.2ch.net/test/read.cgi/download/1164164363/176n-
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
176 :[名無し]さん(bin+cue).rar:2006/11/30(木) 14:54:42 ID:q1e8wQ340
>174
大丈夫じゃね?
オレもそれでログ掘ったけどいくつかやって即飽きた。
だって一度に落とせるわけじゃなく一つ終わったら次のURLを指定って
すげーめんどくさいもん。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
複数の板を設定して自動クロール取得とか
改造すれば可能ですハイ
埋もれてますが下のスクリプトと合わせて
改造すれば可能ですハイ
http://www.geocities.jp/mirrorhenkan/others/mirrorserve/
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
177 :[名無し]さん(bin+cue).rar:2006/11/30(木) 15:43:02 ID:AIStFLjH0
>>176
いやお前みたいなのは普通に読んでるのと変わらんからいいんだけどな。
俺みたいにスクリプトで一回設定したらあとは一括で全ダウソとかやるヤツが
増えたらあっという間に破綻するぞ。既に期限付きだしな。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
これだけではわからんのですが
177さんはそういうスクリプトを作って一括DLされたのでしょうか。
makimo.toさんの過去ログ墓場のページを見てみると
一括クロールされないようにという配慮なのか
ソースだけ見てもスレのURLとかわかんないようにされてるみたいですけど。
さてさて
改造は可能なんですが
177さんの仰られる事も御尤もだもんで
どうしたものか。
makimo.toさんの所に過度な迷惑をかけられないですし
かといって
makimo.toさんの所にしか残ってないログも多いでしょうし
うーむ
そういう風にプチハック(カッケー!)したwshを
欲しい人とか居たら連絡下さいです
(↑そんな人誰も居ないだろうとタカをくくっているのかな)
- 193 :名無しさん@勉強中 ★:06/11/30 18:54:27 ID:???
- というか
>>192の176さんが使ってみて
問題なく動いた由
いやー嬉しいなあ
- 194 :名無しさん@勉強中 ★:06/11/30 21:09:07 ID:???
- さて
スレタイ検索とかやるとして
perlやphpのデータベース検索スクリプトとか結構ありますが
例えばnews4vipとかだと
subject.txtだけで150メガとか200メガあるいはもっともっと
という事になる訳ですよ。
レンタルサーバではとてもとてもな状態です。
makimo.toさんのスレタイ検索とかでも
300メガくらいのデータベースを一括検索されておられると
以前お書きになられてましたし。
で データベース板に行ってみたんですが
http://pc8.2ch.net/db/
Mysqlをphpで運用すれば何とかなるのでしょうか。
データベースに100万行とか書けるのでしょうか。
Mysqlを使えるサーバとか結構あるですが 使えるのでしょうか。
というか 私 使えるのでしょうか。
- 195 :名無しさん@勉強中 ★:06/12/01 00:30:40 ID:???
- へたった頭で考えた世迷い言かもですが
>>192の改造したものを出しておいたら
全ログを拾って公開して下さる方とか
もしかしたら 出てこられるかもです
出してみまs
この場合
賛成する人と反対する人
拮抗するんだろうなあ
ほんと どうしようか
- 196 :名無しさん@勉強中 ★:06/12/01 09:55:17 ID:???
- メモ
http://blog.yuhisa.com/2ch_dat.php?ita=operate
よくわかんないんですが
現在進行形の所みたいです
http://blog.yuhisa.com/2ch_dat.php?ita=news4vip&p=43&t=&s=
左上に「DATファイル追加」という項目があるので
datをアップロード出来るみたい。
ルートを辿ってブログを見せて頂くと
7/24の項目に
http://blog.yuhisa.com/archives/2channel.php
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
ついでに今までfopenで行ってた読み込みをfileで行うようにしたので快速に。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
そうなんですか。
fopenよりfileのほうが速いんですか。
fileって一行づつ読み込む関数だったっけかな
file_get_contentsが一括読み込みだったっけかな
あと
http://2se.dyndns.org/
- 197 :名無しさん@勉強中 ★:06/12/01 19:40:23 ID:???
- http://tmp6.2ch.net/test/read.cgi/download/1164164363/194-195n
さあ書くだけは書いた
叩かれるかな
もうどうでもいいけど。
それにしても
態度や口調がコロリと変わりますな
相手によって態度が変わるのはある程度仕方ないですが
私も気をつけなければ。
- 198 :名無しさん@勉強中 ★:06/12/01 19:42:43 ID:???
- と書き込んだ自分の文章を見て
さらに鬱になったりして
- 199 :名無しさん@勉強中 ★:06/12/01 19:49:46 ID:???
- さらにさらに
まだ改造してないもんで
何か反応があればあったら
まいっちんぐマチコ先生だったりして
- 200 :名無しさん@勉強中 ★:06/12/01 20:02:43 ID:???
- さらにさらにさらに
反応が無ければないで
まあそんなもんやね
というか打たれ弱いもんで
煽られるよりは
無反応なほうがよっぽどいいです
- 201 :名無しさん@勉強中:06/12/02 03:45:49 ID:4JoD/kho
- 検索したら出てきたので>>127に返信w
以前(xrea.comから戻る前)までは一定期間datを保持していましたが、容量不足により現在は長時間のdat保管は行っていません。
近日中にdatを分散させる形でdat落ち後のdatを表示する又は、●等に対応させようと思っています。
- 202 :名無しさん@勉強中 ★:06/12/02 08:08:03 ID:???
- >>201さん
御返信ありがとうございます
楽しみにしていますです
さて
makimo.toさんのhtml2dat.cgiが真っ白画面だ・・・。
いろいろ書かれているなあ
でも他に方法は無かったですし
まあ仕方ない
もしこのままの状態だとしたら
htmlをDLするように作り替えて
htmltodatに一括変換させるようにするですかね。
とりあえず
ごめんなさい
- 203 :名無しさん@勉強中 ★:06/12/02 08:23:48 ID:???
- それにしても
後付けオプションだから仕方ないんでしょうけど
何でhtml2cgi.cgi経由なのでしょうか。
みみずんさんやDinoswiftさんのところのように
datを静的にDL出来るようにされておられれば嬉しいのですが。
そもそも どのような形式でログ保存されているのか
教えて頂きたく思うです
古いスレッドのdatとかをDLしても
本家ではカンマ(「,」)区切りになっているのに
makimo.toさんの所では「<>」区切りになっておられますし
2chのdat形式では保存してないのかな
- 204 :名無しさん@勉強中 ★:06/12/02 08:38:55 ID:???
- ずっとこのままだとしたら
方法は2つ
(1)あきらめて静観する
(2)htmlをダウンロードするようにしてdat化する
(1)ですが、のちのち後悔しそうです。
あの時にああしとけば良かったこうしとけば良かったとか
あれこれ思いそう。
となると(2)ですかね。
あと
公開したのを後悔してないですが
縁もゆかりも興味もないDownload板に書いたのは後悔してたりして。
# 関係ないですが
# 47さんもこんな心境だったのかな
# 今はどう思っておられるのかな とか思ったりして
- 205 :名無しさん@勉強中 ★:06/12/02 08:54:36 ID:???
- # ↑随分大きく出たもんだ・・
という訳で
htmlを保存するように作り替えて
あとは静観かな
htmlをダウンロードして
dat化してdat保存
その後 htmlを削除とか
wsh単独でも やって出来なくはないですね。
ただスキルが追いつかないだけで。
(↑一番駄目なパターン)
- 206 :名無しさん@勉強中 ★:06/12/02 11:19:04 ID:???
- とりあえず
htmlファイルをローカル保存するものを出しておくです
http://www.geocities.jp/mirrorhenkan/others/makimotoforever/html.html
dat落ち避難所スレにだけ書いておこう
- 207 :名無しさん@勉強中 ★:06/12/02 12:21:32 ID:???
- メモ
正規表現(このBBS 改行規制何とかならないものか)
m#<dt>([0-9]+) 名前:<span .*?>(?:<span title="(.*?)" cl
ass=sage>|<a href="mailto:(.*?)" class=mailto>)? ?(.*) (?
:</a>|</span>)?</span> ?(.*?) <br><dd> *?(.*?) <br> *?<br
> *?(<a name.*?>|</tl>|</dl>)#mi
変換結果式
$4<>$2$3<>$5<>$6<>
これでいけるですが
問題点をあげると
・be関係を入れてない
・「あぼーん」や「sage」等
プレーンテキストになる可能性のある前処理をつけてない
・他スレのリンクが
「../../be_be/1107/1107809637.html 」
「../../qb5_operate/1106/1106061017.html#249」
となっている
3番目は前処理で何とかしたいなぁ。
1・2番目も前処理でごまかせればいいなぁ。
という訳で
htmltodatのバージョンアップされたものを使う時がきたかもです
(すみませんスルーしたみたいになってしまって>mukiyuさん)
- 208 :名無しさん@勉強中 ★:06/12/02 12:37:33 ID:???
- http://pc8.2ch.net/test/read.cgi/tech/1143262686/676n-
・・いよいよ始動したようです。
- 209 :名無しさん@勉強中 ★:06/12/02 12:56:08 ID:???
- (1)be部分
ID:Zpu0G/4N <a href="JavaScript:be(486461748)">?</a>BRZ(1113) <br>
(2)他スレリンク
・同サーバ・同板の場合
<a href="../1127/1127911361.html">../1127/1127911361.html</a> <br>
・別板の場合
<a href="../../be_be/1106/1106239080.html">../../be_be/1106/1106239080.html</a>
- 210 :名無しさん@勉強中 ★:06/12/02 13:10:59 ID:???
- s#<a href="JavaScript:be\((\d+)\)">\?(\#*)</a>(.+?)( <br>)#BE:$1-$2$3$4#gi
- 211 :名無しさん@勉強中 ★:06/12/02 13:52:49 ID:???
- 上の駄目
これでOKっぽい
s#<a href="JavaScript:be\((\d+)\)">\?(\#*)</a>#BE:$1-$2$3#gi
- 212 :名無しさん@勉強中 ★:06/12/02 14:03:40 ID:???
- 次
同サーバ・同板の場合
s#(>)\.\./\d+?/(\d+?)\.html(</a>)#$1http://server.2ch.net/test/read\.cgi/board/$2/$3#ig
これで何とか変換出来ました。
問題は「server」「board」で入力した箇所。
自動変換出来るようにはならないものか。
- 213 :名無しさん@勉強中 ★:06/12/02 14:19:19 ID:???
- 別サーバ・別板の場合
s#(>)\.\./\.\./(.+?)_(.+?)/\d+?/(\d+?)\.html(</a>)#$1http://$2\.2ch\.net/test/read\.cgi/$3/$4/$5#ig
これで何とかなったかな
- 214 :名無しさん@勉強中 ★:06/12/02 14:24:15 ID:???
- >>208のスレッド
楽しそうだなー。
でも
この方と同様 私には関係ない話みたいです
http://pc8.2ch.net/test/read.cgi/tech/1143262686/938n
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
938 :デフォルトの名無しさん :sage :2006/12/02(土) 14:11:28
Win98の俺には関係ない話だったのか(´・ω・`)
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
read.txtの通りにインストールして何度再起動しても
MSXML3.0エラーのままです
- 215 :名無しさん@勉強中 ★:06/12/02 15:18:29 ID:???
- という訳で
http://makimo.to/2ch/qa_nandemo/index.html
にある10スレのhtmlをローカル保存して
さっきまで延々やっていたhtmltodatの正規表現・結果式・前処理
で一括変換したものを
http://user.ftth100.com/mirrorhenkan/xml/
に上げてみました。
beと他スレのURLはうまくいっているようです。
- 216 :名無しさん@勉強中 ★:06/12/02 15:36:09 ID:???
- さてと
私がとっておきたいのは
下の各板でしょうか。
Webプログラミング板
プログラミング板
Windows板
ビジネスソフト板
Web製作板
ソフトウェア板
どれもこれも住民でも何でもないですが
調べるのにはとても重宝するので。
- 217 :名無しさん@勉強中 ★:06/12/02 16:15:23 ID:???
- 要望を出させて頂いたです
http://jbbs.shitaraba.com/bbs/read.cgi/computer/1929/1038588508/355-356n
それにしても
スレッドを一つdat変換するのに3分くらいかかってるみたい・・。
もっと短縮出来ないかな。
これよりも もっとスマートな変換書式を書いたら少しは違うのかな。
- 218 :名無しさん@勉強中 ★:06/12/02 16:57:50 ID:???
- ・・よし
htmlをローカル保存して
どこかに上げておこうか。
- 219 :名無しさん@勉強中:06/12/02 23:50:21 ID:KUK6YJ5a
- 2chdatgetを不在時に実況板で便利に使わせてもらってます。
livefoot (実況せんかいゴルァ!@さっかーch)
で使用すると必ずエラー表示が出ます。(他の板でもたまに出ます)
dat取得は成功してますが、取得のたびに画面に出て溜まる一方です。
Windows2000sp4使用です。表示内容は以下の通りです。
Windows Script Host
スクリプト: E\2ch\livefoot\2chdatget.vbs
行: 142
文字: 1
エラー: ファイルが見つかりません。
コード: 800A0035
ソース: Microsoft VBScript 実行時エラー
- 220 :名無しさん@勉強中 ★:06/12/03 18:04:38 ID:???
- >>219さん
どうもです。
えーと
お書きになられてますけど
livefootでは必ず出るのですか?
他の所ではそうエラーにならないと
うーん。。
ノートン等のアンチウイルスソフトや
何か常駐させるものとかお使いでしょうか。
もしそうなら、いったんそれらを切って試してみて下さい。
関連かもしれないですが(って勝手に出してごめんなさいですが)
こんな場合もありますし。↓
http://jbbs.livedoor.jp/bbs/read.cgi/computer/21256/1164941934/11
もしそれで駄目な場合は・・どうしよう。
人によっては負荷増大・サーバ攻撃ツールと捉える人も居るので
(その側面がある事は否定出来ませんし)
誰かに聞くのも はばかられるんだよなあ(って私がですけど)
とりあえず試してみて下さい。
- 221 :名無しさん@勉強中 ★:06/12/03 18:34:35 ID:???
- さて
http://ex13.2ch.net/test/read.cgi/gline/1118753283/982
↑で書いたものを
出せるようにしないとです
「マダー(AA略)」とか言われる前に。
生成するindexのヘッダとフッタをどうするかという事を
ちょっと思いあぐねているです
- 222 :名無しさん@勉強中 ★:06/12/03 21:35:35 ID:???
- http://ex13.2ch.net/test/read.cgi/gline/1118753283/986
やる事はやったです
あとは野となれ山となれ
- 223 :名無しさん@勉強中 ★:06/12/03 21:42:16 ID:???
- 作ってて思ったですけど
本家dat2htmlと同じようなものも
wshでできそうですね。
- 224 :名無しさん@勉強中 ★:06/12/04 08:22:59 ID:???
- makimo.toさんの掲示板に
どなたかhtml2dat.cgiの復活依頼をされておられるので
障害にならないように
makimoto_datget2のページのリンクを変えたです
index.html→index0.html
html2dat.cgi 復活して欲しいです。
- 225 :DinoSwift ◆m7TsEz1c5. :06/12/04 18:43:43 ID:kPk4kKs/
- (へ´ω`) ここのBBS見て、とりあえずこんなの書きました。
http://wannabe.fam.cx/service/2ch_get/index.html
- 226 :名無しさん@勉強中 ★:06/12/04 20:18:36 ID:???
- >>225
あ、どうもです。
御連絡ありがとうございます。
・・・素晴らしい。
自分にはとても書く事の出来ないような文章だ・・。
cronではなく、タスク管理を使っておられたのですか。
(ってタスク管理という機能 知らなかったですが)
そういえばmakimo.toさんやみみずんさんの所もwindowsサーバみたいですが
どちらをお使いになっておられるのかな。
ファイルのヘッダを取得して更新してるかどうか見る方法とかも
と〜く2ちゃんねるとかで見ていたのですが
wshでもそういう事をすれば 負荷軽減になるかもですね
余裕が出来たら見てみよう。
これを見て
ログ保管庫とか設置される方も居られるかもですね。
私も perlやphpで作ったクローラーがあるので
負荷分散(?)の為に公開しようかな
でも今見たら何書いてるのか訳わからん・・
ここを見ている方々へ(ってどれくらい居るんだか)
DinoSwiftさんは私の不躾なマイミク申請を快諾して下さった方です
そういえば、みみずんさんやルクダルさんひろゆきさんも
mixi内でお見かけしてるです(それだけです)
- 227 :名無しさん@勉強中 ★:06/12/04 23:04:44 ID:???
- ちょうどいい話題があったのでメモ
http://qb5.2ch.net/test/read.cgi/operate/1164201063/528n-
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
528 : ◆TWARamEjuA :2006/12/04(月) 22:08:18 ID:Zww3h5Cn0 ?BRZ(6677)
Q「Windowsアプリケーションを自動で操作し、cronしたいけれどもperl(ActivePerl)のみで実現出来るのかしら?」
530 :桶屋 :2006/12/04(月) 22:21:27 ID:G1WR0r6C0
Windowsのタスクは、バッチファイルなども起動させられるけど、
それを使わない/使えない理由は何?
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
wshも起動できるみたいなので
1時間毎に巡回クロールとか可能ですね。
- 228 :名無しさん@勉強中 ★:06/12/05 09:00:27 ID:???
- # 公私ともに嫌な事ばかり起こる・・・
>>224にした奴を元に戻しました。
下を見たもので。
蜷局を巻いて逃亡したと思われても何なので。
http://tmp6.2ch.net/test/read.cgi/download/1164164363/286
もう使えないツールですが
誰かが同様のものを作る際に参考になるかもなので。
私もあちこちのwshを見て参考にしたですし。
かえすがえすも
download板とUNIX板に書き込んだ事が悔やまれてなりません。
- 229 :名無しさん@勉強中 ★:06/12/05 09:10:41 ID:???
- # 上のレス番は269でしたな
そういう意味では
自分がやってるのはどれもこれも
色々なスクリプトのソースを参考にしてツギハギしたものばかりなので
さて どこからがオリジナルと言えるのか・・・。
なので、↓こう仰られる方とか尊敬するです。
ゼロから書けるなんて すごいなあと。
http://udon.be/test/read.cgi/rainbow/1112995210/901
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
ってゆーか、他のソースをコピーして使ったら
その時点で配布しづらくなるので、搭載するとしても自分で書きます。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
- 230 :名無しさん@勉強中 ★:06/12/05 13:06:23 ID:???
- http://ex13.2ch.net/test/read.cgi/gline/1118753283/997の件ですが
やってみたら
なかなか難しいですよ
入れ子構造にすればいいのかなと思うですが
慣れてないもので。
- 231 :名無しさん@勉強中 ★:06/12/05 14:57:20 ID:???
- http://jbbs.shitaraba.com/bbs/read.cgi/computer/1929/1038588508/367-368n
やってみようとしたけど
すんげー微妙にどこもかも違うんだなこれが
・「投稿日:」という文字がついている
・メール欄のタグが
<a class=mailto href="mailto:(.*?)">
となっている
通常は下記
<a href="mailto:(.*?)" class="?mailto"?>
・他のmakimo.to形式htmlの日付の後についていた<br>がない
あと一歩なのでしょうか。
- 232 :名無しさん@勉強中 ★:06/12/05 16:40:06 ID:???
- メモ
http://oshiete1.goo.ne.jp/kotaeru.php3?q=801858&rev=1
- 233 :名無しさん@勉強中 ★:06/12/05 18:17:51 ID:???
- うう
For Each in 〜 Next
へのパラメータ渡しの方法がわかんない
- 234 :名無しさん@勉強中 ★:06/12/05 19:37:45 ID:???
- ・・よし、出来た。
- 235 :名無しさん@勉強中 ★:06/12/05 20:01:17 ID:???
- 書いたです
http://ex13.2ch.net/test/read.cgi/gline/1165245437/14
何かもう
どうでもよくなってきた
- 236 :名無しさん@勉強中 ★:06/12/05 20:49:43 ID:???
- という訳でこの件
もうそろそろ お開きという事に。
いやー勉強になったっけやー。
- 237 :名無しさん@勉強中 ★:06/12/05 21:32:08 ID:???
- さて
後はソフトウェア板とWeb製作板でしょうか
どちらも1ギガ以上あるみたいです
とても自分のPCでは
って お開きって書いたくせに
自分から再開してら
- 238 :名無しさん@勉強中 ★:06/12/06 18:05:36 ID:???
- 差し障りのない範囲でメモ
自分のマシン、ハードディスクの残り容量が200メガかそこらなので
適当な量ダウンロードしたら即ftpでサーバにアップロードして
削除しての繰り返しをしなければならない訳ですが
そのようにしてアップした850メガくらいのプログラム板ログが
一つだけでは実に心許ない。
かといっていったんDLしてアップするにしても容量不足で
という事で
サーバ間転送というものを使ってみようかと。(FXPともいうらしい)
http://www.smartftp.com/
http://www.smartftp.com/localization/projects/japanese/documentation.html
http://akky.cjb.net/exploit.html
http://members.tripod.com/ks2000/sorce_code/fxp/fxp.txt
smartftpというソフトがFXP対応しているそうです。
ただ、ソフトウェア板のスレッドを見ると
レジストリをいじるみたいでどうしよう。
それにしても5年前のスレッドなのに現役だ・・。
http://pc7.2ch.net/test/read.cgi/software/1008611176/88-89n
まあ、メモ止まりかもしれないですけど。
- 239 :名無しさん@勉強中 ★:06/12/06 18:27:54 ID:???
- o2onスレより
http://tmp6.2ch.net/test/read.cgi/download/1165212097/540
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
540 :[名無し]さん(bin+cue).rar:2006/12/06(水) 01:39:02 ID:VDUG/zCz0
http://tmp6.2ch.net/download/subject.txt
http://anime.2ch.net/asong/subject.txt
http://ex17.2ch.net/news4vip/subject.txt
http://news19.2ch.net/newsplus/subject.txt
http://news20.2ch.net/news/subject.txt
http://anime.2ch.net/anime/subject.txt
http://live22x.2ch.net/livewkwest/subject.txt
http://live23.2ch.net/livenhk/subject.txt
http://live23.2ch.net/liveetv/subject.txt
http://live23.2ch.net/liventv/subject.txt
http://live23.2ch.net/livetbs/subject.txt
http://live23.2ch.net/livecx/subject.txt
http://live23.2ch.net/liveanb/subject.txt
今↑を定期巡回して1000レスのスレを保存するようにしてるが、
他に押さえるべきスレはあるかのぉ?
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
どのような方法で保存されておられるのか教えて頂きたい所ですが
datsearchget(という名前でいいのか?)でも同様の事が出来ますね。
http://www.geocities.jp/mirrorhenkan/others/datsearchget/
subject.txtを一行づつ読み込んで
それが入力した検索ワードにを含んでいたらDLするだけの事なので
1001行ったスレッドだけ抽出してDLしたいなら
行の終わりが「(1001)」にマッチすればいいと思うので
> .+\(1001\)$
または単に
> \(1001\)$
でいいのかも。
ただ、文末を示す「$」が使えるのかどうかわかんない
- 240 :名無しさん@勉強中 ★:06/12/06 18:35:02 ID:???
- 同様に
例えば800レス以上のスレだけ保存したいなら
> \([89]\d\d\)$
950レス以上なら
> \(9[5-9]\d\)$
かなと。
ただ、これだと1000や1001にマッチしないので
それぞれ
> \((?:[89]\d\d|100[01])\)$
> \((?:9[5-9]\d\|100[01]))$
で良いのでしょうか。
試してみる気力が無いので間違っているのかも。
- 241 :名無しさん@勉強中 ★:06/12/06 18:43:36 ID:???
- それと
>>233-235で作ったものがあるので
これを使いまわして
複数板を巡回クロールor巡回抽出クロールするwshも出来そうです。
それが出来たら
>>239で出した方と全く同じような事が出来るかもしれない。
windows標準(ほぼ)の付属機能も
なかなか侮れないもんだなぁ とか思ったりして。
奥が深いです。
- 242 :名無しさん@勉強中 ★:06/12/06 19:45:48 ID:???
- さらに押し進めれば
http://menu.2ch.net/bbsmenu.htmlをDLして
正規表現で各掲示板のURLおよび板名を取得
しかる後に巡回クロール or 巡回抽出クロールすれば
全てのログをバックアップするような事も夢ではなさそうですね。
datの保管先もDinoswiftさんやみみずんさんみたいに
それぞれ分類分けする事も可能でしょうし
ヘッダだかステータスコードだかを見て
未更新ならスルーするようにすれば
負荷も減るでしょうし。
でも差分取得とか出来るのかな。
- 243 :名無しさん@勉強中 ★:06/12/06 20:49:44 ID:???
- さて
makimo.toさんの所
復活された訳ですが
どうやら
各板のリストを表示しないようにされたようです。
過去ログ墓場から入って
http://makimo.to/2ch/index.html
ここまでは表示されますが
http://makimo.to/2ch/bbs1.html
それ以降のページに行こうとしても
エラーページが表示されます
http://makimo.to/2ch/news18_namazuplus/index.html
ふむ。
これが答えか。
- 244 :名無しさん@勉強中 ★:06/12/06 21:06:15 ID:???
- これ
意図的に表示させないようにされておられるのでしょう。
スレタイ検索等から行くと ちゃんと表示されますし。
半日ほど繋がらなかったのはその作業をされていたのかも。
ここから私のとる道は三つ。
(1)諦める
(2)makimo.toさんの意向を汲んで静観する
(3)諦めずに模索する
さて
(1)ですが、まだ私が出来る事はまだありそうですし
前にも書いたように 後悔の種を残しておきたくないので
これはなしという事で。
(2)ですが、連絡も何も頂いていませんし
掲示板[1004]でお書きになられた
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
今のうちに必要分を落としておくしかないと思います。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
これはまだ生きていると思います。
過剰アクセスが原因だろうという事は理解しているつもりですが
連絡も何も頂いていないので
(3)を採択させて頂こうかと。
何というか 逆に奮い立ってくるですよ。
出来るか出来ないかはわかんないですけど。
- 245 :名無しさん@勉強中 ★:06/12/06 21:27:40 ID:???
- # きゅうにIMEがきかなくなった・・
というわけで
やることをやってみようかなと。
アイデアはあるので
それをかたちにしてみますか。
できなかったらごめんねということで。
- 246 :名無しさん@勉強中 ★:06/12/07 10:08:02 ID:???
- で その前に
消すのも何なので
遊んでおこうかなと
http://www.geocities.jp/mirrorhenkan/others/makimotoforever/
http://www.geocities.jp/mirrorhenkan/others/makimotoforever/html.html
- 247 :名無しさん@勉強中 ★:06/12/07 12:29:04 ID:???
- ・・よし、出来た。
- 248 :名無しさん@勉強中 ★:06/12/07 12:50:47 ID:???
- ・・よし、書いた。
http://ex13.2ch.net/test/read.cgi/gline/1165245437/24-25n
- 249 :名無しさん@勉強中 ★:06/12/07 17:25:51 ID:???
- ・・今makimo.toさんのhtmlを見てみたら
http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/362
http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/367
http://makimo.to/2ch/pc7_affiliate/1161/1161168474.html
http://makimo.to/2ch/log_musicj/959/959833697.html
全部テキスト表示に変わっている・・・。
半日休んでこれをやっていたのか・・・。
html2dat.cgiは公開されないそうですし
何をお考えなのだろうか・・・。
このプレーンテキストをdat化させるのは事だぞ。
もうmakimo.toさん大嫌い!
- 250 :名無しさん@勉強中 ★:06/12/07 17:56:04 ID:???
- 上のは大嘘
バーカバーカ(←自分)
それはそうと
http://tmp6.2ch.net/test/read.cgi/download/1164164363/326
立場は違えど
苦労されてますね・・・お察しします
- 251 :名無しさん@勉強中 ★:06/12/07 21:15:29 ID:???
- いろいろ対策されておられるのだなあ
もう疲れたです
まだやるとしたら
ターゲットのhtmlを整形抽出列挙して
インターバルとランダムプロキシを設定できる
DLツールを用いるくらいですか。
あんまり根気が無いほうなのでこのへんで。
大変勉強になりました。
- 252 :名無しさん@勉強中 ★:06/12/08 08:18:18 ID:???
- メモ
javascript:document.body.innerHTML=document.body.innerHTML.replace(/(<A class=bbs href=\")(.+?)(\/index\.html\"\>.+?\<\/A\><\/TD>)/ig,"$1$2$3 <td>$2.html</td>");void(0);
- 253 :名無しさん@勉強中 ★:06/12/08 19:14:18 ID:???
- kage板総合雑談スレッドより
http://kage.monazilla.org/test/read.cgi/kage/037005742/334-339n
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
334 名前:名無しさん@お腹いっぱい。 投稿日:2006/12/01(金) 01:50:36 ID:???
書けない…
http://azlucky.s31.xrea.com/katjusha/
335 名前:名無しさん@お腹いっぱい。 投稿日:2006/12/03(日) 07:07:19 ID:eVKoo/UY
>>334
同じく・・・何度書きこもうとしてもエラーが出ます。新・かちゅーしゃ板の管理者の方
ここみてたら確認お願いします
336 名前:◆KAGESsh/NQ 投稿日:2006/12/03(日) 09:34:28 ID:???
>>334-335
あ〜書けないね。「Script Error」とか吐いてる。
Firefox から書いてみても同じで、HTTP のレスポンスみると 500 が帰ってきてるね。
何か cgi が逝ってるか、規制関連でミスってるか、そんな雰囲気。
339 名前:◆YaAzLuckyc 投稿日:2006/12/08(金) 19:02:11 ID:???
こちらにも気付きませんで大変ご迷惑をおかけしました。m(__)m
かちゅ板、なんでも板 ともに復旧しております。
どうもNGワードにカタカナの「ー」が含まれているとScriptErrorが出るみたいです。
面倒なのでNGワードから省くだけで対処しました。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
> どうもNGワードにカタカナの「ー」が含まれているとScriptErrorが出るみたいです
下の件が事前にあった事もあり
どこかで見たぞ んうんなるほどなるほど と(←えっらそーに)
http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/353-354n
それにしても、何でかちゅ〜しゃ絡みの件だと
デジャヴが多発するのでしょうか。
- 254 :名無しさん@勉強中 ★:06/12/08 21:07:52 ID:???
- UNIX板でいろいろ書かれてますが
もう現状 そのままでは使えないのでいいかなと
それはともかく
http://pc8.2ch.net/test/read.cgi/unix/1164200330/194-196n
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
194 :名無しさん@お腹いっぱい。:2006/12/07(木) 02:15:38
●とやらを買えば過去ログ見れると言うのは知ってるが、
きちんと過去のスレのリンク張ってあればたどれるが、そうでないとこも結構あるんでない?
195 :名無しさん@お腹いっぱい。:2006/12/07(木) 03:09:41
>>194
倉庫見ればindexあるよ
196 :名無しさん@お腹いっぱい。:2006/12/07(木) 06:49:48
倉庫のindexから探すのは大変だぉ
OpenJaneがヘタレなだけ?
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
>>168で書いたように考えてみたですが
そういうのを出しても批判されるだけでしょうね。
いったいどうすりゃいいんだか。
- 255 :名無しさん@勉強中 ★:06/12/09 16:18:59 ID:???
- とりあえず
sports2サーバの板のログをのんびりと落とさせて頂かせております
本家に残ってないログなので落としている訳ですが
行った事なかったですけど結構面白い所なんですね。
そうそう
過剰アクセスでdenyされた時は
IEの設定でプロキシを付けるor変更すればいいです
万々一makimo.toさんが此方を見ておられたら
色々御迷惑をおかけしておりますと私が申しております。
悪意も何もありませんです
# ↑思い上がっているような書き方で何ですが
# もし自分がmakimo.toさんの立場だったら
# 見ているだろうなあと思いましたので。
- 256 :名無しさん@勉強中 ★:06/12/09 17:01:44 ID:???
- で
IEのプロキシ変換を自動的に変換させるように出来ないかと
少し調べてみたら
どうもプロキシ情報(というかIEの設定情報)はレジストリに保存されているようで
もし何かあったらこまわりくん八丈島のキョンなので
やめとくです。
「IEプロキシチェンジャー」みたいなのって結構ありそうですが
実は怖い事やってるみたいですね。
- 257 :名無しさん@勉強中 ★:06/12/10 04:59:50 ID:???
- ・・今
http://makimo.to/2ch/cookie.html
の表示モード選択で「dat」を選んだら
datファイルが落ちてきた・・。
サイズもhtmlより少ないですが
負荷とかどうなのでしょうか・・
- 258 :名無しさん@勉強中 ★:06/12/10 05:16:20 ID:???
- 「※古いログはdatが存在しません。」
とあるので
html2dat.cgi経由ではないのかも。
だとしたら負荷も少ないかもです
- 259 :名無しさん@勉強中 ★:06/12/10 05:44:34 ID:???
- なのでスクリプト中の
work=GetHTMLDocument(out,sRoot & "/html/" & dat_folder & "/" & datkey & ".html")
を
work=GetHTMLDocument(out,sRoot & "/html/" & dat_folder & "/" & datkey & ".dat")
に変更して作動させたです
それにしても
ウェイト時間を1分とっているのですが
それでも気が付くとバーボン行きになっている事が多いのです
まあアクセス集中しているでしょうから仕方ないのかもなのですが
人力で右クリック保存してもそうなるのかな
1分で1datなので
計算ではあと20時間くらいですか。
ごめんなさいごめんなさい
- 260 :名無しさん@勉強中 ★:06/12/10 05:58:55 ID:???
- さて
on2on(オニオン?)も実用段階に入っているみたいで
http://tmp6.2ch.net/test/read.cgi/download/1165212097/994-995n
−−−−−−−−−−−−−−−−−−−−−−−−−−−
994 :[名無し]さん(bin+cue).rar :sage :2006/12/09(土) 23:53:54 (p)ID:zV0N4Jgf0(17)
すげぇ
ログ削除して将棋スレを検索したらこれまでにはありえないスピードで落ちてきた
しかも直接見れるし。なかなか回りがよくなってきたな
995 :[名無し]さん(bin+cue).rar :sage :2006/12/09(土) 23:53:54 (p)ID:vkzoFNjh0(3)
ちょっと興味あった落ちたスレが読めた!
ありがとー!
−−−−−−−−−−−−−−−−−−−−−−−−−−−
でも私のPCでは
蚊帳の外の宇宙の話なので
寂しいです
- 261 :名無しさん@勉強中 ★:06/12/10 11:19:49 ID:???
- 実況系とニュース系のdat落ちスレの
1とラストを見る事が出来るようにして下さったのですけど
まあそのままでも別に問題ないですよね。
いえ、最近wshを作るのでVBScriptばかり見てたもんで
逆にJavaScriptのほうを忘れているという
ああ付け焼き刃
逆さに読めば
バキヤケツああ
- 262 :名無しさん@勉強中 ★:06/12/10 13:23:19 ID:???
- # 上の文訂正
# まあそのままでも → まあ自分の所はそのままでも
さて
久しぶりに
http://6419.net/
に行ってみたです。
sports2サーバのラウンジクラシック板が揃っているので。
・・いやー、凄い。
- 263 :名無しさん@勉強中:06/12/10 17:15:38 ID:22J8A3k3
- んー、バーボンに入ってやり直すとまた最初のDATから取得・・・。
重複チェックで取得済みはスルーできないかのぉ。スクリプトむずかすぃw
- 264 :名無しさん@勉強中 ★:06/12/10 17:46:52 ID:???
- >>263
えーと
http://ex13.2ch.net/test/read.cgi/gline/1165245437/39-40n
で書いたようにやればいいのですが。
あと>>257-258のクッキー変更もやったほうがよいかも。
で
とりあえず今
自分が使ってる奴をそのまま出しときます
http://www.geocities.jp/mirrorhenkan/others/makimotoforever/makimoto_htmlget_4_20061210.vbs.txt
バーボン入りしたら
エクスプローラで時間でソートして
最終取得dat(html)を開いてスレタイをコピーして
リスト(server_board.html)をエディタで開いて
さっきのスレタイのあった行まで消して上書き保存
しかる後に
上のスクリプトを走らせればいいと思うです。
また叩かれても何なのでコピペ拡散は控えて頂きたく。(>見てる方々)
それにしても
1分間隔でやってみてるのですが
気がつくとdenyされている事が多いです
それだけ駆け込み需要が増えているんだなと。
という訳で他言無用に。
- 265 :名無しさん@勉強中 ★:06/12/10 17:57:00 ID:???
- download板より
http://tmp6.2ch.net/test/read.cgi/download/1164164363/339-348n
−−−−−−−−−−−−−−−−−−−−−
339 :[名無し]さん(bin+cue).rar:2006/12/09(土) 23:39:03 ID:1L7uzLnE0
設定すればdat落とせるみたいだけど
http://makimo.to/2ch/cookie.html
347 :[名無し]さん(bin+cue).rar:2006/12/10(日) 12:56:56 ID:y2+rR8JL0
>>339
Proximitron経由してCookie送ればJaneでもdat取得できるね
348 :[名無し]さん(bin+cue).rar:2006/12/10(日) 13:56:00 ID:71ojeTpF0
>>347
クッキーの設定がよくわからないんだけど、これでいいのかな?
text=dat<>1<>0<>false<>mycss=<>0<>0<>3000<><><><>;
−−−−−−−−−−−−−−−−−−−−−
これ見て
proxomitronの勉強をしてみようかなと。
うまくやれば
dumper.jpさんとかのhtmlファイルをdat化してDL出来るかも。
- 266 :名無しさん@勉強中 ★:06/12/10 20:44:38 ID:???
- メモ
http://php.dori-mu.net/
- 267 :名無しさん@勉強中:06/12/11 12:07:16 ID:NL76Neo7
- どうやらバーボンに入ったままDATかhtml取得してるとダミーファイル掴まされる・・・。
ご丁寧にサイズもランダムでw
- 268 :名無しさん@勉強中:06/12/11 12:50:58 ID:Pk+XrS3F
- 結局IP変えないと駄目だよね。
- 269 :昼休み@名無しさん@勉強中 ★:06/12/11 13:13:25 ID:???
- 何だか最近書き込みが増えている・・
>>267
自分とこも以前はそうでしたけど
おととい辺りから一定のサイズのエラーページになったですよ
>バーボン行きの場合
>>268
IEのプロキシを変えればいいです
自動プロキシ変換させるようなソフトを検索すると
例えばこれがヒットしたです
http://www.vector.co.jp/soft/win95/net/se168304.html
試してませんが、一定時間毎のプロキシ変換とかできそうな感じ。
(まあ「できねーぞコラ」とか言われても困るんですが)
これで無理でもまだ他にありそうな。
http://www.vector.co.jp/vpack/filearea/win/net/dialup/
で
http://ex13.2ch.net/test/read.cgi/gline/1165245437/43-44n
実現するとしたら、リストファイルからURL一覧生成ればいいので
できなくはなさそうですが
迷惑をさらにかけるのは誠にしのびないので
やめときますです
人間、あきらめが肝心です
本当に。(自分に言い聞かせています)
- 270 :昼休み@名無しさん@勉強中 ★:06/12/11 13:16:01 ID:???
- ちなみにバーボン入りすると
こういうファイルが落ちてきます
194kb
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
BBQ<>kunio@makimo.to<>2006/12/08(金) 00:00<>しばらく時間を置いてからアクセスしてください。<>BBQ
他サイトで探してみる<><>2006/12/08(金) 00:00<>ttp://makimo.to/cgi-bin/ffind/ffind2.cgi?referer<>
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
- 271 :名無しさん@勉強中 ★:06/12/11 19:36:53 ID:???
- うーん
makimo.toさんの所
スレタイ検索結果からひとつづつ右クリックDLしても
バーボン行きになりますね。
きついなー
- 272 :名無しさん@勉強中 ★:06/12/11 19:53:35 ID:???
- ふと考えてみれば
>>263
> 重複チェックで取得済みはスルーできないかのぉ
ファイルの存在の可否を調べればいいので
−−−−−−−−−−−−−−−−−−−−−−−−−−−
work=GetHTMLDocument(out,sRoot & "/html/" & dat_folder & "/" & datkey & ".dat")
−−−−−−−−−−−−−−−−−−−−−−−−−−−
を
−−−−−−−−−−−−−−−−−−−−−−−−−−−
If Fs.FileExists(sRoot & "/html/" & dat_folder & "/" & datkey & ".dat")
Then '存在したので何もしない
Else work=GetHTMLDocument(out,sRoot & "/html/" & dat_folder & "/" & datkey & ".dat")
End If
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
とかすればいいのかなあと思ったりした初冬の暮れ
試してないのでこれでいいのかどうかわかんない
- 273 :名無しさん@勉強中 ★:06/12/11 21:37:23 ID:???
- ふむ
Iria ver1.07s9aを見てみると
オプション→オプション設定→速度制限
で速度を制限出来るんですな。
これやると
400kbのdatをDLするのに40秒くらいかかるです
- 274 :名無しさん@勉強中 ★:06/12/11 21:42:39 ID:???
- ただ問題は
クッキー送信がわかんないもんで
htmlで降りてくることです
どなたかproxomitronで
クッキー送信と
ベーシック認証の自動送信方法を教えて下さい
いろいろ見たけどよくわかんないdす
- 275 :名無しさん@勉強中 ★:06/12/11 21:50:22 ID:???
- メモです(流れてしまう掲示板仕様なので)
http://makimo.to/cgi-bin/bbs/Bbs.cgi
−−−−−−−−−−−−−−−−−−−−−−−−−−
[1024] (無題) 投稿者:makimo.to 投稿日:2006/12/11(Mon) 21:35
>>1020
詳細は非公開ですが、規模はみみずんさんより小さいです。
OS以外は普通のパソコンとあまり変わりません。
04Webserverをカスタマイズしてgzip転送やアクセス制御を行っています。
トラフィックとデータ量の推移は以下の通りです。
http://www.alexa.com/data/details/traffic_details?url=makimo.to
http://makimo.to/2ch/ssilog.txt
>>1023
アクセスがあるごとにカウンターが+1されていき、一定数(現在は300)を超えるとしばらくアクセスできなくなります。
カウンターは通常、数十分〜数時間アクセスがなければリセットされます。
慌てて実装したので、現在試行錯誤中です。
−−−−−−−−−−−−−−−−−−−−−−−−−−
ふむ。。
- 276 :名無しさん@勉強中 ★:06/12/12 00:16:00 ID:???
- たぶんやらない(というより出来ない)と思いますが
いざやろうとするなら
次のようなものが考えられるかな
makimo.toさんの御返事を見ると
300アクセスでバーボン行きにされておられるので
300個DLしたらIPを変更すればよいのかなと。
となると
ループ文に変数を置いて
300に達したらいったんsleep
↓
IEのプロキシ変更
↓
DL再開
この繰り返しでOKかも
- 277 :名無しさん@勉強中:06/12/12 14:13:13 ID:muY/+Bqb
- >274
なんか書いてあたーよ。
ttp://tmp6.2ch.net/test/read.cgi/download/1164164363/368
368 名前:[名無し]さん(bin+cue).rar[sage] 投稿日:2006/12/12(火) 12:13:26 ID:ER6udlPO0
[HTTP headers]
In = FALSE
Out = TRUE
Key = "Cookie: 29ch html2dat (out)"
URL = "$OHDR(User-Agent: Monazilla/1.00)"
Replace = "text=dat<>1<>0<>false<>mycss=<>0<>-1<>3000<><><><>"
In = FALSE
Out = TRUE
Key = "URL: 2ch - 29ch kakolog Redirect (Out)"
URL = "$OHDR(User-Agent: Monazilla/1.00)"
Match = "http://(([^.]+)\2.2ch.net|(www(2|)\0$SET(2=bbspink\0)|([^.]+)\0$SET(2=bbspink-\0)).bbspink.com)(:80|)/([^/]+)\3/((kako/([0-9]+{4})\4/\4([0-9])\5/
\4\5([0-9]+{5})\6|dat/([0-9]+{4})\4([0-9])\5([0-9]+{5})\6)$SET(7=\4\5\6)|(kako/([0-9]+{3})\4/\4([0-9]+{6})\5|dat/([0-9]+{3})\4([0-9]+{6})\5)$SET(7=\4\5)).dat"
Replace = "$RDIR(http://makimo.to/2ch/\2_\3/\4/\7.html)$FILTER(false)"
行が長すぎるから改行一個入ってる
- 278 :名無しさん@勉強中 ★:06/12/12 18:44:49 ID:???
- >>277
おぉう素晴らしい
でけたでとっつぁん
で、これ 専用ブラウザ用みたいなので
通常用のもやってみたです
[HTTP headers]
In = FALSE
Out = TRUE
Key = "Cookie: 29ch html2dat (out)"
URL = ".+makimo.to.+"
Match = "*"
Replace = "text=dat<>1<>0<>false<>mycss=<>0<>-1<>3000<><><><>"
[HTTP headers]
In = FALSE
Out = FALSE
Key = "Cookie: Fake a cookie (out)"
Replace = "monster"
これでhtmltodat経由で呼び出したら
dat形式で呼び出されたよママン。
ついでなので
http://contents-factory.net/remix2ch/
の階層状のものもクッキーを調べてやってみたら
[HTTP headers]
In = FALSE
Out = TRUE
Key = "Cookie: remix2ch (out)"
URL = ".+contents-factory.net.+"
Match = "*"
Replace = "preview_limit=zero; design=2ch; normal_view=on"
[HTTP headers]
In = FALSE
Out = FALSE
Key = "Cookie: Fake a cookie (out)"
Replace = "monster"
うまくいったぜベイビー
ヒューヒュー
- 279 :名無しさん@勉強中 ★:06/12/12 18:58:53 ID:???
- という事で
iriaをproxomitron経由にして帯域制限をつけてDLして
まとめたです
http://user.ftth100.net/mirrorhenkan/proxomitron/
いやー先人の方々の知恵の宝庫だなこれぁ
ベーシック認証についてもとか
ググってもさっぱりわからんかったですけど
スレ内検索で何とかなったですよはい
[HTTP headers]
In = FALSE
Out = TRUE
Key = "Authorization: p2"
URL = ".+xbb.jp.+"
Replace = "Basic *****************"
ちなみにこれ
公式p2サポスレ等で盛んに宣伝されている会員制●p2で
dat落ちしたスレをproxomitron経由のhtmltodatで読み出して
そのままdat化させるテストに使ったです。
テスト成功やったぜ母ちゃん
まあそれだけなんですけど。
501KB
続きを読む
掲示板に戻る 全部 前100 次100 最新50