■掲示板に戻る■ 全部 1- 101- 201- 301- 401- 501- 601- 701- 801- 最新50

サイズが 480KB を超えています。500KB を超えると書きこめなくなるよ。

メモ2

1 :名無しさん@勉強中 ★ : 06/09/16 19:36:34 ID:???
これまた思いついた事など


144 : ◆nika/si95E : 06/11/24 13:46:15 ID:daey9F0h
test


145 : ◆QFr6nbcU8Q : 06/11/24 13:48:33 ID:daey9F0h
>>130
>datをfopenでローカル保存する予定とかないですか?
とは、どういうことですか。


146 :名無しさん@勉強中 ★ : 06/11/24 18:15:56 ID:???
>>144-145
こんにちは。
http://com-nika.osask.jp/
の方でしょうか。

拡張子からPHPをお使いなのかと思い
そう書いたです。
詳細は

http://php.s3.to/man/function.fopen.html

ですが、
リモートのファイルを保存する際に

$fp = fopen("subject.txt", "w");
fputs($fp,$buff);
fclose($fp);

等のようにfputsと共に使うのかな と思いましたが
違ってたら申し訳ありませんという事で。


何というか
何もかもが付け焼き刃なもので
別の事をやっていると色々忘れてしまうです。

何か一つの事に打ち込めればいいのですが。


147 :名無しさん@勉強中 ★ : 06/11/24 19:26:11 ID:???
>>137の後半で書いたものを作ってみたので
出してみるです

http://www.geocities.jp/mirrorhenkan/others/mirrorget/

「このスクリプトは、指定した2ch/bbspink内の指定した掲示板の
 諸ミラーサイトに定期的にアクセスして
 諸ミラーサイトにログを蓄積させるWSHスクリプト(VBScript)です」

・・うまく説明できません。

とりあえず、バックグラウンドで動作するので
それほど煩わしくはないと思うですが、
datを取得するのと違い いくつかのミラーサイトにアクセスするもんで
正直 getdatよりも不安定かも。
開いたページはIEのキャッシュに蓄積されるみたいなので
昔ながらのPCを使っている人(私だ私)なんかは
「リソースが足りません」「メモリ不足です」とか出るかも。

とはいえ
皆に見える公の場で読める状態になる訳ですから
そう悪くないかも。


dat落ちした実況スレを求めている人達に
転ばぬ先の杖として是非とも使ってもらいたいとか思うですけど
まあどうなる事やら。


148 :名無しさん@勉強中 ★ : 06/11/24 19:30:01 ID:???
うお

http://qb5.2ch.net/test/read.cgi/operate/1164201063/109
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
109 :ひろゆき@どうやら管理人 ★ :2006/11/24(金) 19:25:37 ID:???0 ?S★(101304)
>>91
面白そうだし、いいんじゃないすかー。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−


149 :名無しさん@勉強中 ★ : 06/11/24 19:59:20 ID:???
あと同工異曲のものですが

複数の板を指定しておいて
夜のうちにそれらを巡回ミラークロール(といっていいのか)
させておくようなスクリプトとか。

これが出来たら
実況スレの依頼もほんとに減るかもしれないな と。
(まあ私のPCでは走らせるのは無理なんですが)


150 : ◆nika/si95E : 06/11/24 20:13:50 ID:daey9F0h
いや datをローカルに保存 の方について聞きたかったんですが…

それともdatを保管した先のsubject.txtですか?
datを保管している時はsubject.txtは弄ってないです。
ちなみに、>>94 のURL
http://com-nika.osask.jp/bbs/bbs.php?http://ex17.2ch.net/test/read.cgi/news4vip/1163222472/l200
の保管場所は以前から
http://com-nika.osask.jp/news4vip/dat/1163222472.dat
となっております。




151 :名無しさん@勉強中 ★ : 06/11/24 20:28:30 ID:???
>>150
あ、御丁寧にありがとうございます。

dat落ちした後でも閲覧出来るようになっておられるのですか。
以前拝見した時は、dat落ちしたら見られないのかもと思っていたです。

・・そうか、私「ローカル」の使い方が間違っていたですね。
本家(2ch)ではないという事で
http://com-nika.osask.jp/bbs/ を「ローカル」と書いてたです。
誤解するような書き方をしてしまって、ごめんなさいです。

ところで、保管したdatはどのくらいの期間 保管されておられますでしょうか。

(すみません、今日は離れますです)



152 : ◆nika/si95E : 06/11/24 23:50:28 ID:daey9F0h
>>151
保管しているdatを表示するように実装したのは1週間くらい前で、
保管先のアドレスを正確に表示するように実装したのは今日なので
それ以前はまさにそのとおりの状態でした。

保管しているdatですが、いまのところ削除とかは考えてないです。
今後、ディスクを圧迫するくらい多くなったら削除も考えるかも知れないですが…。


153 : ◆nika/si95E : 06/11/24 23:53:57 ID:daey9F0h
それとクッキーに名前とか保存するときに半角カタカナとかが
文字化けするらしく、トリップのキーが変化してしまいます…


154 :名無しさん@勉強中 ★ : 06/11/25 16:08:41 ID:???
>>152-153
> 保管しているdatですが、いまのところ削除とかは考えてないです。

御返事ありがとうございます。
変換スクリプトに追加してみてもいいですか?
http://www.geocities.jp/mirrorhenkan/ なのですが。

ところで
http://com-nika.osask.jp/bbs/
の下部
> 2ちゃんねる専用ブラウザについて
> 今現在対応しておりません。
ですが、subject.txtを生成すれば対応出来るのではないかと思うですが。

上の
http://com-nika.osask.jp/news4vip/dat/1163222472.dat
だと
http://com-nika.osask.jp/news4vip/subject.txt
があればいいのかなと。

news4vip/のディレクトリに
news4vip/dat/以下にあるdatから生成するスクリプトを置けば
釈迦に説法ですが
そういうスクリプトも出してる方も居られるです
perlだと
http://shutdown.jp/index.php?script%2F2ch#content_1_2
PHPだと(って自分とこですが)
http://user.ftth100.net/mirrorhenkan/javascript/readdir.phps

で、subject.txtを生成しておけば
専用ブラウザ対応になると思うです。


クッキー・・・勉強しようにもとっかかりがない・・。


155 :名無しさん@勉強中 ★ : 06/11/25 16:14:55 ID:???
メモ
2chSpider
http://www.ne.jp/asahi/p2p2ch/spider/
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
 指定した板のミラーを作成できる簡易2ちゃんねるブラウザです。
 所得したsubject.txt、datファイルを公開出来る形で保存出来ます。
 ログの公開にはWebサーバを別途準備する必要があります

・2ちゃんねる、及び2ちゃん型掲示板の巡回(ROM専用)
・差分取り込み対応
・板一覧URL複数指定可(100個まで)
・HTML自動生成
−−−−−−−−−−−−−−−−−−−−−−−−−−−−

すごい。
これと同じようなものってwshでも出来るかな。
dat2htmlとdat2subjectは以前作ったものがありますし。

まあスクリーンショットを見ると
専用ブラウザも兼ねているみたいなのでそこまでは無理そうですが。
http://www.ne.jp/asahi/p2p2ch/spider/gamen1.gif


156 :名無しさん@勉強中 ★ : 06/11/25 17:49:24 ID:???
ふと思ったですけど

倉庫の分散しているsubject.txtを一つに結合して
ピタハハさんのgetlogのようなソフトを作って
●を持っている人に頼んで
dat落ちしたdatを一括DLしてもらう とか
やろうと思えば出来そうですね。
別に法には触れないですし。

ピタハハさんのソフト、ソースも同梱されておられるので
どなたかチャレンジして頂けると嬉しいかも。


157 :名無しさん@勉強中 ★ : 06/11/25 18:32:31 ID:???
狼板より

http://ex11.2ch.net/test/read.cgi/morningcoffee/1164165217/
http://user.ftth100.net/mirrorhenkan/morningcoffee2/read.php/1164165217/

−−−−−−−−−−−−−−−−−−−−−−−−−−−−
18 :名無し募集中。。。:2006/11/22(水) 13:31:28.41 0
●買ってやるから過去ログ検索(スレタイ/URL)を作って欲しい
−−−−−−−−−−−−−−−−−−−−−−−−−−−−

スレタイ/URLでの過去ログ検索なら何とかできそうです
「●のパス教えて」みたいな無理は言いませんので
ぜひ協力して頂けると嬉しいですけど
ってもうdat落ちしてますか。



−−−−−−−−−−−−−−−−−−−−−−−−−−−−
20 :名無し募集中。。。:2006/11/22(水) 13:40:58.39 O
2ch全体じゃなくて狼だけだったら俺が作るかもしれない

22 :名無し募集中。。。:2006/11/22(水) 14:23:12.22 0
>>20
勇者よ頼んだぞ
−−−−−−−−−−−−−−−−−−−−−−−−−−−−

本気だったらいいな と。


158 :名無しさん@勉強中 ★ : 06/11/25 20:12:17 ID:???
メモ
2ch Ajax Browser
http://www.tagajo.tv/2ch/

これ、かなり前に見た
http://xfujdkqv.japan.webmatrixhosting.net/DatBrowser/
と関係あるのでしょうか。

ちなみにwebmatrixhosting.netさん
私も入ってたですけど
もうやめられたそうです


159 :名無しさん@勉強中 ★ : 06/11/25 20:42:33 ID:???
>>156
わからないなりにmain.pasのソースを見てるんですけど
http://kage.monazilla.org/system_DOLIB100.htmlと突き合わせると
やっておられる事とか何となくわかる感じです

makimo.toさんの休止前に
Delphi過去スレを集めてみようかな


160 : ◆nika/si95E : 06/11/26 00:15:48 ID:Av4YbIIB
>>154
dat保管は掲示板のおまけ的な機能ですので、
専用ブラウザはhttp://com-nika.osask.jp/bbs/subject.txt
存在するスレッド以外に対応させるつもりはないです。

変換スクリプトと言うかこれ自体が専用ブラウザみたいなものですが、
よければスクリプトとして追加してもいいです。


161 :名無しさん@勉強中 ★ : 06/11/26 11:15:31 ID:???
>>160
ありがとうございます
追加させて頂きますです


162 :名無しさん@勉強中 ★ : 06/11/26 11:59:00 ID:???
メモ
subject.txtの一行を
2ch形式のURLに変更

s#([0-9]+)\.dat<>.+#http://server.2ch.net/test/read.cgi/board/$1/#ig
w test.txt


163 :名無しさん@勉強中 ★ : 06/11/26 12:07:13 ID:???
あと
getlogのmain.pas236-237行目

dat2html(DAT, HTML);
HTML.SaveToFile(IncludeTrailingBackslash(folder_dir) + thnum + '.html');

この2行をコメントアウトすれば
htmlを作らなくなるのかなと




164 :名無しさん@勉強中 ★ : 06/11/26 12:26:10 ID:???
または

http://user.ftth100.net/mirrorhenkan/wsh/read.php/1009175619/528n
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
528 117(WSH見習いの3倍) [ 02/02/27 15:38 ]
指定したフォルダのサブフォルダにReleaseフォルダ、Debugフォルダが存在するとき、
その中のファイルで拡張子が exe、dll以外のものを削除してくれます。
めっちゃ便利なんだけど需要ないかも。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−

VBScriptではなくJScriptなので、拡張子「js」で保存するみたい

これを少し書き換えて
指定したフォルダ内を検索して、拡張子.dat以外のものを削除するような
ものを作れば、ハックしないでいいかも。


165 :名無しさん@勉強中 ★ : 06/11/26 19:32:16 ID:???
迷走し始めた時は
過去でも振り返ってみようかと

2ch閉鎖の危機なんだと
http://cocoa.2ch.net/unix/kako/998/998695422.html
http://fun.poosan.net/mirrorhenkan/2chscript/read.php/998695422/

久しぶりに読み返してみたら面白い面白い。
5から>>108で紹介したPerler ◆GSi39OA6 さんが出ておられます。
こういう経緯があって>>108のスレッドがあった訳なのかと。
「dat落ちして見られないからミラーを作る」のではなく
「2chのサーバ負荷を分散させる為にミラーを作る」という
発想、というか出発点が全く違う。


166 :名無しさん@勉強中 ★ : 06/11/26 19:37:32 ID:???
それにしても色んな所で何度も紹介されているスレッドですが
やはり何というか全く凄い。
度重なる悪戯書き込みにも関わらず
粛々と作業が進行していくさまは もう何というか。

で、転送量がもう爆発的に縮小される と。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
466 :369 ◆3XTuRnAc :2001/08/25(土) 23:30 ID:
とりあえず、read5.cで手動で試してみたところ、問題の転送量に関しては

32483 Aug 25 23:30 998695422.html
2261 Aug 25 22:58 998695422.html.gz

てかんじ。すげー、1/16・・・。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−


167 :名無しさん@勉強中 ★ : 06/11/26 22:08:13 ID:???
メモ

○ADO Streamオブジェクトを使ってみる
2001年 10月 14日 19時 35分 39秒
http://www.roy.hi-ho.ne.jp/mutaguchi/bbs/list48.shtml


168 :名無しさん@勉強中 ★ : 06/11/26 22:35:20 ID:???
さて
板の過去ログ倉庫のsubject.txtを頼りに
存在するdat落ちしたdat(変な表現)を
丸ごとローカル保存する方法を考えたですが

●がないので試せない・・。


使うもの
・getlog(http://pita.paffy.ac/top/getlog.lzh)
・htmltodat(http://mukiyu.hp.infoseek.co.jp/)
・Div(http://www.vector.co.jp/soft/win95/util/se088352.html)
>>97で作ったwsh
>>164を参考に作ったwsh

●と上記のものがあれば
だいたい1000datづつ取得出来る・・と思う。
getlogのURL貼りつけがそれ以上だと何か変になるので。
書くのは厄介です・・。


板の全datをDLしておられる人というと
バイク板のピタハハさんと
http://ex13.2ch.net/test/read.cgi/gline/1118753283/454
の格闘技板の方とか居られるですが
やはり人力ではなくて 半自動的な方法をとられたのでしょうね。



169 :名無しさん@勉強中 ★ : 06/11/27 00:29:07 ID:???
http://ex13.2ch.net/test/read.cgi/gline/1118753283/942-947n

945-946はどこの誤爆なんじゃいオラオラオラ
 ってー件はおいといてですな

ループし続けるスクリプトを スマートに終了させる方法として
とりあえず3つほど思いついたのでメモしとくです

(1) 最初にループ回数を入力するダイアログを出し
 その回数だけループしたら終了する
(2) ループ直前に
 「5秒後に開始します やめる場合は[いいえ]をクリックして下さい」
 というダイアログを出す
(3) 別にstop.vbsを作り、それを実行したら終了させるようにする

/*
それにしても どこの誤爆だったのだろうか。。
*/


170 :名無しさん@勉強中 ★ : 06/11/27 00:38:37 ID:???
煩わしいとかいう点はおいといて
(2)は実装出来たです。

(1)ですが、逆に無限にループさせたい場合は
どうすればいいのでしょう。
回数入力で「10000」とか入力すればいいのでしょうけど
別の方法とか ないかな。


ただ、上の二つの方法のどちらも
一巡した次のループ箇所でしか効かないので
「今この場で止めたい」場合には使えないです。



171 :名無しさん@勉強中 ★ : 06/11/27 00:44:48 ID:???
という事で、(3)かなと。

考えられる方法としては
何かフラグになるファイルを指定しておいて
そのファイルに働きかける事で終了させるようにする とか。
例えばsubject.txtを削除すればreadfile出来ないので
ループを抜けて終了ダイアログを出すとか。

そんな感じでしょうか。


172 : ◆/vmukiyuzw : 06/11/27 01:09:42 ID:9NL6xccS
UNIXでのdaemonスクリプトなんて大抵無限ループなんで
別に気にする必要ないじゃねーのと思うのは私だけかな


173 :名無しさん@勉強中 ★ : 06/11/27 19:19:46 ID:???
>>172
ですよね
ですよね

まあ何とかなりそうなので
そのうちやってみますか。

それと
検索で引っかかったですけど

http://pc8.2ch.net/test/read.cgi/win/1152843217/818

あたしゃ
Meよりも古い機種使ってるんですけど



174 :名無しさん@勉強中 ★ : 06/11/27 19:21:41 ID:???
さて

思い立ったら吉日という事で
とりあえず初心者スレをまとめたです

http://user.ftth100.net/mirrorhenkan/delphi/
http://user.ftth100.net/mirrorhenkan/ruby/


今はまださっぱりわからんですけど
そのうち理解出来るに違いない・・と思っておこう。
JavaScriptもPHPもPERLもWSHも まとめた当初は訳わからなかったですし。

それにしても
過去ログを探しても
下記3つは本家に見当たらない感じです

09:http://pc5.2ch.net/test/read.cgi/tech/1071294733/
10:http://pc5.2ch.net/test/read.cgi/tech/1074523803/
11:http://pc5.2ch.net/test/read.cgi/tech/1076609666/

サーバ移転してるかも と色々見てみたですけど
どうもうまくいかない。
makimo.toさんの所もみみずんさんの所にも存在していない。

という事で
dumper.jpさん、ありがとうございます。


175 :名無しさん@勉強中 ★ : 06/11/27 19:39:29 ID:???
それと
dumper.jpさんの所
様変わりしているです

http://2ch.dumper.jp/0001382261/

htmltodatの正規表現はそのままで変換出来るのですが
タイトルにつく言葉が
「dumper.jp」から「2ちゃんねるみらー」に変わっているです。

なので

> s#(<title.*?) - DUMPER.JP(</title>)#$1$2#



> s#(<title.*?) - 2ちゃんねるみらー(</title>)#$1$2#

に変えるとマッチしない。なんでだ・・。。

仕方ないので

> s#(<title.*?) - 2.+?(</title>)#$1$2#

とやったらマッチしたです。

でも何で
最初のだと駄目なのでしょうか。


176 : ◆/vmukiyuzw : 06/11/27 23:53:41 ID:9NL6xccS
>>175
ちょっとサポート向けの問題を含んでいるので
htmltodatサポ板のほうでレスさせていただきました。
http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/353


177 :名無しさん@勉強中 ★ : 06/11/28 18:24:19 ID:???
>>176
レスありがとうです
勉強になりますです

すごいや兄さんです
ドロンジョの言葉を借りると
「ながれいしだね さすがだね」です


それにしても
調べれば調べるほど わからない事が増えていきます。
「うんうんわかるわかる」と思いながら進んでゆくと
すぐ ここはどこ私は誰状態になってしまうです。

タイムボカン風にいえば
「あっという間に知らない世界」です


178 :名無しさん@勉強中 ★ : 06/11/28 18:38:38 ID:???
いや、ほんとに勉強になりました。
kオプションとか こういう事が無ければ一生知らなかったでしょう。

ただ惜しむらくは
実生活に役立つような生活をしてない事で
今までやってきているどれもこれも
何ら 実生活に寄与していないなあ と。



というような考え方は
あまりにも功利主義的かつ軽佻浮薄だなあ


179 :名無しさん@勉強中 ★ : 06/11/28 18:57:51 ID:???
さて
あちこちに にくちゃんねる休止スレが立ってますが
その中の一つ
ダウンロード板より

「にくちゃんねる」休止のおしらせ
http://tmp6.2ch.net/test/read.cgi/download/1164164363/l50

流石ダウンロード板(って何が流石なのか)
とはいえ
●でも実況スレが見れないという書き込みが多いのは何故なのか
−−−−−−−−−−−−−−−−−−−−−−−−−−−
17 :[名無し]さん(bin+cue).rar:2006/11/22(水) 14:02:15 ID:bBQXvDIL0
>>7ではああいったけど
●は実況系の過去ログ見れないから正直なくなると不便です

57 :[名無し]さん(bin+cue).rar:2006/11/23(木) 08:59:47 ID:qtCSI0pU0
マジでなんとかしろよ
●買えってレベルじゃ…

実況スレ見れねーし

128 :[名無し]さん(bin+cue).rar:2006/11/26(日) 16:03:43 ID:dt77QoPt0
にくちゃんねるないと困る・・・
特に実況

129 :[名無し]さん(bin+cue).rar:2006/11/26(日) 16:36:32 ID:GIjeUJ5U0
なんでそんなに実況が見たいの?
−−−−−−−−−−−−−−−−−−−−−−−−−−−−

あと

−−−−−−−−−−−−−−−−−−−−−−−−−−−−
81 :[名無し]さん(bin+cue).rar:2006/11/24(金) 03:24:16 ID:AXijsvC50
>75
だが、にくちゃんの変換用正規表現が良く分らんので困る
−−−−−−−−−−−−−−−−−−−−−−−−−−−−

dat化しようとしてるのかな


180 :名無しさん@勉強中 ★ : 06/11/28 19:07:39 ID:???
自分とこも出てますがそれはおいといて

−−−−−−−−−−−−−−−−−−−−−−−−−−−−
38 :[名無し]さん(bin+cue).rar:2006/11/22(水) 20:16:18 ID:NL9sAICj0
誰かにくちゃんの全データをコピーしたHDDをnyに流してくれ

70 :[名無し]さん(bin+cue).rar:2006/11/23(木) 19:42:27 ID:GmF3wrqh0
洒落かnyでダウンロード板のJaneで使えるログ
流してくださいお願いします。

91 :[名無し]さん(bin+cue).rar:2006/11/24(金) 11:48:42 ID:GiDgZZtC0
ダウソ板だけで結構なのでJaneで使える過去ログをnyか洒落に放流してください
−−−−−−−−−−−−−−−−−−−−−−−−−−−−

流石ダウンロード板



181 :名無しさん@勉強中 ★ : 06/11/28 19:18:29 ID:???


−−−−−−−−−−−−−−−−−−−−−−−−−−−−
140 :[名無し]さん(bin+cue).rar:2006/11/27(月) 17:56:42 ID:67uYNAUkO
にくちゃんねるのログをまとめて一気に保存する良い方法ないですか?ダウンロードソフトを使ってもうまく落とせません

141 :[名無し]さん(bin+cue).rar:2006/11/27(月) 17:58:20 ID:yKv4SAJu0
そーゆーことするから回線パンクすんじゃねーの

145 :[名無し]さん(bin+cue).rar:2006/11/27(月) 23:56:31 ID:jHWPqKqB0
にくちゃんねるのログをぶっこ抜くのってどうすればいいの?

146 :[名無し]さん(bin+cue).rar:2006/11/28(火) 00:49:13 ID:JuPlfqp60
ぶっこ抜くとか言う奴ってネトラン厨っぽくて厭
−−−−−−−−−−−−−−−−−−−−−−−−−−−−

やらないけど
ちょっと考えてみたです。

過去ログ墓場をJavaScriptオンで開いて

http://makimo.to/2ch/tmp6_download/index.html

適当なスレを選んで

http://makimo.to/2ch/tmp6_download/1164/1164624670.html --(1)

それの右上にあるdatのURL

http://makimo.to/cgi-bin/html2dat/html2dat.cgi?tmp6_download/1164/1164624670.html --(2)


この(1)と(2)のURLの相違点を調べて
正規表現か何かでdatURLに一括変換して
(2)なら保存名を「1164624670.dat」にするように設定して
あとは適当に保存すればいいかなと。

個別に保存名を変えるのはwshならわかるですけど
他のツールだと どうやるんだろうなー。


182 :名無しさん@勉強中 ★ : 06/11/29 06:02:52 ID:???
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
[1004] (無題) 投稿者:ぴ 投稿日:2006/11/28(Tue) 21:50
(中略)
>>1002-1003
削除というよりは「見えなくなる」と言うほうが適切かもしれません。
今のうちに必要分を落としておくしかないと思います。

休止後にアクセスがあった場合は以下のような感じで他サイトへ誘導するようになります。
●があれば大半は読めると思います。
http://makimo.to/cgi-bin/ffind/ffind2.cgi?news20_news/1164/1164162822.html
−−−−−−−−−−−−−−−−−−−−−−−−−−−−

うむ
やはりもう少し考えてみようかな


183 :名無しさん@勉強中 ★ : 06/11/29 07:32:34 ID:???
メモ

・ダイアログから板URL入力(例http://ex13.2ch.net/gline/)

・サーバ名・板名抽出(ex13・gline)
 makimo.toURL変換(http://makimo.to/2ch/ex13_gline/index.html

http://makimo.to/2ch/ex13_gline/index.htmlをダウンロード

・一行づつ読み込む
 正規表現によるマッチング−−−−−−−−--(1)
 マッチしたらURLを組み立ててダウンロード
 以下最終行まで繰り返し

※(1)
・datキーの場合→半角数字9or10文字のマッチング→「\d{9,10}」とか
・タイトルの場合→まんまやないけ


184 :名無しさん@勉強中 ★ : 06/11/29 08:59:41 ID:???
考えたら
板のdatを全取得するwshとか出してみても
それほど反応は無かったので
makimo.toさんの所からdatを取得するwshを出しても
そう反応も無いだろうなと。

「何仕込んであるかわかんねーし怖くて使えねー」
という人とか多いでしょうし。


185 :名無しさん@勉強中 ★ : 06/11/29 17:54:13 ID:???
はい出来たですよ

http://www.geocities.jp/mirrorhenkan/others/makimotoforever/makimoto_datget.zip

説明のindexもつけて
後で書いときますかね


186 :名無しさん@勉強中 ★ : 06/11/29 18:08:12 ID:???
さて
どうしようか

避難所に書いて
mirrorhenkanのindexにつけて
あとはどうしたものか。

>>179のスレにも書こうかな
でも「ウイルス」とか言われても何ですし
うーむ


187 :名無しさん@勉強中 ★ : 06/11/29 19:46:01 ID:???
はい完成

http://www.geocities.jp/mirrorhenkan/others/makimotoforever/

作ってから気付いたですけど
datキー9桁の場合 うまくいかんかもです
一応正規表現でつけたつもりですけど
実際に試してないもんで


188 :名無しさん@勉強中 ★ : 06/11/29 19:57:07 ID:???
http://jbbs.livedoor.jp/bbs/read.cgi/computer/21256/1116159529/l50

>>992
参考にさせて頂くです

ただ つくづく思うですけど
「こんな事出来ないですか」とか書いてあって
こうやったら出来るよ とか書いても
無反応なのは なんだかなあ
もう慣れたですけど。

あと私 動けばいいと思ってるので
「きたねーソースだなー」とか言われても
やはり なんだかなあと。
まあそれだけの話なんですが


>>993
私のPCは残容量200メガかそこらだもんで
372メガをDLする再現とか出来んです

ただ news4vip板のブーンスレとか
自分の環境ではエラーもなく丸一日過ごせたもんで
どうしたものでしょうか。

ほんと
新しいPC 欲しいなあ


189 :名無しさん@勉強中 ★ : 06/11/29 20:22:49 ID:???
追記

http://makimo.to/2ch/pc8_prog/index.html

の 230件79.8メガで無問題だったですが


190 :名無しさん@勉強中 ★ : 06/11/29 20:44:27 ID:???
とりあえず
UNIX板とDownload板に書いてみたです

マルチポストと言われればそれまでですが
板だけでも800以上ありますし
サーバ毎に分かれているので
実質 2000〜5000くらい分岐しているのかなと。

makimo.toさんには悪いですが
かなり動員しても さてどんなもんでしょうという感じです


191 :名無しさん@勉強中 ★ : 06/11/30 09:01:16 ID:???
http://tmp6.2ch.net/test/read.cgi/download/1164164363/174


言い訳じみていますが

(1)「12/31まで」と期限が限られている事
(2)>>182のmakimo.toさんの書き込み
  「今のうちに必要分を落としておくしかないと思います」

この2点を勘案して上のスクリプトを出したです。
まあしかしDownload板のほうには書かないほうが良かったかな


あと

http://makimo.to/cgi-bin/bbs/Bbs.cgi
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
1007] 長い間お世話になりました 投稿者:名無しさん 投稿日:2006/11/30(Thu) 00:46
出先や会社などの●を使えない環境から時々使わせていただいていました。
出来る限り負担をかけないようにgeoのhenkanとかは最低限しか利用せずに共存共栄を目指していたのですが残念です。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−

> geoのhenkan

どう考えてもここの事だよなあ



しばらく静観


192 :名無しさん@勉強中 ★ : 06/11/30 18:41:07 ID:???
http://tmp6.2ch.net/test/read.cgi/download/1164164363/176n-
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
176 :[名無し]さん(bin+cue).rar:2006/11/30(木) 14:54:42 ID:q1e8wQ340
>174
大丈夫じゃね?
オレもそれでログ掘ったけどいくつかやって即飽きた。
だって一度に落とせるわけじゃなく一つ終わったら次のURLを指定って
すげーめんどくさいもん。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−

複数の板を設定して自動クロール取得とか
改造すれば可能ですハイ
埋もれてますが下のスクリプトと合わせて
改造すれば可能ですハイ

http://www.geocities.jp/mirrorhenkan/others/mirrorserve/

−−−−−−−−−−−−−−−−−−−−−−−−−−−−
177 :[名無し]さん(bin+cue).rar:2006/11/30(木) 15:43:02 ID:AIStFLjH0
>>176
いやお前みたいなのは普通に読んでるのと変わらんからいいんだけどな。

俺みたいにスクリプトで一回設定したらあとは一括で全ダウソとかやるヤツが
増えたらあっという間に破綻するぞ。既に期限付きだしな。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−

これだけではわからんのですが
177さんはそういうスクリプトを作って一括DLされたのでしょうか。
makimo.toさんの過去ログ墓場のページを見てみると
一括クロールされないようにという配慮なのか
ソースだけ見てもスレのURLとかわかんないようにされてるみたいですけど。


さてさて
改造は可能なんですが
177さんの仰られる事も御尤もだもんで
どうしたものか。
makimo.toさんの所に過度な迷惑をかけられないですし
かといって
makimo.toさんの所にしか残ってないログも多いでしょうし
うーむ


そういう風にプチハック(カッケー!)したwshを
欲しい人とか居たら連絡下さいです
(↑そんな人誰も居ないだろうとタカをくくっているのかな)


193 :名無しさん@勉強中 ★ : 06/11/30 18:54:27 ID:???
というか
>>192の176さんが使ってみて
問題なく動いた由
いやー嬉しいなあ


194 :名無しさん@勉強中 ★ : 06/11/30 21:09:07 ID:???
さて

スレタイ検索とかやるとして
perlやphpのデータベース検索スクリプトとか結構ありますが
例えばnews4vipとかだと
subject.txtだけで150メガとか200メガあるいはもっともっと
という事になる訳ですよ。
レンタルサーバではとてもとてもな状態です。
makimo.toさんのスレタイ検索とかでも
300メガくらいのデータベースを一括検索されておられると
以前お書きになられてましたし。

で データベース板に行ってみたんですが
http://pc8.2ch.net/db/

Mysqlをphpで運用すれば何とかなるのでしょうか。
データベースに100万行とか書けるのでしょうか。
Mysqlを使えるサーバとか結構あるですが 使えるのでしょうか。

というか 私 使えるのでしょうか。


195 :名無しさん@勉強中 ★ : 06/12/01 00:30:40 ID:???
へたった頭で考えた世迷い言かもですが


>>192の改造したものを出しておいたら
全ログを拾って公開して下さる方とか
もしかしたら 出てこられるかもです

出してみまs





この場合
賛成する人と反対する人
拮抗するんだろうなあ
ほんと どうしようか


196 :名無しさん@勉強中 ★ : 06/12/01 09:55:17 ID:???
メモ

http://blog.yuhisa.com/2ch_dat.php?ita=operate

よくわかんないんですが
現在進行形の所みたいです

http://blog.yuhisa.com/2ch_dat.php?ita=news4vip&p=43&t=&s=

左上に「DATファイル追加」という項目があるので
datをアップロード出来るみたい。

ルートを辿ってブログを見せて頂くと
7/24の項目に

http://blog.yuhisa.com/archives/2channel.php
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
ついでに今までfopenで行ってた読み込みをfileで行うようにしたので快速に。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−

そうなんですか。
fopenよりfileのほうが速いんですか。
fileって一行づつ読み込む関数だったっけかな
file_get_contentsが一括読み込みだったっけかな

あと
http://2se.dyndns.org/


197 :名無しさん@勉強中 ★ : 06/12/01 19:40:23 ID:???
http://tmp6.2ch.net/test/read.cgi/download/1164164363/194-195n

さあ書くだけは書いた
叩かれるかな
もうどうでもいいけど。

それにしても
態度や口調がコロリと変わりますな
相手によって態度が変わるのはある程度仕方ないですが
私も気をつけなければ。



198 :名無しさん@勉強中 ★ : 06/12/01 19:42:43 ID:???
と書き込んだ自分の文章を見て
さらに鬱になったりして


199 :名無しさん@勉強中 ★ : 06/12/01 19:49:46 ID:???
さらにさらに

まだ改造してないもんで
何か反応があればあったら
まいっちんぐマチコ先生だったりして


200 :名無しさん@勉強中 ★ : 06/12/01 20:02:43 ID:???
さらにさらにさらに

反応が無ければないで
まあそんなもんやね


というか打たれ弱いもんで
煽られるよりは
無反応なほうがよっぽどいいです


201 :名無しさん@勉強中 : 06/12/02 03:45:49 ID:4JoD/kho
検索したら出てきたので>>127に返信w
以前(xrea.comから戻る前)までは一定期間datを保持していましたが、容量不足により現在は長時間のdat保管は行っていません。
近日中にdatを分散させる形でdat落ち後のdatを表示する又は、●等に対応させようと思っています。


202 :名無しさん@勉強中 ★ : 06/12/02 08:08:03 ID:???
>>201さん
御返信ありがとうございます
楽しみにしていますです


さて


makimo.toさんのhtml2dat.cgiが真っ白画面だ・・・。


いろいろ書かれているなあ
でも他に方法は無かったですし
まあ仕方ない



もしこのままの状態だとしたら
htmlをDLするように作り替えて
htmltodatに一括変換させるようにするですかね。


とりあえず
ごめんなさい


203 :名無しさん@勉強中 ★ : 06/12/02 08:23:48 ID:???
それにしても
後付けオプションだから仕方ないんでしょうけど
何でhtml2cgi.cgi経由なのでしょうか。
みみずんさんやDinoswiftさんのところのように
datを静的にDL出来るようにされておられれば嬉しいのですが。

そもそも どのような形式でログ保存されているのか
教えて頂きたく思うです
古いスレッドのdatとかをDLしても
本家ではカンマ(「,」)区切りになっているのに
makimo.toさんの所では「<>」区切りになっておられますし
2chのdat形式では保存してないのかな


204 :名無しさん@勉強中 ★ : 06/12/02 08:38:55 ID:???
ずっとこのままだとしたら
方法は2つ

(1)あきらめて静観する
(2)htmlをダウンロードするようにしてdat化する


(1)ですが、のちのち後悔しそうです。
あの時にああしとけば良かったこうしとけば良かったとか
あれこれ思いそう。

となると(2)ですかね。


あと
公開したのを後悔してないですが
縁もゆかりも興味もないDownload板に書いたのは後悔してたりして。

# 関係ないですが
# 47さんもこんな心境だったのかな
# 今はどう思っておられるのかな とか思ったりして


205 :名無しさん@勉強中 ★ : 06/12/02 08:54:36 ID:???
# ↑随分大きく出たもんだ・・

という訳で
htmlを保存するように作り替えて
あとは静観かな

htmlをダウンロードして
dat化してdat保存
その後 htmlを削除とか
wsh単独でも やって出来なくはないですね。


ただスキルが追いつかないだけで。
(↑一番駄目なパターン)


206 :名無しさん@勉強中 ★ : 06/12/02 11:19:04 ID:???
とりあえず
htmlファイルをローカル保存するものを出しておくです

http://www.geocities.jp/mirrorhenkan/others/makimotoforever/html.html

dat落ち避難所スレにだけ書いておこう


207 :名無しさん@勉強中 ★ : 06/12/02 12:21:32 ID:???
メモ

正規表現(このBBS 改行規制何とかならないものか)
m#<dt>([0-9]+) 名前:<span .*?>(?:<span title="(.*?)" cl
ass=sage>|<a href="mailto:(.*?)" class=mailto>)? ?(.*) (?
:</a>|</span>)?</span> ?(.*?) <br><dd> *?(.*?) <br> *?<br
> *?(<a name.*?>|</tl>|</dl>)#mi

変換結果式
$4<>$2$3<>$5<>$6<>

これでいけるですが
問題点をあげると

・be関係を入れてない
・「あぼーん」や「sage」等
 プレーンテキストになる可能性のある前処理をつけてない
・他スレのリンクが
 「../../be_be/1107/1107809637.html 」
 「../../qb5_operate/1106/1106061017.html#249」
 となっている

3番目は前処理で何とかしたいなぁ。
1・2番目も前処理でごまかせればいいなぁ。

という訳で
htmltodatのバージョンアップされたものを使う時がきたかもです
(すみませんスルーしたみたいになってしまって>mukiyuさん)


208 :名無しさん@勉強中 ★ : 06/12/02 12:37:33 ID:???
http://pc8.2ch.net/test/read.cgi/tech/1143262686/676n-

・・いよいよ始動したようです。


209 :名無しさん@勉強中 ★ : 06/12/02 12:56:08 ID:???
(1)be部分
ID:Zpu0G/4N <a href="JavaScript:be(486461748)">?</a>BRZ(1113) <br>

(2)他スレリンク
・同サーバ・同板の場合
<a href="../1127/1127911361.html">../1127/1127911361.html</a> <br>
・別板の場合
<a href="../../be_be/1106/1106239080.html">../../be_be/1106/1106239080.html</a>




210 :名無しさん@勉強中 ★ : 06/12/02 13:10:59 ID:???
s#<a href="JavaScript:be\((\d+)\)">\?(\#*)</a>(.+?)( <br>)#BE:$1-$2$3$4#gi


211 :名無しさん@勉強中 ★ : 06/12/02 13:52:49 ID:???
上の駄目

これでOKっぽい

s#<a href="JavaScript:be\((\d+)\)">\?(\#*)</a>#BE:$1-$2$3#gi


212 :名無しさん@勉強中 ★ : 06/12/02 14:03:40 ID:???

同サーバ・同板の場合

s#(>)\.\./\d+?/(\d+?)\.html(</a>)#$1http://server.2ch.net/test/read\.cgi/board/$2/$3#ig

これで何とか変換出来ました。
問題は「server」「board」で入力した箇所。
自動変換出来るようにはならないものか。


213 :名無しさん@勉強中 ★ : 06/12/02 14:19:19 ID:???
別サーバ・別板の場合

s#(>)\.\./\.\./(.+?)_(.+?)/\d+?/(\d+?)\.html(</a>)#$1http://$2\.2ch\.net/test/read\.cgi/$3/$4/$5#ig

これで何とかなったかな


214 :名無しさん@勉強中 ★ : 06/12/02 14:24:15 ID:???
>>208のスレッド
楽しそうだなー。

でも
この方と同様 私には関係ない話みたいです

http://pc8.2ch.net/test/read.cgi/tech/1143262686/938n
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
938 :デフォルトの名無しさん :sage :2006/12/02(土) 14:11:28
Win98の俺には関係ない話だったのか(´・ω・`)
−−−−−−−−−−−−−−−−−−−−−−−−−−−−

read.txtの通りにインストールして何度再起動しても
MSXML3.0エラーのままです




215 :名無しさん@勉強中 ★ : 06/12/02 15:18:29 ID:???
という訳で

http://makimo.to/2ch/qa_nandemo/index.html

にある10スレのhtmlをローカル保存して
さっきまで延々やっていたhtmltodatの正規表現・結果式・前処理
で一括変換したものを

http://user.ftth100.com/mirrorhenkan/xml/

に上げてみました。
beと他スレのURLはうまくいっているようです。


216 :名無しさん@勉強中 ★ : 06/12/02 15:36:09 ID:???
さてと

私がとっておきたいのは
下の各板でしょうか。

Webプログラミング板
プログラミング板
Windows板
ビジネスソフト板
Web製作板
ソフトウェア板

どれもこれも住民でも何でもないですが
調べるのにはとても重宝するので。


217 :名無しさん@勉強中 ★ : 06/12/02 16:15:23 ID:???
要望を出させて頂いたです

http://jbbs.shitaraba.com/bbs/read.cgi/computer/1929/1038588508/355-356n

それにしても
スレッドを一つdat変換するのに3分くらいかかってるみたい・・。

もっと短縮出来ないかな。
これよりも もっとスマートな変換書式を書いたら少しは違うのかな。


218 :名無しさん@勉強中 ★ : 06/12/02 16:57:50 ID:???
・・よし
htmlをローカル保存して
どこかに上げておこうか。


219 :名無しさん@勉強中 : 06/12/02 23:50:21 ID:KUK6YJ5a
2chdatgetを不在時に実況板で便利に使わせてもらってます。

livefoot (実況せんかいゴルァ!@さっかーch)
で使用すると必ずエラー表示が出ます。(他の板でもたまに出ます)
dat取得は成功してますが、取得のたびに画面に出て溜まる一方です。
Windows2000sp4使用です。表示内容は以下の通りです。

Windows Script Host
スクリプト: E\2ch\livefoot\2chdatget.vbs
行: 142
文字: 1
エラー: ファイルが見つかりません。
コード: 800A0035
ソース: Microsoft VBScript 実行時エラー



220 :名無しさん@勉強中 ★ : 06/12/03 18:04:38 ID:???
>>219さん
どうもです。

えーと

お書きになられてますけど
livefootでは必ず出るのですか?
他の所ではそうエラーにならないと

うーん。。

ノートン等のアンチウイルスソフトや
何か常駐させるものとかお使いでしょうか。
もしそうなら、いったんそれらを切って試してみて下さい。

関連かもしれないですが(って勝手に出してごめんなさいですが)
こんな場合もありますし。↓

http://jbbs.livedoor.jp/bbs/read.cgi/computer/21256/1164941934/11


もしそれで駄目な場合は・・どうしよう。
人によっては負荷増大・サーバ攻撃ツールと捉える人も居るので
(その側面がある事は否定出来ませんし)
誰かに聞くのも はばかられるんだよなあ(って私がですけど)

とりあえず試してみて下さい。


221 :名無しさん@勉強中 ★ : 06/12/03 18:34:35 ID:???
さて

http://ex13.2ch.net/test/read.cgi/gline/1118753283/982

↑で書いたものを
出せるようにしないとです
「マダー(AA略)」とか言われる前に。

生成するindexのヘッダとフッタをどうするかという事を
ちょっと思いあぐねているです


222 :名無しさん@勉強中 ★ : 06/12/03 21:35:35 ID:???
http://ex13.2ch.net/test/read.cgi/gline/1118753283/986

やる事はやったです
あとは野となれ山となれ


223 :名無しさん@勉強中 ★ : 06/12/03 21:42:16 ID:???
作ってて思ったですけど
本家dat2htmlと同じようなものも
wshでできそうですね。


224 :名無しさん@勉強中 ★ : 06/12/04 08:22:59 ID:???
makimo.toさんの掲示板に
どなたかhtml2dat.cgiの復活依頼をされておられるので
障害にならないように
makimoto_datget2のページのリンクを変えたです
index.html→index0.html

html2dat.cgi 復活して欲しいです。


225 :DinoSwift ◆m7TsEz1c5. : 06/12/04 18:43:43 ID:kPk4kKs/
(へ´ω`) ここのBBS見て、とりあえずこんなの書きました。
     http://wannabe.fam.cx/service/2ch_get/index.html


226 :名無しさん@勉強中 ★ : 06/12/04 20:18:36 ID:???
>>225
あ、どうもです。
御連絡ありがとうございます。

・・・素晴らしい。
自分にはとても書く事の出来ないような文章だ・・。

cronではなく、タスク管理を使っておられたのですか。
(ってタスク管理という機能 知らなかったですが)
そういえばmakimo.toさんやみみずんさんの所もwindowsサーバみたいですが
どちらをお使いになっておられるのかな。

ファイルのヘッダを取得して更新してるかどうか見る方法とかも
と〜く2ちゃんねるとかで見ていたのですが
wshでもそういう事をすれば 負荷軽減になるかもですね
余裕が出来たら見てみよう。

これを見て
ログ保管庫とか設置される方も居られるかもですね。
私も perlやphpで作ったクローラーがあるので
負荷分散(?)の為に公開しようかな
でも今見たら何書いてるのか訳わからん・・

ここを見ている方々へ(ってどれくらい居るんだか)
DinoSwiftさんは私の不躾なマイミク申請を快諾して下さった方です

そういえば、みみずんさんやルクダルさんひろゆきさんも
mixi内でお見かけしてるです(それだけです) 
 


227 :名無しさん@勉強中 ★ : 06/12/04 23:04:44 ID:???
ちょうどいい話題があったのでメモ

http://qb5.2ch.net/test/read.cgi/operate/1164201063/528n-
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
528 : ◆TWARamEjuA :2006/12/04(月) 22:08:18 ID:Zww3h5Cn0 ?BRZ(6677)
Q「Windowsアプリケーションを自動で操作し、cronしたいけれどもperl(ActivePerl)のみで実現出来るのかしら?」

530 :桶屋 :2006/12/04(月) 22:21:27 ID:G1WR0r6C0
Windowsのタスクは、バッチファイルなども起動させられるけど、
それを使わない/使えない理由は何?
−−−−−−−−−−−−−−−−−−−−−−−−−−−−

wshも起動できるみたいなので
1時間毎に巡回クロールとか可能ですね。


228 :名無しさん@勉強中 ★ : 06/12/05 09:00:27 ID:???
# 公私ともに嫌な事ばかり起こる・・・

>>224にした奴を元に戻しました。
下を見たもので。
蜷局を巻いて逃亡したと思われても何なので。

http://tmp6.2ch.net/test/read.cgi/download/1164164363/286

もう使えないツールですが
誰かが同様のものを作る際に参考になるかもなので。
私もあちこちのwshを見て参考にしたですし。

かえすがえすも
download板とUNIX板に書き込んだ事が悔やまれてなりません。


229 :名無しさん@勉強中 ★ : 06/12/05 09:10:41 ID:???
# 上のレス番は269でしたな

そういう意味では
自分がやってるのはどれもこれも
色々なスクリプトのソースを参考にしてツギハギしたものばかりなので
さて どこからがオリジナルと言えるのか・・・。

なので、↓こう仰られる方とか尊敬するです。
ゼロから書けるなんて すごいなあと。

http://udon.be/test/read.cgi/rainbow/1112995210/901
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
ってゆーか、他のソースをコピーして使ったら
その時点で配布しづらくなるので、搭載するとしても自分で書きます。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−


230 :名無しさん@勉強中 ★ : 06/12/05 13:06:23 ID:???
http://ex13.2ch.net/test/read.cgi/gline/1118753283/997の件ですが
やってみたら
なかなか難しいですよ

入れ子構造にすればいいのかなと思うですが
慣れてないもので。


231 :名無しさん@勉強中 ★ : 06/12/05 14:57:20 ID:???
http://jbbs.shitaraba.com/bbs/read.cgi/computer/1929/1038588508/367-368n

やってみようとしたけど
すんげー微妙にどこもかも違うんだなこれが

・「投稿日:」という文字がついている
・メール欄のタグが
 <a class=mailto href="mailto:(.*?)">
 となっている
 通常は下記
 <a href="mailto:(.*?)" class="?mailto"?>
・他のmakimo.to形式htmlの日付の後についていた<br>がない

あと一歩なのでしょうか。


232 :名無しさん@勉強中 ★ : 06/12/05 16:40:06 ID:???
メモ
http://oshiete1.goo.ne.jp/kotaeru.php3?q=801858&rev=1


233 :名無しさん@勉強中 ★ : 06/12/05 18:17:51 ID:???
うう
For Each in 〜 Next
へのパラメータ渡しの方法がわかんない


234 :名無しさん@勉強中 ★ : 06/12/05 19:37:45 ID:???
・・よし、出来た。


235 :名無しさん@勉強中 ★ : 06/12/05 20:01:17 ID:???
書いたです

http://ex13.2ch.net/test/read.cgi/gline/1165245437/14

何かもう
どうでもよくなってきた


236 :名無しさん@勉強中 ★ : 06/12/05 20:49:43 ID:???
という訳でこの件
もうそろそろ お開きという事に。

いやー勉強になったっけやー。


237 :名無しさん@勉強中 ★ : 06/12/05 21:32:08 ID:???
さて
後はソフトウェア板とWeb製作板でしょうか
どちらも1ギガ以上あるみたいです
とても自分のPCでは

って お開きって書いたくせに
自分から再開してら


238 :名無しさん@勉強中 ★ : 06/12/06 18:05:36 ID:???
差し障りのない範囲でメモ

自分のマシン、ハードディスクの残り容量が200メガかそこらなので
適当な量ダウンロードしたら即ftpでサーバにアップロードして
削除しての繰り返しをしなければならない訳ですが
そのようにしてアップした850メガくらいのプログラム板ログが
一つだけでは実に心許ない。
かといっていったんDLしてアップするにしても容量不足で

という事で
サーバ間転送というものを使ってみようかと。(FXPともいうらしい)

http://www.smartftp.com/
http://www.smartftp.com/localization/projects/japanese/documentation.html
http://akky.cjb.net/exploit.html
http://members.tripod.com/ks2000/sorce_code/fxp/fxp.txt

smartftpというソフトがFXP対応しているそうです。
ただ、ソフトウェア板のスレッドを見ると
レジストリをいじるみたいでどうしよう。
それにしても5年前のスレッドなのに現役だ・・。

http://pc7.2ch.net/test/read.cgi/software/1008611176/88-89n

まあ、メモ止まりかもしれないですけど。


239 :名無しさん@勉強中 ★ : 06/12/06 18:27:54 ID:???
o2onスレより

http://tmp6.2ch.net/test/read.cgi/download/1165212097/540
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
540 :[名無し]さん(bin+cue).rar:2006/12/06(水) 01:39:02 ID:VDUG/zCz0
http://tmp6.2ch.net/download/subject.txt
http://anime.2ch.net/asong/subject.txt
http://ex17.2ch.net/news4vip/subject.txt
http://news19.2ch.net/newsplus/subject.txt
http://news20.2ch.net/news/subject.txt
http://anime.2ch.net/anime/subject.txt
http://live22x.2ch.net/livewkwest/subject.txt
http://live23.2ch.net/livenhk/subject.txt
http://live23.2ch.net/liveetv/subject.txt
http://live23.2ch.net/liventv/subject.txt
http://live23.2ch.net/livetbs/subject.txt
http://live23.2ch.net/livecx/subject.txt
http://live23.2ch.net/liveanb/subject.txt

今↑を定期巡回して1000レスのスレを保存するようにしてるが、
他に押さえるべきスレはあるかのぉ?
−−−−−−−−−−−−−−−−−−−−−−−−−−−−

どのような方法で保存されておられるのか教えて頂きたい所ですが
datsearchget(という名前でいいのか?)でも同様の事が出来ますね。

http://www.geocities.jp/mirrorhenkan/others/datsearchget/

subject.txtを一行づつ読み込んで
それが入力した検索ワードにを含んでいたらDLするだけの事なので
1001行ったスレッドだけ抽出してDLしたいなら

行の終わりが「(1001)」にマッチすればいいと思うので

> .+\(1001\)$

または単に

> \(1001\)$

でいいのかも。
ただ、文末を示す「$」が使えるのかどうかわかんない





240 :名無しさん@勉強中 ★ : 06/12/06 18:35:02 ID:???
同様に
例えば800レス以上のスレだけ保存したいなら

> \([89]\d\d\)$

950レス以上なら

> \(9[5-9]\d\)$

かなと。

ただ、これだと1000や1001にマッチしないので
それぞれ

> \((?:[89]\d\d|100[01])\)$

> \((?:9[5-9]\d\|100[01]))$

で良いのでしょうか。
試してみる気力が無いので間違っているのかも。


241 :名無しさん@勉強中 ★ : 06/12/06 18:43:36 ID:???
それと
>>233-235で作ったものがあるので
これを使いまわして
複数板を巡回クロールor巡回抽出クロールするwshも出来そうです。
それが出来たら
>>239で出した方と全く同じような事が出来るかもしれない。

windows標準(ほぼ)の付属機能も
なかなか侮れないもんだなぁ とか思ったりして。
奥が深いです。


242 :名無しさん@勉強中 ★ : 06/12/06 19:45:48 ID:???
さらに押し進めれば

http://menu.2ch.net/bbsmenu.htmlをDLして
正規表現で各掲示板のURLおよび板名を取得
しかる後に巡回クロール or 巡回抽出クロールすれば
全てのログをバックアップするような事も夢ではなさそうですね。
datの保管先もDinoswiftさんやみみずんさんみたいに
それぞれ分類分けする事も可能でしょうし
ヘッダだかステータスコードだかを見て
未更新ならスルーするようにすれば
負荷も減るでしょうし。

でも差分取得とか出来るのかな。


243 :名無しさん@勉強中 ★ : 06/12/06 20:49:44 ID:???
さて
makimo.toさんの所
復活された訳ですが


どうやら
各板のリストを表示しないようにされたようです。


過去ログ墓場から入って

http://makimo.to/2ch/index.html

ここまでは表示されますが

http://makimo.to/2ch/bbs1.html

それ以降のページに行こうとしても
エラーページが表示されます

http://makimo.to/2ch/news18_namazuplus/index.html


ふむ。
これが答えか。


501 KB
続きを読む

掲示板に戻る 全部 前100 次100 最新50
名前: E-mail (省略可) :

read.php ver2.4 2005/04/13

楽天モバイル[UNLIMITが今なら1円] ECナビでポインと Yahoo 楽天 LINEがデータ消費ゼロで月額500円〜!


無料ホームページ 無料のクレジットカード 海外格安航空券 解約手数料0円【あしたでんき】 海外旅行保険が無料! 海外ホテル