楽天モバイル[UNLIMITが今なら1円] ECナビでポインと Yahoo 楽天 LINEがデータ消費ゼロで月額500円〜!


無料ホームページ 無料のクレジットカード 海外格安航空券 解約手数料0円【あしたでんき】 海外旅行保険が無料! 海外ホテル
告知欄です


■掲示板に戻る■ 全部 1- 101- 201- 301- 401- 501- 601- 701- 最新50
メモ

1 :663:05/05/01 17:30:46 ID:boieiukf
思いついた事など

607 :名無しさん@勉強中 ★:06/05/14 17:07:08 ID:???
>>580で作ったスクリプトを
index.htmlにも組み込んでみました。
あんまりうざくないように広告で隠れる箇所に挿入してみたり。
まあ煩わしいと思う人の方が多いかもしれないな(なら置くなと)

それにしても
一秒づつ動く時計とキーを見ていると
何だか身につまされるです
遊んでばかりもいられない

608 :名無しさん@勉強中 ★:06/05/14 19:15:52 ID:???
はてなダイアリーにこんな記事が。

http://d.hatena.ne.jp/hacking_dubby/20060307
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
2006-03-07
■[うんちく] データベースと情報集約〜新たな情報生成 21:07
選択範囲を処理するようなJavaScriptのサンプルを探し回ったものの、
有効なサンプルを見つけることができませんでした。サンプルを探すこ
とは半分諦め、一から勉強して作ろうと思ってた矢先に

偽モナメント〜datアップローダ〜

を発見し、望みのサンプルを探し当てました。これは2chの過去
ログをアップロードし、検索できるアプリケーションです。2ch
のデータベースとしての価値を再確認したと同時に、情報は集約
されることでより価値を増すということも実感できました。
このアプリケーションのように、2chのデータベース使用を期待し
てうまい"仕組み"を作り、その上でユーザーを活動(アップロー
ドや、検索する)させるという視点は面白いと思います。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

JavaScript質問スレ過去ログの事みたい。
そこまで考えてやった訳ではないのですが・・
http://user.ftth100.net/mirrorhenkan/javascript/

−−−−−−−−−−−−−−−−−−−−−−−−−−−−
しかし、この仕組みにはプラスのスパイラルを引き起こす要素が
足りないと思いました。例えば「検索されているキーワードラン
キングを公開する」など、場で起こっているメタ情報をも集約し
公開すると面白いでしょう。既存のデータベースを用いて、便利
な仕組みを作り上げ、そこからプラスαの情報を生み出すことが、
プラスのスパイラルを引き起こさせる要因だと思います。

では、プラスのスパイラルを引き起こさせるとはどういうことで
しょうか?例えば「検索されているキーワードランキングを公開
する」では、キーワードランキングを公開することで、「トレン
ド」という新たな情報が生み出されます。情報の集約のみならず、
情報を発信することで、より場は活性化され、プラスのスパイラ
ルが起きると考えられます。

と偉そうに言ってみます。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−

うーむ、検索ワードランキングですか・・。
そういえば
みみずんさんもmakimo.toさんも公開されてますね>検索ランキング


余裕が出来たら考えてみますか。。

609 :名無しさん@勉強中 ★:06/05/19 20:19:32 ID:???
メモ

硝子の円錐-Mariko GODA's Web Site
http://www.madin.jp/

すんっごいです。

目についたのは
「2ちゃんねるスレッドタイトル漢字頻度解析」とか
「マスゲーム壮大画像生成CGI」とか。
後者は多分ImageMagickを使ってるんでしょうね。
チャレンジしてみたら面白いかも。

ちなみにこのサイト
「2ch 変換機」で検索したら出てきたものです

610 :名無しさん@勉強中 ★:06/05/24 23:59:32 ID:???
http://ex13.2ch.net/test/read.cgi/gline/1140057115/259n

携帯ですか・・。
携帯対応とか出来たらいいですね

611 :名無しさん@勉強中 ★:06/05/27 10:38:34 ID:???
とりあえず携帯からコピペとか出来るのかという件

http://ex13.2ch.net/test/read.cgi/gline/1146289102/410
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
404 :水先案名無い人:2006/05/26(金) 17:14:54 ID:D1kd2KsIO
携帯のブラウザだとコピーできないんで張ってもらいたいんですが
--
410 :水先案名無い人:2006/05/27(土) 01:38:38 ID:L8Y9XsxFO
>>404 おまえみたいな馬鹿がいるから携帯ユーザーはいつまでたっても携帯厨なんだよボケ

コピーも検索も改行も安価も携帯からだってできるんだぞ

携帯だから云々じゃないんだよ自分中心に考えんなタコ
--
411 :水先案名無い人:2006/05/27(土) 02:07:55 ID:oviwXZzg0
今気骨のある携帯ユーザーを見た
−−−−−−−−−−−−−−−−−−−−−−−−−−−−


出来るようですね

612 :名無しさん@勉強中 ★:06/05/27 17:06:42 ID:???
携帯用のdat2html用メモ

http://mirror.k2.xrea.com/dat2html/

・ナンバリングを「1-」「前10」「次10」「最新10」だけに出来たらいいなあ
・「レス○番に飛ぶ」用のジャンプ用入力窓とか出来たらいいなあ
・最下部にも「1-」「前10」「次10」「最新10」があったらいいなあ

613 :名無しさん@勉強中 ★:06/05/27 18:03:05 ID:???
http://ex13.2ch.net/test/read.cgi/gline/1125943726/832-835

makimo.toにありました
http://220.254.5.211:8000/cgi-bin/dat2html/dat2html.cgi?www2/b/801/1073335045/

これのdat化とか出来るのかな
http://220.254.5.211:8000/cgi-bin/dat2html/dat2html.cgi?www2/b/801/1073335045/&view=DAT
何か真っ白画面だ

でも
古いスレの形式まで対応は出来ないです。。
makimo.toの検索結果にキャッシュがあるからそこで見てもらうしかないかも

614 :名無しさん@勉強中 ★:06/05/28 08:15:04 ID:???
メモ
□remix2ch
http://contents-factory.net/remix2ch/

phpで404チェック
http://www.arielworks.net/articles/2003/1220a

外部datファイルの読み込み
$line = file("http://".$server."/".$b_name."/dat/".$dat_num.".dat");


615 :名無しさん@勉強中 ★:06/05/28 11:35:26 ID:???
さて
>>613をdat化してみようと思い
http://220.254.5.211:8000/cgi-bin/dat2html/dat2html.cgi?www2/b/801/1073335045/
に行ってみたら「datファイル取得エラー」と出ました。
・・・どうなってるのよ?
で、いちおうhtmltodatで呼び出してみると
呼び出せたりdat取得エラーになったり。
不思議だ。

で、mukiyuさんのお書きになられたメモを使わせて頂いて
http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038409548/44
変換してみると
何故か本文が取得出来ない・・・。
だいぶ悩みました。

しばらくして
変換オプションの変換結果式を「makimo.to」に変えてなかった事に気付き
もうアホかバカかと。

そして変換してみました。
・・・うーん
988レスあるのに変換結果は986行だぞ・・・。

616 :名無しさん@勉強中 ★:06/05/28 11:43:26 ID:???
ひとつひとつ見るのは大変なので
変換結果式を
「$4<>$2$3<>$5<>$6<>」
から
「$1<>$4<>$2$3<>$5<>$6<>」
にして
dat化して保存
  ↓
行数表示出来るエディタで開いて、付き合わせてみました。
  ↓
レス317とレス735が抜けてるみたいです。

該当レスを見てみたですが
ようわからん・・・

疲れたのでここまで。(すっげー消化不良)


# ごめんなさいhtmltodat0.8.5まだ試してないです
# ごめんなさいごめんなさい

617 :名無しさん@勉強中 ★:06/05/28 12:13:45 ID:???
メモ

re-builder
http://ohkubo.s53.xrea.com/xyzzy/#re-builder

xyzzyでの正規表現の作成・確認を行うツールだそうです

画像はこちら
http://ohkubo.s53.xrea.com/xyzzy/re-builder.png

htmltodatにもこういうのがあったら
すごく幸せになるだろうなあ(私が)

618 :名無しさん@勉強中 ★:06/05/28 12:37:26 ID:???
何だかhttp://2ch.from.tvさんが初期画面になっちゃったので
http://old.suppa.jp/からリンクしている
まとめ倉庫のプレビューをつけたです

かえって無料サーバを使ったサイトのほうが後々まで残ってる感じですね
大昔(といっても5〜6年前)のサイトとかだと特に。

619 :名無しさん@勉強中 ★:06/05/28 18:43:02 ID:???
http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/317n-

すみませんです(というか速い・・)

変換した際に出力される$1の連続関係が簡単に確認出来たら
嬉しいです。(私が)
上の例だと「317と735が抜けてます」とか自動的に検出とか出来たら
嬉しいです。(私ry)



メモ
http://user.ftth100.com/mirrorhenkan/javascript/read.php/1014289221/n769-785

620 :名無しさん@勉強中 ★:06/05/29 22:03:01 ID:???
http://jbbs.shitaraba.com/bbs/read.cgi/computer/1929/1038588508/319-321n

いえもう気にかけて頂いただけでも。
ただ、[age]となっているのなら、前処理で

s#\[age\]#<a href="mailto:age">#g

とかすればいいのかなーとか。
(ごめんなさい確かめずに書いてます)


makimo.to繋がりでもう一つ。
以前意味もなく挑戦して断念した所があります

http://jituwa.gozaru.jp/

何とも見栄えが良くてうらやましくなるようなサイトなんですが
下部にある過去ログは 
どうもmakimo.toさんのログをブラウザ保存しているようで
これをdat化出来たら面白そうだとやってみたんですが
駄目でしたです
何てこった。

621 :名無しさん@勉強中 ★:06/05/29 22:21:09 ID:???
あと
エラーダイアログでもメモウインドウでも
あればあっただけで嬉しいです。

出来れば
失敗したレス番号の羅列をコピー出来たら嬉しいです(こればっかですが)

622 :名無しさん@勉強中 ★:06/06/03 16:52:51 ID:???
以下二つ追加したです

携帯用dat2html
http://mirror.k2.xrea.com/dat2html/

携帯用ミラー変換機
http://mirror.k2.xrea.com/i/


自分的には消化不良な感じですが
まあいいやと。

623 :名無しさん@勉強中 ★:06/06/03 17:47:07 ID:???
携帯用のdat2htmlのバグも
何とか消せたのではないかと。
細かいフォーマットとかはよくわかんないや

それにしても
http://www.geocities.jp/mirrorhenkan/
のトップに携帯用リンクをつけたのですが
何だか変だなあ・・・
どうすべか。

右寄せすれば隠れますが
携帯から見たらわかるのかな
わかるんならそうしたいんですが。

624 :名無しさん@勉強中 ★:06/06/03 17:55:37 ID:???
と書いたけど
シミュレータから見たらどっちも大差なかったんで
右寄せしました。

625 :名無しさん@勉強中 ★:06/06/04 11:51:22 ID:???
メモ
携帯で閲覧可能なように変換してくれるCGI

http://www.rcdtokyo.com/pc2m/note/archives/i000790.php
http://www.core-p.com/cgi-search/search/search.cgi?cmd=dp&num=853
http://www.yumemaboroshi.net/cate21/
http://yuki-lab.jp/ginga/index.html

一番下のサイトは、
以前谷山浩子さんの事について色々検索した中で
ヒットしたものの一つです。
いやーすごい人が居るんだなーと思ったものですが
今回探し直して読み返してもすごいですよー。

626 :名無しさん@勉強中 ★:06/06/04 12:01:53 ID:???
http://pc8.2ch.net/test/read.cgi/hp/1148609976/164n-
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
164 :Name_Not_Found:2006/06/04(日) 10:02:16 ID:??? ?
>>156
俺はここを使った。マジお勧め
http://www.geocities.jp/mirrorhenkan/

172 :Name_Not_Found :sage :2006/06/04(日) 11:52:13 ID:???
>>164
※このアドレスは危険URLのひとつです。って言われた
−−−−−−−−−−−−−−−−−−−−−−−−−−−−

よくわかんないんですが
ノートンインターネットセキュリティの誤反応なんでしょうか。

とりあえず聞いてみました。
http://pc8.2ch.net/test/read.cgi/hp/1148609976/175n



627 :名無しさん@勉強中 ★:06/06/04 12:09:56 ID:???
http://pc8.2ch.net/test/read.cgi/hp/1148609976/176n
即レス頂いたので調べてみたです


http://so.7walker.net/index.php?site=http%3A%2F%2Fwww.geocities.jp%2Fmirrorhenkan%2F&hua=
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
-- 「2006/05/05 10:37」のキャッシュをチェックしています。 --
※このアドレスは危険URLのひとつです。
注意!アラートオープンを発見! (3)
ブラクラチェックが終了しました。

※ ジャンプタグを発見しました。(1)
\
※ windowオープンを発見しました。(9)
※ インラインフレームタグを発見しました。 (40)
\
\
\
\
\
※ 隠しスクリプトを発見しました。(8)
./others/find2ch.js
http://washboard.s6.xrea.com/imakoko.cgi
http://j1.ax.xrea.com/l.j?id=100440888
http://bc.geocities.yahoo.co.jp/js/sq.js
上記アドレスのチェックもお勧めします。(そのままチェックできます。)
−−−−−−−−−−−−−−−−−−−−−−−−−−−−

うーむ

628 :名無しさん@勉強中 ★:06/06/04 14:31:47 ID:???
何か書き過ぎた感じですが
http://ex13.2ch.net/test/read.cgi/gline/1118753283/777n-

webarchiveに残っている
クラシックさんがバックアップしたhtmlミラーとか↓
http://web.archive.org/web/*sr_11nr_10/http://1983.rocketspace.net/*

それはともかく
datには元スレのURLとかは無いんですよねー。
検索すれば判るんですけど
疲れてると どうしてもそのへん疎かになっちゃうです

629 :名無しさん@勉強中 ★:06/06/07 08:03:54 ID:???
http://ex13.2ch.net/test/read.cgi/gline/1118753283/784n
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
784 :水先案名無い人:2006/06/07(水) 02:27:50 ID:owgGyeKt0
ミラー変換機もう使い物になんないよ。ローカル保存の後外すタグが異様に増えて面倒。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−

・・?


よくわかんないです。

630 :名無しさん@勉強中 ★:06/06/09 17:41:36 ID:???
メモ
http://php.s3.to/tt/tt6.php
http://plog.pya.jp/program/php/lesson06/sample03.html


631 :名無しさん@勉強中 ★:06/06/09 22:01:44 ID:???
なんと
上で挙げた説明サイトとマニュアルを参考にあれこれやってみたら
結構簡単にdat取得スクリプトが出来たみたいです

流れとしては
最初にsubject.txtを読み込んでバッファに入れ
一行づつ解釈してdatを取得保存するだけのものです
コメントやエスケープした行も含めて50行足らず
とりあえずvip板をクロールしたら
50くらいのdatが溜まりました(ってそこでやめたんですが)



で、問題が3点。

(1) スクリプトが全部終わる前にタイムアウトしてしまうかも
 datの取得の為に、ループで回すのですが、
 それが終わりきらないうちにタイムアウトになるです
 (レンタルサーバの宿命かも。他の方々の迷惑にもなるし)

(2) 「過剰クロール」となってブラックリストに入れられてしまうかも
 sleep文とかで間隔をあけてアクセスする事は可能なんですが
 (例えば「sleep(10);」で10秒間休止出来るみたい)
 そうすると(1)のタイムアウトに引っかかってしまいますし
 かといって休みなく取得し続けるとdenyされそうですし
 んあああジレンマ

(3) サーバの保存容量に限りがある
 無料サーバの宿命ですからしょうがないなぁ

(4) 全自動に出来ない
 cronジョブとか使えればいいんですが。



どなたかphpの使えるサーバとか貸して頂けたら
完全に取得出来るかどうかわかるかもですが
まあ難しいだろうなー。。

632 :名無しさん@勉強中 ★:06/06/09 22:58:47 ID:???
とりあえず試してみたら
145dat/9.9メガ取得してタイムアウトしたです。

今vip板を見たら1038スレあるので
全datの容量は、単純計算で70.8メガくらいになるのかなと。



633 :名無しさん@勉強中 ★:06/06/10 08:40:09 ID:???
試しにphp質問スレ過去ログ内を検索してみたら。

http://user.ftth100.net/mirrorhenkan/php/read.php/1096965398/350-371n
http://user.ftth100.net/mirrorhenkan/php/read.php/1087191395/357-364n
http://user.ftth100.net/mirrorhenkan/php/read.php/1089929520/31-48n

・・・素晴らしい。


特に、>>557のサイトの管理人さんが登場されているのですが
出されたスクリプトへのリンクが生きてて
んもー猛烈に感動したです。

という訳で
Imo ◆.jC7ANgFY.さんのファンになりました。
http://user.ftth100.net/mirrorhenkan/php/search.php?word=%81%9F.jC7ANgFY&submit=++%8C%9F%8D%F5%82%B7%82%E9++

634 :名無しさん@勉強中 ★:06/06/11 12:21:54 ID:???
ふむふむ
取得中にdat落ちした場合は
http://www2.2ch.net/live.html
が保存されとりますな。

ヘッダに「302」が含まれている場合は
何もしないで進むようにすればいいかなと。

# それにしても
# http://www.mewlist.xxxxxxxx.jp/script.html
# −−−−−−−−−−−−−−−−−−−−−−−−−−−
# 下記URLにてHEAD Methodでデータを取得
# http://ホスト名/板のフォルダ名/dat/スレッドキー.dat
# このときHTTPヘッダーの全てを取得する必要はなく、先頭12バイトのみでよい
# 取得した12バイトの文字列から末尾の3バイトを抽出すれば
# それがHTTPステータス・コードとなる
# −−−−−−−−−−−−−−−−−−−−−−−−−−−−
#
# 「正規表現使えばもっと簡単だろうになあ」
# とか思ったり。
#


あと
news4vipのサーバが「ex14→ex15」に変わったみたいで
昨晩取得した1160個のdatの半分くらいが
http://www2.2ch.net/live.html
になってました。

取得中のサーバ移動の場合はどうしようもないですが
最初のsubject.txtのURLは
http://menu.2ch.net/bbsmenu.html
から取得すればいいのかも。

635 :名無しさん@勉強中 ★:06/06/11 13:14:48 ID:???
とはいえ
1日30〜50メガくらいログが増えるみたいなので(適当)
仮に1ギガ使えるとしても
単純計算で ひと月かそこらで使いきってしまうのか。


いやー、ミラー保管サイトの管理人様って本当に凄い方々なんですね。

636 :名無しさん@勉強中 ★:06/06/11 13:30:16 ID:???
メモ
http://ns1.php.gr.jp/php-jp/archives/msg11953.html
http://www.twin.ne.jp/~akr_m/free/free

下とかすごいです。
プログラム系かと思いきや お絵描きCGサイトですし。
(どちらも出来ない私はどうすりゃいいのかと)

DinoSwift ◆m7TsEz1c5さんも凄い絵を描かれますし
「天は二物を与えず」なんて事はないなーと。


637 :名無しさん@勉強中 ★:06/06/11 17:22:58 ID:???
>>614下で出されていたコードを参考にして
ヘッダのステータスコードを取得するものを設置してみました。
いやー、phpって本当にいいもんですね。

http://mirror.k2.xrea.com/head.php

638 :名無しさん@勉強中 ★:06/06/11 18:51:09 ID:???
上のスクリプト
バグが幾つかありますが
まあいいや。

メモ
http://modern.dw.land.to/
http://homepage1.nifty.com/yito/anhttpd/faq/ie-ftp.html

上 phpでのdat2html
下 IEを FTPクライアントとして使用するときの問題と対策

下なんですが
ftpで繋ぐ際のポート番号が特殊な場合(21では無い場合)
どうすればいいのか検索した中にあったものです。
結局まだ未解決なんですが、どうすればいいのかな


639 :名無しさん@勉強中 ★:06/06/12 16:02:22 ID:???
こういうのがあったんですけど

http://www.atmarkit.co.jp/fwin2k/win2ktips/649ftpport/ftpport.html

試してみたらうまくいかない・・・。

640 :名無しさん@勉強中 ★:06/06/12 16:57:50 ID:???
http://php.nekosuke.com/000012.html

641 :名無しさん@勉強中 ★:06/06/12 21:08:47 ID:???
とりあえず、クローラーのスクリプトをつけてみました。
これでニュー速vipのスレの依頼が減ればいいかなと。

貧乏人はcronジョブが使えないので
iframeでスクリプトのリンクをつけて、
そのアクセスをトリガーにして(あとflockで排他制御して)
クロールするようにしてみたです。

subject.txtは集めてないですし
datのリンクとか全然つけてないので
news4vipの検索結果で出てくるだけですが
まあ最初はこんなもんかなと。


ただ この試み、ちょっと怖いので
すぐやめてしまうかもです(^^;)
あらゆる所に迷惑をかけてしまう感じですし。

642 :名無しさん@勉強中 ★:06/06/12 22:35:04 ID:???
うーん、どうもうまくいない感じですね。
様子見です。

# 恥ずかしいので、何事も無かったかのように
# 外してしまってるかもです^^;)

643 :名無しさん@勉強中 ★:06/06/13 19:48:19 ID:???
とりあえず丸一日置いてみたですが

昨晩のワールドカップの日豪戦の余波なのか
何だかすごいdat数なんですが。

http://www.geocities.jp/mirrorhenkan/others/img/buttobi20060613.png

3881個で49.40メガだそうで。

subject.txtも追記するようにすれば面白いんですけど
同じスレのダブりとかを排除するのにどうしたらいいのかとか
考え中ではあります。

前後しましたがdatはこちら↓
いちおう一覧表示出来るようにしてはありますが
なかなか表示できません。

http://mirrorhenkan.run.buttobi.net/news4vip/dat/

ここ 前触れもなく消えそうで怖いです。
どなたか 容量無制限でいきなり消失しないような無料サーバ
御存知ありませんか?
ftpさえ使えれば、Perlやphpが使えなくても全然問題ないです。

644 :名無しさん@勉強中 ★:06/06/13 20:28:24 ID:???
うーん

例えば
http://ex15.2ch.net/test/read.cgi/news4vip/1150194792/
とか拾ってないですね。
http://mirrorhenkan.run.buttobi.net/news4vip/dat/1150194792.dat
は404ですし。
みみずんさんの所も43ログだけみたいだし
自動取得の限界かな

自分のスクリプトは
誰かのアクセスがあったらsubject.txtを読み込んで
読み込んだらロック(他のアクセスがあっても反応しないようにする)
で、順番にひとつづつログを見ていって
ヘッダが302でなければ保存
このループを繰り返して 終端まで行ったら終了という奴なんですが

スレッドは全部で約1000スレあるので
仮に10スレ/分の速度で保存しても、100分かかる計算です。
その間に1001行ったスレがあっても 1時間40分も残ってないでしょうし
うむ、makimo.toさんは偉大だ。

900以上とか 1001まで行ったスレとかだけ保存して
他のものはスルーするようなスクリプトとかも出来るですが
二つ一緒には動かせないだろうしなー。


みみずんさんとmakimo.toさん 保存方針が異なっておられますが
それぞれ相互に補完出来て、覗かせて頂いている側としては
有り難いな、とひたすら思ってみたり。

645 :名無しさん@勉強中 ★:06/06/14 20:18:44 ID:???
news4vip板はだいたい2000スレ/日みたいですね。
今のところdat数は6000くらいですし。

というか
ftpではもう見れないです。
反応がめちゃ遅いですし
見た後で再起動しなければいかんのです

あとhttp://mirrorhenkan.run.buttobi.net/news4vip/dat/
ですが、最新保存10スレだけ表示させるようにしたです。
いちおう全表示は
http://mirrorhenkan.run.buttobi.net/news4vip/dat/indexall.php
ですが、たぶん誰も見る事は出来ないのではなかろうかと。


646 :名無しさん@勉強中 ★:06/06/14 20:28:43 ID:???

レスが800超とか900超とかのdatだけ取得して
他はスルーするスクリプトも出来ましたが
subject.txtの再構成で躓いています。
さてどうすればいいのだろうか。
こっちはsubject.txtでタイトルとか見れるほうが良いですし。

あとサーバも何か難民状態だなー。
何方か使わせて欲しいなとか書いてみるテスト

647 :名無しさん@勉強中:06/06/14 23:18:54 ID:Z30LBP/v
雪だるま作戦のスレを待ち続けるスレ Part11
http://aa5.2ch.net/test/read.cgi/nanmin/1149356198/804-806,858

804 名前: ◆MUMUMUhnYI [sage] 投稿日:2006/06/11(日) 02:12:37 ?#
今 news4vip って、1日に何本ぐらいスレ立ってるのかしら。

805 名前:名無し草[sage] 投稿日:2006/06/11(日) 02:16:43
http://sabo2.kakiko.com/bbspost/autoimg.cgi?bbs=news4vip&type=th

806 名前: ◆MUMUMUhnYI [sage] 投稿日:2006/06/11(日) 02:28:42 ?#
>>805
6000〜7000 本/day ってとこですか。

これは多いのか、少ないのか。
なんか感覚が麻痺しているかも。

858 名前: ◆MUMUMUhnYI [sage] 投稿日:2006/06/11(日) 22:05:14 ?#
>>857
ふむ。

36G だと、news4vip をやった場合、半年ぐらいしかもたないですね。
HDD がおなかいっぱいになってしまうです。

(今落ちているけど)tiger507 でつないでおいて、
大きな HDD をつけたいところです。

648 :名無しさん@勉強中 ★:06/06/15 20:24:39 ID:???
>>647
どうもです。
そんなにあるんですか。

6000個のdatが全部1キロバイトだとしても
6000キロバイト=6メガ増えるという事ですか。
(実際は1メガ=1024キロバイトでしょうけどそれはそれとして)
やはり1日で40〜50メガづつ増えてるんですね。

さて
phpのflockがうまくいかない・・・。
これを解決しないとsubject.txtが壊れてしまうので
もう少し考えてみますか。

http://www.sound-uz.jp/php/bbs/index.php?mode=klog&num=22
http://pukiwiki.sourceforge.jp/dev/?BugTrack2%2F98
http://jn.swee.to/cano/lock/index.shtml
http://www.sound-uz.jp/php/bbs/index.php?mode=klog&num=45

649 :名無しさん@勉強中 ★:06/06/16 22:57:42 ID:???
>>646
> レスが800超とか900超とかのdatだけ取得して
> 他はスルーするスクリプトも出来ましたが

これ昨晩xreaに置いてみたんですが
何か167datで30メガ強になってたですよ
50メガしか使えないもんでとてもとても。

という訳で
別のところに置いてみました。

http://www.tok2.com/home/mirror/news4vip/dat/?M=D

xreaさんの所みたいに全部クロール出来ないみたいで
どうも途中でタイムアウトしてるみたい。
だもんで多分 抜けが多いかもです。
それでも140datくらいになってますか。
まあ消えたらそれまでという事で。

安定してたら
ここも変換スクリプトにつけてみますか。

650 :名無しさん@勉強中 ★:06/06/16 22:59:34 ID:???
あ、短縮URLで書いたつもりだったんですが
アドレス欄からコピペしたもんで長いままでした

http://1.tok2.com/mirror/news4vip/dat/


651 :名無しさん@勉強中:06/06/17 08:51:16 ID:aRbjrN5r
クロール専用裏口 http://liveb1.2ch.net/

652 :名無しさん@勉強中 ★:06/06/17 18:55:18 ID:???
>>650を見てみたら264datの52メガだそうで。
何か凄いなー。


>>651
うわー、そんなのがあるんですか。連絡ありがとうございます。
用途がよくわかんないんですが、そこを高速クロールしても
問題無いという事でしょうか。(←違うと思いますよ)

ただ、タイムスタンプを見ると今朝の0時過ぎなので
流れが速い板だと どうなんだろう。。

653 :名無しさん@勉強中 ★:06/06/17 19:26:27 ID:???
ところで、検索してたらこんな所が。

VIP サービス 〜VIPPERの提供するVIPなサービス〜 
http://vip2ch.com/

凄いです。
datアップローダはあるわ、日付→キー変換はあるわ
個人フォルダの保管庫はあるわ(自宅サーバの強みですね)
何だか、同じにおいを感じます。
相違点は、掲示板が大変賑わっている事と
彼我の技術格差でしょうか。何とも凄い。
googleのキャッシュを見ると15万アクセス/日だそうで
すごいなー。

ここなら
見つからないdat落ちスレとかもあるかもです。

654 :名無しさん@勉強中:06/06/17 22:17:09 ID:DbhAjRvu
>>652
> 用途がよくわかんないんですが、そこを高速クロールしても
> 問題無いという事でしょうか。(←違うと思いますよ)
クロール専用ですからお腹いっぱいクロールしても無問題ですよ

> ただ、タイムスタンプを見ると今朝の0時過ぎなので
ヒント: 西海岸時刻

655 :名無しさん@勉強中 ★:06/06/18 14:16:56 ID:???
>>646
本当なの!?と阪神ファンキーだったのですが
試しに検索してみたら、ほんとだったんですね。

http://user.ftth100.net/mirrorhenkan/operate/read.php/1135003617/434-450n
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
434 :動け動けウゴウゴ2ちゃんねる:2005/12/26(月) 11:42:54 ID:Olz5KwAX0 ?
あの、質問なんですが、

http://liveb1.2ch.net/

これはどういう仕組みなんですか?

436 : ◆MUMUMUhnYI :2005/12/26(月) 11:55:33 ID:CZ8UFMdj0
>>434
datとsubject.txtを、ゆっくり同期しているですね。
ここは今実験的にバーボンなしなので、まとめてクロールしたい各位はこちらからと。

437 :動け動けウゴウゴ2ちゃんねる:2005/12/26(月) 11:58:43 ID:Olz5KwAX0 ?
>>436
どうもご丁寧にありがとうございます。
ん、やっぱりクロールするならliveb1のほうがいいのか。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−

サーバ一覧にも書かれてますし。
http://mumumu.mu/serverlist.html
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
liveb1.2ch.net
datコピー・クローリング用サーバ
−−−−−−−−−−−−−−−−−−−−−−−−−−−−


こういうものまで用意してるとは思わなかったです・・・。

これって運営者の側からみたらどんな感じなんでしょうか。
例えるなら
エイズ拡大を防ぐ為にコンドームを配布する学校や慈善団体や
教会・政府みたいなものなのかな(って変な例えですが)


656 :名無しさん@勉強中 ★:06/06/18 15:06:40 ID:???
激しくレス番号を間違えていたようです

×>>646
>>654

> 西海岸
なるほどです。グローバルだなー。


ついでといっては何ですが
>>647の「雪だるま作戦」って
具体的にいうとどういう事なんでしょか?

検索すると
http://sunos.saita.ma/2ch-cgi-lw.html
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
従来,2ch では個別のサーバ単位で処理を完結させて いましたが,
複数のサーバで処理を分散化して処理能力を高めるための
仕組み作りが「 雪だるま作戦」として進められ,それがついに
稼働し始めました
−−−−−−−−−−−−−−−−−−−−−−−−−−−−

個別にやってた事を統一化させるという事なのかな

例えるなら
明治維新によって、各藩毎に統治していたものを
中央集権化させるようなものなのかな(って変な例えですが)
最近だと
旧ソ連の崩壊や旧ユーゴの合併とか(って変な例え・・もういいか)

657 :名無しさん@勉強中 ★:06/06/18 18:05:40 ID:???
さて
>>605で出した
http://p2p.jisaku.org/
の方なんですが

「( ^ω^)ブーン系小説スレ勝手にピックアップ」
http://p2p.neontetra.net/boon/

を、なでしこからphp版に変更させたそうです。
で、ソースを出されておられました。

http://d.hatena.ne.jp/kyuuzyuu9yen/20060610

4時間で作られたんですか・・・。
それは別にいいんですけど

http://d.hatena.ne.jp/kyuuzyuu9yen/20060616
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
■[PC]アプリケーションも今すぐWindows9xを切り捨てるべきか?
知らんがなは2000とXP以外サポートしてませんが何か?

つかいまどき98系使ってる人ってどんな理由があるのか気になる。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−


> いまどき98系使ってる人ってどんな理由があるのか気になる

・・・orz

658 :名無しさん@勉強中 ★:06/06/18 18:26:54 ID:???
まあフォローのつもりなのかなと思いますが

http://d.hatena.ne.jp/kyuuzyuu9yen/20060617
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
■[ぼやき]
某Y氏に「99円は言葉が足りなくて誤解を生む」とか言われたけど、そうか?
俺は某Y氏と違ってそんなに完璧主義者でもないからワカンネ。
ケースバイケースでわかるだろとかそういうのはなしですかそうですか。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−

「某Y氏」というのは
よく話題にされるゆりかもめさんの事かなと。
http://blog.goo.ne.jp/yurikamome_1991/


若いっていいな、と素朴に思いました。
別に非難でも何でもないですし
ここを見る事もそうないと思いますので、別にいいです。

ただ、こういうスレもあるんだよとハイ

http://user.ftth100.net/mirrorhenkan/test5/summary.php?search=windows98

659 :名無しさん@勉強中 ★:06/06/18 18:41:33 ID:???
これだけでは何なので

以前http://pc8.2ch.net/test/read.cgi/hp/1112367773/105-115n
のやりとりの後、下のページを作ったのですが

http://www.geocities.jp/mirrorhenkan/subject.html

もう少し突っ込んでみようかと。


で、拵えたのがこちら(置いてるサーバがちょっと広告多いですが)

http://www.tok2.com/home/mirror/news4vip/threadsearch.php

これで、ブーンスレだけではなく他のスレも検索出来るかなと。
ブーンスレだと下のものになりますです

http://www.tok2.com/home/mirror/news4vip/threadsearch.php?server=ex15.2ch.net&board=news4vip&keyword1=%83u%81%5B%83%93%7C%CC%DE%B0%DD%7CBOON%7Cboon&keyword2=%5B%82%E6%82%A4%7C%97l%5D%82%C5%82%B7&keyword3=

作ってから気付いたのですが、正規表現が少し違ってました。
これ99円さんのを参考にさせてもらったのですが

> [よう|様]です

これ
「ようです」」or「様です」
だけヒットさせたいんだろなと思うんですが
「よです」や「そうです」や「あうです」「買うです」
にもヒットしちゃうです。

上の二つだけヒットさせたいなら

> よ?[う|様]です

とすればいいのかなと。



これにクロールスクリプトもつければ
ブーンスレ自動追尾取得とかも可能な感じですね。

660 :名無しさん@勉強中 ★:06/06/18 18:56:49 ID:???
よく考えたらこの正規表現でも駄目だ・・・。
どうすりゃいいんだか。

・・・って

> [ようです|様です]

これで良いのか。(いや確信が持てないですけど)
または「〜そうです」も入れたいなら

> [そうです|ようです|様です]

でしょうか。


661 :名無しさん@勉強中 ★:06/06/18 19:01:27 ID:???
・・あー馬鹿でした

http://www.tok2.com/home/mirror/news4vip/threadsearch.php

に入れるなら[]は要らなかった
というか、上二つとも間違いです
んもーバカバカ

> そうです|ようです|様です


アホだという事を露呈してしまいました

662 :名無しさん@勉強中 ★:06/06/19 20:23:52 ID:???
メモ

このブーン検索で

賓乳パイパン処女ですが (26)
http://ex15.2ch.net/test/read.cgi/news4vip/1150710756/l50

・・・ってのが
何度やっても引っかかるんですが
なんでなんですか?
正規表現の達人の方、お導きを。


以上覚え書き(アホと思われてるかも)

663 :名無しさん@勉強中 ★:06/06/20 20:41:45 ID:???
上の件
「です」でヒットしたって事かな。
それしか考えられないです
あとは細かい文字コードレベルで偶然に正規表現が合致したとか。

再現環境を拵えるのも何だか億劫ですし
まあいいか(よくない)


664 :名無しさん@勉強中 ★:06/06/20 20:54:56 ID:???
とりあえずdatフォルダ内のファイルを全部ひろって
subject.txtに構成するスクリプトを作ってみました

http://www.tok2.com/home/mirror/news4vip/readdir.php

アクセスすれば再構成されると思うです。

最初、鏡の国スクリプト(http://script.s15.xrea.com/
を参考にしてやってみようと思ったのですが
何が何だかわかんなくて挫折しました
(subject再構成出来るんでしたっけか)

Perlはあんまり慣れてないので、0chスクリプトや
shutdown.jpさんの「subject2dat」(*1)
もよくわからず途方に暮れましたが
phpのマニュアルの「readdir命令」の例文をもとに試行錯誤したら
何とかなったかも。

http://shutdown.jp/index.php?cmd=read&page=script%2F2ch#content_1_2


665 :名無しさん@勉強中 ★:06/06/20 21:09:14 ID:???
これの課題として
あと 更新時間順にソート保存出来ればいいかなと。

とりあえずこれで専用ブラウザから読みこめると思うです。
ただ、使わせて頂いているサーバの規約により
スレッドフロート掲示板の設置は禁止との事なので
それっぽいものを置くのはやめとこうかなと。
「耳鼻科の看護婦に萌え萌え」といいますし。
(↑原型をとどめてませんが)

ただ これだけでは物足りないので、
外部から読み込み表示させるようにしてみました。

http://mirror.s151.xrea.com/news4vipover800/

表示部分とか全然手を入れてないですが、まあぼちぼちと。
レス800以上のスレッドをクロール取得してるだけなんですが
読む時間とか 取れるかなー。
あとsubject.txtの更新とか どういうタイミングでやればいいんだか。


666 :名無しさん@勉強中 ★:06/06/20 23:15:33 ID:???
どうやら「です」だけで反応するみたい
これ↓ヒットしてるし

お疲れ様です、一息入れませんか?【Night Rest】 (14)
http://ex15.2ch.net/test/read.cgi/news4vip/1150810796/l50




というか

http://ex13.2ch.net/test/read.cgi/gline/1118753283/808
失礼しました
ただ一つだけ

せめてコンパイルしたものも上げて頂いたほうが
いろいろフリーのコンパイラもあるみたいですし
あと自分みたいに容量や環境その他で
そういうのを入れられない者も居る訳ですし
後略

以後も後略という事で何とぞ

667 :名無しさん@勉強中 ★:06/06/21 09:31:05 ID:???
ちょっと浮かんだのでメモなんですが

・そうです
・ようです
・様です
の3つにマッチさせる正規表現なんですが
たぶん>>661で良いと思うんですが

> (?:よう|そう|様)です

これでもいいのではないかと。

668 :名無しさん@勉強中 ★:06/06/21 09:34:42 ID:???
http://compact.s56.xrea.com/

669 :名無しさん@勉強中 ★:06/06/21 22:33:05 ID:???
subject.txt生成スクリプトですが
datのキーでソートするようにしたです。

で、んもう疲れちゃったんで
news4vipの800超スレ自動保管の試みという事で
リネームして設置してリンクつけたです

http://mirror.s151.xrea.com/news4vip/

datのアップロードも出来ますし
まあこんなもんかなと。
広告バナーは別に気にならないのですが
ポップアップが出るのは何とかなんないもんかなあ。

自動クロール生成したスレをちょっと読んでみたんですが
人が多いと 何とも不思議なもんですね。
呑みこまれそうだ。

もう200メガを超えてますし
何だか消滅しそうで怖いです。
ちなみにhttp://user.fttp100.net/のほうなんですが
1ギガとか とっくに超えているのだろうなあ
もう怖いよ怖いよ


それにしても
http://ex15.2ch.net/news4vip/
ここの注意文とか 何度読んでも やな気分になるんですが
私だけでしょうか。
(↑こんな事書いたらまずいかもかと思いつつ)

670 :名無しさん@勉強中 ★:06/06/22 19:29:49 ID:???
とりあえずIE限定ですが(たぶん)
ポップアップが出ないようにしました。
別に悪いタグを使った訳ではないです。

それと、subject.txtのタイムスタンプを見て
スレッドメニューの最終更新時間を表示するようにしたです
リモートファイルのタイムスタンプを見るのは面倒なようで
ftp接続してftp_mdtm関数を使うくらいしかないみたい

http://always-pg.com/php/std_rd/ftp/ftp_connect.html
http://php.plus-server.net/function.ftp-mdtm.html

これの関連で>>638の件も何とかなりました。

あと、調べていて判ったのですが
fopenでftpサーバを開いて保存する場合って
一回限りで 上書きとか出来ないんですね。

http://php.s3.to/man/features.remote-files.html
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
注意: 上の例からリモートログに書きこむためにこの手法を
使用することを考えるかも しれません。 しかし残念ながら、
リモート上のファイルが既に存在する状態では fopen()を
コールすることができないため、 それはできません。 分散
ロギングのようなことを行うには、 syslog() の使用を考え
てみてください。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−

困った。

671 :名無しさん@勉強中 ★:06/06/22 20:04:16 ID:???
あと矛盾してると思われるだろなとは思うけど
上のとは別件で

今のところ、ログは全て上書き保存してるのですが
ヘッダのステータス状況を見て
サイズを見て
増えてるようなら差分取得とかするほうが効率的なのかな
もちろんサーバに優しいだろうし。

とかいって見てみたら
こことか凄い参考になるじゃないですか!
(とても有名な所だけど)

http://age.s22.xrea.com/talk2ch/
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
要求ヘッダに次の項目を追加する

If-Modified-Since: リモートDATの最終更新時刻(値は応答
ヘッダのLast-Modifiedを調べる)
Range: bytes=ローカルDATのファイルサイズ-

DATが更新されていれば206 HTTP_PARTIAL_CONTENTが返って
きて、差分データを取得できる。
更新(新着)なしならば304 HTTP_NOT_MODIFIEDが返ってくる

あぼーんがあった場合、ファイルサイズ不一致により、データ
が取得できません。(ローカルDAT>リモートDAT)
返ってくるステータスは416 HTTP_RANGE_NOT_SATISFIABLEに
なります。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−

>>614>>637でやった事とか
そのまま流用出来そうです。

別に大それた事をするつもりもないですが
こういうのって 面白いですね。

672 :名無しさん@勉強中 ★:06/06/22 20:13:59 ID:???
追記

−−−−−−−−−−−−−−−−−−−−−−−−−−−−
巡回
HEADメソッドとIf-Modified-Sinceヘッダを利用して、DATが
更新されているかどうかだけを調べるのがベストだと思います
が、どうなんでしょう。
えいやーとGETメソッドを投げまくると、夜勤さんが卒倒しそう
だし、ここは控えめに行きましょう。
ちなみにHEADを投げると、更新されていれば200 HTTP_OK、更新
されていなければ304 HTTP_NOT_MODIFIEDが返ってきます。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−

すごーい。

673 :名無しさん@勉強中 ★:06/06/23 19:36:14 ID:???
dinoswiftさんの所
一時的に復活したみたいです。

http://wannabe.fam.cx
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
6/22
   一時的に復活させました
ラウンジスレ保管庫が使いたいというひとがいたため
一時的にサーバを復活させました。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−


検索したらこのスレ↓なのかな

http://etc3.2ch.net/test/read.cgi/entrance/1150764478/694-711n
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
694 :ラフ ◆N7U4M80v5I :2006/06/22(木) 16:54:39 ID:6UBqq/0g
そういえば、DinoSwift ◆m7TsEz1c5.に聞きたかったんだけど、前にやってたスレ保管庫復活しないのかな?
あれ凄く便利だったんだよな。

見てねえかな、ディノ。

704 :DinoSwift ◆m7TsEz1c5. :2006/06/22(木) 17:56:29 ID:???
(へ´ω`) >>694
      いや、見てるけどさ
      サーバが物理的に壊れたっぽいんだよ。
      それにHDDとか物凄く圧迫してた割にはさほど利用者いなかったし。

706 :ラフ ◆N7U4M80v5I :2006/06/22(木) 18:02:51 ID:Ok24F0c2
>>704
利用者いなかったんだ?
暇と金銭的余裕が出来たら復活して欲しいな、是非。

にくちゃんねるは1000行ったのしか拾えないからな。
その辺が不便だ。
VIPなんかどうでもいいからラウンジのは欲しいよな。
一日一回の取得で充分だろうし。
なんたってラウンジのスレタテの量はたかが知れてるし。

708 :DinoSwift ◆m7TsEz1c5. :2006/06/22(木) 18:05:27 ID:???
(へ´ω`) そうか。
     そこまで言うのならラウンジのだけ今から立てるわ。
     今のパソコンも吹っ飛んだら凹むなぁ・・・。

709 :ラフ ◆N7U4M80v5I :2006/06/22(木) 18:08:51 ID:Ok24F0c2
>>708
うれしいな。
ディノ大好き!

アドレスお気に入りから削除しちゃったんで、新たに貼って頂戴。
何ならスレ立てて宣伝したら?

711 :ラフ ◆N7U4M80v5I :2006/06/22(木) 18:20:00 ID:Ok24F0c2

ディノがスレ保管サイトを立ち上げてくれるってのはラウンジにとってスゴイ有用なことなんだぜ。
滅多に見かけない人なんだから居る時にメッセージ交わしてもよかろうよ。
アンタは論議できるのかい?
チャモロじゃないんだろ?
単なる俺の粘着君じゃないの?
−−−−−−−−−−−−−−−−−−−−−−−−−−−−

674 :名無しさん@勉強中 ★:06/06/23 19:47:57 ID:???
お元気そうで何よりです

news4vip保管庫や
色々な技術資料とかも再掲して欲しいなと思うのですが
私 そんな要望出せる程の者ではないからなぁ・・・。
謙遜とかではなく。

あと mixiで活躍されておられるとは知りませんでした。
結構mixiのほうでやっておられる方が多いみたいで
こういう時 招待してくれた方にすごく感謝しているです。
最初にremix2chの事を知ったのもmixiでしたし。
作者さんがphp系のコミュニティで立てたトピックが最初でしたか。

ただ自分 日記とか身辺雑記とか書けないもんで
放置状態に見えるかも 。。


ちなみに
最初にmixiの事を知ったのはこの記事(4/15)が最初でした
http://blackash.net/Body/BlackAshNews200504_1.html

で、飛んでみるとこんな所とか。
http://d.hatena.ne.jp/mixi_love/
http://b-station.sytes.net/ban/buffer/link.html

一年前の記事なんですが、今はどうなのでしょうか。


ちなみに
技術系の興味深い話題を書かれる方が居られるのですが
ある日を境に非公開になっちゃって
紹介文に曰く
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
マイミクはオフで会ったことがある、あるいは会う可能性の
ある方に限定させていただいてます。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−

しょうがないです
泣きました

675 :名無しさん@勉強中 ★:06/06/23 20:56:13 ID:???
さて
remix2chですが

http://smartworks.jp/suren/dasa/bbs/test/read.cgi?bbs=1&key=1148876173&st=26&to=26&nofirst=true
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
26 名前:MIZ@製作者 投稿日:2006/06/20(火) 12:55 ID:R7J2TqJA
[機能追加]
容量的な問題は発生しないようなので、datのキャッシュを取ることにしました。
これにより、(一度remix2chで閲覧したスレッドの場合に限り)
本家2ch側でdat落ちしてもremix2chでの閲覧は可能です。

ただし、datの保存が主目的ではないので、HDDの空き容量次第で
以前のdatを一気に削除することもありえます。
本気で取っておきたいスレッドは手動でまとめHTMLを作成してください。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−

ほんとみたいで、dat落ちしても見る事が出来るスレが
結構あります。

http://contents-factory.net/remix2ch/read.php?url=http://ex15.2ch.net/test/read.cgi/news4vip/1151022051/
http://contents-factory.net/remix2ch/read.php?url=http://ex15.2ch.net/test/read.cgi/news4vip/1151038150/

で、今のところdatの場所をMIZさん出しておられないので
dat化はhtmltodatでしょうか。

デフォルトは階層表示みたいで、これはやっかいだぞ。
右上の
・「その他の設定」

・「ツリー表示をしない(返信として表示せず、ごく普通の
  2chスレッドとして並べます。) 」
にチェックを入れれば、順番通りにはなりますが
これ クッキーで表示変更してるんだろうなー。

htmltodatがクッキー受け付け出来るようになれば
出来るようになるのでしょうが、
今のところは

・IE等のブラウザからソース取得

・htmltodatにソースのコピー貼りつけ

しかないのかな。



676 :名無しさん@勉強中 ★:06/06/24 19:03:15 ID:???
>>671の件ですが

サーバ側のdatを取得保存する際に
タイムスタンプをその取得時点のものに変更しているので↓
さてどうすべかと。

http://www.tok2.com/home/mirror/news4vip/dat/?M=D

# それにしても上の倉庫
# 時々刻々と時間が変化してるのを見ると
# 何とも空恐ろしくなります(今見たら1547dat・292メガだって)
# そろそろ消える覚悟を決めておこうかな

これではタイムスタンプによる比較が出来ないぞ と
検索してみたら
タイムスタンプを変更する命令もあるんですね

http://php.s3.to/man/function.touch.html

がんばれば何とかなるかも(と書いただけになるかも)

677 :名無しさん@勉強中 ★:06/06/27 19:50:45 ID:???
テスト倉庫が消えましたが
想定の範囲内という事にしておこう

とりあえず
スクロールの位置を変えてみました
あんまり見ないもんで面白いかなと。

あと、横文字に強い人用に
横文字版もつけました。

http://www.geocities.jp/mirrorhenkan/index-yoko.html


意味?
考えるんじゃない、感じるんだ。

678 :663 ◆fnwcOWFi56 @名無しさん@勉強中 ★:06/06/28 18:15:45 ID:???
さて
http://ex13.2ch.net/test/read.cgi/gline/1118753283/825n
をうけて
http://mahonet.info/sv/
に登録を申し込んでみました。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
はじめまして。
2chのdat落ちしたスレッドを探すサイトを運営している者です。

作成したいものですが、news4vip板(http://ex15.2ch.net/news4vip/)のsubject.txtを一定時間毎に取得するサイトです。
こちらを使わせて頂きたい理由ですが、cronジョブが利用可能との事なので、一定時間毎に取得できるかも(1時間おきとか2時間おきとか)と思いましたので。
なお、取得するsubject.txtはそれほど大きなファイルではないので そう負荷はかからないのではないかと考えております。
(http://ex15.2ch.net/news4vip/subject.txt)

宜しかったら、お願い致します。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−

御返事を頂けるかどうかわかりませんが、正直どうなんでしょうか。
落ちたら落ちたで仕方ない事ですが。
駄目な場合は御返事も何もないそうですし。


ちなみにこちらのサーバなんですが、レンタルサーバ板にスレッドが立っており
管理人さんが登場されています。

http://pc8.2ch.net/test/read.cgi/hosting/1149086027/l50

vipperさんみたいなので
「2ch」という言葉で却下という事もないかなと。

あまり多くを期待せずに期待してみますです

679 :名無しさん@勉強中:06/06/30 06:01:47 ID:ieGRwuqv
>>656
http://info.2ch.net/wiki/pukiwiki.php?%C0%E3%A4%C0%A4%EB%A4%DE%BA%EE%C0%EF

680 :663 ◆fnwcOWFi56 @名無しさん@勉強中 ★:06/06/30 17:12:53 ID:???
>>679
どもです
読んでみると
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
実況板を全て同じサーバーに入れよう と言う作戦
(実際には複数のサーバに入れてそれを統合させて負荷を分散する)
−−−−−−−−−−−−−−−−−−−−−−−−−−−−

私には無縁みたい
反射神経よくないもんで実況とか速すぎるし。

681 :663 ◆fnwcOWFi56 @名無しさん@勉強中 ★:06/06/30 17:24:52 ID:???
さて
携帯用スクリプトのアクセスとか見てみたら
きのう一日だけで1300アクセスだって
うわー

内訳を見ると
http://www.geocities.jp/mirrorhenkan/others/img/keitai20060630.png
ほとんど携帯からのアクセスみたいなんで
まともな(?)使われ方をされているんで
とりあえずまあいいやと。
それにしても 携帯ユーザーって多いんだなー。

なんかやってて思うんですが
携帯のネット環境もないのに 携帯用スクリプトを作るってのは
何とも不思議な感じですね。

かちゅ〜しゃも入れてないのに
かちゅ〜しゃdatの変換スクリプトを考えてた頃の事を
思い出したりして。

682 :663 ◆fnwcOWFi56 @名無しさん@勉強中 ★:06/06/30 18:14:22 ID:???
>>678の件
反応が無いままでもまあ仕方無いかなと。

ただ 登録した晩に
http://mahonet.info/sv/panel/admin/regist.php?select=10
からアクセスがあったので
届いてはいるみたい

管理人さんのサイトとか見ると
http://mahonet.info/~syokora/
うん、vipperさんだ。

683 :663 ◆fnwcOWFi56 @名無しさん@勉強中 ★:06/07/02 14:00:13 ID:???
昨晩メールが届いてました。
cronジョブはカンパされた方々への付加オプションなので
他の方との平等を期する為その点は留意頂きたい との事で
納得です。

「なお、審査内容自体は問題御座いません」との事なので
返信させて頂きました。

−−−−−−−−−−−−−−−−−−−−−−−−−−−−
麻帆良ネットワーク様

御返事有り難うございました。

早速ですが、当方の読解力不足による
cronジョブオプションの件、大変失礼致しました。
仰る通り、最初から出来るものだと思っておりました。

その件を理解させて頂いた上で
使わせて頂く事は出来ないものでしょうか?


その際、此方で考えている方法ですが
pseudocronを用いて一定時間毎に作動させるような事とか
出来るかな、と思っております。
http://www.akenotori.jp/soft/188.html

# 余談ですが、こういう事をやってみようと思った理由ですが
# http://ex13.2ch.net/test/read.cgi/gline/1118753283/825n
# という事があったからです

また、Imagemagickを導入なされたとの由、
AAS(http://example.ddo.jp/)のような事が出来ないかな、
とも思っております。

宜しければ、お願い致します。
末筆になりましたが、乱筆乱文失礼致しました。

                           663
−−−−−−−−−−−−−−−−−−−−−−−−−−−−


何だかごめんなさいです

684 :663 ◆fnwcOWFi56 @名無しさん@勉強中 ★:06/07/02 16:49:12 ID:???
携帯版ですが
昨日とかも何か2000アクセスとかあるみたいなので
管理画面から負荷率を見てみたら
「0ポイント」との事なので、安心しました。

というか
本当に負荷とか かかってないんですかね。
別にあやしい事をやってる訳じゃないんですけど
本当に0ポイントなのかな。


ついでに書くと
http://www.geocities.jp/mirrorhenkan/
にあるgeocitiesのカウンタなんですが
実際のアクセス数と比べて ひどく違っているみたいで
だからどうしたといわれても
どうもしないよ と答えるしかない訳で


685 :名無しさん@勉強中 ★:06/07/02 23:23:36 ID:???
・・今>>683の返信文を読んだら

−−−−−−−−−−−−−−−−−−−−−−−−−
その件を理解させて頂いた上で
使わせて頂く事は出来ないものでしょうか?
−−−−−−−−−−−−−−−−−−−−−−−−−

この「使わせて頂く」というのは
「サーバーを」使わせて頂きたい旨書いたつもりだったんですが
「cronジョブを」使わせて欲しい というようにもとれるような
何とも誤解されそうな書き方だったなぁ・・。

冷や汗。

686 :名無しさん@勉強中 ★:06/07/02 23:35:12 ID:???
とはいえ今
別所哲也なもので
御連絡は明日という事で


しかし冷や汗

687 :663 ◆fnwcOWFi56 @名無しさん@勉強中 ★:06/07/03 19:34:47 ID:???
という訳で
今朝連絡させて頂いたです

・・・ついさっきアカウントを発行させて頂いたのです
ありがとうございます。

http://mahonet.info/~mirror/


さーて
プログラミング(←おっかっこいい!!)でもやってみますか。


・・・ごめん今日疲れちゃった
 明日にでも。。

688 :663 ◆fnwcOWFi56 @名無しさん@勉強中 ★:06/07/04 19:46:39 ID:???
さて>>683にて
AAS(http://example.ddo.jp/)の事を書きましたが

「まーたハッタリかましてるよコイツ」とか思われても何なので
偽AASをつくってみたです

http://aas.k2.xrea.com/

でもって
携帯用のdat2htmlとか偽モナメント5とかに導入してみたりして。

まあわざわざ出す事もないけど
例えば
http://user.ftth100.net/mirrorhenkan/2chscript/ri.php?key=1116860602&st=955&to=957&nofirst=true

それぞれの[AAS]という所を押すとjpg画像になります
まあ最初にしてはうまくいったかなと。

それにしてもAAS開発スレを読んでたら
実にまあ錚々たる方々がどっさり出てきて
みんなAASの作者さんの事を称賛しておられて
何というか
自分の境遇を考えてしまったですよ
孤立無援というか何というか
いやこんな事を書いたら
自分を応援してくれている方々に
そりゃもう何とも失礼なんですが

http://user.ftth100.net/mirrorhenkan/2chscript/read-light.php/1109904456/
http://user.ftth100.net/mirrorhenkan/2chscript/read-light.php/1116860602/



閑話休題
use SOKCETの使い方がよくわかんないんで
わかるようになったらもう少し偽AASの手直しとか出来るかもですね。


689 :663 ◆fnwcOWFi56 @名無しさん@勉強中 ★:06/07/05 00:07:49 ID:???


http://mahonet.info/~mirror/
−−−−−−−−−−−−−−−−−−−−−−−−−−−
403 Forbidden

Forbidden
You don't have permission to access /~mirror/ on this server.

Additionally, a 403 Forbidden error was encountered while trying to use an ErrorDocument to handle the request
−−−−−−−−−−−−−−−−−−−−−−−−−−−


・・・ディスクエラーだろうか。トップにもそうあったし。
ftpも繋がらないや


でも
下記ページにあるアカウントを幾つか行ってみたらみんな生きてるし
http://mahonet.info/sv/index.php?page=account&ACC_page=1

メール連絡とかすべきなのかもですが、もしかしたら駄目かもですね。
スクリプトのテスト段階だったんですが。

こちら↓のアカウント凍結or削除のリストに
そのうち載るかもしれないですね

http://mahonet.info/sv/index.php?page=account&ACC_page=2

690 :663 ◆fnwcOWFi56 @名無しさん@勉強中 ★:06/07/05 18:30:50 ID:???
何というか
求めよさらば与えられんとはいうものの
わかんないこととか聞いても無反応なので
自分で試行錯誤するしかない訳ですが
まあ世の中そんなもんなんでしょう


さて

暇なんで姉貴に何かするけど? まとめ
http://www.geocities.jp/tekoky_land/
携帯バージョン
http://www.geocities.jp/tekoky_land/m_index.html

これの携帯バージョンの下のほうにある過去ログで
携帯版dat2htmlが使われておったです

http://mirror.k2.xrea.com/dat2html/read1.php?url=http://www.geocities.jp/tekoky_land/dat/01.dat

で、参照先のdatを見てみると
http://www.geocities.jp/tekoky_land/dat/01.dat

news4vipの長いデフォルト名無しを全部手動で消しておられるみたい
確かに携帯版で出てきても無駄だしなー。

でも各板でデフォルト名無しが違うもんで
dat2htmlでそれを自動削除するのは出来ないなーと。
もろもろの2chタイプの掲示板スクリプトの携帯バージョンは
たぶんsetting.txtとかからデフォルト名無しを出してるんでしょうけど。

691 :663 ◆fnwcOWFi56 @名無しさん@勉強中 ★:06/07/05 18:41:58 ID:???
そこの掲示板に行ってみると
こんなやりとりが

http://yy11.kakiko.com/test/read.cgi/news4vip/1151939758/18n-
−−−−−−−−−−−−−−−−−−−−−−−−−−−
18 :以下、名無しにかわりましてVIPがお送りします :06/07/04 00:53:35 ID:Vg4VO1L4
携帯(FOMA)だと、まとめにいけないんだが
orz

19 :まとめ人:06/07/04 01:02:11 ID:e76JejVT
>>18
申し訳ないが携帯用に作ってないんだ(´・ω・`)

21 :以下、名無しにかわりましてVIPがお送りします :06/07/04 01:16:56 ID:Vg4VO1L4
まとめの人dクス
なるべくなら携帯にも愛の手を

23 :以下、名無しにかわりましてVIPがお送りします :06/07/04 01:49:57 ID:e76JejVT
>>21
前向きに検討するお
明日以降になると思うがorz

25 :まとめ人:06/07/04 14:58:54 ID:e76JejVT
携帯でも見れるようになったかも。
AUでしか確認できないんで、DoCoMo、Vodafone怪しいです。
確認ヨロ

26 :DoCoMo人:06/07/04 15:52:37 ID:uX1zHVCf
ドコモ確認しました^^
GJです
まとめ人、乙であります

27 :以下、名無しにかわりましてVIPがお送りします :06/07/04 18:24:28 ID:Vg4VO1L4
まとめの人、乙です
−−−−−−−−−−−−−−−−−−−−−−−−−−−

これ見ると
携帯用dat2htmlはAUとDoCoMoは大丈夫みたい。
昨晩の状態を見ると(ちなみに2500アクセスあったです)
http://www.geocities.jp/mirrorhenkan/others/img/keitai20060705.png
Vodafoneからのアクセスが423回あるみたいなので
たぶん使えるのでしょう。

692 :663 ◆fnwcOWFi56 @名無しさん@勉強中 ★:06/07/05 18:51:41 ID:???
で こんなスレが

【モバイル】携帯端末のネット利用者がPCを逆転、Web2.0で消費行動に変化 [06/07/04]
http://news18.2ch.net/test/read.cgi/bizplus/1152023749/l50

あとこんなのとか

2ch特化型サーバ・ロケーション構築作戦 Part22
http://qb5.2ch.net/test/read.cgi/operate/1150052911/223--
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
227 :動け動けウゴウゴ2ちゃんねる :2006/07/05(水) 02:26:59 ID:qVaUU4as0
携帯で過去ログ読む機会ってあまりなさそう。少なくとも自分はないですね。
議論系のスレで過去ログ参照しつつレスとかになると
PCでタブ表示してじっくり考えてレスだし。。。

携帯から書き込みの場合、5秒程度のフラッシュ広告流すとか。
で、それスルー用の●とか。
んー、弱いな。
モニタの大きさと言う制約をどうするか次第でしょうねぇ。。。

249 :動け動けウゴウゴ2ちゃんねる :2006/07/05(水) 14:01:53 ID:qVaUU4as0 ?
携帯でスレ一つざっと見るだけでも結構しんどいと思う。
フルブラウザ携帯持ってないんで、その場合どうなのかは知らないけど
それでもモニタの大きさが変わらない以上、そんなに差がない気が。

"読む"ではなく、"書く"で何からのモデルを打ち出す方がいいんじゃないかな?と。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−


とはいえ
携帯のネットとかもやってないので
まあ自分はここまでかなと。

しかし何やってるんだろ


693 :663 ◆fnwcOWFi56 @名無しさん@勉強中 ★:06/07/07 20:12:57 ID:???
さて

本家AASは、文字の長さによって
フォントを自動リサイズしているみたい。
あと画像の横幅は240固定みたい(単位はピクセルでいいのかな?)
画像の縦幅もちょうど収まるようにしておられるようです。

よし、やってみますか。

まずは、フォントサイズ毎の収まる文字数を考えてみようかなと。
で、フォントサイズを指定出来るようにしてみました。

http://aas.k2.xrea.com/j/?fontsize=5&01234567890123456789
http://aas.k2.xrea.com/j/?fontsize=10&01234567890123456789
http://aas.k2.xrea.com/j/?fontsize=15&01234567890123456789
http://aas.k2.xrea.com/j/?fontsize=20&01234567890123456789
http://aas.k2.xrea.com/j/?fontsize=25&01234567890123456789
http://aas.k2.xrea.com/j/?fontsize=30&01234567890123456789
http://aas.k2.xrea.com/j/?fontsize=35&01234567890123456789
http://aas.k2.xrea.com/j/?fontsize=40&01234567890123456789
http://aas.k2.xrea.com/j/?fontsize=45&01234567890123456789
http://aas.k2.xrea.com/j/?fontsize=50&01234567890123456789

サイズを指定しない場合は、10に固定してます

http://aas.k2.xrea.com/j/?fontsize=5&01234567890123456789

694 :663 ◆fnwcOWFi56 @名無しさん@勉強中 ★:06/07/07 20:20:06 ID:???
最後の行訂正
http://aas.k2.xrea.com/j/?01234567890123456789

これで適正値を割り出すしかないのかな


とりあえず
フォントサイズ:書ける文字数 で見てみると

7 :102
8 :90
9 :72
10 :68

ここらで飽きちゃったです

695 :663 ◆fnwcOWFi56 @名無しさん@勉強中 ★:06/07/08 20:54:49 ID:???
一行の文字数と行数を自動算出して
フォントサイズと画像の縦サイズを
自動的に決めるようにしたです。
perl質問スレ過去ログが非常に役に立ちました。
あとはsocketを用いたdatを取得と
指定行の抽出およびAAS化ですね。

上のでフォント指定も出来るようにしてあるので
拡大縮小も出来る感じですし
紙芝居のようにクリック毎に絵が変わるように出来るかも。


htmlをウェブ上でdat化するように出来れば

http://sunset.freespace.jp/aavideo/

↑とかも偽AASで読めるようになるかもですね。

696 :663 ◆fnwcOWFi56 @名無しさん@勉強中 ★:06/07/08 21:58:52 ID:???
で、表示例をフォント指定しないものに変えました

http://aas.k2.xrea.com/

でも「<s>パク</a>」というのはやめたほうがいいかもですな
「インスパイア」も差し障りありそうだし
(でもこの場合は明らかに「インスパイア」なんですが・・)


AAS開発スレを読み直したんですが
なんで「よーし俺もやってみるぞー」
という人が出ないのかな
ほんとみんな称賛するばかりで

でも本家だと諸ミラーにあるdatはサポート外なんだよなあ
要望したってスルーされそうだし
こんなやりとりもあったし

http://qb5.2ch.net/test/read.cgi/operate/1116860602/902-907n
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
902 :動け動けウゴウゴ2ちゃんねる :2006/05/30(火) 01:31:41 ID:8xadaNmcP
当然だけど、既に落ちたスレやHTML化されたスレは読めないんですね
落ちたスレはともかく、HTML化されたスレはなんとかなりませんかね……

907 : ◆WMaLhm.gkw :2006/05/30(火) 19:16:54 ID:Q0wXMMCG0
>>902
HTMLからDATを再構築して、キャッシュに入れればいいのかなぁ?
と漠然と思いましたが、どうなることやら……。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−

697 :663 ◆fnwcOWFi56 @名無しさん@勉強中 ★:06/07/08 22:18:14 ID:???
メモ
暇つぶし2ch
保持スレ一覧
http://mobile.seisyun.net/th_list.html
−−−−−−−−−−−−−−−−−−−−−−−−−−−
  現在キャッシュに持っているスレの一覧です。
  貴重なスレがあったら保守なりなんなり。  上のほうのは今にも消えそうなスレですよ。
  read : read.cgiでスレを見る
  getdat : dat取得  agate : agateでスレを見る (新規にレスを取得します)
  1時間毎更新/全部で丁度500MBくらい。
−−−−−−−−−−−−−−−−−−−−−−−−−−−

698 :663 ◆fnwcOWFi56 @名無しさん@勉強中 ★:06/07/10 02:49:45 ID:???
とりあえず
偽AASが形になったかなと。

http://aas.k2.xrea.com/

表示例は
例えばこちらとか

http://aas.k2.xrea.com/pickup.php?url=http://mimizun.com:81/log/2ch/alone/that4.2ch.net/alone/dat/1148213872.dat&st=1&to=1&nofirst=true

でもって
あちこち見てみて「やったぜベイビー」と思ったのですが
いざAA板を見ようとすると本文が「×」になるんですが
何でなんでしょうか。
サーバーの限界なのでしょうか。

http://mirror.k2.xrea.com/pickupj.php?url=http%3A%2F%2Fmakimo.to%2Fcgi-bin%2Fdat2html%2Fdat2html.cgi%3Fhttp%3A%2F%2Faa5.2ch.net%2Ftest%2Fread.cgi%2Faastory%2F1151496606%2F%26view%3DDAT&st=1&nofirst=true

画像単独だと表示されるんですが。(私の環境では)

SocketようわからんもんでQuery_String でやってみたんですが
そのせいなのでしょうか

699 :663 ◆fnwcOWFi56 @名無しさん@勉強中 ★:06/07/10 10:22:46 ID:???
メモ
本家AASで表示出来ますね
http://example.ddo.jp/aas/a.i/user.ftth100.net+mirrorhenkan/test5/1047432142/482

ちなみに自分のやつで表示するとこうなります
http://aas.k2.xrea.com/pickup.php?url=http://user.ftth100.net/mirrorhenkan/test5/dat/1047432142.dat&st=482&to=482&nofisst=true

えーと
自作に固執する訳じゃないです
車輪の再発明以上のものにはなりそうもないですし

という訳で、偽モナメントのほうでは
本家AASをそのまま使わせてもらえそうです
時間が出来たらやってしまおう


ただ問題は
makimo.toさんやみみずんさんの所にあるdatや
本家2chでhtml化したスレのdat(というかdat.gz)なんですが
これらはまだ本家では未対応みたいなので
まあいいやと(何がいいのかと)

700 :663 ◆fnwcOWFi56 @名無しさん@勉強中 ★:06/07/11 11:45:46 ID:???
半角カナが絡むと文字化けしますね

http://example.ddo.jp/aas/a.i/user.ftth100.net+mirrorhenkan/test5/1047432142/497
http://mirror.k2.xrea.com/dat2html/read1.php?url=http://user.ftth100.net/mirrorhenkan/test5/dat/1047432142.dat&st=497&to=497&nofirst=true

本家では文字化けしてないんですが
どうやったのでしょう
http://example.ddo.jp/aas/a.i/user.ftth100.net+mirrorhenkan/test5/1047432142/497

701 :663 ◆fnwcOWFi56 @名無しさん@勉強中 ★:06/07/11 12:41:13 ID:???
どうやら全角混じりの文章の中だと
文字化けしないみたいです

http://aas.k2.xrea.com/j/?%83e%83X%83g%81%40%C3%BD%C4

半角で「テスト」(←化けるかな)とやるとこの通り

http://aas.k2.xrea.com/j/?%C3%BD%C4

ちなみに「%C3%BD%C4」は文字コードEUCで上の文字になります
(竹カンムリに「単」 って何て読むんだろ)


こういうのって面白いですね。
豪田まりぽさんもこんな事調べておられますし↓

http://www.madin.jp/diary/?date=20060216
http://www.madin.jp/docs/sjis.txt

それにしても、凄い。


702 :663 ◆fnwcOWFi56 @名無しさん@勉強中 ★:06/07/11 17:13:45 ID:???
偽AASですが
URLで全部の文章をパラメータ渡しするのはどうも無理っぽい。
やはりsocketやlwpで取り込まないといかんようです。
それにしてもPerlは外部参照がややこしいなー。
phpのほうがいいんですが
phpでImageMagickの使い方とかあるサンプル
なかなかみつかんないし。

それはともかく

http://jbbs.shitaraba.com/bbs/read.cgi/computer/1929/1038409548/63n

こんな事とか出来るなーと。

http://aas.k2.xrea.com/j/?%92m%82%C1%82%C4%82%A2%82%E9%82%AA%3Cbr%3E%82%A8%91O%82%CC%91%D4%93x%82%AA%3Cbr%3E%8BC%82%C9%93%FC%82%E7%82%C8%82%A2

もっと勉強すれば
ルパン三世フラッシュみたいなのとか
出来るかもしれませんね

703 :663 ◆fnwcOWFi56 @名無しさん@勉強中 ★:06/07/14 20:17:42 ID:???
はい途中経過

http://aas.k2.xrea.com/pickup1.php?url=http://www.geocities.jp/tekoky_land/dat/01.dat&st=1001&to=1001&nofirst=true


socketでdatのデータを取り込めたですよ。
ただ、取り込める所と取り込めない所があるもんで
まだまだなんですが。

例えばこれ
http://user.ftth100.net/mirrorhenkan/test5./dat/1140183731.dat
取り込めないです。

もしかしたらgzip圧縮されているものが駄目なのか と
zlibなんたらかんたらというのを見てみたんですが
ようわからず。

それと
gzip圧縮で届いているかどうかを見るのに
今では幻の(?)htmltodat0.3.0を使わせて頂いたです。
gzipかどうか簡易的にすぐわかったです
いやーすごい。

という訳で>mukiyuさん
htmltodatで取得したページがgzipだったかどうかとか
わかるようになっていたら
簡易チェッカーとして凄く重宝するのですが。
って私だけかもなんですが。

それにしても、phpだと
外部ページ取得でポートとかホストとかgzipとか
そういうのを考えなくていいのでいいなあ

704 : ◆/vmukiyuzw :06/07/15 19:46:43 ID:wEHLvL1G
>>703
> という訳で>mukiyuさん
> htmltodatで取得したページがgzipだったかどうかとか
> わかるようになっていたら
> 簡易チェッカーとして凄く重宝するのですが。

gzipかどうかの判定はHTTPヘッダのContent-Encodingを見て行っているので
例えばオミトロンのログを見るとかでもわかるのではと思います。

705 :663 ◆fnwcOWFi56 @名無しさん@勉強中 ★:06/07/16 15:47:00 ID:???
うーむ

>>704
わかりました。
・・・もしかして気を悪くされてます?

オミトロンというのはproxomitronの事なのかなと思ったんですが
作動させてログを開いて見てみたんですが
何だかわかんなかったです・・だめだ。

で、別の方法でやってみたら
何とか表示出来るようになりました
他のgzip化されているものも表示出来るみたい

http://aas.k2.xrea.com/sockettest.xcg?url=http://user.ftth100.net/mirrorhenkan/test5./dat/1140183731.dat
http://aas.k2.xrea.com/sockettest.xcg?url=http://f55.aaa.livedoor.jp/~vipper/browjer/projectlog3.html

今のところは上のは ただ表示させているだけですが
これをデータとして配列に入れて必要な部分を取り出せれば
いいのかなと。

706 :663 ◆fnwcOWFi56 @名無しさん@勉強中 ★:06/07/16 16:08:39 ID:???
さて
ポートが80以外の所でも問題ないんですが
http://aas.k2.xrea.com/sockettest.xcg?url=http://mimizun.com:81/log/2ch/alone/that4.2ch.net/alone/dat/1148213872.dat

makimo.toさんの所は表示すら出来ません。
http://aas.k2.xrea.com/sockettest.xcg?url=http://makimo.to/

php版のdat2htmlとかだと無問題に読み込めるんで
完全に駄目だという訳でもないみたいです。

でもPerlの場合はどうすればいいのかなー・・。

707 : ◆/vmukiyuzw :06/07/16 21:00:08 ID:Ps/qywQz
>>705
別の方法で出来たのであれば以下は蛇足な情報ですが

> オミトロンというのはproxomitronの事なのかなと思ったんですが
> 作動させてログを開いて見てみたんですが
> 何だかわかんなかったです・・だめだ。

ログウィンドウを表示させた状態でメニューの「Edit」から
「HTTP headers」をクリックしてONの状態にすると
HTTPヘッダの情報が表示されるようになります。
(当然ですがproxomitronをプロキシに指定した通信についてのみ)

500KB
続きを読む

掲示板に戻る 全部 前100 次100 最新50
名前: E-mail(省略可)

0ch BBS 2006-02-27