楽天モバイル[UNLIMITが今なら1円] ECナビでポインと Yahoo 楽天 LINEがデータ消費ゼロで月額500円〜!


無料ホームページ 無料のクレジットカード 海外格安航空券 解約手数料0円【あしたでんき】 海外旅行保険が無料! 海外ホテル
告知欄です


■掲示板に戻る■ 全部 1- 101- 201- 301- 401- 501- 601- 701- 最新50
メモ3

1 :名無しさん@勉強中 ★:07/08/04 06:09:43 ID:???
またまた思いついた事など

237 :名無しさん@勉強中 ★:07/11/17 07:47:09 ID:???
http://namahage.dip.jp/public_s/
−−−−−−−−−−−−−−−−
namahage@2chlog は閉鎖しました。
2007/11/15
−−−−−−−−−−−−−−−−



お疲れ様でした

238 :名無しさん@勉強中 ★:07/11/17 15:51:01 ID:???
>>236を追加させて頂いたです
別窓版や軽量版は様子を見つつ

239 :名無しさん@勉強中 ★:07/11/17 18:59:27 ID:???
全てhtml化されておられる訳ではないみたいなので
dat.gzのリンクだけにしたです

gzファイルではプレビューとか出来ないので
gzip圧縮されたファイルにアクセス取得解凍して
php版dat2html経由で表示とか出来ればいいんですけど
そういうWebプログラムCGIってどこかにありそうなものですけど
実際 どこかにないですかね。
perlでもphpでもrubyでもpythonでもいいんですけど。
それ用のgzip解凍モジュールが必要なものでも
xreaなら何とかしてくれそうなので。

ところで
tatsuさん作のdat2htmlで
多段ポップアップやレス抽出も出来るスキン(?)なんですが
ポップアップはともかく
レス抽出ってIEだけなのでしょうか。
自分とこのBagelではウンともスンともしないですが。

240 :名無しさん@勉強中 ★:07/11/17 19:34:14 ID:???
メモ

gzip圧縮転送について/Apache/CGI/Perl
http://tech.bayashi.net/pdmemo/gzip.html

241 :名無しさん@勉強中 ★:07/11/18 08:59:42 ID:???
メモ

フォルダ スレッドの数
オカルト倉庫 51442
2ch.net 269246
bbspink.com 31332
html化済3項目 352020
DAT(gz) 386952

242 :名無しさん@勉強中 ★:07/11/18 12:10:24 ID:???
さて
いっちょPythonでもやってみべかと
下のをdat化しようとしたですが
read.cgiそのままではあちこち抜けてるみたい(私の頭のようだ)
や、もしかしたらdatとかあるかもですが
まだ見とらんですよ。

http://www.geocities.jp/futasuke5/bbs/1061523335_part1



上のスレその他を読むと、Pythonって
MacやLinuxでは標準装備されてるっぽいですね。
Windowsだけは要インストールみたいですが。

って事は
今までwshで作ってある物をPythonに書き換えたら
非win環境の方にもOKになるかも。
何だか面白そうですね。

243 :名無しさん@勉強中 ★:07/11/18 12:40:40 ID:???
何だ
>>242って元htmlの状態から抜けていたのか。
これでは指定レス番がズレてしまうではないですか。

244 :名無しさん@勉強中 ★:07/11/18 12:53:34 ID:???
という事で要望を

http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/498

要望されても困るかもですが
必要無い or 面倒だと思われるのでしたらいいです

245 :名無しさん@勉強中 ★:07/11/18 16:00:45 ID:???
メモ
2ch-imode(http://2ch-i.net/)のdat化


正規表現
m#<p>\[([0-9]+):(.+?)(?:≪(.+?)≫)? \((.+?)\) (?:<a href=.+?>AA</a>)?\]<br> (.+?)</p>.*?<hr>#mik

前処理
s#(<title.*?): 2ch-imode(</title>)#$1$2#k
s#<SCRIPT language="JavaScript">.+?</SCRIPT></body></html>##igk

変換結果式
メール欄逆転

後処理
s#(\n.*?)(◆.+?)<>(.*?)<>#$1</b>$2<b><>$3<>#igk



>>90の正規表現ではマッチしなくなったようですが
これでどうでしょうか。

246 :名無しさん@勉強中 ★:07/11/18 16:13:35 ID:???
後処理これではレス1にマッチしないですね。こうかな?

s#((?:^|\n).*?)(◆.+?)<>(.*?)<>#$1</b>$2<b><>$3<>#igk


正規表現も半角スペースの有無とか よく見てないので
うまくいかないものもあるかも。
>>90のをもとにあれこれやってたら見事泥沼状態になったもんで
最初からやり直したです。

マッチしなくなった原因は何だろうなあ。
AAリンク前後の半角スペースとかなのかなあ。
頭にモヤがかかってるみたいでよくわかんないです。

247 :名無しさん@勉強中 ★:07/11/18 22:29:50 ID:???
http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/499

あらま
見られてましたかここ
了解です



それはともかく

あれから
>>242のスレッドから現在までのdatを取得して読んでみたですが
pythonですごい事をやられていたんですね。
画像取得や巡回のみならず
現在進行形でp2pでキャッシュ画像を融通しあったりしているみたいで
フォルダのサイズが2ギガとか4ギガとか結構いるみたい

スクリプトをDLして見ているですが
まだ全然何もわかんないです
まあわかんないまま終わっても構わないですけど。

248 :名無しさん@勉強中 ★:07/11/18 22:57:33 ID:???
さっきまで最新版のほうを見てたですが

http://www.geocities.jp/futasuke5/

オリジナルを作られた作者さんの最終バージョンを見てみたら

http://heika-love.cool.ne.jp/futasuke.htm

サイズもファイル数も半分くらいで
此方のほうが少しだけわかりやすいかも。

p2p機能とかも面白いものですね。

http://futasuke.jf.land.to/howto.html



メモ

Python入門
http://www.f7.ems.okayama-u.ac.jp/~yan/python/
初歩の「Perl」「Python」「Ruby」 − @IT情報マネジメント
http://www.atmarkit.co.jp/im/carc/serial/redge60/redge60a.html
Python
http://osksn2.hep.sci.osaka-u.ac.jp/~taku/osx/python/index.html
Python チュートリアル
http://www.python.jp/doc/release/tut/

249 :名無しさん@勉強中 ★:07/11/18 23:36:12 ID:???
2chlog公開停止の件
http://namahage.dip.jp/blog/archive/2007/11/18/98479.aspx

再度 お疲れ様でした。

> 復帰予定はありません。全く。回線止められるの嫌だし。

との事ですが
まあ自分とこはそのままにさせて頂こうかなと。


そういえば
MoonWolfさんの所も
やっとトップページから「2chミラー計画」のリンクをお消しになられたようで。

http://www.moonwolf.com/

250 :名無しさん@勉強中 ★:07/11/18 23:48:17 ID:???
Twisted Mind
http://d.hatena.ne.jp/Voluntas/
perezvonの日記
http://d.hatena.ne.jp/perezvon/
グニャラくんのグニャグニャ備忘録@はてな
http://d.hatena.ne.jp/tasukuchan/

251 :名無しさん@勉強中 ★:07/11/20 19:34:18 ID:???
いやーpython面白いわー。
後でインストールして試してみるかなー。


Kawasaq通信 いかにして効率よく大量のおっぱい画像をダウンロードするか。おっぱいマニア編
http://kawasaq.blog56.fc2.com/blog-entry-97.html
pythonでニコニコ動画のflvをダウンロードする
http://d.hatena.ne.jp/spacecadet/20070814/1187106008
コマンドライン上で動作するニコニコ動画ダウンローダー on Python
http://d.hatena.ne.jp/y_yanbe/20070827/1188160390
ニコニコ動画ダウンロードスクリプトその後
http://d.hatena.ne.jp/spacecadet/20070828#1188315993


何だかどちらもwshで書き換えられそうですね。実際誰かやってそう。
ただ どちらもバイナリファイルのダウンロードという事になるので
その場合 ADODB.streamを使うとなると
自分のPCでは 作ったとしても検証(カッケー!)出来ないです。
他の方法はないのかな。

252 :名無しさん@勉強中 ★:07/11/20 19:44:31 ID:???
とりあえず容量食わないみたいですし
BASP21を入れてみるかな

http://www.b21soft.co.jp/basp21/basp21psocket.html#vbs_download

253 :名無しさん@勉強中 ★:07/11/21 07:18:58 ID:???
別件で使えそうなのでメモ

http://d.hatena.ne.jp/spacecadet/20070814/1187106008
−−−−−−−−−−−−−−−−−−−−−−−−
#エスケープ文字を置換する
def unescape(strg):
strg = string.replace(strg,'%2F','/')
strg = string.replace(strg,'%3A',':')
strg = string.replace(strg,'%3D','=')
strg = string.replace(strg,'%3F','?')
return strg
−−−−−−−−−−−−−−−−−−−−−−−−

254 :名無しさん@勉強中 ★:07/11/21 12:49:14 ID:???
BASP21入れてみたです。

すごいやこれ!(私が言っても何にもなりませんが)
ADODB.streamを使うほうが汎用的ですが
>>92の通り 追加モジュールのサイズが段違いに多いので。

で >>92でも書いたですが

> 何をしたいかというと
> 画像等のバイナリファイルを
> スクリプトでDL出来ないかというだけの事なんですが。

書いてあったサンプルをもとに実行してみたら
出来たです出来たです。




メモ

unibonのページ(unibon)
http://www.geocities.co.jp/SiliconValley/4334/unibon/index.html

更新止まってるように見えるですが
日記は現在進行中です

255 :名無しさん@勉強中 ★:07/11/22 08:43:18 ID:???
メモ

Python標準リリース
http://www.python.jp/Zope/download/pythoncore
Python インストール ガイド
http://www.xucker.jpn.org/pc/python_install.html
Python Home
http://hp.vector.co.jp/authors/VA003670/python/
CodeZine:Pythonを始めよう(入門, Python)
http://codezine.jp/a/article/aid/1617.aspx
a geek
http://d.hatena.ne.jp/hiratara/
python.matrix.jp
http://python.matrix.jp/index.html


実際入れてみると
50メガくらい容量を使ってしまうみたい。
過信するほど詳しい訳でも頼りきってる訳でもありませんが
pythonで出来てwshで出来ない事ってあるのかな。
(↑問題発言かな)

wshだと ほとんどのwindowsマシンで標準装備されているから良いのですが
pythonだと>>242のようにMacやLinuxで標準装備されているというのが強みなのかな。
dat落ちしてますが、それぞれの板にスレッドがありますし。

MacでPython Part 1
http://pc7.2ch.net/test/read.cgi/mac/1105894574/
Python
http://pc8.2ch.net/test/read.cgi/linux/1078144088/



それにしても
クロスOS(とは言わないか)という事で考えたら
JavaScriptって凄いですね。
ほとんど全てのPCでOKだし
最近だと携帯でも少しづつ対応しているみたいですし。

+ JavaScript の質問用スレッド vol.61 +
http://pc11.2ch.net/test/read.cgi/hp/1194265231/288
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
288 名前:Name_Not_Found[sage] 投稿日:2007/11/18(日) 06:41:16 ID:???
今の携帯ってJavaScript使えるのかあ

すっかり時代に取り残されてしまった
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

256 :名無しさん@勉強中 ★:07/11/22 13:39:20 ID:???
>>251から飛んだ先の説明文を読んで
proxomitronでクッキーとリファラーとUAを適当な値で送信するよう設定して
試しにやってみたら
nicovideo.jpのflvをDLする事が出来たです
すげーやこれ。
flvファイルってローカルで再生してもカクカクするですが
もうそこは私の旧型マシンの性能なのだろうなと。

これ本当にwshで出来そうですね。
ログイン時のSSL認証も
前スレ432や657のように何とかなりそうです。

まあ作ったところで
私しか使わないでしょうけど。

257 :名無しさん@勉強中 ★:07/11/22 16:16:31 ID:???
うーむ
ターゲットのPOST先がよくわかんない・・・
まあ
proxomitronとブラウザの併用で十分かもです(←逃げ口上)

flvファイルのリンク抽出だけならwshで出来るかな?
ブックマークレットでも何とかなるかも。
やった途端に仕様変更とかあるかもですが。

258 :名無しさん@勉強中 ★:07/11/22 18:15:20 ID:???
Yusukebe::Tech
http://yusukebe.com/tech/
Perlでニコニコ動画のflvとコメントxmlをダウンロードする (Yusukebe::Tech)
http://yusukebe.com/tech/archives/20070803/124356.html
ゆーすけべー日記
http://yusukebe.com/
ゆーすけべー日記: いかにして効率よく大量のおっぱい画像をダウンロードするか
http://yusukebe.com/archives/07/10/15/174049.html

やっぱギークでナイト!
http://geek.oyspe.com/
ギークなお姉さんは好きですか
http://lovecall.14.dtiblog.com/


いちばん最後のべにぢょさんは
はてなブックマークで何故か私の所があったっけだっけなと

259 :名無しさん@勉強中 ★:07/11/22 20:01:04 ID:???
いやーpython難しいわー。
さっきインストールして試してみてるですが
とっかかりすら覚束ないー。
>>248>>251の諸スクリプトも全然動かないー。

何が足りないのかもわかんないー。
私の頭か?多分そうだ。



でも、htmlやJavaScriptやphpやperlやwshも最初はそうだったので
やってれば何とかなるかもですが
それらの言語と比べて資料やサンプルがWeb上にそう多くなさそうなので
何とも難しいです。
誰かに訊く訳にもいかないですし。

適当にやってみますか。

260 :名無しさん@勉強中 ★:07/11/22 20:40:55 ID:???
というか
"Hello Python World"
の出し方からしてわかんないのですが
これって流石にどこでも訊けないですよね。

コマンドプロンプトやとIDLE(? 内蔵エディタみたいなの)では

print 'Hello Python World'

とやったら次の行に表示されましたが
pyファイルに書いて実行しても
(一行目は「#!/usr/bin/python/」 Windowsだと無意味そうだけど)
Dosプロンプトめいたものが一瞬出てすぐ消えるだけですが
これって正しい動作なんでしょうか。

正しい動作なのかもですが、では
プロンプト画面が消えないようにするにはどうすればいいのだろう・・・

まだチュートリアル見てないですが
sleepとかかな?

261 :名無しさん@勉強中 ★:07/11/22 21:19:47 ID:???
・・・出来た。

Python
http://www1.u-netsurf.ne.jp/~merita/python/python20.html
−−−−−−−−−−−−−−−−−−−−−−−−−−
hello.py
---
#!/usr/local/bin/python
from Tkinter import *
Label(text='Hello, world!').pack()
mainloop()
---

−−−−−−−−−−−−−−−−−−−−−−−−−−


メッセージ表示するだけなのにこれは一体。
Tcl/Tkって何だろう・・・

262 :名無しさん@勉強中 ★:07/11/23 00:19:07 ID:???
メモ
日本版googleで「Python」の検索結果を表示するコード

http://usamimi.info/~mirrorhenkan/2ch/python/prog/read.php?key=1081312810&st=435&to=435
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
import urllib, sys

ACTION = "http://www.google.co.jp/search"
DATA = "q=%(q)s&hl=%(hl)s&lr="
q = "Python"
hl = "ja"
urlopener = urllib.FancyURLopener()
urlopener.addheaders = [('User-agent', "Mozilla/3.0")]
print urlopener.open(ACTION + "?" + DATA % locals()).read()
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


結局、Pythonスレッドを検索するのが一番実用的な感じがするですが
もっとわかりやすいサンプルとかサイトとかないのかな

あと上のだと
結果表示がプロンプト画面で一瞬出てすぐ消えてしまうです。
ローカルに保存するのも、他言語と同じ要領で何とか出来る感じです。

で、画像とかのバイナリファイルのDL保存も
同じコードで何とかなるのでしょうか。
wshはそこがネックだったですが。

263 :名無しさん@勉強中 ★:07/11/23 00:46:34 ID:???
http://usamimi.info/~mirrorhenkan/2ch/python/prog/read.php?key=1176059681&st=941&to=965

あとでじっくり読んでみよう。

264 :名無しさん@勉強中 ★:07/11/23 09:33:11 ID:???
メモ
その15・その16のdat化について

URL例
http://snapshot.publog.net/dat.php?url=http://ex20.2ch.net/test/read.cgi/gline/1165245437/
http://snapshot.publog.net/dat.php?upd=y&url=http://ex20.2ch.net/test/read.cgi/gline/1165245437/

前処理
s#<title.*?/title>##
s#dc:title=\"(.*)\"#<title>$1</title>#

正規表現
m#<dt>([0-9]+).+?(?:"mailto:\.?(.+?)">)?<b>(.*?)</b>(?:</font>|</a>) :(.*?)<dd> ?(.*?)<br><br>(<dt>|</dl>)#mik

265 :名無しさん@勉強中 ★:07/11/23 11:57:19 ID:???
http://ex20.2ch.net/test/read.cgi/gline/1165245437/476

あう
アップし忘れてたです

バックアップとして旧ファイルをリネームして
新ファイルをアップしているのですが
リネームだけしてアップを忘れてしまっていたという塩梅で。


それにしても
最近、あちこちに御迷惑をおかけしているのだなと
少し罪悪感を感じている真っ最中なのであります

266 :USA, New York:07/11/23 12:26:48 ID:mArO8/K1
<a href=http://fpcmfopv.blogspot.com/ >nude teen amateur file sharing</a>
nude teen amateur file sharing http://fpcmfopv.blogspot.com/ nude teen amateur file sharing
[url=http://fpcmfopv.blogspot.com/ ]nude teen amateur file sharing[/url]
<a href=http://fxpwflpcx.blogspot.com/ >amature older</a>
amature older http://fxpwflpcx.blogspot.com/ amature older
[url=http://fxpwflpcx.blogspot.com/ ]amature older[/url]
<a href=http://22bfpmffwpp.blogspot.com/ >granny porn on viedo</a>
granny porn on viedo http://22bfpmffwpp.blogspot.com/ granny porn on viedo
[url=http://22bfpmffwpp.blogspot.com/ ]granny porn on viedo[/url]

267 :名無しさん@勉強中 ★:07/11/23 13:46:24 ID:???
ふむ
nude teen amateur fileですか。
って こっちはまあ需要あるでしょうけど
問題はその下で

あのあの
amatrute olderiに
granny pornって何なのよと。
年輩や年増の女性のpornっていう事ですか?
だとしたら、何とも熟女たるものがありますねこの場合。

とはいえ そういう嗜好が世の中にあるのも間違いのない所で。
痴女とか逆ナンみたいなものもお伽話ではないでしょうし。

とか書くと
熟女板(http://sakura02.bbspink.com/mature/)や
フェチ板(http://pie.bbspink.com/feti/
等の住民の方々に怒られるかもなと。

それと
「amateur older」ではなく
「amature older」なのですか。
勉強になるなー。


という訳で
http://yy14.kakiko.com/test/read.cgi/mirror/1115213835/237
をつけたです。
あらあらかしこ

268 :名無しさん@勉強中 ★:07/11/23 16:25:02 ID:???
この流れで貼っとこう

http://mousouteki.blog53.fc2.com/blog-entry-4879.html
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
110 名前:Cal.7743[sage] 投稿日:2007/11/08(木) 23:28:29
ったくどいつもこいつもバカだな。
セックスなど存在しない。神話といっしょで想像上の出来事だ。
チンコはおしっこをするためについているものだし、マンコなど存在しない。
好きな人ができても普通はキスまで。それ以上の行為は無い。
何を根拠にそんな暴論を吐くんだ?
お前はそのセックスとやらをしたことがあるって言うのかよ。そんな夢物語を。
流れ星を見ただけなのにUFO見たと言って大騒ぎするタイプだなw
UFOの意味は「未確認飛行物体」だ。実際にはきちんと確認されてないんだよ。
カッパとかも同じ。
UMA(ユーマ)と言って意味は「未確認」生物だ。
無学にして知らないが、おそらく「SEX」にも同じような意味があるのだろう。
意味は「未確認行為」といったところか。スペルが当てはまらないのが少し気になるが。
ビデオとかの映像もあれは偽物だぞ?
お前みたいにうかつに信じ込む奴がいるから面白がって誰かが作っているだけ。
その証拠に繋がってるとこにはモザイクとかついてるだろ?
そういうことなんだよ。
無修正の裏ビデオなども実はトリック。
最近はコンピュータによる映像処理の技術も進んできているからな。
イタチゴッコで切りがないが騙されないよう気を付けるように。
本当にあるのなら俺だってしてみたいよ。
そのセックスとかいうやつをなw
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


さあ元スレを探すのだ

269 :名無しさん@勉強中 ★:07/11/23 16:41:00 ID:???
読んでる人が上見てひくかもしれませんが
この程度の事でひかれても。
そういう人って
モーツァルトの書簡集とか完全版アンネの日記とかも許容出来ないのかも とか。
(って何こいつ偉そう)


ちょっと本屋に行って立ち読みしてきたですが
pythonでWeb上のファイルにアクセスするには
urllibモジュールをimportしてから
urlparse()やurlopen()等をすればいいみたい。

それにしてもpythonの本少ないなー。
他の言語のは沢山あるですが。
サイトを出しておられる方も結構いらっしゃるですが
MacやLinux使いの方々ばかりですし
専門的な 頭痛が痛くなるようなサイトが多いです。
対して、その本屋では wshの本は皆無ですが
サイトを開いている凄い方が一杯居られるので
此方は何とかなってる感じ。

270 :名無しさん@勉強中 ★:07/11/23 19:36:42 ID:???
あれれ

>>6
>>128
>>177
が使えなくなったみたい
まあいいや

271 :名無しさん@勉強中 ★:07/11/24 08:28:54 ID:???
Programmer's Gate
http://morchin.sakura.ne.jp/index.php
Programmer's Gate / Effective Python /minidom
http://morchin.sakura.ne.jp/effective_python/minidom.html
プログラミング日記
http://d.hatena.ne.jp/morchin/
On Python
http://www.shido.info/py/index.html


pythonで大量のおっぱい画像をダウンロード出来るようになるのは
いつの事だろう
ハハハハハハハハ

272 :名無しさん@勉強中 ★:07/11/24 08:44:35 ID:???
Dive Into Python
http://diveintopython.org/


どうして日本語が無いんだよー。
下の言語はあるのにー。

* Italian
* French
* Spanish
* Chinese
* Korean
* Russian

"Translations are freely permitted"
ってあるけど
自分には無理だよー。

273 :名無しさん@勉強中 ★:07/11/24 10:11:20 ID:???
メモ

[Python] - veryberry_cafeの日記
http://d.hatena.ne.jp/veryberry_cafe/searchdiary?word=*%5BPython%5D

274 :名無しさん@勉強中 ★:07/11/24 11:24:46 ID:???
tomoemonの日記
http://d.hatena.ne.jp/tomoemon/
BOON SUTAZIO ⊂二二二( ^ω^)二⊃ ブーン スタジオ
http://d.hatena.ne.jp/boonvoyage/
FrontPage - Pythonのお勉強
http://python.rdy.jp/wiki.cgi?page=FrontPage

275 :名無しさん@勉強中 ★:07/11/24 11:26:19 ID:???
Python Home
http://hp.vector.co.jp/authors/VA003670/python/
テキストファイル
http://hp.vector.co.jp/authors/VA003670/python/FileIO/TextFile.htm
バイナリファイル
http://hp.vector.co.jp/authors/VA003670/python/FileIO/BinaryFile.htm

276 :名無しさん@勉強中 ★:07/11/24 11:40:16 ID:???
ああ、やっと
pythonでWeb上のデータを
ローカル保存出来た・・・
感動。

Mac使い or Linux使いの方居られますか?
って ココに書いても反応は期待出来ないかもですが。

277 :名無しさん@勉強中 ★:07/11/24 17:32:11 ID:???
ちょっくらpythonで書かれた CGIを表示させようと

http://mirror.s151.xrea.com/

にFTP接続してアップしようとしたら
容量満杯だそうで。

でもpublic_html内のサイズは何度やっても35メガくらいだもんで
おかしいなと調べてみたら
自動生成されてるlogフォルダが15メガくらいあったです。
5日分あって
1ファイルが3MBくらい。

これってApatch(?)が吐き出す生ログみたいなんですけど
どうすればいいんでしょう。
消しちゃって問題ないのかな。

278 :名無しさん@勉強中 ★:07/11/24 18:42:16 ID:???
datファイルを共有するP2Pソフト o2on 12dat
http://pc11.2ch.net/test/read.cgi/tech/1180440415/366
−−−−−−−−−−−−−−−−−−−−−−−−−−−
366 名前:デフォルトの名無しさん[sage] 投稿日:2007/11/24(土) 17:36:41
PC我物故我他ので色々再インストール中なんだが
Janeの右クリックでどっかから過去ログ持ってこれるソフトはなんだっけ?
このスレで知った気がしたんだが
o2onも入れるからおしえてくり

367 名前:デフォルトの名無しさん[sage] 投稿日:2007/11/24(土) 17:48:14
>>366
漏れが作ったソフト
既に消えている
要望があったら再うpする

368 名前:デフォルトの名無しさん[sage] 投稿日:2007/11/24(土) 18:12:24
p2todatか
−−−−−−−−−−−−−−−−−−−−−−−−−−−


p2todat配布停止されてたのかなとgoogle検索から行ってみたですが
まだ配布しておられるような。
mimizun.jsも おささんの所にありますし
となるとgetlog.wsfの事なのだろうか。

でもgetlog.wsfの作者さん、jane外部コマンドスレで何回かお見かけしたですが
一人称で「漏れ」というような文章をお書きになられるような方には見えなかったですが。
続報求む

279 :名無しさん@勉強中 ★:07/11/24 20:20:35 ID:???
という事で
>>276を出してみるです

http://www.geocities.jp/mirrorhenkan/others/python/getimg.py.txt

pythonが入っているマシンの方のみですが
上のコードをDLして拡張子をpyにリネームして実行してみて下さい。
スクリプトと同じフォルダにyahooのタイトル画像が生成していたら成功です。

pyファイルの実行方法ですが
・ダブルクリック
・コマンドライン
・GUI (IDLE)
の3種類あるみたいです。


あと、Mac/Linuxの方は
スクリプト1行目の

#!/usr/bin/python



#!/usr/local/bin/python

または各自のpython設定先に書き換えなければいけないかも。


この程度のスクリプトでも、まんま書いてある所がなかったので
なかなか勉強になったです。
自分とこではうまくいったですが
他のところではどうでしょうか。



反応があったら嬉しいのですが。
という事で、お願いします。

280 :名無しさん@勉強中 ★:07/11/25 04:27:49 ID:???
Python入門
http://www.f7.ems.okayama-u.ac.jp/~yan/python/
Japanese Python Links
http://homepage1.nifty.com/kazuf/pythonlinks.html
機械伯爵の最新Python講座
An Introduction to Python & IronPython
http://www.okisoft.co.jp/esc/python/iron-python-intro.html
Python
http://ar.aichi-u.ac.jp/python/
九十九のぶろぐ:Python
http://sima8921.exblog.jp/i14/
WisdomSoft - Python言語入門【Python言語】
http://www.wisdomsoft.jp/dev/prog/python
猫日誌 -2005-
http://mineko.fc2web.com/box/my-room/dialy/privateDialy2005kisaragi.html

開発者のためのオンライン参考書
http://hp.vector.co.jp/authors/VA003670/index.html

281 :名無しさん@勉強中 ★:07/11/25 08:39:17 ID:???
>>279ですが
どこか外部に晒したほうが反応が見込める。かもしれず。
かといって
チキンなので
凄い方が沢山居られるプログラム板pythonスレで訊いてみるのも二の足を踏むですし


あと

http://blawat2015.no-ip.com/~mieki256/diary/20071003.html#200710030
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
「なんだこの書き方は。なっちゃいねえプゲラ」とか優越感ゲームしてる暇があるなら
添削してブログ公開して共有知にしてくれると嬉しいかもしれず。などと思わないでもない。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

pythonでの画像処理について調べていたのですが
まったく同感だなと。

282 :名無しさん@勉強中 ★:07/11/25 11:09:50 ID:???
おおこれは!!

中国2CH (http://cn2ch.cn/)
http://cn2ch.cn/
中国■2ch BBS ..
http://cn2ch.cn/bbs/

コスプレとか漫画とか御宅とかあって
何だか馴染めそうな感じです。
簡体字なので少しとっつきにくいですが。
掲示板もUTF-8なのですが
dat直読みは開放してないみたい。
して欲しいな。

管理人さんのブログがMySQLエラーで読めないのですが
是非読んでみたいです。

283 :名無しさん@勉強中 ★:07/11/25 11:43:56 ID:???
dat直読みは開放してないといっても
windowsサーバでIISを使ってるみたいですから
パーミッションとかではないみたいだし



メモ
双葉スクリプト中文化配布サイト
これで双葉中文化サイトは3つめなのかな
各々関係のないスタンドアローンでしょうし

Pixmicat! in Development
http://pixmicat.openfoundry.org/


それにしても
台湾のサイトは皆軽いのに
なんで大陸中国のサイトは重いのだろう。
インフラがまだ整備されてないのかな。
あるいは端的に国力の違いという奴なのだろうか。

国際電話も
通話料は何故かアメリカの倍くらいかかるみたいだし。

284 :名無しさん@勉強中 ★:07/11/25 15:59:12 ID:???
さて次は
ダウンロード or ローカルのdatを正規表現その他でhtml化する
python版dat2htmlが出来たら面白そうだなと。
誰かがとっくにやってそうですがそういうのはどうでもいい話で
html化が出来た場合
Web上でのpythonCGIでのdat2htmlも出来るかもです

ほんとはpythonでhtmltodatのようなものが出来れば
非win環境の方でもdat取得出来そうだなーとか思うんですが
そちらのほうは少し敷居が高そうなので。




と書いただけで終わるかもですが
まあどうでもいいわな

285 :名無しさん@勉強中 ★:07/11/25 18:13:42 ID:???
メモ

http://yusukebe.com/tech/archives/20070803/124356.html

を片手に頭の整理


URL
http://www.nicovideo.jp/watch/sm1049327


・スクリプト起動
|
・inputbox→URL入力
|
http://www.nicovideo.jp/api/getflv?v=sm1049327 にアクセス
|
・response.text取得→URL整形
|
・inputboxで整形後のURLを表示&クリップボードコピー

286 :名無しさん@勉強中 ★:07/11/25 19:39:27 ID:???
>>282
ブログも読めたです
音楽が流れていますが
結構良いではないですか。

http://cn2ch.cn/blog/
http://xasm.yo2.cn/

JaneNidaで読めたらなあ。

287 :名無しさん@勉強中 ★:07/11/26 17:23:08 ID:???
/*
  私信:
 メールを送らせて頂きましたので
  宜しかったら試してみて下さい
*/


さて
>>285をもとに
nicovideo.jpからflvファイルを半自動で取得するwshが出来たですが
どうしたものだろう・・。

perlやphpやrubyやpythonで作られた方々のコードを参考に
あれこれやって何とかなったっぽいですが

wshって 上記諸言語と違って
ほとんどのPC(win機)で標準装備されてるもんで
という事は 色んな人がそのまま使えてしまうかもなので
サーバへの負担やら帯域やらが心配になってしまうです
帯域が凄くてまた方式が変更になったりしても何ですし。
まあSmileDownloaderとか他にも色々あるでしょうけど
あと 車輪の再発明の域を出ていないものだという事もありますし。



うん
自分だけで使おうか

288 :名無しさん@勉強中 ★:07/11/27 09:17:02 ID:???
うう
>>287って
今読んでみたら
恥ずかしい事を書いてしまったかもだ・・・

perlやphpも スクリプトの検証用(カッケー!)に入れているですが
サイトで使うCGIはともかくとして
Web上で出されているものって
例えばLWPとかCookieとか用の諸モジュールを追加インストールしないといけないものが多いので
なかなか試そうという気にはならないのです。
>>251のpythonスクリプトもmechanizeモジュール(?)を入れないと動かないみたいですが
入れてみてPCが動かなくなっても何ですし。
そう考えると wshって結構すごいかも。

自分のPCが んもうパッツンパッツンなので
なるべく追加インストールせず
標準装備されているものだけでやってみたいのですが。
って こんな事では
例えばDelphiとかC言語とか手を出せないじゃないかとか思ったりして。




ああ また恥ずかしい事を書いてしまったかも
(なら書くなと)

289 :名無しさん@勉強中 ★:07/11/27 10:09:17 ID:???
VBSで便利なプログラムを作れスレ
http://pc11.2ch.net/test/read.cgi/tech/1170492587/59-67
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
59 名前:デフォルトの名無しさん[] 投稿日:2007/11/26(月) 08:03:28
BASP21でダウンロードソフトを作ろうと思っているんですが、
FTPだとFTPサーバーの名前を知らないとアノニマスでも接続できませんよね?
どうすれば良いのでしょうか?
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

ちょうどBASP21で画像等のバイナリファイルをDLするスクリプトとか
面白いかなと見てたんですが
えーと
以下略

てかwin2000以上なら
BASP21を入れずともwshだけで何とでもなると思うです
私のPCだとダメですが。

290 :名無しさん@勉強中 ★:07/11/27 21:27:33 ID:???
RubyもMacOSに標準装備されるのかなと

試験前だからプログラミングスレ
http://yutori.2ch.net/test/read.cgi/news4vip/1196066303/62
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
55 名前:以下、名無しにかわりましてVIPがお送りします。 [] 投稿日:2007/11/26(月) 21:09:54.60 ID:onQpvCMa0 (PC)
将来性はどのスクリプト言語がよさそうですか?
jscriptみたいになるのはどれだと思いますか?

62 名前:以下、名無しにかわりましてVIPがお送りします。[sage] 投稿日:2007/11/26(月) 21:28:32.46 ID:sHVCrD300
>>55
Rubyは?
いいとこ取りの言語らしいから今後期待できるかも。
すでに結構広がってるけどwwww
Mac OS X v10.2以降では標準で入ってるらしい
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


って
このレス見ただけなんで
ホントかどうか調べてないんですが。
まあ事実かどうかわかるまでは「ソースは2ch」って事で。

291 :名無しさん@勉強中 ★:07/11/27 21:46:41 ID:???
ふむ
py2exeを使えば
非python環境でも使えるようになるみたい

http://pc11.2ch.net/test/read.cgi/sec/997431887/758
http://dukedog.flnet.org/pukiwiki/index.php?%A5%D6%A5%ED%A5%C3%A5%AF%A5%EA%A5%B9%A5%C8#manaita

292 :名無しさん@勉強中 ★:07/11/27 22:04:21 ID:???
メモ

Python @ 7bit
http://nanabit.net/softwares/python.html


此方で勉強させて頂こうかな。

というか
python版htmltodatも既にお作りになられてるではないですか。。

293 :名無しさん@勉強中 ★:07/11/28 00:47:56 ID:???
コマンドプロンプトでの実行方法がわからない・・・

294 :名無しさん@勉強中 ★:07/11/28 01:33:19 ID:???
>>279ですが
何だかDLして実行してみても動かなかったので直したです

コメント文の箇所(行頭にシャープ「#」をつけるやつ)でエラーが出ておったのですが
いったい何でなのでしょう

295 :名無しさん@勉強中 ★:07/11/28 02:15:36 ID:???
うーん困った
pythonでのコマンドラインからの実行方法がほんとにわかんない
検索してもよくわかんない
こういうのって誰にきけばいいのだろう

明朝までにやんなきゃいけない事があるのに
なかなか手につかぬ
困ったほんと困った

296 :名無しさん@勉強中 ★:07/11/28 18:37:21 ID:???
さて>>282ですが
やはりJaneNidaで読んでみたいです

思いつく手段を適当に書くと
・JaneNida作者さんに対応してもらう
・htmltodatをUTF-8対応してもらう(ユニコード用鬼車dllもありますし)
・xyzzyで一つづつdat化
・htmltodatプロキシ的CGIを作って(http://usamimi.info/~shukeisho/みたいな)
 それ経由(& proxomitron経由)で閲覧する
・htmlをdat化しつつDLするようなスクリプトを作る

最初二つは無理でしょうね。
となると後ろ二つですか。

297 :名無しさん@勉強中 ★:07/11/30 02:12:00 ID:???
メモ

MacでPython入門
http://www.hlj.com/~tanoue/Python/Mac/mpy00.html
ニシキヘビを飼おう python入門
http://www.f7.ems.okayama-u.ac.jp/~yan/python/
僕と僕のサル以外、みんな何かを隠してる
http://xwave.exblog.jp/
HMDT - Back Number / June, 2001
http://homepage.mac.com/mkino2//backnumber/2001_06.html
続・おもむろに Python の勉強をはじめてみる - 星一の日記
http://d.hatena.ne.jp/hajimehoshi/20070609/1181378283

298 :名無しさん@勉強中 ★:07/11/30 02:36:16 ID:???
>>260-262
「画面が一瞬だけ表示されて消える」事に対する対処法ですが

虚ろなる破壊への夢 Python
http://www.naoto.tv/pc/python/py_01.html
−−−−−−−−−−−−−−−−−−−−
#! /usr/local/bin/python

print "Hello World!"
input("OK?")
−−−−−−−−−−−−−−−−−−−−

なるほど。
データ入力方法もわかりました。

print raw_input("write something")


ただ、私の環境では
コメント中の日本語であってもエラーが出てしまうみたい。
間違っているのかな。

299 :名無しさん@勉強中 ★:07/11/30 09:48:31 ID:???
>>298ですが
一行目で書いたpythonのパスの次行に

#coding:shift_jis

を書いたら、日本語も表示出来るようになったです。

本当は

# -*- encoding: shift_jis -*-

とやったほうが良いのかもしれないですが。

300 :名無しさん@勉強中 ★:07/11/30 09:54:19 ID:???
メモ

Python Home
http://hp.vector.co.jp/authors/VA003670/python/
文字列の検索
http://hp.vector.co.jp/authors/VA003670/python/RE/Search.htm
Pythonはじめました
http://www.kototone.jp/com/python01.html
Python - TSNETWiki
http://www.rakunet.org/TSNET/pukiwiki/?Python
Pythonドキュメント翻訳プロジェクト
http://www.python.jp/Zope/pythondoc_jp/
リンク集
http://www.python.jp/Zope/links
日本の Python サイト
http://www.python.jp/Zope/links/japanesesite
Pythonソフトウェア作法
http://www.python.jp/Zope/articles/SoftwareTools
わたしの愛した機械
http://www.kototone.jp/com/index.html


ブックマーク替わりという事で。
やっとブラウザを閉じられる・・・

そういえば
讃岐さんも ソーシャルブックマークサービスを始められるみたい。

301 :名無しさん@勉強中 ★:07/12/02 11:36:25 ID:???
中国の掲示板
http://chinabbs.seesaa.net/

中国の掲示板: 日本語を勉強すると白い目で見られる
http://chinabbs.seesaa.net/article/51692218.html#more
百度_日??_周???我学日?
http://bbs.baidu.com/f?kz=230385104


これって簡体中文なんですが
やはりJaneNidaで読んでみたく思ったです。
文字コードを見ると「gb2312」との事なので
何らかの方法でUTF-8に変換してからdat化すれば
文字化けもしないんじゃないかなと。
cjcode.plで変換するなりxyzzyで読み込んでUTF-8保存するなりして。


上に挙げたブログを読んでみると
実に様々な掲示板(フォーラムといったほうがいいのかな)から引用されているですが
同様に専用ブラウザで読んでみたいなと。



・・・自分で何とかするしかないのかな。。

302 :名無しさん@勉強中 ★:07/12/02 12:00:39 ID:???
メモ

http://takatyan.ddo.jp/test/read.cgi/main/1192376543/42

検索結果URL
http://takatyan.ddo.jp/title_search.cgi?query=検索ワード

303 :名無しさん@勉強中 ★:07/12/02 13:04:26 ID:???
関連で

Google Custom Search Engine - Site search and more
http://www.google.com/coop/cse/

これでwebarchive内のスレッドも検索出来れば面白いのですが。

現状、dumper.jpさんの所にあったログって探しようがないですし。
webarchiveに結構残ってるみたいなんだけど。

304 :名無しさん@勉強中 ★:07/12/02 13:12:52 ID:???
webarchive関連といえば
下記フィルタをproxomitronに入れると文字化けしないです

[HTTP headers]
In = TRUE
Out = FALSE
Key = "Content-Type: Fix WebArchive Encode (in)"
URL = "web.archive.org/web/[0-9]+/.+"
Match = "(text/html)\0; charset=*"
Replace = "\0"



あと404だったり403だったり503だったりした場合にはこれ

[Patterns]
Name = "Error Page to Cache Page (2006-12-08 +1)"
Active = TRUE
URL = "$RESP((403|404|503)*)|$KEYCHK(C)"
Limit = 64
Match = "$RESP(\0)$STOP()"
Replace = "<h1>  \0</h1>  \n"
"<a href="http://web.archive.org/web/*/\u">Internet Archive</a>  \n"
"<a href="http://www.google.co.jp/search?q=cache:\u">Google cache (co.jp)</a>  \n"
"<a href="http://www.google.com/search?q=cache:\u">Google cache (com)</a>  \n"
"<a href="http://megalodon.jp/?url=\u">ウェブ魚拓</a>"



どちらもproxomitronスレで教えて頂いたもので
すごく感謝しつつ入れさせて貰っています

305 :名無しさん@勉強中 ★:07/12/03 23:41:37 ID:???
いやーpythonすげーやすげー。
こんな事もあんな事も出来るのか。


python版dat2htmlは意外に簡単に出来そうです。
python版htmltodatのほうも 無い頭を絞ればできるかもしれない
てか そう思ってなきゃ 何も出来やしない
まあ口だけで終わってしまっても別にいいんですが。


問題は、作ったスクリプトが
自分とこでうまく動いたとしても
LinuxやMac環境で使えるのかどうかという事で。

あと、同じwindowsでのpython環境でも
色々バリエーションがあるようで。
本家Pythonおよび日本語移植Pythonのみならず
ActivePythonやらIronPythonやらあるみたいなんですが
果たして同じ動作をするのだろうかと。

306 :名無しさん@勉強中 ★:07/12/04 08:24:50 ID:???
と書いてから>>292のpython版html2datを思い出したので
今朝やってみたら


使えるではないですか!!


正規表現は
htmltodatでいうところの「read.cgi.7.00?」決め打ちみたいですが
これはその箇所を書き換えれば良いだけの話で。

という事で
>>282もこれを用いてdat化出来そうです。
文字コードUTF-8にして
スクリプト中のコード指定も

# -*- encoding: shift_jis -*-



# -*- encoding: UTF-8 -*-

にして
適当な正規表現に書き直して実行すれば良さそう。

307 :名無しさん@勉強中 ★:07/12/04 21:01:57 ID:???
いずれにしても正規表現を書かなければdat化出来ぬ
こうかな

URL
http://cn2ch.cn/bbs/test/read.cgi/cn2ch/1169813975/

正規表現
m#<dt><input.+?><a.+?>([0-9]+)</a>.+?<b>(?:<a href="mailto:(.+?)">)?(.+?)(?:</a>)?</b>(?:</font>)? (.+?)<dd>(.+?)<br><br>(<dt>|</dl>)#mik

後処理
s#((?:^|\n).*?)(◆.+?)<>(.*?)<>#$1</b>$2<b><>$3<>#igk
wu G:\DOEVIEW051128\NIDAUTF8\NIDA070202\Logs\2ch\中国2ch\cn2ch\1169813975.dat


後処理のwコマンドはhtmltodat-convert.wsfで自動生成したものですが
UTF-8保存しないといけないので(付加機能感謝です)
「wu」としないと文字化けするです。

で、これでいいと思うんですが
Shift_Jisの文字コードでは存在しないような簡体中国文字フォントの部分が
ことごとく「????」になってしまうのは
さてどうしたものか・・・
逆に 例えばレス115等は何の問題もなく変換できてますが。
簡略化されて骨と皮みたいな感じの漢字とはいえ
或る程度内容を理解する手助けになる訳だし
選択して外部コマンドで飛ばして翻訳する事も出来るので何とかしたいところ。


python版html2datを
それ用にプチハック(カッケー!)するしかないのかな?
これって、フォルダ内一括dat変換とかも出来るようですし
改めてwshで車輪の再々発明とかするような気にもならんです

308 :名無しさん@勉強中 ★:07/12/05 12:42:10 ID:???
Python で日本語を扱う基本をまとめてみるメモ(その1) - 猫(=・ω・=)顔 1.0β
http://d.hatena.ne.jp/nyagao/20070805/1186314723

309 :名無しさん@勉強中 ★:07/12/05 19:31:17 ID:???
・・・よし、上手くいったかも。
dat化したものをJaneNidaの該当フォルダに入れてに見てみたところ
文字化けも無い感じ。
ただ、TeraPad/xyzzyどちらで開いても
最初Shift_Jisで認識してしまいますね。
まあ大勢に影響は無さそうですが。

では適当なhtmlをDLしてdat化して
読んでみますか。

310 :名無しさん@勉強中 ★:07/12/05 19:54:28 ID:???
>>292のスクリプト中の正規表現なんですが
43行目あたりの

−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
# <dt>〜(?=<dt>)抽出
mo = re.match('.*?<dt><input.+?><a.+?>(.*?)<br><br>((?=(<dt>|</dl>)).*)', htmlstr)
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

ここで前スレ754で少し触れた肯定先読みの式を使ってるんですけど
これってどういう意味なのでしょうか。
Bregexp.dllとかで使えない使い方だからか 検索してもよくわかんないです


というかそれ以前に
上のって
カッコの中にカッコがあって
更にカッコがもひとつあるんですが
んもう頭がこんがらがってしまってるです

311 :名無しさん@勉強中 ★:07/12/05 20:12:10 ID:???
という事で
非windows環境での諸ミラーサイトのhtmlを各自dat化してもらうような事も
何とかなりそうですね。
MacやLinux(Fedora系だけかな)でPythonが標準装備されているそうですし。

ただ、実際に使えるかどうかは
誰か試して下さる方が出てこない事にはどうにもなりませんが
今のところ そういう方も居られないようなので
気が向いたらそのうちやってみようかなと。

312 :名無しさん@勉強中 ★:07/12/05 20:28:06 ID:???
と書いてからpythonスレを巡回してたら

Pythonのお勉強 Part22
http://pc11.2ch.net/test/read.cgi/tech/1196426978/58
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
58 名前:デフォルトの名無しさん[] 投稿日:2007/12/05(水) 18:44:02
2chのログを保存しているサイト(みみずん、snapshot 2ch等)からログを引っ張ってきて、
dat形式に変換してローカルに保存したいのですが、
自分がうんこ野郎なので、webサイトから何かしらのデータを取得する方法が分かりません。
主にどのようなライブラリを使えば良いのでしょうか?
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


何というタイミング・・・


とりあえず58さんの環境を知りたく思ったですが
python初心者の自分が出てもグダグダになるだろうなと

313 :名無しさん@勉強中 ★:07/12/06 17:13:51 ID:???
windowsをお使いの方みたいですね。
とりあえず投稿してみようかな


さて
出来たです。やったー。

http://www.geocities.jp/mirrorhenkan/others/img/cn2ch20071206.png

で、これをやっているうちに
右上窓のほうでも外部コマンドが出来ればいいなと思ったです。
あと それとの絡みで
やはりwshでhtmltodatみたいなスクリプトを作ったほうが
今まで作ったものを一部流用出来るなーと。

314 :名無しさん@勉強中 ★:07/12/08 08:03:50 ID:???
さて
やはり動的に取得したいなと
phpでhtmlをdat化するプロキシCGIを書いてみましたが(てかツギハギコピペ^^;)
これをJaneNidaで読み込ませるにはどうしたものでしょう。

あとで要望してみますか。

315 :名無しさん@勉強中 ★:07/12/08 17:55:35 ID:???
作ったものはこちら

http://mirror.s206.xrea.com/x/htmltodat/?url=http://cn2ch.cn:80/bbs/test/read.cgi/cn2ch/1172006580/

dat化の対象htmlはこれ

http://cn2ch.cn:80/bbs/test/read.cgi/cn2ch/1172006580/

で、問題なんですが

これをproxomitronで読み込んだ場合
なぜか上のスレだけ レス1の本文が表示されないのです。
ポップアップでは表示出来るので不思議。
ちなみに他のスレではOKなのでなお不思議。
UTF-8のdatはJaneNidaでしか読み込めないので
他で訊けないのだよなー。

それと、思い上がる訳ではないのですが
こんな事やってる方ってそうそう居られないと思うので
要望して、万一「需要はあるの?」とか言われたら返答に困りますし。

316 :名無しさん@勉強中 ★:07/12/08 18:30:02 ID:???
さて次は
wshでhtmltodatのようなものですかね。 (←書いただけかも)
cn2chのような dat直読み出来ない板を専用ブラウザで読みたい場合
dat化CGI経由よりはDLして自前dat化させるほうが
自給自足的で良さそうじゃないですか。

何より、文字コードUTF-8で
繁体・簡体その他の文字混じりのhtmlをdat化させようとしても
現状 誰もやってくれなさそうですし。
仕方無いので独りコツコツと暗中模索するしかない。


と書いただけかも。

317 :名無しさん@勉強中 ★:07/12/08 19:48:30 ID:???
要望を書かせて頂いたです

http://pc11.2ch.net/test/read.cgi/software/1195310686/358

もし、datの位置をある程度自由に設定出来るようになったとしたら
megaBBSをはじめとして 結構多くの掲示板が読めるようになるのではないかなと。
で、それ以外の形式の掲示板でも
dat化CGI経由で読み込むように設定すれば(dat化CGIは作らなければいけないですが)
ものすごく選択肢が拡がるのではないかと思うです。
まあスルーされたらそれまでの話ですけど。


で、>>315のdat化スクリプトも出しておくです

http://mirror.s206.xrea.com/x/htmltodat/htmltodat.phps

正規表現の箇所と次の始端(この場合は「<DT>」)のところを変更すれば
他のhtmlにも使えると思うです。
前処理・後処理・変換結果式等はつけてないですが、まあ何とかなるのではないかと。

それにしても、慣れているからか
他言語と比べて phpは理解し易いなー。

318 :名無しさん@勉強中:07/12/09 00:21:37 ID:bZpZAxtN
プロキシでhtmlからdatに変換しつつ取得する場合、
「差分取得」は原理的に無理ですよね?

であれば毎回全部取得するしかないと思うのですが
Janeの場合、レスポンスが206でなく200の場合
(Range: が指定されていない場合かも)
内部で自動的に差分だけをマージするような動作を
してくれていたと思うのです。

以前様なプロキシを作った経験より。

319 :名無しさん@勉強中 ★:07/12/09 12:16:17 ID:???
何だか大変な事に首突っ込んじゃったかなぁ・・・
まあ頭の体操という事で。

>>318
これはこれは。先輩ですね。
どの言語でプロキシをお作りになられたのか知りたかったり。


> プロキシでhtmlからdatに変換しつつ取得する場合、
> 「差分取得」は原理的に無理ですよね?

「原理的に無理」という事はないと思うです。
例えば したらば掲示板とかdatの差分取得出来てますし。

例を出すと、例えば下記スレ

http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/

これのdatは下記

http://jbbs.livedoor.jp/bbs/rawmode.cgi/computer/1929/1038588508/

つまり、したらば掲示板のdatは
httpリクエストがあったら リダイレクトなり何なりして
datを都度生成(=リダイレクト)する 動的なものだと思われます。
とはいえレスポンスヘッダ(カッケー!)を見ても
ステータスコード304や200や206を返してますし
Content-Lengthも返ってきており
差分取得も 問題なく出来ているので。


この辺りの事って、したらば掲示板作者のけんすうさんに
訊いてみてもいいかもですが
まあいいや・・。

ロケスタ社長日記
http://blog.livedoor.jp/kensuu/
けんすうライフログ
http://d.hatena.ne.jp/kensuu/
ひとり開発ブログ
http://blog.ideami.jp/

320 :名無しさん@勉強中 ★:07/12/09 12:50:02 ID:???
繰り返しになりますが
他言語では判りませんが(したらばはperlかな)
phpでは出来なくもないかなと。
少なくとも「原理的に無理」という事は無いと思うです。


差分取得の場合、
・If-Modified-SincenリクエストによるLast-Modified(ファイルの更新時間)取得
・ステータスコードの戻り値(更新ならHTTP/1.1 206 Partial Contentだったかな)
・Range: bytes

を見ているように思えるので
そのようにヘッダを返してやるだけで良いと思うです。
phpのheader命令に適切な値を入れれば良さそう。
詳しくは下記

header
http://php.s3.to/man/function.header.html


>>317のスクリプトソースでいうと

header("Content-Type:text/plain");

に続いて
例えば

header("HTTP/1.1 206 Partial Content");
header("Last-Modified: Sat, 08 Dec 2005 14:25:19 GMT");
header("Content-Length: 3378");

とやれば(したらばdatのように)静的ファイルのようなレスポンスを返せそうですし
従って差分取得も可能になるのではないかと。

試しにやってみましたが
書いた通りのヘッダやステータスを返してますね。

http://mirror.s206.xrea.com/x/htmltodat/test.php


ソースは下記
スレッドのタイトルを取得するテストに使ったものの再利用ですが。

<?php
$url = "http://cn2ch.cn/bbs/test/read.cgi/cn2ch/1169813975/";
$source_array = file($url);
$source = join("", $source_array);
eregi("<title.*>(.*)</title>", $source, $title);
header("HTTP/1.1 206 Partial Content");
header("Last-Modified: Sat, 08 Dec 2005 14:25:19 GMT");
header("Content-Length: 3378");
echo $title[1];
php?>

321 :名無しさん@勉強中 ★:07/12/09 13:02:36 ID:???
>>319追加

100日プログラミング
http://100prog.com/

けんすうさん、phpを始めて100日足らずとの事ですが
やはり凄いなと。

って、そういえば
自分もpython始めてまだ3週間足らずだけど
比べちゃいかん

322 :名無しさん@勉強中 ★:07/12/09 13:20:32 ID:???
>>320続き

もしやるとすると

・dat化プロキシにhttpリクエスト

・dat化させたものの最終レスの時間をGMT化してlast-modifiedに格納
 httpリクエストのIf-Modified-Sinceの時間の項目と比較:
 項目そのものが無かったらステータス200
 同じならステータス304
 違っていたらステータス206

・ステータス200 or 206の場合
 dat化したテキストファイルのバイト数を取得して
 Content-Lengthに格納

・レスポンス


この流れで良いのではないかと。
まあやってみないとわかりませんが。


・・・というか
今日は時間がとれなさそうなんですが・・・。

323 :名無しさん@勉強中 ★:07/12/09 14:27:04 ID:???
ところで>>320のソースなんですが

eregi("<title.*>(.*)</title>", $source, $title);

の正規表現の部分、
ほんとは最短一致で

eregi("<title.*?>(.*)</title>", $source, $title);

とやりたかったんですが
こうやると「eregiの書式が変です」みたいなエラーが出るのですが
何でなのでしょうか。
php特有の問題なのかな。
phpでは最短一致の「?」って使えないんでしょうか。

ここ見てるかもしれない人でphpに詳しそうな方というと
com-nika.osask.jpのnikaさんとか
2se.dyndns.orgのsyoboonさんとか
namahageのひろせあさんとかですかね。
sane.justblog.jpの實松アウトプットさんも見てるかもしれないですが。

324 :名無しさん@勉強中 ★:07/12/09 15:22:57 ID:???
書いたです
ちょっと余裕が無かったので>>317を自己コピペしたりして

http://pc11.2ch.net/test/read.cgi/software/1195310686/383

でもこれって、読む人によっては
顔を真っ赤にして涙目になりながら
必死に反論しているような文章に見えるのかもしれないなぁ
全然そんな事はないんだけどなぁ

325 :名無しさん@勉強中 ★:07/12/09 16:03:50 ID:???
>>318後半
> Janeの場合、レスポンスが206でなく200の場合
> (Range: が指定されていない場合かも)
> 内部で自動的に差分だけをマージするような動作を
> してくれていたと思うのです。

という事は、
datファイル(のようなもの)が更新されているorローカルに該当datが無い場合は
どちらでも200を返しておいてもいいという事ですか。

あと実は
「マージ」ってよくわかんなかったり。

http://www.google.com/url?sa=t&ct=res&cd=1&url=http%3A%2F%2Fe-words.jp%2Fw%2FE3839EE383BCE382B8.html&ei=1ZJbR5bxBJamswLv1YiIBw&usg=AFQjCNG56KvMvaqO5MVodbm1aX5cRxsJZg&sig2=WyyOB07q51ECwy7lZ_tWrw
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
【マージ】 「合併する」「融合する」といった意味の英単語で、複数のファイルやデータ、
プログラムなどを、決められたルールに従って一つに統合すること。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

なるほど
差分取得=マージという理解でいいのかな(細かく見たら違うでしょうけど)

326 :名無しさん@勉強中 ★:07/12/09 19:18:39 ID:???
可否はさておき>>322を考えてみますか。
いやー面白いなー。


> ・dat化させたものの最終レスの時間をGMT化してlast-modifiedに格納

http://cn2ch.cn/bbs/test/read.cgi/manhua/1161804392/
を例にとると
最終レス時間はレス64の「2007/11/05 21:11」になるので
何らかの方法でこの文字列を取得して
splitまたは正規表現その他で下記形式に格納
RFC822フォーマット(って何)での日付表示だと
「Fri, 11 May 2007 00:11:21 +0900」となってしまうので
面倒だけど下記

$last_modify = date ("D,d M Y H:i:s", mktime (0,11,21,05,11,2007));

これで$last_modifyには「Fri,11 May 2007 00:11:21」が格納されるので

header("Last-Modified:".$last_modify." GMT");

と付ければLast-Modifiedのヘッダ送信出来上がり
実際試したら出来てます

<?
//2007/11/05 21:11
$last_modify = date ("D,d M Y H:i:s", mktime (0,11,21,05,11,2007));
header("Last-Modified:".$last_modify." GMT");
echo $last_modify;
?>

327 :名無しさん@勉強中 ★:07/12/09 19:50:17 ID:???


> httpリクエストのIf-Modified-Sinceの時間の項目と比較:
> 項目そのものが無かったらステータス200
> 同じならステータス304
> 違っていたらステータス206

クライアント(カッケー!)からのIf-Modified-Sinceリクエストは
「$_SERVER['HTTP_IF_MODIFIED_SINCE']」で取得出来るみたい
サーバによって出来なかったりするみたいですが。

なので、issetでリクエスト取得可否を調べてからUNIXタイムスタンプに変更。

$if_modified_since = isset($_SERVER['HTTP_IF_MODIFIED_SINCE']) ?
// UNIX タイムスタンプに変換
str2time( stripslashes( $_SERVER['HTTP_IF_MODIFIED_SINCE'])) : false;

これを>>326のUNIXタイムスタンプ化したものと比較して

(1)項目そのものが無かったら

header("HTTP/1.1 200 OK");

(2)変化なしなら

header("HTTP/1.1 304 Not Modified");

(3)タイムスタンプが違っていたら

header("HTTP/1.1 206 Partial Content");


をそれぞれ付けてやれば良さそうです。



参考URL:
PHP で If-Modified-Since に対応してみる -avoidnote-
http://www.avoidnote.com/archives/2005/07/modified_since.php
モジュール版PHPで「If-Modified-Since」に対応する
http://www.arielworks.net/articles/2004/0125a

328 :名無しさん@勉強中:07/12/09 21:58:02 ID:bZpZAxtN
>> プロキシでhtmlからdatに変換しつつ取得する場合、
>> 「差分取得」は原理的に無理ですよね?

言葉足らずだったかもしれません。
例えばJaneで差分取得する場合、
1:2ch>取得済みのdatのバイト数からRangeでリクエストしdatを取得する
2:したらば>取得済みのdatのスレ数からrawmode.cgiでリクエストしdatを取得する
3:まちBBS>取得済みのdatのスレ数からhtmlを取得しdat変換する

少なくともこれくらいのバリエーションがあるわけです。
基本はもちろん1なので、「差分取得が原理的に無理」ていうのはそういう意味です。
(2,3はURLを判別してのスペシャル処理なので)

で、プロキシでhtmlからdatに変換しつつ取得する場合となると
多分まちBBS方式になるでしょう。
でもそれはBBSの種類により方式が異なる可能性が高いわけで
それを専ブラ作者にいちいち対応してもらえるのも難しいでしょうから
結局プロキシ側で吸収するしかないと思われます。
バリエーションが増えてくると対応するのは大変でしょう。

あと、「差分」を確認するためにはローカルのdatを都度読まないといけないと
思われますがこれも意外に敷居が高いと思います。


> あと実は
> 「マージ」ってよくわかんなかったり。

まあ言葉の意味はどうでもいいんですが実際試してみるといいと思います。
ある程度取得済みのスレにレスポンス206で返すと全部追加される
はずですが、200だと取得済みのレスとの比較を行って新たに追加された
レスだけ追加されると思います。

329 :名無しさん@勉強中 ★:07/12/10 20:50:42 ID:???
ぐあー余裕が無いー。

>>328
えーと、もしかしたら 前々スレ191-193の
謎の通りすがりさんのように実はとても凄いお方の御降臨なのかもしれず。。
もしそうだとしたら 釈迦に説法 平に平に御容赦頂きたく。
(って 相手によって態度を変えている訳でもないですが)

で、早速ですが

> で、プロキシでhtmlからdatに変換しつつ取得する場合となると
> 多分まちBBS方式になるでしょう。
> でもそれはBBSの種類により方式が異なる可能性が高いわけで
> それを専ブラ作者にいちいち対応してもらえるのも難しいでしょうから
> 結局プロキシ側で吸収するしかないと思われます。

・・・えーと。
もう作ってあるのは判っておられますよね。
>>315でも出しましたが再掲すると

http://mirror.s206.xrea.com/x/htmltodat/?url=http://cn2ch.cn/bbs/test/read.cgi/cn2ch/1172006580/

dat化したこれの元スレは

http://cn2ch.cn/bbs/test/read.cgi/cn2ch/1172006580/

という事なのですが。

で、差分取得云々という事なので調べてたら
レスポンスヘッダのステータスコードやContent-Length等を適切に返せば良さそうなので
phpでそのような事も出来そうだな(>>320)という事だったんですが。


んもー
何でみんな判ってくれないのかなー。
subject.txtは読み込めるけどdat直読み出来ない板(http://cn2ch.cn/)を
専用ブラウザでストレスなく読みたいだけなんだけどなー。
これが文字コードShift_Jisの板なら
htmltodat-convert.wsf(http://www.geocities.jp/mirrorhenkan/jane/htmltodat-convert/
でOKなんだけどなー。
これが文字コードUTF-8なので使えないもんだから
pythonやphpでdat化する方策を模索しただけなんだけど。
で、何とかdat化プロキシが出来たっぽいから
datの位置を(datフォルダ固定でなく)別個設定出来るようにして欲しかっただけの話で。

subject.txtは問題なく読み込めるので
どのスレッドが更新されたかとかはスレッド一覧で問題なくわかるんですよ。
そのスレだけdat化プロキシ経由で取得すれば良いだけの話なんで
差分取得云々は正直どうでもいい。

で、結局何をしたいかというと
現地の方が現地語で「萌え〜☆」とか書いてるのを見てみたいだけなんですが。
例えば下
笑わば笑え

“常萌”有希?
http://cn2ch.cn/bbs/test/read.cgi/COSPLAY/1161396248/

330 :名無しさん@勉強中 ★:07/12/10 21:01:00 ID:???
ちなみに、phpinfo()を見ると
xreaでは$_SERVER['HTTP_IF_MODIFIED_SINCE']が使えないみたいです。

phpinfo()
http://mirror.s206.xrea.com/x/htmltodat/phpinfo.php

途中にある「last_modified」の項目が0になっていますし
print_r($_SERVER)で環境変数一覧を出力してもlast_modifiedがないみたい。
環境変数を取得出来ないとなると
>>327自体が無意味になってしまうです。

この環境変数を使えるphp可のサーバを探すのも何ですし
とりあえず棚上げですね。
使えれば本当にうまくいきそうなんだけどなー。

331 :名無しさん@勉強中 ★:07/12/10 21:22:35 ID:???
繰り返しになりますが
単にdatの読み込み先を変えたいだけなんですよ。
勿論、まちBBSのようにhtmlをdat化する機能を内蔵して頂けたら有り難いんですが。
例えば えまのんとかだと htmltodatでいう「read.cgi.7.00?」のhtmlだけですが2CI化してくれるみたい。

proxomitronを使えばリダイレクトとかも出来るんですが
出来ればそのまま読み込めたほうがいいなと。
フィルタを使うとしたら下記
キーボードのCとZを押しながら読み込めばプロキシCGI経由になるです


[HTTP headers]
In = FALSE
Out = TRUE
Key = "URL: Non-dat BBS to ProxyCGI (Out)"
URL = "$KEYCHK(Z)$KEYCHK(X)"
Match = "http://(*)\0/([^/]+)\1/(dat/|kako/\d+/\d+/)(*)\2.(dat|dat\.gz)"
Replace = "$RDIR(http://mirror.s206.xrea.com/x/htmltodat/?url=http://\0/test/read.cgi/\1/\2/)$FILTER(false)"



って
こういう事書いてもわかる方にしかわかんなさそうですし
わかんない方には導入方法とかから伝えるのも前スレ283以降ので私には不適格だと思いましたし
わかる方には 何だその程度の低いショボいフィルタはとか言われそうだし
そういう事を考えると
って何言いたいのだ私は

332 :名無しさん@勉強中 ★:07/12/10 21:40:10 ID:???


http://pc11.2ch.net/test/read.cgi/software/1195310686/386
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
スレッド一覧で外部コマンドが使えるというのは便利ですよね。
スクリプトにURLを渡してやることで色々と応用が利きそうです。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


ではwshでhtmltodatのようなものを作りますか。
dat変換用の正規表現中で2バイト文字(UTF-8なら3バイト文字か)を使わなければ
どの文字コードでも問題なくdat化出来るみたいですし。

車輪の再々発明になりますが、本家でUTF-8のファイルがdat化出来ないみたいですし
それなりに意味はありそうです。

333 :名無しさん@勉強中 ★:07/12/10 21:43:42 ID:???
>>331訂正

×キーボードのCとZを押しながら

○キーボードのXとZを押しながら

334 :318=328:07/12/10 23:30:11 ID:yolwaXMk
誤解されておられるかもしれないですが、
貴方のやろうとしてることを否定しているわけでは全然ないですよ。
ただ、自分の経験上、同様のソフトで一番面倒だったのは差分取得の部分だったので
指摘しておきたかっただけで。

> 差分取得云々は正直どうでもいい。
のなら無視してもらっていいです。

335 :名無しさん@勉強中 ★:07/12/11 02:17:44 ID:???
いえ、別に誤解しているつもりもないです。

ただ、転送量がシビアなものとかなら別ですが
あまり過度のアクセスもなさそうなものの場合
わざわざ難しく考えなくても良さそうな感じがするだけです

経験の浅い者が書いても空疎なだけですが
そもそもdatの差分取得の重要性というのは
read.cgi経由の取得ではCGI・転送量の両方とも負荷が高いので
CGI不可のない静的なdatを 
そして転送量を抑えるために差分取得を という流れで出た話だと思うのですが
一般的に言われている差分取得の意義ってそういう風な理解で良いんですよね。

となると
read.cgiのみ閲覧出来て dat直読み不可の板を閲覧する場合
そういうのってあまり意味がないような気がするのですが。

てか そんなワッショイワッショイと人が集まるようなものだったらまた考え直しますが
そこまでアクセス集中するようなものでもないと思うのです。
浅墓かな。

336 :名無しさん@勉強中 ★:07/12/11 02:31:53 ID:???
という事で
wshでhtmltodatのようなものを出しとくです

http://www.geocities.jp/mirrorhenkan/wsh/htmltodat/htmltodat_wsh_0_0_1.zip

試作品という事でsample.htmlをdat化させるだけのスクリプト
案ずるより産むが易しで 思ったより簡単に出来たです。

やたらに時間がかかるです。
いったん丸ごとデータ取得する箇所で時間をとられるみたい。
で、データ取得後のdat化はそう時間はかからない感じです。
この辺 いろいろ改良の余地がありそう。
って 続けるならの話ですが。
反応とかも期待してないですし。

pythonのhtml2datとかだと
何十個ものhtmlをスココンスココンとあっという間にdat化してくれたので
wsh版も同じくらいのスピードと途中経過の可視化が出来たら面白いかなと。

337 :名無しさん@勉強中 ★:07/12/11 08:24:25 ID:???
ちょっと昨晩の文を読んで反省したです。
有用な助言を頂きながら 何も活かせずに過ぎてしまうのかなと。
そのうち裸の王様になってしまうかも
いやなっているのかも。



>>309で使った
python版html2datも出しておくです

http://www.geocities.jp/mirrorhenkan/python/htmltodat_for_cn2ch.zip

html2dat_UTF8.pyと35個のhtmlファイルが入っているので
pyファイルを実行(ダブルクリック)すれば全部dat化されると思うです

pythonが入っている人しか使えないものなのでwindows環境ではほとんど居ないと思うですが
Mac/Linuxではほぼ標準で入っているそうなので
そのような環境で余裕がある方は試してみて頂きたく。

良かったら結果を教えて頂きたく思うです

500KB
続きを読む

掲示板に戻る 全部 前100 次100 最新50
名前: E-mail(省略可)

0ch BBS 2006-02-27