楽天モバイル[UNLIMITが今なら1円]
ECナビでポインと Yahoo 楽天
LINEがデータ消費ゼロで月額500円〜!
無料ホームページ 無料のクレジットカード 海外格安航空券 解約手数料0円【あしたでんき】
海外旅行保険が無料! 海外ホテル
■掲示板に戻る■ 全部 1- 101- 201- 301- 401- 501- 601- 701- 最新50
メモ3
- 1 :名無しさん@勉強中 ★:07/08/04 06:09:43 ID:???
- またまた思いついた事など
- 307 :名無しさん@勉強中 ★:07/12/04 21:01:57 ID:???
- いずれにしても正規表現を書かなければdat化出来ぬ
こうかな
URL
http://cn2ch.cn/bbs/test/read.cgi/cn2ch/1169813975/
正規表現
m#<dt><input.+?><a.+?>([0-9]+)</a>.+?<b>(?:<a href="mailto:(.+?)">)?(.+?)(?:</a>)?</b>(?:</font>)? (.+?)<dd>(.+?)<br><br>(<dt>|</dl>)#mik
後処理
s#((?:^|\n).*?)(◆.+?)<>(.*?)<>#$1</b>$2<b><>$3<>#igk
wu G:\DOEVIEW051128\NIDAUTF8\NIDA070202\Logs\2ch\中国2ch\cn2ch\1169813975.dat
後処理のwコマンドはhtmltodat-convert.wsfで自動生成したものですが
UTF-8保存しないといけないので(付加機能感謝です)
「wu」としないと文字化けするです。
で、これでいいと思うんですが
Shift_Jisの文字コードでは存在しないような簡体中国文字フォントの部分が
ことごとく「????」になってしまうのは
さてどうしたものか・・・
逆に 例えばレス115等は何の問題もなく変換できてますが。
簡略化されて骨と皮みたいな感じの漢字とはいえ
或る程度内容を理解する手助けになる訳だし
選択して外部コマンドで飛ばして翻訳する事も出来るので何とかしたいところ。
python版html2datを
それ用にプチハック(カッケー!)するしかないのかな?
これって、フォルダ内一括dat変換とかも出来るようですし
改めてwshで車輪の再々発明とかするような気にもならんです
- 308 :名無しさん@勉強中 ★:07/12/05 12:42:10 ID:???
- Python で日本語を扱う基本をまとめてみるメモ(その1) - 猫(=・ω・=)顔 1.0β
http://d.hatena.ne.jp/nyagao/20070805/1186314723
- 309 :名無しさん@勉強中 ★:07/12/05 19:31:17 ID:???
- ・・・よし、上手くいったかも。
dat化したものをJaneNidaの該当フォルダに入れてに見てみたところ
文字化けも無い感じ。
ただ、TeraPad/xyzzyどちらで開いても
最初Shift_Jisで認識してしまいますね。
まあ大勢に影響は無さそうですが。
では適当なhtmlをDLしてdat化して
読んでみますか。
- 310 :名無しさん@勉強中 ★:07/12/05 19:54:28 ID:???
- >>292のスクリプト中の正規表現なんですが
43行目あたりの
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
# <dt>〜(?=<dt>)抽出
mo = re.match('.*?<dt><input.+?><a.+?>(.*?)<br><br>((?=(<dt>|</dl>)).*)', htmlstr)
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
ここで前スレ754で少し触れた肯定先読みの式を使ってるんですけど
これってどういう意味なのでしょうか。
Bregexp.dllとかで使えない使い方だからか 検索してもよくわかんないです
というかそれ以前に
上のって
カッコの中にカッコがあって
更にカッコがもひとつあるんですが
んもう頭がこんがらがってしまってるです
- 311 :名無しさん@勉強中 ★:07/12/05 20:12:10 ID:???
- という事で
非windows環境での諸ミラーサイトのhtmlを各自dat化してもらうような事も
何とかなりそうですね。
MacやLinux(Fedora系だけかな)でPythonが標準装備されているそうですし。
ただ、実際に使えるかどうかは
誰か試して下さる方が出てこない事にはどうにもなりませんが
今のところ そういう方も居られないようなので
気が向いたらそのうちやってみようかなと。
- 312 :名無しさん@勉強中 ★:07/12/05 20:28:06 ID:???
- と書いてからpythonスレを巡回してたら
Pythonのお勉強 Part22
http://pc11.2ch.net/test/read.cgi/tech/1196426978/58
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
58 名前:デフォルトの名無しさん[] 投稿日:2007/12/05(水) 18:44:02
2chのログを保存しているサイト(みみずん、snapshot 2ch等)からログを引っ張ってきて、
dat形式に変換してローカルに保存したいのですが、
自分がうんこ野郎なので、webサイトから何かしらのデータを取得する方法が分かりません。
主にどのようなライブラリを使えば良いのでしょうか?
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
何というタイミング・・・
とりあえず58さんの環境を知りたく思ったですが
python初心者の自分が出てもグダグダになるだろうなと
- 313 :名無しさん@勉強中 ★:07/12/06 17:13:51 ID:???
- windowsをお使いの方みたいですね。
とりあえず投稿してみようかな
さて
出来たです。やったー。
http://www.geocities.jp/mirrorhenkan/others/img/cn2ch20071206.png
で、これをやっているうちに
右上窓のほうでも外部コマンドが出来ればいいなと思ったです。
あと それとの絡みで
やはりwshでhtmltodatみたいなスクリプトを作ったほうが
今まで作ったものを一部流用出来るなーと。
- 314 :名無しさん@勉強中 ★:07/12/08 08:03:50 ID:???
- さて
やはり動的に取得したいなと
phpでhtmlをdat化するプロキシCGIを書いてみましたが(てかツギハギコピペ^^;)
これをJaneNidaで読み込ませるにはどうしたものでしょう。
あとで要望してみますか。
- 315 :名無しさん@勉強中 ★:07/12/08 17:55:35 ID:???
- 作ったものはこちら
http://mirror.s206.xrea.com/x/htmltodat/?url=http://cn2ch.cn:80/bbs/test/read.cgi/cn2ch/1172006580/
dat化の対象htmlはこれ
http://cn2ch.cn:80/bbs/test/read.cgi/cn2ch/1172006580/
で、問題なんですが
これをproxomitronで読み込んだ場合
なぜか上のスレだけ レス1の本文が表示されないのです。
ポップアップでは表示出来るので不思議。
ちなみに他のスレではOKなのでなお不思議。
UTF-8のdatはJaneNidaでしか読み込めないので
他で訊けないのだよなー。
それと、思い上がる訳ではないのですが
こんな事やってる方ってそうそう居られないと思うので
要望して、万一「需要はあるの?」とか言われたら返答に困りますし。
- 316 :名無しさん@勉強中 ★:07/12/08 18:30:02 ID:???
- さて次は
wshでhtmltodatのようなものですかね。 (←書いただけかも)
cn2chのような dat直読み出来ない板を専用ブラウザで読みたい場合
dat化CGI経由よりはDLして自前dat化させるほうが
自給自足的で良さそうじゃないですか。
何より、文字コードUTF-8で
繁体・簡体その他の文字混じりのhtmlをdat化させようとしても
現状 誰もやってくれなさそうですし。
仕方無いので独りコツコツと暗中模索するしかない。
と書いただけかも。
- 317 :名無しさん@勉強中 ★:07/12/08 19:48:30 ID:???
- 要望を書かせて頂いたです
http://pc11.2ch.net/test/read.cgi/software/1195310686/358
もし、datの位置をある程度自由に設定出来るようになったとしたら
megaBBSをはじめとして 結構多くの掲示板が読めるようになるのではないかなと。
で、それ以外の形式の掲示板でも
dat化CGI経由で読み込むように設定すれば(dat化CGIは作らなければいけないですが)
ものすごく選択肢が拡がるのではないかと思うです。
まあスルーされたらそれまでの話ですけど。
で、>>315のdat化スクリプトも出しておくです
http://mirror.s206.xrea.com/x/htmltodat/htmltodat.phps
正規表現の箇所と次の始端(この場合は「<DT>」)のところを変更すれば
他のhtmlにも使えると思うです。
前処理・後処理・変換結果式等はつけてないですが、まあ何とかなるのではないかと。
それにしても、慣れているからか
他言語と比べて phpは理解し易いなー。
- 318 :名無しさん@勉強中:07/12/09 00:21:37 ID:bZpZAxtN
- プロキシでhtmlからdatに変換しつつ取得する場合、
「差分取得」は原理的に無理ですよね?
であれば毎回全部取得するしかないと思うのですが
Janeの場合、レスポンスが206でなく200の場合
(Range: が指定されていない場合かも)
内部で自動的に差分だけをマージするような動作を
してくれていたと思うのです。
以前様なプロキシを作った経験より。
- 319 :名無しさん@勉強中 ★:07/12/09 12:16:17 ID:???
- 何だか大変な事に首突っ込んじゃったかなぁ・・・
まあ頭の体操という事で。
>>318
これはこれは。先輩ですね。
どの言語でプロキシをお作りになられたのか知りたかったり。
> プロキシでhtmlからdatに変換しつつ取得する場合、
> 「差分取得」は原理的に無理ですよね?
「原理的に無理」という事はないと思うです。
例えば したらば掲示板とかdatの差分取得出来てますし。
例を出すと、例えば下記スレ
http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/
これのdatは下記
http://jbbs.livedoor.jp/bbs/rawmode.cgi/computer/1929/1038588508/
つまり、したらば掲示板のdatは
httpリクエストがあったら リダイレクトなり何なりして
datを都度生成(=リダイレクト)する 動的なものだと思われます。
とはいえレスポンスヘッダ(カッケー!)を見ても
ステータスコード304や200や206を返してますし
Content-Lengthも返ってきており
差分取得も 問題なく出来ているので。
この辺りの事って、したらば掲示板作者のけんすうさんに
訊いてみてもいいかもですが
まあいいや・・。
ロケスタ社長日記
http://blog.livedoor.jp/kensuu/
けんすうライフログ
http://d.hatena.ne.jp/kensuu/
ひとり開発ブログ
http://blog.ideami.jp/
- 320 :名無しさん@勉強中 ★:07/12/09 12:50:02 ID:???
- 繰り返しになりますが
他言語では判りませんが(したらばはperlかな)
phpでは出来なくもないかなと。
少なくとも「原理的に無理」という事は無いと思うです。
差分取得の場合、
・If-Modified-SincenリクエストによるLast-Modified(ファイルの更新時間)取得
・ステータスコードの戻り値(更新ならHTTP/1.1 206 Partial Contentだったかな)
・Range: bytes
を見ているように思えるので
そのようにヘッダを返してやるだけで良いと思うです。
phpのheader命令に適切な値を入れれば良さそう。
詳しくは下記
header
http://php.s3.to/man/function.header.html
>>317のスクリプトソースでいうと
header("Content-Type:text/plain");
に続いて
例えば
header("HTTP/1.1 206 Partial Content");
header("Last-Modified: Sat, 08 Dec 2005 14:25:19 GMT");
header("Content-Length: 3378");
とやれば(したらばdatのように)静的ファイルのようなレスポンスを返せそうですし
従って差分取得も可能になるのではないかと。
試しにやってみましたが
書いた通りのヘッダやステータスを返してますね。
http://mirror.s206.xrea.com/x/htmltodat/test.php
ソースは下記
スレッドのタイトルを取得するテストに使ったものの再利用ですが。
<?php
$url = "http://cn2ch.cn/bbs/test/read.cgi/cn2ch/1169813975/";
$source_array = file($url);
$source = join("", $source_array);
eregi("<title.*>(.*)</title>", $source, $title);
header("HTTP/1.1 206 Partial Content");
header("Last-Modified: Sat, 08 Dec 2005 14:25:19 GMT");
header("Content-Length: 3378");
echo $title[1];
php?>
- 321 :名無しさん@勉強中 ★:07/12/09 13:02:36 ID:???
- >>319追加
100日プログラミング
http://100prog.com/
けんすうさん、phpを始めて100日足らずとの事ですが
やはり凄いなと。
って、そういえば
自分もpython始めてまだ3週間足らずだけど
比べちゃいかん
- 322 :名無しさん@勉強中 ★:07/12/09 13:20:32 ID:???
- >>320続き
もしやるとすると
・dat化プロキシにhttpリクエスト
↓
・dat化させたものの最終レスの時間をGMT化してlast-modifiedに格納
httpリクエストのIf-Modified-Sinceの時間の項目と比較:
項目そのものが無かったらステータス200
同じならステータス304
違っていたらステータス206
↓
・ステータス200 or 206の場合
dat化したテキストファイルのバイト数を取得して
Content-Lengthに格納
↓
・レスポンス
この流れで良いのではないかと。
まあやってみないとわかりませんが。
・・・というか
今日は時間がとれなさそうなんですが・・・。
- 323 :名無しさん@勉強中 ★:07/12/09 14:27:04 ID:???
- ところで>>320のソースなんですが
eregi("<title.*>(.*)</title>", $source, $title);
の正規表現の部分、
ほんとは最短一致で
eregi("<title.*?>(.*)</title>", $source, $title);
とやりたかったんですが
こうやると「eregiの書式が変です」みたいなエラーが出るのですが
何でなのでしょうか。
php特有の問題なのかな。
phpでは最短一致の「?」って使えないんでしょうか。
ここ見てるかもしれない人でphpに詳しそうな方というと
com-nika.osask.jpのnikaさんとか
2se.dyndns.orgのsyoboonさんとか
namahageのひろせあさんとかですかね。
sane.justblog.jpの實松アウトプットさんも見てるかもしれないですが。
- 324 :名無しさん@勉強中 ★:07/12/09 15:22:57 ID:???
- 書いたです
ちょっと余裕が無かったので>>317を自己コピペしたりして
http://pc11.2ch.net/test/read.cgi/software/1195310686/383
でもこれって、読む人によっては
顔を真っ赤にして涙目になりながら
必死に反論しているような文章に見えるのかもしれないなぁ
全然そんな事はないんだけどなぁ
- 325 :名無しさん@勉強中 ★:07/12/09 16:03:50 ID:???
- >>318後半
> Janeの場合、レスポンスが206でなく200の場合
> (Range: が指定されていない場合かも)
> 内部で自動的に差分だけをマージするような動作を
> してくれていたと思うのです。
という事は、
datファイル(のようなもの)が更新されているorローカルに該当datが無い場合は
どちらでも200を返しておいてもいいという事ですか。
あと実は
「マージ」ってよくわかんなかったり。
http://www.google.com/url?sa=t&ct=res&cd=1&url=http%3A%2F%2Fe-words.jp%2Fw%2FE3839EE383BCE382B8.html&ei=1ZJbR5bxBJamswLv1YiIBw&usg=AFQjCNG56KvMvaqO5MVodbm1aX5cRxsJZg&sig2=WyyOB07q51ECwy7lZ_tWrw
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
【マージ】 「合併する」「融合する」といった意味の英単語で、複数のファイルやデータ、
プログラムなどを、決められたルールに従って一つに統合すること。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
なるほど
差分取得=マージという理解でいいのかな(細かく見たら違うでしょうけど)
- 326 :名無しさん@勉強中 ★:07/12/09 19:18:39 ID:???
- 可否はさておき>>322を考えてみますか。
いやー面白いなー。
> ・dat化させたものの最終レスの時間をGMT化してlast-modifiedに格納
http://cn2ch.cn/bbs/test/read.cgi/manhua/1161804392/
を例にとると
最終レス時間はレス64の「2007/11/05 21:11」になるので
何らかの方法でこの文字列を取得して
splitまたは正規表現その他で下記形式に格納
RFC822フォーマット(って何)での日付表示だと
「Fri, 11 May 2007 00:11:21 +0900」となってしまうので
面倒だけど下記
$last_modify = date ("D,d M Y H:i:s", mktime (0,11,21,05,11,2007));
これで$last_modifyには「Fri,11 May 2007 00:11:21」が格納されるので
header("Last-Modified:".$last_modify." GMT");
と付ければLast-Modifiedのヘッダ送信出来上がり
実際試したら出来てます
<?
//2007/11/05 21:11
$last_modify = date ("D,d M Y H:i:s", mktime (0,11,21,05,11,2007));
header("Last-Modified:".$last_modify." GMT");
echo $last_modify;
?>
- 327 :名無しさん@勉強中 ★:07/12/09 19:50:17 ID:???
- 次
> httpリクエストのIf-Modified-Sinceの時間の項目と比較:
> 項目そのものが無かったらステータス200
> 同じならステータス304
> 違っていたらステータス206
クライアント(カッケー!)からのIf-Modified-Sinceリクエストは
「$_SERVER['HTTP_IF_MODIFIED_SINCE']」で取得出来るみたい
サーバによって出来なかったりするみたいですが。
なので、issetでリクエスト取得可否を調べてからUNIXタイムスタンプに変更。
$if_modified_since = isset($_SERVER['HTTP_IF_MODIFIED_SINCE']) ?
// UNIX タイムスタンプに変換
str2time( stripslashes( $_SERVER['HTTP_IF_MODIFIED_SINCE'])) : false;
これを>>326のUNIXタイムスタンプ化したものと比較して
(1)項目そのものが無かったら
header("HTTP/1.1 200 OK");
(2)変化なしなら
header("HTTP/1.1 304 Not Modified");
(3)タイムスタンプが違っていたら
header("HTTP/1.1 206 Partial Content");
をそれぞれ付けてやれば良さそうです。
参考URL:
PHP で If-Modified-Since に対応してみる -avoidnote-
http://www.avoidnote.com/archives/2005/07/modified_since.php
モジュール版PHPで「If-Modified-Since」に対応する
http://www.arielworks.net/articles/2004/0125a
- 328 :名無しさん@勉強中:07/12/09 21:58:02 ID:bZpZAxtN
- >> プロキシでhtmlからdatに変換しつつ取得する場合、
>> 「差分取得」は原理的に無理ですよね?
言葉足らずだったかもしれません。
例えばJaneで差分取得する場合、
1:2ch>取得済みのdatのバイト数からRangeでリクエストしdatを取得する
2:したらば>取得済みのdatのスレ数からrawmode.cgiでリクエストしdatを取得する
3:まちBBS>取得済みのdatのスレ数からhtmlを取得しdat変換する
少なくともこれくらいのバリエーションがあるわけです。
基本はもちろん1なので、「差分取得が原理的に無理」ていうのはそういう意味です。
(2,3はURLを判別してのスペシャル処理なので)
で、プロキシでhtmlからdatに変換しつつ取得する場合となると
多分まちBBS方式になるでしょう。
でもそれはBBSの種類により方式が異なる可能性が高いわけで
それを専ブラ作者にいちいち対応してもらえるのも難しいでしょうから
結局プロキシ側で吸収するしかないと思われます。
バリエーションが増えてくると対応するのは大変でしょう。
あと、「差分」を確認するためにはローカルのdatを都度読まないといけないと
思われますがこれも意外に敷居が高いと思います。
> あと実は
> 「マージ」ってよくわかんなかったり。
まあ言葉の意味はどうでもいいんですが実際試してみるといいと思います。
ある程度取得済みのスレにレスポンス206で返すと全部追加される
はずですが、200だと取得済みのレスとの比較を行って新たに追加された
レスだけ追加されると思います。
- 329 :名無しさん@勉強中 ★:07/12/10 20:50:42 ID:???
- ぐあー余裕が無いー。
>>328
えーと、もしかしたら 前々スレ191-193の
謎の通りすがりさんのように実はとても凄いお方の御降臨なのかもしれず。。
もしそうだとしたら 釈迦に説法 平に平に御容赦頂きたく。
(って 相手によって態度を変えている訳でもないですが)
で、早速ですが
> で、プロキシでhtmlからdatに変換しつつ取得する場合となると
> 多分まちBBS方式になるでしょう。
> でもそれはBBSの種類により方式が異なる可能性が高いわけで
> それを専ブラ作者にいちいち対応してもらえるのも難しいでしょうから
> 結局プロキシ側で吸収するしかないと思われます。
・・・えーと。
もう作ってあるのは判っておられますよね。
>>315でも出しましたが再掲すると
http://mirror.s206.xrea.com/x/htmltodat/?url=http://cn2ch.cn/bbs/test/read.cgi/cn2ch/1172006580/
dat化したこれの元スレは
http://cn2ch.cn/bbs/test/read.cgi/cn2ch/1172006580/
という事なのですが。
で、差分取得云々という事なので調べてたら
レスポンスヘッダのステータスコードやContent-Length等を適切に返せば良さそうなので
phpでそのような事も出来そうだな(>>320)という事だったんですが。
んもー
何でみんな判ってくれないのかなー。
subject.txtは読み込めるけどdat直読み出来ない板(http://cn2ch.cn/)を
専用ブラウザでストレスなく読みたいだけなんだけどなー。
これが文字コードShift_Jisの板なら
htmltodat-convert.wsf(http://www.geocities.jp/mirrorhenkan/jane/htmltodat-convert/)
でOKなんだけどなー。
これが文字コードUTF-8なので使えないもんだから
pythonやphpでdat化する方策を模索しただけなんだけど。
で、何とかdat化プロキシが出来たっぽいから
datの位置を(datフォルダ固定でなく)別個設定出来るようにして欲しかっただけの話で。
subject.txtは問題なく読み込めるので
どのスレッドが更新されたかとかはスレッド一覧で問題なくわかるんですよ。
そのスレだけdat化プロキシ経由で取得すれば良いだけの話なんで
差分取得云々は正直どうでもいい。
で、結局何をしたいかというと
現地の方が現地語で「萌え〜☆」とか書いてるのを見てみたいだけなんですが。
例えば下
笑わば笑え
“常萌”有希?
http://cn2ch.cn/bbs/test/read.cgi/COSPLAY/1161396248/
- 330 :名無しさん@勉強中 ★:07/12/10 21:01:00 ID:???
- ちなみに、phpinfo()を見ると
xreaでは$_SERVER['HTTP_IF_MODIFIED_SINCE']が使えないみたいです。
phpinfo()
http://mirror.s206.xrea.com/x/htmltodat/phpinfo.php
途中にある「last_modified」の項目が0になっていますし
print_r($_SERVER)で環境変数一覧を出力してもlast_modifiedがないみたい。
環境変数を取得出来ないとなると
>>327自体が無意味になってしまうです。
この環境変数を使えるphp可のサーバを探すのも何ですし
とりあえず棚上げですね。
使えれば本当にうまくいきそうなんだけどなー。
- 331 :名無しさん@勉強中 ★:07/12/10 21:22:35 ID:???
- 繰り返しになりますが
単にdatの読み込み先を変えたいだけなんですよ。
勿論、まちBBSのようにhtmlをdat化する機能を内蔵して頂けたら有り難いんですが。
例えば えまのんとかだと htmltodatでいう「read.cgi.7.00?」のhtmlだけですが2CI化してくれるみたい。
proxomitronを使えばリダイレクトとかも出来るんですが
出来ればそのまま読み込めたほうがいいなと。
フィルタを使うとしたら下記
キーボードのCとZを押しながら読み込めばプロキシCGI経由になるです
[HTTP headers]
In = FALSE
Out = TRUE
Key = "URL: Non-dat BBS to ProxyCGI (Out)"
URL = "$KEYCHK(Z)$KEYCHK(X)"
Match = "http://(*)\0/([^/]+)\1/(dat/|kako/\d+/\d+/)(*)\2.(dat|dat\.gz)"
Replace = "$RDIR(http://mirror.s206.xrea.com/x/htmltodat/?url=http://\0/test/read.cgi/\1/\2/)$FILTER(false)"
って
こういう事書いてもわかる方にしかわかんなさそうですし
わかんない方には導入方法とかから伝えるのも前スレ283以降ので私には不適格だと思いましたし
わかる方には 何だその程度の低いショボいフィルタはとか言われそうだし
そういう事を考えると
って何言いたいのだ私は
- 332 :名無しさん@勉強中 ★:07/12/10 21:40:10 ID:???
- で
http://pc11.2ch.net/test/read.cgi/software/1195310686/386
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
スレッド一覧で外部コマンドが使えるというのは便利ですよね。
スクリプトにURLを渡してやることで色々と応用が利きそうです。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
ではwshでhtmltodatのようなものを作りますか。
dat変換用の正規表現中で2バイト文字(UTF-8なら3バイト文字か)を使わなければ
どの文字コードでも問題なくdat化出来るみたいですし。
車輪の再々発明になりますが、本家でUTF-8のファイルがdat化出来ないみたいですし
それなりに意味はありそうです。
- 333 :名無しさん@勉強中 ★:07/12/10 21:43:42 ID:???
- >>331訂正
×キーボードのCとZを押しながら
↓
○キーボードのXとZを押しながら
- 334 :318=328:07/12/10 23:30:11 ID:yolwaXMk
- 誤解されておられるかもしれないですが、
貴方のやろうとしてることを否定しているわけでは全然ないですよ。
ただ、自分の経験上、同様のソフトで一番面倒だったのは差分取得の部分だったので
指摘しておきたかっただけで。
> 差分取得云々は正直どうでもいい。
のなら無視してもらっていいです。
- 335 :名無しさん@勉強中 ★:07/12/11 02:17:44 ID:???
- いえ、別に誤解しているつもりもないです。
ただ、転送量がシビアなものとかなら別ですが
あまり過度のアクセスもなさそうなものの場合
わざわざ難しく考えなくても良さそうな感じがするだけです
経験の浅い者が書いても空疎なだけですが
そもそもdatの差分取得の重要性というのは
read.cgi経由の取得ではCGI・転送量の両方とも負荷が高いので
CGI不可のない静的なdatを
そして転送量を抑えるために差分取得を という流れで出た話だと思うのですが
一般的に言われている差分取得の意義ってそういう風な理解で良いんですよね。
となると
read.cgiのみ閲覧出来て dat直読み不可の板を閲覧する場合
そういうのってあまり意味がないような気がするのですが。
てか そんなワッショイワッショイと人が集まるようなものだったらまた考え直しますが
そこまでアクセス集中するようなものでもないと思うのです。
浅墓かな。
- 336 :名無しさん@勉強中 ★:07/12/11 02:31:53 ID:???
- という事で
wshでhtmltodatのようなものを出しとくです
http://www.geocities.jp/mirrorhenkan/wsh/htmltodat/htmltodat_wsh_0_0_1.zip
試作品という事でsample.htmlをdat化させるだけのスクリプト
案ずるより産むが易しで 思ったより簡単に出来たです。
やたらに時間がかかるです。
いったん丸ごとデータ取得する箇所で時間をとられるみたい。
で、データ取得後のdat化はそう時間はかからない感じです。
この辺 いろいろ改良の余地がありそう。
って 続けるならの話ですが。
反応とかも期待してないですし。
pythonのhtml2datとかだと
何十個ものhtmlをスココンスココンとあっという間にdat化してくれたので
wsh版も同じくらいのスピードと途中経過の可視化が出来たら面白いかなと。
- 337 :名無しさん@勉強中 ★:07/12/11 08:24:25 ID:???
- ちょっと昨晩の文を読んで反省したです。
有用な助言を頂きながら 何も活かせずに過ぎてしまうのかなと。
そのうち裸の王様になってしまうかも
いやなっているのかも。
で
>>309で使った
python版html2datも出しておくです
http://www.geocities.jp/mirrorhenkan/python/htmltodat_for_cn2ch.zip
html2dat_UTF8.pyと35個のhtmlファイルが入っているので
pyファイルを実行(ダブルクリック)すれば全部dat化されると思うです
pythonが入っている人しか使えないものなのでwindows環境ではほとんど居ないと思うですが
Mac/Linuxではほぼ標準で入っているそうなので
そのような環境で余裕がある方は試してみて頂きたく。
良かったら結果を教えて頂きたく思うです
- 338 :名無しさん@勉強中 ★:07/12/11 17:53:19 ID:???
- メモ
WSH@Workshop - WSHのサンプル集&リファレンス
http://wsh.style-mods.net/index.htm
- 339 :名無しさん@勉強中 ★:07/12/11 18:06:11 ID:???
- >>336
> やたらに時間がかかるです。
> いったん丸ごとデータ取得する箇所で時間をとられるみたい。
> で、データ取得後のdat化はそう時間はかからない感じです。
> この辺 いろいろ改良の余地がありそう。
という事で、色々試してみようかなと思うんですが
wshでのベンチマークテスト(? 意味不明なまま書いちゃったけど^^;)ってどうやるんでしょうか。
データ取得にしても
ReadAll()で丸ごと取得したり
配列に入れたものをjoinで結合取得したり
同じく配列からforの繰り返しで結合取得したりとか色々あるですが
それぞれにかかる時間って どうやって調べればいいんだろか。
ストップウォッチ片手によーいドンでそれぞれ計測するのもいいんですが
やっぱかっこいい事やってみたいですよねー。
- 340 :名無しさん@勉強中 ★:07/12/12 12:40:23 ID:???
- メモ
お前ら、wsh使ってますか? Part4
http://pc8.2ch.net/test/read.cgi/win/1100489339/887
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
887 名前:名無し~3.EXE[sage] 投稿日:2005/07/13(水) 17:55:23 ID:9mrwEXfu
改行文字って知ってるかい? ってか知らないからこうなんだろうな。
文字列の一行の最後に含まれる仮想的な文字のことなんだけど。
ReadLineは一行の改行直前まで読み取る。つまり改行文字は含まれない。
で、その改行文字を含まない文字列をどんどん足していっちゃったからベタな無改行文字列が出力されたって訳。
改行文字をVBScriptでどう表現するかはこんな感じでぐぐれ。
ttp://www.google.com/search?num=100&hl=ja&c2coff=1&q=VBScript+%E6%94%B9%E8%A1%8C%E6%96%87%E5%AD%97&lr=lang_ja
で、WriteLineは文字列の後ろに改行文字を付加して書き込む。
であるからさ、ReadLineしたのを一々fにため込んだりせずにそのままWriteLineすれば簡単だと思わないか?
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
- 341 :名無しさん@勉強中 ★:07/12/12 14:54:09 ID:???
- あと現状のhtmltodat.wsf(って書いていいのかな・・何か申し訳ないような)だと
ReadAll()でいったん全部取り込んでから改行コードを削除してるですが
この改行削除ルーチン(カッケー!)で
http://www.kanaya440.com/contents/tips/javascript/002.html
を使わせて頂いているです。
で、これをよく見てみるに
−−−−−−−−−−−−−−−−−−−−
for(var i=0; i<myLen.length; i++){
text = escape(myLen.substring(i, i+1));
if(text != "%0D" && text != "%0A"){
newLen += myLen.substring(i, i+1);
}
−−−−−−−−−−−−−−−−−−−−
ループで該当ファイルを一バイト(?)づつ取り出して
それが改行コードかどうか見てるみたい。
という事は、1000レスあるhtmlとかだと
仮に1レス50文字(=100バイト)として
1000レス×100バイト=10万ループしている計算になるですか!!
その前後のhtmlタグを含めたらもっと膨大なループ回数という事に。
ルーチンを使わせて頂いた方には申し訳ない話なんですが
もしかしたらこれが遅くなっている原因の一つなのかも。
- 342 :名無しさん@勉強中 ★:07/12/12 19:49:11 ID:???
- htmltodat.wsfですが
「ほんとに動いてんのかな 固まってんじゃないだろうな」と自分でも思ったので
経過表示するようにしたです。
これがあると結構ストレスがなくなったりして
でも今日はここまで
ああ余裕がない余裕がない
- 343 :名無しさん@勉強中 ★:07/12/13 07:59:28 ID:???
- テキストデータを合成するプログラム - 教えて!goo
http://oshiete1.goo.ne.jp/qa2711256.html
- 344 :名無しさん@勉強中 ★:07/12/13 21:05:53 ID:???
- という事で
htmltodat.wsfのdat化部分は何とか固まったっぽいです
http://www.geocities.jp/mirrorhenkan/wsh/htmltodat/htmltodat005.zip
変換速度もスココンスココンとまあいい感じ。
ところでやっていて気付いたのですが
これってsample.htmlを本家htmltodatと同じものにしたのですが
最初うまくいったので「よーし次は改行無しのhtmlにしてdat化だ」とやってみたら
全然うまくいかない。
あれこれ考えてやっと判ったのは
本家htmltodatの正規表現「sample」では
本文に該当する箇所で最短一致にしてないのが原因だったみたい。
つまり
m#<DT>([0-9]+).+?(?:<A HREF="mailto:(.+?)">)?<b> (.*?) </b>.*?投稿日: (.*?)<BR><DD>(.*)<BR><BR>#mi
これだと
sample.htmlの改行無しバージョンだと本文が最長一致になってしまうので
m#<DT>([0-9]+).+?(?:<A HREF="mailto:(.+?)">)?<b> (.*?) </b>.*?投稿日: (.*?)<BR><DD>(.*?)<BR><BR>#mi
としてやっとマッチしたと。
ほんと正規表現は奥が深いなあと。
って
私が間違えてsample正規表現を改悪してあった可能性も捨てきれないのですが。
- 345 :名無しさん@勉強中 ★:07/12/14 08:19:41 ID:???
- さて次は
Web上のhtmlをdat化して
指定フォルダ内への保存ですかね。
ここで留意点なんですが
Web上の文字コードによって
DLする時の方策が違ってくるです
Shift_Jisの場合とUTF-8のそれとでは方法が違っていて
逆の方法でやったら文字化けしてしまうのですが
まあ この辺りは各自で取捨選択して頂くしかないかも
って使う奴おるんかい
でもこれって実は
クラシックOSを使っている者だけの悩みっぽくて
実際はADODB.streamでDLすれば全く無問題なのかも。
BASP21が入っていたらそれを使ってもOKですし。
- 346 :名無しさん@勉強中 ★:07/12/14 16:48:05 ID:???
- さて
空き時間に頭の体操のつもりでやってみたら
Web上のhtmlをdat化する事が出来たです。
あとはdat化したものの保存先ですが
これもそう難しくなさそう。
作ったものの用途ですが
dat直読みできない板を無理矢理dat化させて
Janeで読めたら嬉しいなあというだけの事で。
まあ私しか使わない事でしょうけど。
副産物として
p2todatやgetlog.wsfのような事も出来そうですが
こっちのほうは 別にいいです
- 347 :名無しさん@勉強中 ★:07/12/14 20:37:51 ID:???
- http://pc2.2ch.net/test/read.cgi/win/1022248379/635
PC等 [Windows] “お前ら、wsh使ってますか? Part2”
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
635 名前:624 [sage] 投稿日:03/03/02 13:01 ID:ZynoVCOP
しまった、GMT - JST = -9 やん。
そのままでは恥ずいので、www.yahoo.co.jpサーバからGMTを取得するScript
Set xh = WScript.CreateObject("Microsoft.XMLHTTP")
xh.Open "HEAD", "http://www.yahoo.co.jp/", False
xh.send Null
sDate = xh.getResponseHeader("Date")
sDate = Replace(Mid(sDate, 6, 20), " ", "-", 1, 2)
datGreenwich = CDate(sDate)
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
- 348 :名無しさん@勉強中 ★:07/12/15 10:25:26 ID:???
- うーむ
UTF-8のhtml取得って結構厄介だなー。
下のファイルをtest.jsにして実行しても簡体字フォント部分は文字化けしとるです。
保存する文字コードをUTF-8やUTF-8NやUnicodeにしても結果は同じ。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
var strUrl = "http://cn2ch.cn/bbs/test/read.cgi/tongren/1195601732/";
var oXMLHttpRequest = new ActiveXObject("Microsoft.XMLHTTP");
with(oXMLHttpRequest)
{
Open("GET", strUrl, false);
Send();
}
var str=oXMLHttpRequest.responseText;
WScript.echo(str);
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
どこかで読んだですが
UnicodeとUTF-8って別物なんだなーと。
どうしても解決出来なかったら
pythonでやってみますか。
Web上のデータの読み込み部分を追加すれば良さそうなので。
- 349 :名無しさん@勉強中 ★:07/12/15 10:48:08 ID:???
- と書いたけど
win2000以上とかだと文字化けしないかもですが
何方か試して頂けないかなと
- 350 :名無しさん@勉強中 ★:07/12/15 11:26:56 ID:???
- HTTP Get -- 各キャラクタセットのWebページの読込み ( IXMLHTTPRequest )
http://winofsql.jp/VA003334/smalltech040206011410.htm
まさか解決策不在なのか? OperaのXMLHttpRequestオブジェクトのresponseTextが文字化けする問題の更なる深み 【▲→川俣晶の縁側→ソフトウェア→技術雑記】
http://mag.autumn.org/Content.modf?id=20051210160430
- 351 :名無しさん@勉強中 ★:07/12/15 11:37:51 ID:???
- >>348
> どうしても解決出来なかったら
> pythonでやってみますか。
その前に
ADODB.streamを使う奴と
BASP21を使う奴をやってみますか。
自分の環境では後者しか確認出来ないですけど。
- 352 :名無しさん@勉強中 ★:07/12/15 12:26:01 ID:???
- いやー文字コードよくわかんないや
お前ら、wsh使ってますか? Part4
http://pc8.2ch.net/test/read.cgi/win/1100489339/269,367
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
269 名前:名無し~3.EXE[sage] 投稿日:05/01/14 22:04:18 ID:9FAifjvD
>>266
たしか、ResponseBodyはUTF-16BEになってると思う。
367 名前:名無し~3.EXE[sage] 投稿日:05/02/19 09:06:43 ID:PxBwsUtK
>>366
対象のhtmlファイルの文字コードと、
どう元ファイルを開いてるか、保存ファイルをどう作ってるかのコードを。
UTF16/UTF8なら、OpenTextFileの第4引数に-1、CreateTextFileの第3引数にTrueを入れればいけると思うけど。
//UTF8をUTF8のままで保存してくれるのは良いけど、なんでUTF16用のBOM付きなんだ……? >FileSystemObject
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
上の366さんの書き込みも面白いです
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
366 名前:名無し~3.EXE[sage] 投稿日:05/02/19 05:26:30 ID:5E0bL9lX
中国語のHTMLテキストを整形しているのですが、ReadLineやReadAllを使うと一部の中国語が勝手に変換されてしまいます。
どのような対策が考えられるでしょうか?
370 名前:366[sage] 投稿日:05/02/21 03:19:16 ID:y0/zN+N5
コード = gb2312
例えば、
ttp://www.eg365.com/disp.asp?boardid=12&typeid=237
をIEからファイル保存して、Q237.HTMという名前を付ける。
以下VBS。
IN_FNAME = "Q237.HTM"
set FS = CreateObject("Scripting.FileSystemObject")
set in_file = FS.GetFile(IN_FNAME)
set in_text_file = in_file.OpenAsTextStream(1) ''' 1 = for read
str = in_text_file.ReadAll
in_text_file.Close
OUT_FNAME = "Q237X.HTM"
FS.CreateTextFile OUT_FNAME
set out_file = FS.GetFile(OUT_FNAME)
set out_text_file = out_file.OpenAsTextStream(2) ''' 2 = for write
out_text_file.Write(str)
out_text_file.Close
VBSおわり。
"FC Q237.HTM Q237X.HTM"などすると違っている。(Windows98)
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
- 353 :名無しさん@勉強中 ★:07/12/15 12:39:51 ID:???
- あ、出来たです。
>>352
> UTF16/UTF8なら、OpenTextFileの第4引数に-1、CreateTextFileの第3引数にTrueを入れればいけると思うけど
これやったらOKになったですよ。
チュートリアル見てもよくわかんないんですけど。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
var strUrl = "http://cn2ch.cn/bbs/test/read.cgi/tongren/1195601732/";
var oXMLHttpRequest = new ActiveXObject("Microsoft.XMLHTTP");
with(oXMLHttpRequest)
{
Open("GET", strUrl, false, -1);
Send();
}
var str=oXMLHttpRequest.responseText;
WScript.echo(str);
var moto = "testsample.html";
fs = WScript.CreateObject("Scripting.FileSystemObject");
abc = fs.OpenTextFile(moto, 2, true, -1);//2=ForWriting, true=create
abc.Write(oXMLHttpRequest.responseText);//改行コード入らない
abc.Close();
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
結果表示のポップアップでは文字化けしてるですが
生成したtestsample.htmlでは直ってるみたい。
- 354 :名無しさん@勉強中 ★:07/12/15 13:32:41 ID:???
- よっしゃ
では対象htmlがShift_JisとUTF-8の場合の分岐処理をすればいいのかな。
URLや保存先は
WScript.Arguments()で取り出せば良さそうです
- 355 :名無しさん@勉強中 ★:07/12/15 16:35:50 ID:???
- うむむ
上手くいったぜベイビーと思ってJaneNida該当フォルダに入れてみたら
「ここ壊れてます」ばかりで
生成したdatの文字コードを見たら
UTF-8ではなくUnicode(って何よ)になってるのが原因みたい。
datの文字コードをUTF-8に変換したら読み込めたです。
文字コードをUnicodeからUTF-8にして保存するにはどうすりゃいいんだ
ぐああ
- 356 :名無しさん@勉強中 ★:07/12/15 18:23:29 ID:???
- えーと
つまり>>353で生成されたhtmlの文字コードが
UTF-8ではなく
Unicodeなのがネックのようで。
どうしても駄目なら
御返事はあまり期待せず
偉い人に伺ってみるしかないかな
- 357 :名無しさん@勉強中 ★:07/12/15 19:46:25 ID:???
- 仕方ないので目先を変えて
pythonでやってみますか。
とりあえず>>279のスクリプトで
http://cn2ch.cn/bbs/test/read.cgi/tongren/1195601732/
を取得してみると
文字化けもせずUTF-8だったので
これを>>337のhtml2datに追加してみようかなと。
見よう見真似で何とかなりそう。
ただ問題は、これをJaneNidaで使う場合
getlog.wsfのような保存先フォルダ自動指定が出来ないのです
だってpython全然わかんないんだもん
ごめんなさいごめんなさい
- 358 :名無しさん@勉強中 ★:07/12/16 13:28:04 ID:???
- >>351
> ADODB.streamを使う奴と
> BASP21を使う奴をやってみますか
まず前者
下のをtestADODB.vbsとでもして保存
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
sSource = "http://cn2ch.cn/bbs/test/read.cgi/tongren/1195601732/" 'ダウンロード元
sDest = "testsample.html" 'コピー先
test = GetHTMLDocumentADODB(sSource, sDest)
Function GetHTMLDocumentADODB(sSourcr, sDest)
Set oHTTP = WScript.CreateObject("microsoft.xmlhttp")
oHTTP.Open "GET", sSource, False
oHTTP.Send
Set Stream = WScript.CreateObject("Adodb.Stream")
Const adTypeBinary = 1
Const adSaveCreateNotExist = 1
Const adSaveCreateOverWrite = 2
Stream.Type = adTypeBinary
Stream.Open
Stream.Write oHTTP.responseBody
Stream.Savetofile sDest, adSaveCreateOverWrite
End Function
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
これを実行して
同じフォルダにtestsample.htmlが出来ていたらいいなと。
自分の環境では試せないので何方か試して頂きたく。
これって>>52のスクリプトを手直ししただけなので
バイナリモードで取得するようになってますが
取得出来たらいいじゃないか(出来なかったら残念だけど)
- 359 :名無しさん@勉強中 ★:07/12/16 13:34:29 ID:???
- 次
BASP21を使う場合
testBASP21.vbs
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
test = GetHTMLDocumentBASP21("http://cn2ch.cn/bbs/test/read.cgi/tongren/1195601732/", "testsample.html")
Function GetHTMLDocumentBASP21(sURL, sFileName)
Set Fs = WScript.CreateObject("Scripting.FileSystemObject")
Set bobj = WScript.CreateObject("basp21")
sRoot=Fs.BuildPath(Fs.GetParentFolderName(WScript.ScriptFullName),"\") 'スクリプトのあるフォルダ
WScript.echo sRoot & sFileName
'hozontest = sRoot & sFileName
'rc = bobj.W3get("-d " & sRoot & " " & sURL)
rc = bobj.W3get("-d " & sRoot & " -o " & sFileName & " " & sURL)
End Function
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
BASP21は下からDL出来るです
1.44メガあるですがアンインストールも出来るので安心安心
http://www.hi-ho.ne.jp/babaq/basp21.html
どうしてもUTF-8のhtmlをローカル保存出来なかったら
これを使うしかないのかも。
でも、ふと思ったんですが
外国の方々も当然wshを使ってると思うですが
こういう場合 みんなどうしてるんでしょうか。
babaqさんがお作りになられたBASP21やBregexp.dllだって
日本ローカルのものでしょうし。
- 360 :名無しさん@勉強中 ★:07/12/16 13:37:09 ID:???
- >>358のコード スペルミス
×Function GetHTMLDocumentADODB(sSourcr, sDest)
↓
○Function GetHTMLDocumentADODB(sSource, sDest)
だって自分で試せないんだもの
だもんでまだあるかも
- 361 :名無しさん@勉強中 ★:07/12/16 14:43:25 ID:???
- >>359補足(言い訳)
> babaqさんがお作りになられたBASP21やBregexp.dllだって
> 日本ローカルのものでしょうし
これ別に他意や含意は全く無くて
勿論外国の方々で使っておられる方も居るとは思いますが
例えばBregecp.dllはShift_Jisでしか使えないという制約が未だにある訳で
もしUTF-8やUnicodeやBig5やgb2312でも使えたら
私が 無い頭をうんうん唸らせる事もないのですが。
鬼車のUnicode対応版も出ていますが
自分では何も出来ないですし。
K.Takata's software : bregonig.dll
http://homepage3.nifty.com/k-takata/mysoft/bregonig.html
例えば下のhtmlは文字コードBig5ですが
正規表現を考えればそれなりにdat化出来ると思うです
建議改用UTF-8編碼取代Big5編碼
http://web.archive.org/web/20050113190336/www.comic.com.tw/mini02/test/read.cgi/operate/1078772150/l25
- 362 :名無しさん@勉強中 ★:07/12/16 15:02:33 ID:???
- と書いたけど
英語版もあるという事は
何とかなるのかな>Bregexp.dll
BREGEXP.DLL
http://www.hi-ho.ne.jp/babaq/eng/bregexp.html
- 363 :名無しさん@勉強中 ★:07/12/16 20:21:46 ID:???
- 文字列を UTF-8 に変換
http://www.geocities.co.jp/SilkRoad/4511/vb/utf8.htm
参考になるかな
なったらいいな
JavaScriptでファイルの書き込みをUTF-8で行う(htaまたは、wsh用) - jiroの日記
http://d.hatena.ne.jp/sukesam/20070922/1190400851
- 364 :名無しさん@勉強中 ★:07/12/16 20:47:13 ID:???
- うむむ
BASP21のWgetでUTF-8のhtmlを取得するようにしたら
それを読み出して変換保存する箇所も変えなければいけないみたい
いやー面白いなー
文字コードって愉快だなー
あはは
- 365 :名無しさん@勉強中 ★:07/12/17 18:47:01 ID:???
- ちょうどBASP21に文字コード変換する命令があって
UnicodeからUTF-8に変換出来たです
より詳しく書くと
「UNICODE UCS2」から「UNICODE UTF8」への変換ですが。
簡単に変換スクリプトを書くと
仮に
文字コードUnicodeのtestsample.htmlを
文字コードUTF-8のtestsample1.htmlに保存するなら
testKconv.vbs
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
Set bobj = WScript.CreateObject("basp21")
test = bobj.KconvFile("testsample.html","testsample1.html",5,4) ' UNICODE からUTF-8に変換
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
この2行だけで済んでしまうです
何て楽なんだ
という訳で
wsh標準機能のみでの変換はひとまず棚上げにして
これで一息つこうかなと。
- 366 :名無しさん@勉強中 ★:07/12/17 18:54:44 ID:???
- それにしても
Bregexp.dllがShift_Jis以外ではうまくいかないからって色々やって
結局babaqさんがお作りになられたBASP21を使うっていうのは
お釈迦様の手の掌から一歩も出られなかった孫悟空みたいなもんですかね。
でもまだ他に手はあるかもと思いはしますが。
次なんですが
ADODB.streamでUnicode→ UTF-8変換するような方策はないものかなと。
これがあればwsh標準の機能だけで出来るようになるので。
(ただ私は確認も何も出来ないので・・・ってもういいか)
- 367 :名無しさん@勉強中 ★:07/12/17 20:13:10 ID:???
- ADODB.streamの文字コード変換って
検索すると実にわんさかあるですね。
ありすぎてよくわかんない
それはそうと
これ↓もしかして使えないかな。
Unicode ⇔ UTF-8 by AOK
http://homepage3.nifty.com/aokura/jscript/utf8.html
- 368 :名無しさん@勉強中 ★:07/12/18 07:40:18 ID:???
- http://tmp7.2ch.net/test/read.cgi/download/1190839251/363
htmltodat.wsfでも出来ますが
wshでの変換はCやDelphiのと比べて格段に遅いでしょうし
わざわざ作って「おせーぞばか」とか言われても割に合わないし
ただでさえあちこち迷惑しまくり千代子なのにまた負荷をかけるのも何だし
やめとこかな
公開しても後悔するだけだろなと
てか現状でも
htmltodat-convert.wsfで何とかなるんじゃないかなと
- 369 :名無しさん@勉強中 ★:07/12/18 07:57:37 ID:???
- 中日翻訳(簡体字)=$CHOTTO http://www.excite.co.jp/world/chinese/?before=$TEXTIU&wb_lp=CHJA&big5=no&start=%E7%BF%BB+%E8%A8%B3&after=
これで中国2chのわかんないとこを外部コマンド翻訳して読んでるです
にしても 台湾の掲示板と違って ほとんど日本語出てこない感じですね。
「毒男板」「御宅族」とかは明らかに日本語由来でしょうけど
ってcn2chの存在自体が日本由来でしょうけど。
「有閑倶楽部板」って
今オンエア中のドラマの板なのかな
どうやって見てるんだろ
ジャニーズの画像(ですよね)が結構あるですが
日本じゃないから大丈夫なのかな
- 370 :名無しさん@勉強中 ★:07/12/18 08:06:26 ID:???
- VBScriptで文字コード変換 [Design For Life]
http://www.inaba.vc/item/5
[WSH] - Fioの素敵な日々
http://d.hatena.ne.jp/Fio/searchdiary?of=5&word=*%5BWSH%5D
- 371 :名無しさん@勉強中 ★:07/12/18 19:44:56 ID:???
- メモ
2ちゃんねる等可視化計画
http://v2ch.media.t-kougei.ac.jp/v2ch.php?r=XfW96eYtDjTL9CD6
これ
http://money6.2ch.net/test/read.cgi/haken/1197438526/
がdat落ちした後も閲覧可能だったら
どんなにか嬉しい事でしょうか。
- 372 :名無しさん@勉強中 ★:07/12/18 19:51:12 ID:???
- 詳細あったです
Vis2ch - MediaArtWiki
http://wiki.media.t-kougei.ac.jp/index.php/Vis2ch
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
本文のキャッシュは元DATが倉庫入りした後もローカルに7日間だけ保持される。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
- 373 :名無しさん@勉強中 ★:07/12/18 20:13:35 ID:???
- さて
BASP21でUnicode→UTF-8変換出来たので
今度はADODB.streamでのUnicode→UTF-8変換ですか。
自分には未知の分野なのでどうしたものか。
とりあえずコードを出しとくです
http://www.geocities.jp/mirrorhenkan/wsh/htmltodat/htmltodat006.wsf.txt
上のをダウンロードしてhtmltodat006,wsfにリネームして実行してみて下さい。
cn2chのスレッドがdat化されると思うです。
具体的に書くと
testsample.htmlとsample.datの2ファイルが生成されます。
前者はcn2chのhtmlそのもので
後者はそれをdat化したもの。
ただ、問題は
これらの文字コードがUTF-8ではなくUnicodeな点で。
ちなみにUTF-8だとdat化の際 正規表現が全然ヒットしないので
Unicodeのままdat化した訳で。
私が手を出せない箇所は
253-261行にある
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
if(Uni2UTF8=="0"){
WScript.echo("文字コードShift_Jis");//何もしない
}else if(Uni2UTF8=="1"){
//ADODB.streamでUnicode→UTF-8変換
WScript.echo("ADODB.streamでUnicode→UTF-8変換");
}else if(Uni2UTF8=="2"){
WScript.echo("BASP21でUnicode→UTF-8変換");
BASP21ConvUni2UTF8(moto);//BASP21でUnicode→UTF-8変換
}
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
この
> //ADODB.streamでUnicode→UTF-8変換
の箇所で。
文字コードUnicodeのdatファイル「moto」をUTF-8に変換したいのですが
ADODB.streamでどのようなコードを書けばよいのか全然わからんのです。
自分のマシンで使えるのなら試行錯誤のしようもあるのですが。
反応があったら
おら 舞い上がっちまうで
ほんま
- 374 :名無しさん@勉強中 ★:07/12/19 17:48:28 ID:???
- −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
たる さん 2001年 10月 19日 23時 46分 46秒
To:らしゅ さん
SJISのテキストを上書きしてEUCに変換します。
IE5.0以上必須です。
未検証ですがUCS2でも少し変えれば出来るかなぁと思います。
あれ?utf-8でしたっけ(←あいまいな奴)
本当は文字列をベタでノードにするより、createCDATASectionメソッドでノードにした方が
< > & 辺りの制限が無くて良いんですが(それでもまだ]]>という制限はあるけど)
他にも何か改良の余地がありそうなのでそこら辺も含め後でと言うことにして。
文字列の切り落としがあまりうまくないです。何かいい方法があったら教えてください〜(逃げ)
↑こんなこと仕事じゃ…やらない…はず。(汗)
Option Explicit
Const csFile = "./fileStock/dataText.txt"
Dim objFS, objTS, sRead, sXML,objXML
Set objFS = CreateObject("Scripting.FileSystemObject")
Set objTS = objFS.OpenTextFile(csFile,1)
sRead = objTS.ReadAll
objTS.Close
Set objXML = CreateObject("Microsoft.XMLDom")
objXML.async = False
sXML="<root>" & vbCrLf & _
sRead & vbCrLf & _
"</root>"
objXML.loadXML(sXML)
objXML.insertBefore objXML.createProcessingInstruction("xml","version=""1.0"" encoding=""euc-jp"""), objXML.documentElement
objXML.save("./fileStock/dataText.xml")
Set objTS = objFS.OpenTextFile("./fileStock/dataText.xml",1)
objTS.Skip(49)
sRead = objTS.ReadAll
objTS.Close
objFS.DeleteFile("./fileStock/dataText.xml")
sRead = Left(sRead,Len(sRead)-11) 'あれ?EUCって漢字3バイトだっけ?
Set objTS = objFS.CreateTextFile(csFile, True, False) '同じ名前にする事で上書きします
objTS.Write sRead
objTS.Close
Set objXML = Nothing
Set objFS = Nothing
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
- 375 :名無しさん@勉強中 ★:07/12/19 17:49:14 ID:???
- −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
つちや さん 2002年 09月 22日 14時 04分 20秒
唐突ですが、
UTF-8のテキストファイルを、Shift-JISに変換するサンプルです。
Microsoft ActiveX Data Object (ver2.5以上)が必要です。
なお、指定可能な文字コードは、ISO-2022-JP、EUC-JP、UNICODE、UTF-7など。
MSXMLのXMLHTTPを使う場合は、Srcストリームの方に修正が必要ですが、
結構手軽で応用範囲が広いかも。
(改行コードの指定が必要な場合はLineSeparatorを使います)
Const adTypeText = 2
Const adSaveCreateOverWrite = 2
Set Src = CreateObject("ADODB.Stream")
Src.Open
Src.Type = adTypeText
Src.Charset = "UTF-8"
Src.LoadFromFile "C:\UTF8.txt"
Set Dst = CreateObject("ADODB.Stream")
Dst.Open
Dst.Type = adTypeText
Dst.Charset = "Shift_JIS"
Src.CopyTo Dst
Src.Close
Dst.SaveToFile "C:\SJIS.txt", adSaveCreateOverWrite
Dst.Close
Set Src = Nothing
Set Dst = Nothing
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
- 376 :名無しさん@勉強中 ★:07/12/19 21:13:51 ID:???
- >>374のスクリプト
一時保存のxmlファイルはちゃんとEUC=jpやUTF-8になってますね。
でも読み込み元ファイルがUNICODEだとスクリプトエラーになってしまう・・・
- 377 :名無しさん@勉強中 ★:07/12/20 19:55:11 ID:???
- 三流君VBA:IE 操作 .ExecWB でコマンド実行(検索したかったけど)
http://www.ken3.org/vba/backno/vba112.html
- 378 :名無しさん@勉強中 ★:07/12/21 07:55:52 ID:???
- あー
IEのExecWBでOLECMDID_SAVEを使えば何とかなるっぽいですが
サンプルスクリプトを理解して
そこから該当個所をコピペするってえのは大変だー
だがそこがいい(マゾ)(マジ?)
- 379 :名無しさん@勉強中 ★:07/12/21 18:00:57 ID:???
- よし
ExecWBを使って
Unicode→UTF-8変換出来たぞ
何とかADODB.streamを使わずに済んだかも
IE5.5以上必須になったですが
IEが入ってないWindowsってすっげーレアケースだと思うので
まあいいかなと。
あとはこれをプロシージャ化してhtmltodat.wsfに組み込んで
テストランしたものをJaneNida該当フォルダに入れて調べてみて
文字化けその他もなくてOKっぽかったら
WScript.Arguments()のデータ渡しの辺りと
該当フォルダ指定の箇所に取りかかるだな
いやー面白い
- 380 :名無しさん@勉強中 ★:07/12/21 19:45:29 ID:???
- メモ
2000年 02月 25日 02時 38分 30秒
- 381 :名無しさん@勉強中 ★:07/12/22 16:34:11 ID:???
- よっしゃ
htmltodat.wsfに組み込んでdat化UTF-8化したものを
JaneNida該当フォルダに入れて読んでみたですが
文字化けしてないようだ
- 382 :名無しさん@勉強中 ★:07/12/22 17:55:40 ID:???
- ついでに
htmltodat.phpでdat化したもの(通常こっちを使ってますが)と比べると
php版でdat化したものをエディタで開くと文字化けしたですが
調べてみるとこちらのほうはUTF-8である事のヘッダ目印(BOM)が付いてないのが原因みたい。
wsh版のほうはというと、スクリプト作者様がちゃんと付けるようにしてあったので
文字化けしなかったでした
いやーすごい
- 383 :名無しさん@勉強中 ★:07/12/22 19:02:20 ID:???
- お前ら、wsh使ってますか? Part2
http://pc2.2ch.net/test/read.cgi/win/1022248379/728-730n
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
728 名前:名無し~3.EXE[] 投稿日:03/03/24 01:56 ID:ZmE7iov5
WSHにはDOSの
・ファイル結合
copy /b a.txt+b.txt c.txt
・リネーム
ren a.txt b.txt
に当たる処理を容易に行える命令はないの?
729 名前:名無し~3.EXE[sage] 投稿日:03/03/24 03:46 ID:zcvTmdSc
Dim WSH
Set WSH = CreateObject("WScript.Shell")
WSH.Run "cmd /c copy /b a.txt+b.txt c.txt",1,True
WSH.Run "cmd /k ren a.txt b.txt",1,True
730 名前:名無しさん募集中。。[sage] 投稿日:03/03/24 04:34 ID:MV8cQtQK
>728
そこら辺の(内部、外部問わず)コマンドアプリとして用意されている物は、無理にWSHでやる必要ないんじゃないのかな。
それらをWSH標準で用意されているコマンドで行うには各々3〜4行は必要だよ。
>729
Runメソッドの第2引数を0にすると裏でやっている感じでいいかもね。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
- 384 :名無しさん@勉強中 ★:07/12/23 10:04:46 ID:???
- 上のリネーム
何だかうまくいかない・・・
メモ
htmltodat.pyで使えるかなと
pythonでHTML解析 - 清水川Web
http://www.freia.jp/taka/blog/169
- 385 :名無しさん@勉強中 ★:07/12/23 14:03:01 ID:???
- 別の方法で何とかなったです
'http://q.hatena.ne.jp/1166525285
Function riname(before, after)
Set Fs = WScript.CreateObject("Scripting.FileSystemObject")
Set f = Fs.getFile(before)
f.name = Fs.getFileName(after)
End Function
で、何でこんな事したいかというと
ExecWBで文字コード変換する場合
IEの拡張子設定に左右されるみたいで
拡張子がdatのままではエラーが出るからで。
なるべく標準機能だけで何とかしたいですし。
- 386 :名無しさん@勉強中 ★:07/12/23 16:32:29 ID:???
- よしこれ↑も組み込めた
あとは外部コマンド用にURL取得と保存先フォルダ指定かな
変換結果式並べ替えと前処理・後処理はどうしようか。
必要性を感じたらつけるかな。
どうせ自分しか使わないんだし
- 387 :名無しさん@勉強中 ★:07/12/23 17:26:48 ID:???
- ところで少し悩みが。
datキーなのですが
URLを解析(カッケー!)して9桁or10桁の数字があったらそれをdatキーにしてみたのですが
例えば>>361で出したwebarchiveのURLとかだと
http://web.archive.org/web/20050113190336/www.comic.com.tw/mini02/test/read.cgi/operate/1078772150/l25
はじめのほうの「20050113190336」に先にマッチしそうです。
どうすればいいのだろう。
現状は下のようにしてますが(test1にURLが入るです)
if(test1.match(/.*?(\d{9,10}).*?/i)){
var datkey = RegExp.$1;
}else{
var datkey = "sample";
}
泥臭くなりますが
if(test1.match(/.*?(9\d{8}|1\d{9}).*?/i)){
としたほうがまだマシなのかな。
9桁の場合、先頭数字が9
10桁の場合、先頭数字が1
という事になるですが。
- 388 :名無しさん@勉強中 ★:07/12/23 20:16:52 ID:???
- うーむ
保存先フォルダ指定との絡みもあるのだなぁ>datキー取得
- 389 :名無しさん@勉強中 ★:07/12/23 20:41:20 ID:???
- これまでの途中経過
http://www.geocities.jp/mirrorhenkan/wsh/htmltodat/htmltodat001.wsf.txt
http://www.geocities.jp/mirrorhenkan/wsh/htmltodat/htmltodat002.wsf.txt
http://www.geocities.jp/mirrorhenkan/wsh/htmltodat/htmltodat003.wsf.txt
http://www.geocities.jp/mirrorhenkan/wsh/htmltodat/htmltodat004.wsf.txt
http://www.geocities.jp/mirrorhenkan/wsh/htmltodat/htmltodat005.wsf.txt
http://www.geocities.jp/mirrorhenkan/wsh/htmltodat/htmltodat006.wsf.txt
http://www.geocities.jp/mirrorhenkan/wsh/htmltodat/htmltodat007.wsf.txt
バックアップという事で。
これでローカルのファイルをお掃除出来るです
- 390 :名無しさん@勉強中 ★:07/12/23 22:23:56 ID:???
- おお
そういえばhtmltodat-convert.wsfでも保存先を指定してたっけだ
これのコードをコピペすれば良かったっけだなー
よしクリスマスに片付けてしまおうか
- 391 :名無しさん@勉強中 ★:07/12/24 08:55:44 ID:???
- と書くとプレッシャーがかかるので
前言撤回
- 392 :名無しさん@勉強中 ★:07/12/24 11:46:40 ID:???
- >>245の2ch-imodeのhtmlですが
タイトルに付くものが「2ch-imode」から「2ch-i」に変更されたみたいですね。
前処理部分を下記に変更すれば良さそう
s#(<title.*?): 2ch-imode(</title>)#$1$2#k
↓
s#(<title.*?): 2ch-i(</title>)#$1$2#k
最近 2ch-imodeの管理人さん
更新が立て続けですね。
「IPv6対応」とか 検索してもよくわかんない
- 393 :名無しさん@勉強中 ★:07/12/24 18:34:38 ID:???
- よし
htmltodat.wsfが出来たっぽい。
ただ、経路的問題なのか何なのかわかんないですが
cn2chが私のホストからだととても重いです。
htmltodat.phpだとスムーズだったので
試しにアメリカのプロキシ経由でやってみたらうまくいったのですが。
- 394 :名無しさん@勉強中 ★:07/12/25 17:52:25 ID:???
- メモ
独身男が毒づくスレ
http://cn2ch.cn/bbs/file/1159788900.html
上記dat化
正規表現
m#<DT><A.*?>([0-9]+).+?<B>(?:<A HREF='mailto:(.+?)'>)?(.*?)(?:</A>)?</B>.*?:(.*?)<DD>(.*?)<BR><BR>#mi
- 395 :名無しさん@勉強中 ★:07/12/25 18:05:30 ID:???
- 上の正規表現を
htmltodat007.wsf中のそれと差し替えてdat化させたもの(あっという間に出来たです)を
JaneNida該当フォルダに入れて読んでるんですが
日本語なのは見事にタイトルだけですね。
台湾の掲示板とかだと日本語も結構出てたりするんですが。
ビバ外部コマンド
こういう、何というか
外部向けでない内輪向けの生の声って面白いですね。
台湾や韓国の方々とはまた雰囲気が全然違うですし。
- 396 :名無しさん@勉強中 ★:07/12/25 19:27:10 ID:???
- todoメモ
・変換結果式並べ替え対応
・ドラッグ&ドロップ対応
・フォルダ内一括変換対応
・正規表現各自入力対応(だってソースいちいち見て変えるの面倒なんだもん)
・前処理・後処理対応(「この箇所に各自で入れて下さい」の場所を設ける)
こんなもんですか。
これらは何とか出来そうです。
必要性を感じたらですが。
あと個人的に切実に欲しいのが
文字コードBig-5やgb2312やEuc-krのhtml対応なんですが
今の自分にはwshでは無理っぽい。
phpでもよくわかんない。
pythonのほうで模索してみるかなと。
現地の方でこういう事やってる解説サイトがあったら一発なんですが
まあ適当にやってみますか。
いやー
独り遊びってほんとに楽しいもんですね。
- 397 :名無しさん@勉強中 ★:07/12/26 08:02:46 ID:???
- JaneNida外部コマンド組み込み用のhtmltodat.wsfを出しとくです
http://www.geocities.jp/mirrorhenkan/wsh/htmltodat/htmltodat008.wsf.txt
DLしたhtmltodat008.wsf.txtを拡張子wsfにリネームしてJane2ch.exeと同じフォルダに入れ
外部コマンド登録は下記
htmltodat008=wscript "$BASEPATHhtmltodat008.wsf" "$LINK"
外部板として例えば
http://cn2ch.cn/bbs/tongren/
を適当な板名で登録して
birdconf.iniにUTF-8である旨登録して
例えば下記スレッドを右クリックからコマンド呼び出ししてみて下さい
dat化されて該当フォルダに保存されて、読み込めるようになると思うです
中国語読めない><
http://cn2ch.cn/bbs/test/read.cgi/tongren/1195601732/
この呼び出しがタイトル一覧から出来れば嬉しいなと。
つまりタイトル一覧で外部コマンド呼び出し出来たら有り難いと思うです。
そうすれば
htmltodat008=wscript "$BASEPATHhtmltodat008.wsf" "$URL"
と登録し直して
タイトル右クリックでdat化取得とか出来ると思いますので。
・・・要望の下書きのつもりはなかったんですが
これをもとに要望してみますか。
だとしたらあと2〜3点あるですが。
- 398 :名無しさん@勉強中 ★:07/12/26 21:54:59 ID:???
- 書いたです
http://pc11.2ch.net/test/read.cgi/software/1195310686/552-553n
打たれ弱いので
煽られたらへこむです
- 399 :名無しさん@勉強中 ★:07/12/28 13:08:16 ID:???
- メモ
用WSH 想ASP 一???数据?
http://www.pcdog.com/edu/asp/27/11/d267812.html
文字コードgb2312のファイルをwshで使いたいのですが
参考になったらいいなと。
あとここ
jisaku
http://ha1.seikyou.ne.jp/home/akairingosaita/hangul/jisaku.htm
- 400 :名無しさん@勉強中 ★:07/12/28 18:38:14 ID:???
- ときどきの雑記帖 リターンズ 2007年1月
http://www.kt.rim.or.jp/~kbk/zakkicho/07/zakkicho0701.html
The Past Times
http://lyrics.meicho.com.tw/modify.htm
- 401 :名無しさん@勉強中 ★:07/12/28 19:09:42 ID:???
- 上の「ときどきの雑記帖」さんの所、すごく面白いですね。
で、そこ経由
旗旗 - ブログ「旗旗」 : 日本語CGIを韓国語で動かす by 草加耕助
http://bund.jp/modules/wordpress/index.php?p=326
- 402 :名無しさん@勉強中 ★:07/12/28 20:12:18 ID:???
- WEB開發 | HTML | XML | VBScript | JavaScript | CGI/perl | ASP | PHP | JSP | ASP.NET | DreamWeaver
http://big5.chinaz.com:88/book.chinaz.com/others/web/web/index.htm
- 403 :名無しさん@勉強中 ★:07/12/28 21:51:10 ID:???
- さて
文字コードbig5やgb2312のサイトを
そのまんま取得する方法がわかんない・・・。
ADODB.streamを使ってResponse.bodyをcharset指定して読み込めばいいっぽいんですが
(って間違ってるかも^^;)
私のマシンでは敵わぬ夢なので。
タグ崩れるの承知で
IE経由でDLしてみるかな。
- 404 :名無しさん@勉強中 ★:07/12/29 20:39:52 ID:???
- メモ
http://www.megabbs.com/
のsubject.txtとdatファイルについて
板
http://www.megabbs.com/mac/
subject.txt(に該当するもの)
http://www.megabbs.com/mac/mac_newb.txt
dat(に該当するもの)
http://www.megabbs.com/mac/txt/mac_1008509845a.txt
http://www.megabbs.com/mac/txt/mac_1008509845b.txt
dat一覧リスト表示
http://www.megabbs.com/mac/txt/
- 405 :名無しさん@勉強中 ★:07/12/30 13:07:10 ID:???
- ついさっき
ホットゾヌ2をDLして
proxomitron経由で
http://www.ichigobbs.net/
の板一覧取得とスレッド一覧およびスレッド取得してみたですが
どうもhtmlを取得してそれをsubject.txt化したりdat化したりされてるみたいですね。
で、メモ
ichigoBBSのdat化
スレッド例
http://www.ichigobbs.net/cgi/15bbs/2ch/0115/
正規表現
m#<DT>([0-9]+): *?<font.+?><b>(?:<a href="mailto:(.*?)">)?(?:<font.+?>)?(.*?)(?:</font></a>)?</B></font>(?: )(.*?)<DD>(.*?)(<br> <dt>)#mik
前処理
s#<a rel.+?>(.+?)</a>#$1#igk
これでdat化出来ますが
例えばレス136等は透明消去されているみたいです。
元のhtmlの段階からしてレス番不在で。
http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/498-499n
の機能追加が欲しいなと思うんですが。
- 406 :名無しさん@勉強中 ★:07/12/30 15:22:22 ID:???
- メモ
remix2ch(http://contents-factory.net/remix2ch/)のdat化について
URL例
http://contents-factory.net/remix2ch/read.php?url=http://live23.2ch.net/test/read.cgi/liventv/1176376861/
正規表現
m#<dt>([0-9]+) :<span class="name">(?:.+?"mailto:(.+?)"><b>)?(.+?) ?(?:</b></a>)?</span>:(.*?)\(スコア.+?<dd> ?(.*?)<br></dd><hr>(<dt>|</dl>|<script)#mik
前処理
s#(<title>.+?) - remix2ch(</title>)#$1$2#
受信オプション→HTTPヘッダ
Cookie: preview_limit=zero; design=2ch; normal_view=on
これでいけるかと思います。
クッキー送信が必要な所なので注意して下さい
- 407 :名無しさん@勉強中 ★:07/12/30 15:34:31 ID:???
- で、ついでなんですが
このスレッド snapshotにも1001まで残っていますね。
後で直しておきますか。
http://ss.chbox.jp/dat.php?url=http://live23.2ch.net/test/read.cgi/liventv/1176376861/
chbox.jpのサーバですが
むむむさんのページのサーバ一覧を見てみると(って今URL探すの面倒ですが)
讃岐メニューさんや公式p2さんのように
運営の方から貸与されたものみたいです。
だもんでp2todatとかが出てもそうレスポンスが重くならないみたいで。
いや自分を棚にあげてる訳じゃなくて わざわざ書くのも何ですし。
外部コマンドで23ch.infoさんのログを取得するhtmltodat.wsfもやってみたら簡単に出来たですが
これ以上あちこちに負担をかけるのも何なので
自分 出すのはやめとくです
p2todatの作者さんはどうされるのか判りませんが。
- 408 :名無しさん@勉強中 ★:07/12/30 17:55:41 ID:???
- ホットゾヌですが
メガBBSのほうもhtml経由でdat化subject化されてるみたい。
なるほど、こりゃ安易に
「メガビ対応まだー(後略)」「苺対応(後」
というような要望に
皆反応しない訳だなと。
メガBBSはよう知らんですが
苺BBSのほうは経済板とかたまに覗いたっけだなー
すげーレベルたけーと思ったでしたっけでした
ドラエモンさんとかまだ居られるのかなとか。
- 409 :名無しさん@勉強中 ★:07/12/30 20:28:00 ID:???
- >>406-407
done(カッケー!)
今年も至らないながら色々遊んだっけだなー
ここで出してリンクさせてないやつとか結構あるですが
気が向いたら何とかしますか
まあ自己満足だし別にどうでもいいや
自己満足といえば
>>407で作ったついでに
23ch.infoさんのログをかちゅdatとかちゅidxに取得変換する
htmltokatjudat.wsfも出来たっぽいですが
また出してこじれてもイヤなのでやめとくです
にしても
年々きつくなってくるなー
- 410 :名無しさん@勉強中 ★:08/01/01 11:33:44 ID:???
- 新年おめでとうございます
苺BBSをJaneNidaで読めるように出来ないか画策中。
変換してdat格納&読み込みは>>409のものの流用で簡単に出来たですが
>>405の欠番補完にまだ手をつけとらんです。
もひとつパラメータを追加して
ループ中でレス番(htmltodat.wsfだと$i)との数値比較をして
その差が1より大きかったらその数だけあぼーん行を追加するループをつければ何とかなりそう。
それほど面倒な作業でもなさそうです(そう思わなきゃやっとれん)
問題はsubject.txt生成で
>>404のメガBBSのようなURLが該当しなさそう。
ホットゾヌ2の場合は例えば
http://www.ichigobbs.net/cgi/aska_list.cgi?bo=economy&page=0
からsubject.txt化されてるみたいなんですが
自分でやるとなると次ページ次ページと順繰りにアクセスしてマージしないといかんですし
そうやってsubject.txt化するのも時間がかかりそう。
ここはタイトル取得を諦めて
http://www.ichigobbs.net/economy/economy_new.txt
からsubject.txt生成してみるかな。
でもタイトルが無いというのはやはりなと思うですし
subject.txt都度書き換えで消えてしまうかなとか悶々と
新年早々、何だかもうどうでもいい気がしてきたです
てか苺BBS経済板のドラエモンさん お元気そうで何よりです
- 411 :名無しさん@勉強中 ★:08/01/01 18:03:11 ID:???
- メモ
http://www.ichigobbs.net/cgi/aska_list.cgi?bo=economy&page=0
のsubject.txt化
マッチ用正規表現
<b>[0-9]+</b> : * *(\([0-9]+\)) <a href="/cgi/15bbs/[^/]+/([0-9]+)/L30">(.+?)(</a> <font .+?\n)
変換式
$2.dat<>$3$1\n
- 412 :名無しさん@勉強中 ★:08/01/03 14:28:06 ID:???
- メモ
http://makimo.to:8000/i/
のdat化について
URL例
http://makimo.to:8000/i/d.cgi/livebase/2ch.net/live24/1187671540/?i=1001
正規表現
m#<hr>([0-9]+):(.+?):(.+?)(?:\[(.+?)\])?<br>(.*?)(<hr>)#mki
前処理
s#(<title>)29-(.+?</title>)#$1$2#ik
s#<a href=/i/d.cgi/.+?>(.+?)/(2ch\.net|bbspink\.com)/(.+?)/(\d+?)(/.*?)?</a>#http://$3.$2/test/read.cgi/$1/$4$5#igk
s#<a href=http://www\.google.+?>([^h\&].+?)</a>#http://$1#igk
s#<br><font color=\#000080>▼\d\d/\d\d/\d\d\(.\) \d\d:\d\d</font>##igk
変換結果式
$2<>$4<>$3<>$5<>
後処理
s#((?:^|\n).*?)(◆.+?)<>(.*?)<>#$1</b>$2<b><>$3<>#igk
これって>>111や>>115の再掲になるですが、これでdat化出来るかも。
ただ注意点が二つ。
(1) beリンクがはじめから消えている
(2) 連続スペース等はマージ(カッケー!)されてしまっているので
AAが崩れてしまう
上2点は我慢するしかなさそうです。
- 413 :名無しさん@勉強中 ★:08/01/03 15:13:48 ID:???
- 年月日の欄も省略されてるですか。
「2007/」ってのを日付の前に付ければ良いのなら
後処理で
s#((?:^|\n).+?<>.*?<>)#$1 2007/#igk
でその場しのぎにはなるですが。
ところでこれって
s#((?:^|\n).+?<>.*?<>)#$12007/#igk
ってやると「$12007」の部分で駄目だったのでやむなく半角スペース入れたですが
この場合どうやればいいんでしょうね。
あと、後処理でも
前処理の$serverや$boardみたいなものが欲しいなと思ったです
上のような事をやるのに結構使えるのではないかと。
- 414 :名無しさん@勉強中 ★:08/01/03 15:47:07 ID:???
- >>413の対処案
その場しのぎに変わりないですが。
s#((?:^|\n).+?<>.*?<)>#$1>2007/#igk
年をまたぐ場合はどうしましょう。
実況スレのようにせいぜい数日で終わる場合なら何とかなりますが
そうじゃない場合は・・・わかんない。
- 415 : ◆/vmukiyuzw :08/01/04 01:25:46 ID:070Pexro
- dat→htmlに変換する時点で元データが加工もしくは改竄(?)されてしまってる場合、
どこまで元データに近づけるよう復元したいかは、個人的な割り切りしかない、と思います。
# その割り切りレベルが自分にはわからなかったのでmakimo.toにはなるたけ近づきたくなかった、
# と思うことはあります
で、>>413-414のように、「年」を復元するような作業も、力を入れても不毛かもとか思います。
板によっては数年かけて続いてるようなスレもありますし・・・
これもどこで割り切るか、という話になるかと思います。
- 416 : ◆/vmukiyuzw :08/01/04 02:39:50 ID:070Pexro
- すみません。↑は私の板のほうに書くべきことだったような気がします。
申し訳ありません。
- 417 :名無しさん@勉強中 ★:08/01/04 18:40:57 ID:???
- 8時から18時までみっちりと立ち回った後で
現在一息ついてますが
こういう毎日がまた始まると思うと
なんか何もかもどうでもよくなってきますね
>>415-416
自分もそう思うです。
ただ、>>318-335であれこれ考えた事と同様
何となくやってみただけの事なので
別にそんな大した事でもないです
ただ、思うんですが
意味のある事にしか意味がないという事はないと思うんですよ。
一見 無意味に見える事にも 必ず意味があるのではないかと。
そう思わなかったら意味がないじゃないですか。
ところで
私がやっている事って 意味があるんですかね?
もっというと
私が存在している意味ってあるのかなと。
別に誘い受けという訳でもないですが
こういう考えって 袋小路に迷い込みますね。
- 418 :名無しさん@勉強中 ★:08/01/05 12:01:48 ID:???
- 最下部にぽっぷちゃっとをつけてみたのですが
同時接続人数を見て驚いたです
超人気ブログとかと同じくらいアクセスがあるではないですか
別にカウント数をごまかしてる訳でもないですし
と同時に
自前設置してある入室者表示スクリプトとの差異が気になったです
この違いは何なのだ
スクリプトは
http://myako.net/
の「入室者数表示スクリプト」を使わせて頂いてるのですが
もしかしたらホスト取得の箇所で
ほぼ同一アドレスのものが丸められているのかなとか素人は考えたですが
それ以上はなんとも。
該当個所は
# −−−−−−−−−− ホスト情報の取得 −−−−−−−−−−
sub host{
local ($host);
$addr = $ENV{'REMOTE_ADDR'};
$host = gethostbyaddr(pack("C4",split(/\./,$addr)),2);
if ($host eq ''){ $host = $addr;}
$host =~ s/,/./g;
return($host);
}
なので
$ENV{'REMOTE_ADDR'}に同じ数値が入る場合があるのだろうかと。
同じアパートの隣室同士とかどうなんでしょうか。
- 419 :名無しさん@勉強中 ★:08/01/05 12:52:13 ID:???
- ふと思ったですが
nicovideo.jpの時報と同様の事が
mirrorhenkanでも出来そうですね。
トップ右上で現在時刻と対応キーを現在形で表示させてありますが
そこの所でキリがいい時刻の時には
例えば「jihou.wav」をembedさせるようにする とか。
まあやんないですけど。
- 420 :名無しさん@勉強中 ★:08/01/09 19:09:01 ID:???
- http://society6.2ch.net/test/read.cgi/gline/1165245437/506
done(カッケー!)
でも使ってる人居るのかな
- 421 :名無しさん@勉強中 ★:08/01/09 19:25:08 ID:???
- syoboon - マイピクチャの整理
http://syoboon.asks.jp/78938.html
−−−−−−−−−−−−−−−−−−−−−−−
スレとかに貼られている画像や、ニュースとかの画像をしょっちゅう保存している割に
2006年から全く整理をしていないせいでマイピクチャを開くだけで
CPU100%になってしまうので、そろそろ整理でもしようかと。
ジャンルで分けると恐ろしく面倒になるので、タイムスタンプで分けようと思ったんですが、
ちょっと探した感じじゃそんなソフトは無いみたいですね、、、
−−−−−−−−−−−−−−−−−−−−−−−
ファイルをタイムスタンプで分けるようなソフトもどこかにあるとは思いますが
とりあえずwshで簡単に出来る(語弊があるけど)と思うです。
何らかの規則を設けてフォルダ分けする事にして
振り分けるフォルダが存在しなかったら作成するようにして
振り分け対象のフォルダを指定してその中のファイルのそれぞれについて
FileSystemObject(だったかな)でそれぞれのタイムスタンプを取得して
ファイル移動orファイルコピーすれば良さそうな感じ。
でもsyoboonさん もしかしたらLinuxオンリーの方なのかもしれず。
もしそうだとしたら、wshでスクリプトをこさえたとしても無意味なのかもしれず。
というか phpでも同様な事が出来るでしょうし
だもんでこの件 とっくに解決済みな事なのかもしれず。
まあスクリプト作ってもあたしゃチキンですから。
syoboon - liveb1終わってた
http://syoboon.asks.jp/79456.html
うわー。
- 422 :名無しさん@勉強中 ★:08/01/11 19:30:23 ID:???
- メモ
アニ関西Wiki
http://anikan.tv/
- 423 :名無しさん@勉強中 ★:08/01/11 19:40:55 ID:???
- http://society6.2ch.net/test/read.cgi/gline/1193462528/210-212n
「Linux使いなのでdat化出来ません」という御返事が返ってきたら
どうすればいいのでしょうか
そういえば
http://society6.2ch.net/test/read.cgi/gline/1165245437/502-503n
でMac使いの方も書き込んでおられるのですが
どうすればいいのでしょうか
まあどちらの件も
元気になったら考えてみようという事で。
- 424 :名無しさん@勉強中 ★:08/01/11 19:44:34 ID:???
- ところでもしかしたら
2ch-imodeの管理人さん 上記スレッドを見て
気が向いた時にアップされておられるのかもしれず。
だとしたら ありがとうございます
- 425 :名無しさん@勉強中 ★:08/01/12 18:09:32 ID:???
- メモ
2nv - 2ch News View
http://nika.sakura.ne.jp/2nv/index.html
管理人さんのお名前やブログを見てみると
どこかの研究室に所属されておられる理系の女性なのでしょうか。
- 426 :名無しさん@勉強中 ★:08/01/13 13:37:33 ID:???
- メモ
読めないdat落ちスレのhtmlミラー避難所[2] 2ch過去ログ保管予約
http://2ch.free4seo.com/reserve/view/369
これのdat化および
元URLからの表示が出来たら嬉しいです(私が)
dat化は何とかなるような気もしますが
一見したところ
本文の改行部分が全部なくなっているような。
あと 元URLからの表示のほうは
上記サイト管理人さんにお訊きしないとわかんない感じです。
- 427 :名無しさん@勉強中 ★:08/01/13 14:07:04 ID:???
- メモ
2ch過去ログ保管予約(http://2ch.free4seo.com/)のdat化について
URL例
http://2ch.free4seo.com/reserve/view/369
正規表現
m#<div class="author"><a name="\d+">([0-9]+)</a>名前:( ) Mail: (.*?) 投稿日: (.*?)</div>.+?<div class="post">(.*?) </div>#mik
前処理
s#(<title>.+?) 2ch過去ログ保管予約(</title>)#$1$2#ik
名前と本文改行がhtmlの段階からないみたいです。
あと前処理がうまくいかない感じなのは何でなのでしょうか。
- 428 :名無しさん@勉強中 ★:08/01/13 14:09:20 ID:???
- 書き忘れ
変換結果式
メール欄逆転
- 429 :名無しさん@勉強中 ★:08/01/13 18:45:32 ID:???
- えーと
2ch-imodeさんの所なのですが
やはりこっそりとアップして下さっておられるようで
こっそりとありがとうございます
それはそうと
また少しhtml部分を手直しされたようで
http://mirror.sarashi.com/htmltodat/968412567.html
AASのリンクがあったりなかったりというのは今まで無かったですし
名前や日付あたりの半角スペースの有無もまた少し以前と異なっておられるような。
ちょっとまたこんがらがってしまってるので正規表現やりかけメモ
これだとレス11でストップひばり君です
m#<p>\[([0-9]+):(.+?) (?:≪(.+?)≫)? \((.+?)\) ?(?:<a href=.+?>AA</a>)?\]<br> ?(.*?) </p>.*?<hr>#mik
- 430 :名無しさん@勉強中 ★:08/01/13 19:22:52 ID:???
- メモ
2ch-i(http://2ch-i.net/)のdat化について
正規表現
m#<p>\[([0-9]+):(.+?)(?:≪(.+?)≫)? +\((.+?)\) ?(?:<a href=.+?>AA</a>)?\]<br> ?(.+?)</p>.*?<hr>#mik
前処理
s#(<title.*?): 2ch-i(</title>)#$1$2#k
s#<SCRIPT language="JavaScript">.+?</SCRIPT></body></html>##igk
変換結果式
メール欄逆転
後処理
s#(\n.*?)(◆.+?)<>(.*?)<>#$1</b>$2<b><>$3<>#igk
- 431 :名無しさん@勉強中 ★:08/01/14 12:00:11 ID:???
- また後処理直すの忘れてた・・
上のだとレス1の名前欄にトリップがある場合にヒットしないです
後処理
s#((?:^|\n).*?)(◆.+?)<>(.*?)<>#$1</b>$2<b><>$3<>#igk
- 432 :名無しさん@勉強中 ★:08/01/14 18:32:14 ID:???
- http://pc11.2ch.net/test/read.cgi/software/1195310686/851
しこしこ書いて一応投稿してみたのですが
「PC替えろ」で終わったら悲しいなと
- 433 :名無しさん@勉強中 ★:08/01/16 20:26:57 ID:???
- ふと思ったんですが
名前欄に
#fusianasan
とか
#山崎渉
とか書いて投稿したら
どう表示されるんですかね?
自分とこのホスト名なのか
それとも
それぞれに対応するトリップなのか。
ちなみにトリップ表示された場合
上は「◆M2TLe2H2No」
下は「◆RB/pr3SWUk」
となるみたいですが。
まあ試せばわかるでしょうけど
しかしそれにしても実に何とも限りなくどうでもいい話だ
- 434 :名無しさん@勉強中 ★:08/01/19 19:51:52 ID:???
- 2ch-imodeさんの所なんですが
dat化したい際に問題がある場合があるみたい
http://mirror.sarashi.com/htmltodat/1171967272.html
http://mirror.sarashi.com/htmltodat/1200134001.html
例えばこの二つとかだと>>430で未変換行が出るです
上だとレス5と6
下だとレス258
で、調べてみると
どちらも超長文なので略されているみたいで。
これはちょっとどうしようもなさそうですね。
幸い、未変換行がすぐわかるので
それで省略レスを突き止めて各自手直しして頂くしかないのかな とか。
- 435 :名無しさん@勉強中 ★:08/01/21 18:02:12 ID:???
- メモ
ムッハー(*゚∀゚)=3 (http://muha.xrea.jp/)
のdat化について
URL例
http://muha.xrea.jp/?q=http://society6.2ch.net/test/read.cgi/gline/1165245437/
正規表現
m#<div.+?><dt.+?><input.+?> ([0-9]+) : <label.+?>()<b class="name">(.+?)</b> (.+?)</label></dt><dd>(.*?)</dd></div>#mik
前処理
s#<title.+?/title>##ik
s#<h2>(.+?)</h2>#<title>$1</title>#ik
後処理
s#(<><>)\[(.*?)\](.+?)(<>)#$1$3 $2$4#igk
s#((?:^|\n).*?)(◆.+?)(<>)#$1</b>$2<b>$3#igk
ほんの4日前に開設なさった所みたい。
メール欄は省略しておられるようです。
- 436 :名無しさん@勉強中 ★:08/01/21 18:43:33 ID:???
- とかいって
仕様を見てみると
そうでもないようで
http://muha.xrea.jp/template.txt
ごめんよくわかんないです
- 437 :名無しさん@勉強中 ★:08/01/21 19:03:06 ID:???
- スレッドタイトルとかあんまり気にしないように
ギンギンに勃起した娘。メンバーたちにマワされたい2
http://f57.aaa.livedoor.jp/~moshimo/moshimo_log/moshimo475.htm
検索してたらこれが出てきたんですが
最下部を見てびっくりしたですよ
- 438 :名無しさん@勉強中 ★:08/01/22 18:20:01 ID:???
- >>435でやったものですが、後処理が間違ってたですね。
これだとIDが表示されないです。
こうかな
後処理
s#(<><>)\[(.+?)\](.+?)(<>)#$1$3 ID:$2$4#igk
s#(<><>)\[\](.+?)(<>)#$1$2$3#igk
s#((?:^|\n).*?)(◆.+?)(<>)#$1</b>$2<b>$3#igk
- 439 :名無しさん@勉強中 ★:08/01/22 18:27:38 ID:???
- このサイトですが
Web製作板でお見かけしたです
まとめサイト運営してる人 Part2
http://pc11.2ch.net/test/read.cgi/hp/1148609976/704
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
704 名前:Name_Not_Found[sage] 投稿日:2008/01/17(木) 05:44:10 ID:???
こんなもの作ってみたよ。
とりあえず抽出機能だけ付けた
ttp://muha.xrea.jp
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
で、まあ
色々な人が居るですが
下の方とか
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
750 名前:Name_Not_Found[sage] 投稿日:2008/01/21(月) 21:40:16 ID:???
プログラミングとしては初級だろうな
ただこの板にプログラミングかじった奴が居なさすぎるから神なんて言われる
こりゃただの文字列操作に過ぎない
誰でも作れるから、誰も作ろうとしなかっただけさな
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
こういうのって見ないほうがいいだけなんでしょうけど
本物のすごい人はわざわざこんな事書かないだろうなと
- 440 :名無しさん@勉強中 ★:08/01/22 19:28:53 ID:???
- メモ
Internet Archive Wayback Machine
http://web.archive.org/web/*sr_1nr_2653/http://2ch.dumper.jp/*
dumper.jpさんの所のファイルですが
webarchiveにだいたい1500スレ前後残っているみたいなので
スクリプトでスクレイピング(カッケー!)すれば
ある程度 半自動でリスト生成出来るかもです
って そんなスクリプト 誰が作ってくれるんでしょ
- 441 :名無しさん@勉強中 ★:08/01/22 20:47:36 ID:???
- 少し考えてみると
上のソース(http://web.archive.org/web/*sr_1nr_2653/http://2ch.dumper.jp/*)
から拾い上げたいリンクは例えば下記
<a href="http://web.archive.org/web/20050614012049/2ch.dumper.jp/0000015881/">2ch.dumper.jp/0000015881/</a><br>
<span class="mainSearchText">1 page from Jun 14, 2005</span><br><br>
<a href="http://web.archive.org/web/*hh_/2ch.dumper.jp/0000017733/">2ch.dumper.jp/0000017733/</a><br>
<span class="mainSearchText">~2 pages between Jan 07, 2007 and Jan 12, 2007</span><br><br>
このうち
(1) 上は1ページしか保存されてない(1 page from Jun 14, 2005)ので
http://web.archive.org/web/20050614012049/2ch.dumper.jp/0000015881/
をDLするなりして分析すれば良いと思うですが
(2) 下は2ページ保存されている(2 pages between Jan 07, 2007 and Jan 12, 2007)ので
http://web.archive.org/web/*hh_/2ch.dumper.jp/0000017733/
へ行って各々のアーカイブを見てみる必要がありそうです。
とりあえず(1)と(2)の区分けですが
リンク先URLの正規表現で何とかならないかな?
並べると
http://web.archive.org/web/20050614012049/2ch.dumper.jp/0000015881/
http://web.archive.org/web/*hh_/2ch.dumper.jp/0000017733/
となり
複数ページ保存の場合のURLは「〜/+hh_/〜」というのが他にもついているので
1ページしかないものは
http://web\.archive\.org/web/\d+/2ch\.dumper\.jp/\d+/
複数ページ保存されているものは
http://web\.archive\.org/web/\*hh_/2ch\.dumper\.jp/\d+/
とやって
上にマッチしたらDL
下にマッチしたら別個リストに追加 とか。
- 442 :名無しさん@勉強中 ★:08/01/23 20:59:36 ID:???
- >>435>>438ですが
beや株主優待や●みたいなのがIDの後に付くような所だと
これではよくないっぽいですね。
試してないですがレス1とか多分よくないかもです
いやー奥が深いなぁ (←勝手に深くしてるだけだったりして)
- 443 :名無しさん@勉強中 ★:08/01/23 21:27:02 ID:???
- メモ
2chミラー計画(http://web.archive.org/web/*/http://fun.kz/)
のdat化について
URL例
http://web.archive.org/web/20050221015734/http://fun.kz/test/read.cgi/comic/1085912649/
正規表現(「行が長い」と出たので適当に改行してます)
m#<div class="day"><a.+?>([0-9]+)</a> 名前:(.*?) ?\[(.*?)\] 投稿
日:(.*?)<br><div class="body"> ?(.*?) </div></div>(<div class="day">|[ ]+(?:<hr.*?>|<div align="center">))#mik
変換結果式
メール欄逆転
前スレ651のコピペですが。
- 444 :名無しさん@勉強中 ★:08/01/23 23:29:49 ID:???
- http://pc11.2ch.net/test/read.cgi/software/1195310686/910
更新なさったですが
http://pc11.2ch.net/test/read.cgi/software/1195310686/870-872n
の要望は見送られたみたいで。
駄目なのかなあ
- 445 :名無しさん@勉強中 ★:08/01/26 20:15:00 ID:???
- 更にをミラーを3つ追加してみたりして
あと
(1) http://ruku.qp.tc/
(2) http://2ch.dumper.jp/
(3) http://2ch.pop.tc/
の
消えてしまったそれぞれのhtmlミラーの
http://web.archive.org/に保存されているもののリストでも作ってみようかなと。
- 446 :名無しさん@勉強中 ★:08/01/27 12:28:54 ID:???
- http://society6.2ch.net/test/read.cgi/gline/1193462528/247-249n
ふむ
その1bでも1001レスあるみたいですし
少しだけ携帯用のも追加してみますか
- 447 :名無しさん@勉強中 ★:08/01/27 13:16:41 ID:???
- というか
その20にもあるなあ
でも公式p2にはdatが存在してないですし
色んなケースがあるんだなーと。
ちなみに
http://society6.2ch.net/test/read.cgi/gline/1193462528/245-246n
の
http://etc3.2ch.net/test/read.cgi/charaneta/1107347770/
も、dat落ち保管所さんがアップなさったものがwebarchiveに残ってるみたい。
天使のしっぽ3 トラウマなんてこわくない!
http://web.archive.org/web/20060723021603/http://2ch.pop.tc/log/05/10/05/0723/1107347770.html
- 448 :名無しさん@勉強中 ★:08/01/27 14:54:47 ID:???
- メモ
Internet Archive Wayback Machine
http://web.archive.org/web/*sr_1nr_1368/http://www.2chdat.net/*
http://web.archive.org/web/*sr_1nr_1929/http://user.ftth100.net/mirrorhenkan/*
- 449 :名無しさん@勉強中 ★:08/01/27 18:23:32 ID:???
- http://qb5.2ch.net/test/read.cgi/operate/1201374777/25-26+40-43
再び
キャッシュサーバを用意して下さるのでしょうか
- 450 :名無しさん@勉強中 ★:08/01/27 20:01:16 ID:???
- >>445で書いたwebarchiveに保存されているhtmlですが
いちおうやってみたらそれぞれ
(1) http://ruku.qp.tc/
→18108
(2) http://2ch.dumper.jp/
→1527
(3) http://2ch.pop.tc/
→4880
という事のようで。
>>195で出したwshとhtmltodatが大活躍してくれました。
- 451 :名無しさん@勉強中 ★:08/01/28 20:40:27 ID:???
- 上の間違ってるっぽい
dumper.jpさんのはちょっと見てないですが
他二つやり直してみたです
(1) http://ruku.qp.tc/
→19901
(3) http://2ch.pop.tc/
→4864
たぶんこれで合ってるんじゃないかと。
リストを出しとくです
http://mirror.sarashi.com/webarchive/ruku.txt
http://mirror.sarashi.com/webarchive/2chpop.txt
http://mirror.sarashi.com/webarchive/dumper.txt
「URLリストを出されてもそれでどうしろと」とか言われそうですが
さあこっちでもどうしたものか。
全部合わせて2メガくらいのデータになるので
JavaScriptで検索するのはちと重そうですし
これ以上増える事もなさそうな静的ファイルなので
適当な検索CGIと連動させるようにでもしてみますか。
- 452 :名無しさん@勉強中 ★:08/01/28 21:02:27 ID:???
- ミラーをも一つ追加してみたです
>>451のリストファイルですが
dumper.jpさんのものはそのままでは使えないですね。
それぞれのミラーに対応するdatキーを拾わなければならなそうです
1500スレッドという事なので
手動でいちいち覗いて元スレを探すのはとてもとても。
それ用にスクリプトを考えたほうが速そうだ(って 出来るのかいな自分)
「急がば回れ」という奴ですか。
「労力を惜しむ為の労力を惜しまない」という言い回しもありますな
- 453 :名無しさん@勉強中 ★:08/01/29 19:29:03 ID:???
- メモ
JavaScriptによる全文検索エンジン - llameradaの日記
http://d.hatena.ne.jp/llamerada/20070123/1169566034
- 454 :名無しさん@勉強中 ★:08/01/29 19:58:53 ID:???
- JavaScript を用いて Brass Band Podcasting の全エントリを検索
http://blechmusik.xrea.jp/brasscast/search/
- 455 :名無しさん@勉強中 ★:08/01/30 21:46:19 ID:???
- 何かリロードバーボンがきついみたいなので
一時的にプレビュー表示をやめてみたです
何か言われてもへこむのでここで
ところで
このバーボン回避は他の方々どうされておられるのかとあちこち見てたら
けっこうミラーや中間サーバを出されている方もいらっしゃるんですね。
という訳でまた追加してみたです
こんな状態でこんな事するなんて
私は鬼か鬼なのか
- 456 :名無しさん@勉強中 ★:08/01/31 20:12:52 ID:???
- キャッシュサーバがカタチになられたようで。
【Love Affair】携帯からのアクセスに対する考察・次の一手 Part4 - ボーリング場
http://qb5.2ch.net/test/read.cgi/operate/1201374777/l50
調べようと思ったらsyoboonさんの所に。
syoboon - r.so
http://syoboon.asks.jp/82970.html
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
datはこっち
http://bg20.2ch.net/test/r.so/{server}/{dir}/{key}/
subject.txtはこっち
http://bg20.2ch.net/test/p.so/{server}/{dir}/
↑必ず最後のスラッシュは必要みたい。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
DinoSwiftさんの所もこれでリロードバーボン回避出来るようになるかも。
で、落ち着いたら自分のとこも
datget関係のスクリプトを全部見直してみますか。
- 457 :名無しさん@勉強中 ★:08/02/02 11:53:38 ID:???
- 何か本当に色々あるだなぁ・・・
【スレッド】2ch型掲示板 14 【フロート型】
http://pc11.2ch.net/test/read.cgi/php/1127896640/950-952n
いちおう書いてはみたですが
その前にまず
すっげー大事な事がひとつあるのです
これやるとしたら
まずPerlスクリプトの読み方からまず思い出さないと。
というか
勉強し直さないといかんです
付け焼き刃はこれだから。
- 458 :名無しさん@勉強中 ★:08/02/02 19:27:50 ID:???
- MOONGIFT: ≫ JavaScriptを使ってSQL調にデータを検索「JsonSQL」:オープンソースを毎日紹介
http://www.moongift.jp/2008/02/jsonsql/
VBAエンジン
http://www2s.biglobe.ne.jp/~iryo/java/java1/engform.html
最速インターフェース研究会 :: Ajaxを使ったシンプルなチャット
http://la.ma.la/blog/diary_200507290022.htm
- 459 :名無しさん@勉強中 ★:08/02/02 19:34:06 ID:???
- [JSAN] JavaScriptライブラリ検索 - JSAN Search Kawa.netブログ(川崎有亮)/ウェブリブログ
http://kawa.at.webry.info/200605/article_4.html
- 460 :名無しさん@勉強中 ★:08/02/03 09:23:59 ID:???
- 中国2chさん
トップに行ってみたら
http://cn2ch.cn
−−−−−−−−−−−−−−−
応該結束的遅早還是会結束
byebye
−−−−−−−−−−−−−−−
簡体字の読解力がそう高くないのでgoogle翻訳で繁体字に直して
本字を現代日本で使ってる文字に直してやっと理解出来たんですが
「ここ遅かれ早かれ終わりですバイバイ」って書いてあるのかなと。
掲示板をJaneNidaに登録してたんで知らなかったです。
ブログその他 リンクがないですがアクセス出来るですけど
何だか残念だなあ・・・
- 461 :名無しさん@勉強中 ★:08/02/03 12:01:43 ID:???
- メモ
実験中の何か
http://bbs.bp.to/
ボード一覧がずっと更新されておられないみたいですが
今まで読み込んだものでdat落ちしているものが読めたら嬉しいです(私が)
よく見てないですが。
2ちゃんねるログ勝手に保管所
http://metabolism.que.jp/logs/
- 462 :名無しさん@勉強中 ★:08/02/03 16:44:58 ID:???
- http://wota.jp/morningcoffee/maiha/read.php/1189468917/l10
http://2ch.auken.jp/?
http://cm.umu.cc/2ch.php
- 463 :名無しさん@勉強中 ★:08/02/04 20:12:34 ID:???
- >>457のスレッドで御返事があったので
また書いたですが
http://pc11.2ch.net/test/read.cgi/php/1127896640/950n-
そろそろ
「日本語でおk」
「○○まで読んだ」
みたいな茶々があってもおかしくないかなと。
てか
誰か替わってくんないもんかなー。
引き継いでくれる人が出てこないかなと切実に思うです
自分 Perlも携帯も絵文字もよくわかんないんで。
- 464 :名無しさん@勉強中 ★:08/02/04 20:24:44 ID:???
- メモ
携帯絵文字関連
日本語処理・携帯絵文字処理関係のperlモジュール
http://www.kawa.net/works/perl/i18n-emoji/i18n-emoji.html
プログラミング
http://onlyaffiliate.blog43.fc2.com/blog-category-33.html
絵文字を使いこなして見るためのページ
http://trialgoods.com/emoji/
おまけ
結構売れてるのね
Webプログラム制作【Potora】
http://potora.dip.jp/
- 465 :名無しさん@勉強中 ★:08/02/04 20:44:18 ID:???
- これがうまくいったら
絵文字表示出来る2chタイプのphpスクリプトもやってみますか
ってまた追い込もうとしてるのか自分
絵文字データベースと相互変換マッピングデータベースのJSONファイルを公開します。 : アシアルブログ
http://blog.asial.co.jp/330
- 466 :名無しさん@勉強中 ★:08/02/05 20:03:36 ID:???
- さて
Softbank携帯の絵文字の文字コード範囲を特定しようとしたら
何だか本家オフィシャルにも載ってないような。
まあ んなこたあないですよね。
私の目は節穴なので見つからなかっただけでしょう。
で
SoftBank携帯でShift_JISページのフォームから飛んでくる絵文字のバイナリコード - ゆどうふろぐ
http://d.hatena.ne.jp/Yudoufu/20071102/1193992749
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
ただ、自分で色々調べてて、どこにもこの件の情報がないので
あとからまたやる人は苦労するんじゃないかなーと思ってちょっとメモしとく事にしました。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
ゆどうふさんの心の広さ優しさに感動したです!ありがとうありがとう!
感謝感激ヒデキ還暦あと8年!
−−−−−−−−−−−−−−−−−−−−−−−
で、絵文字の範囲は、SoftBankの絵文字番号順に
1. [0xF9][0x41-0x9B]
2. [0xF7][0x41-0xF3]
3. ここでNo.264 - No.270がスキップ。
4. [0xF9][0xA1-0xED]
5. [0xFB][0x41-0xD1]
で、No.1 - No.478まで、でした。
−−−−−−−−−−−−−−−−−−−−−−−
- 467 :名無しさん@勉強中 ★:08/02/05 21:08:31 ID:???
- メモ
これでどうだろうか
$sjis = '[\x81-\x9F\xE0-\xEF\xFA-\xFC][\x40-\x7E\x80-\xFC]|[\x00-\x7F]|[\xA1-\xDF]';
$emoji_sb = '[\xF9][\x41-\x9B]|[\xF7][\x41-\xF3]|[\xF9][\xA1-\xED]|[\xFB][\x41-\xD1]';
$elem[3] =~ s/\G((?:$sjis)*)($emoji_sb)/$1.''.unpack('n',$2).';'/ego;
open(SBDATA,"<softbanksjisdata.txt") || die "can not open file02";
foreach(<SBDATA>){
chop;
@_ = split(/\t/);
$elem[3] =~ s/$_[1]/'<img src=..\/..\/..\/imgs\/j\/'.$_[0].'.gif>'/eg;
}
close(SBDATA);
どうだ全然わかんないだろう
自分も何が何やら。
まだ覚えていた頃に書いたコードを真似しただけですが
これで良いのかどうか。
とりあえず
$elem[3] =~ s/\G((?:$sjis)*)($emoji_sb)/$1.''.unpack('n',$2).';'/ego;
のunpack部分は違ってるかも。
これで合ってたとしても
softbanksjisdata.txtに書く変換表を478行用意しないとならないかも。
頭が痛くなりそうだ。
imodeとezwebの変換表の時はというと
公式にあったpdfファイルを印刷して一つ一つ手入力したですが
softbankにもそういう公式情報があったら嬉しいのですが。
- 468 :名無しさん@勉強中 ★:08/02/05 22:09:25 ID:???
- http://pc11.2ch.net/test/read.cgi/php/1127896640/961
投稿した直後から少し後悔してるです
尾を引きそうだ
- 469 :名無しさん@勉強中 ★:08/02/06 17:30:41 ID:???
- >>467
どうやらunpackで良さそうですね。
単に16進数表示させるようにしたいだけなんで。
http://tohoho-web.com/wwwperl2.htm#unpack
ところで、このコード中の$elem[3] ってーのにはdatファイル中の本文部分が入ってるんですが
名前やタイトルにも絵文字がある場合があるんで
その場合は$elem[0]と $elem[4]に書き換えれば良さそうですが
いっその事サブルーチンにしてしまえば楽なのかもです。
- 470 :名無しさん@勉強中 ★:08/02/06 20:16:33 ID:???
- さて
ReplaceStr.txtでも$EXTRACTを使えるようにして頂けたら
youtubeやnicovideoその他のサイトで
flvファイルへのリンクを出来るようになると思うんですが
要望してスルーされると寂しくなるしなー。
ImageViewURLReplace.datで代用出来たらいいんですが
画像のみみたいですし
うーむ・・・
- 471 :名無しさん@勉強中 ★:08/02/09 18:39:32 ID:???
- http://pc11.2ch.net/test/read.cgi/php/1127896640/963
絵文字コードを画像リンクにする方法ですが
薄皮を剥ぐように
うっすらと少しづつ
思い出してきたような気がします
覚えているうちに何かしておかないと
また虚空へかき消されてしまう
でも現実生活のほうでいろいろやらなければならなくて
余分な事する余裕が無さそう
ああこのジレンマ
- 472 :名無しさん@勉強中 ★:08/02/10 12:27:49 ID:???
- あれこれ調べながら読んでみて
ああこれ間違いなく私が書いたコードだなあと。
勿論あちこちのサンプルコードからコピペしたツギハギなんですが。
で、今までのコードだと
imode10進数とvodaphoneのそれが混同してしまってたっぽいのでちょっと手直し。
それにしても、vodaphoneって旧j-phoneにして現softbankって事になるんで
いやー目まぐるしいなあ。
で、色々見てみると
http://www.45ch.tv/
で出されていたEZwebビルトインアイコンの追加箇所がわかったので
それも追加してコードも変えてみようかなと。
ただ、コード範囲がよくわかんない。誰かまとめてないかなー。
まとめた方も居られるかもですが、見つからない場合は下のから特定しようかと思うです
EZwebの絵文字(全部)
http://cgi.wap2.jp/emoji/ezweb/?act=table
ついでに見てみると
DocomoとAUはうまく絵文字コード住み分けされてるんだなあと。
EZwebの絵文字(全部)
http://cgi.wap2.jp/emoji/ezweb/?act=table
開発者(カッケー!)側からしてみると
softbank絵文字ってほんとエイリアン来襲みたいな感じだと思ったり思わなかったり。
- 473 :名無しさん@勉強中 ★:08/02/10 13:48:36 ID:???
- >>471の全部コードから書き出してやってみたら
うまくいっている模様。
>>466のゆどうふさんに倣い書いとくです
EZwebの絵文字コード範囲は
[0xF3][0x40-0x7E,0x80-0xFC]
[0xF4][0x40-0x7E,0x80-0x93]
[0xF6][0x40-0x7E,0x80-0xFC]
[0xF7][0x40-0x7E,0x80-0xA8,0xAC-0xFC]
みたいです。
- 474 :名無しさん@勉強中 ★:08/02/10 17:48:54 ID:???
- いちおう出来たっぽいのでお伺いしてみたです
http://pc11.2ch.net/test/read.cgi/php/1127896640/965-966n
ウザいですかそうですかごめんなさい
- 475 :名無しさん@勉強中 ★:08/02/10 18:41:00 ID:???
- http://pc11.2ch.net/test/read.cgi/php/1127896640/967
まあ予想出来ていたので別にいいです
まともな反応が無ければこの件それまでという事で
関係ないですが
後の推移を見るにつけ
「作るんじゃなかったなーこれ」
というものが結構ありますね。
具体的にはよう言わんですが
- 476 :名無しさん@勉強中 ★:08/02/11 09:34:10 ID:???
- 「これってスレッドフロート掲示板の話じゃないよね」
という書き込みがありましたが
スレッドの1から見てみると
ゼロから掲示板スクリプトをやってみましたという投稿に対して
「そんなのイラネ」「0ch使えばいいじゃん」
というような反応ばかりだった訳で。
例えばJane外部コマンドスレでスクリプトの話がけっこう出ているのに
「それは外部コマンドの話じゃないよね」
と茶々を入れるようなものではないかなと。
それはともかく
絵文字表示スクリプト
全部書き直したくなってきた・・・
ニーズとは関係無しに。
- 477 :名無しさん@勉強中 ★:08/02/11 09:39:45 ID:???
- とりあえず
最新(?)の文字コード範囲でやり直したものに差し替えてみたです
read.cgiはまだですが
http://mirror.s151.xrea.com/emoji/emoji/
これ見ると
ASTEL絵文字だった領域が
全部AU絵文字領域にとって代わってしまっているみたい。
あとMac投稿では少しコードが変わるみたいで。
- 478 :名無しさん@勉強中 ★:08/02/11 09:44:41 ID:???
- メモ
i-mode絵文字コード範囲
[0xF8][0x9F-0xFC]
[0xF9][0x40-0x7E,0x80-0xFC]
- 479 :名無しさん@勉強中 ★:08/02/11 11:23:20 ID:???
- >>477の板
read.cgiも差し替えたです
あとはまともな反応があるまで
この件ここまでという事で
思うんですが
「0chありゃ他のイラネ」
「yykakikoあれば同上」
とか書いてる人って
「にくちゃんねるあるからみみずんイラネ」
とか書いてた人たちと同じにおいを感じるです
これ暴言になるかなとは思うですが。
それにしても、考えなしにそういう事書いてた人たちって
今どうしてるんでしょうね。
私の所を使ってるのかな。
- 480 :名無しさん@勉強中 ★:08/02/12 12:35:53 ID:???
- ぐらめぬ・ぜぷつぇんのはてダ
http://d.hatena.ne.jp/msakamoto-sf/
- 481 :名無しさん@勉強中 ★:08/02/12 19:57:21 ID:???
- 日がな一日寒空の下にいると
ほんと疲れちゃう
鏡の国(http://script.s16.xrea.com/)のスレッドフロートphp掲示板スクリプトを
絵文字表示化してみようかと読み込み中
やっぱりperlよりphpのほうが読みやすいわ
問題は、perlのpack/unpack/sprintf/while/chop
をphpでどのように書き換えるかなんだけど
みんな何とかなりそうじゃないですか。
- 482 :名無しさん@勉強中 ★:08/02/14 08:00:08 ID:???
- 笑われそうな話ですが
0chスクリプトのそこかしこに例えば
$allPath= $oConv->CreatePath($this->{'SYS'},0,$this->{'SYS'}->Get('BBS'),$key,'');
みたいに「->」というのがあるんですけど
これってどういう意味なんでしょうか。
検索してもよくわからない。
オブジェクト指向プログラミングでの継承だか外部ソースへのアクセスメソッドだかみたいかもですが
何だかよくわかんない。
てか
「オブジェクト指向」って何なんだろう・・・
いろんなものに喩えて説明しているんですけど正直よくわかんない。
オブジェクト指向の基礎 [Perl講座 -Smart]
http://www.rfs.jp/sb/perl/04/02.html
やはり基本が出来てないと駄目ですね。
下のエントリーとか見ると「モノが違うな」と思うです
\(^o^)/ - まさにっき(使えないプログラマーの記録)
http://d.hatena.ne.jp/seiunsky/20080125/1201307890#c
- 483 :名無しさん@勉強中 ★:08/02/14 19:20:09 ID:???
- やっと説明しているサイトがあったですよ
Perlオブジェクト指向プログラミング
http://www.rwds.net/kuroita/program/Perl_oo.html
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
パッケージ名->サブルーチン名で、パッケージ中のサブルーチンを探して、
それに引数を与えます。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
で、>>482はこちらかな
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
パッケージ名だけでなく、オブジェクトでもいいのです(refで見たとおり、
オブジェクトは、自分が属しているパッケージ名を知っているから)。
$obj->something(引数);
とすると、$objが関連付けられているパッケージ(今の場合、Stone パッケージ)
内にある、 somethingサブルーチンを実行します。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
という事は
$allPath= $oConv->CreatePath($this->{'SYS'},0,$this->{'SYS'}->Get('BBS'),$key,'');
$oBonvが関連づけられているパッケージ内にあるCreatePathサブルーチンを実行
↓
CreatePathサブルーチン処理:
$thisが関連づけられているパッケージ内にある
途中ですがちょっとわかんなくなったんで
上のページを精読してみるです
- 484 :名無しさん@勉強中:08/02/14 19:37:05 ID:pM3srDy0
- >>482
「->」これはPerlの矢印演算子です。左辺をデリファレンスします。
@array = ('hoge','hige','hage');
- 485 :名無しさん@勉強中:08/02/14 19:39:39 ID:pM3srDy0
- 途中で書き込んでしまった
と思ったら答えを見つけたのでよさそうです。
この場合はPerlでオブジェクト指向を実現するために使われます。
> $allPath= $oConv->CreatePath($this->{'SYS'},0,$this->{'SYS'}->Get('BBS'),$key,'');
変数$oConvのオブジェクトのCreatePathメソッドを呼びます。
- 486 :名無しさん@勉強中:08/02/14 21:21:03 ID:fXA8w4Uy
- (><;)
- 487 :名無しさん@勉強中 ★:08/02/15 20:31:58 ID:???
- 説明サイトを読んでから0chスクリプトを見てみると
packageとかコンストラクタとかshiftとかblessとかあって
教科書通りだうおーすげーとか思ったです
完全にオブジェクト指向を踏襲しているスクリプトなのですね。
こりゃオブジェクト指向をマスターしないと手をつけられないのかも。
とりあえず見よう見真似でsoftbank絵文字リンクをつけてみたです
あとは0ch最新版にのせかえて出すですな
やろうと思えばいろいろあると思うですが
早く片付けないと精神的に開放されないです
>>484-485
ごめんなさいごめんなさい
途中で止められても全然わかんないのです
申し訳ないのですが教えて頂けないでしょうか
寸止めプレイでじらされると 興奮しちゃう
ってごめんなさい
ああごめんさいごめんなさい
>>486
がんばりましょう
- 488 :名無しさん@勉強中:08/02/15 21:29:09 ID:SyuqxcwJ
- >>487
「package クラス名」は他の言語での「Class クラス名」に相当する文。
blessはPerlでオブジェクト指向を実現する上で必ず必要な関数。
blessしないとオブジェクトにならない。
shiftは使わなくてもいいんだが、引数が格納される配列@_の最初にパッケージ名(クラス名)
が入っているのでこれを@_から除かないと引数を使うときに2番目(添え字では1)から
はじめなければいけないから。
じゃぁ矢印演算子についてもうちょっと。
# Example これはオブジェクト指向とは関係アリマセン
%hash = ('aho' => 'hige','baka' => 'hage'); # %hashはハッシュです。
$hash_ref = \%hash; # $hash_refにはハッシュのリファレンスが入ります。
print $hash{'aho'}; # => hige
print $hash_ref->{'baka'}; # => hage
# Example End
$hash{'aho'}は%hashの'aho'という要素にアクセス。
対して、$hash_ref->{'baka'}は$hash_refという変数をデリファレンスして、'baka'という要素にアクセスします。
Perlのオブジェクトは、全て既存の型(変数、配列、ハッシュ)のリファレンスです。
たとえば、Carというクラスがあったとしましょう。
my $kuruma = Car->new('TEST');
# ↑の文の矢印演算子はパッケージを指定する用法。$kuramaに入るのは何かのリファンレンス
$kuruma->hashiru('fast');
# ↑の文は「&Car->hashiru($kuruma,'test');」「&Car::hashiru($kuruma,'test');」と同義。
# ただ、↑のように書いたほうがオブジェクト指向プログラミングらしいというだけ。
# Perlのオブジェクトの実体は単なるリファレンスなので、
# $kurumaがハッシュリファレンスだったとすると、↓のように直接インスタンス変数にアクセスできる。
$kuruma->{'syasyu'} , $${kuruma}{'syasyu'}
- 489 :名無しさん@勉強中:08/02/16 01:42:44 ID:vhUmtm1L
- 2ch DAT落ちスレ ミラー変換機 ver.4
いつも使わせて貰ってます。かなり変わってしまいましたね。
ところで、その9での取得したログなんですが、
・「その9」の整形方法はこちらにまとめてみました。ってところから
snapshotのスレをdat化する試みについて ってのでやってもエラーが出ます。
従来はできていたのですが、どうもリニューアルされているみたいで、
おそらく、前処理にさらに追加が必要の様なのです。
つきましては前処理のスクリプトの追加(変更?)をお願いしたいのですが、
対応いただけますでしょうか?
- 490 :名無しさん@勉強中 ★:08/02/16 20:05:57 ID:???
- >>483のページを紙に印刷してみたです
しめて22枚
よーし読むぞー
>>488
ありがとうございますです
恥ずかしながらよくわかんないので(何がわかんないのかもわかんないので)
とりあえず文章を印刷させて頂きましたです
よーし読むぞー
関係ないですが
「何がわかんないのかもわかんないので何を訊いていいのかわかんない」
という状態って
学校の授業とかでいやというほど経験したっけだなー
と下記エントリーを見て思ったり。
裏おんな | 『たったひとつの答え』
http://uraonna.blog31.fc2.com/blog-entry-158.html
今やってる事なんかも
授業で出ていたら猛烈に拒否反応を起こしてるだろうなと。
>>489
とりあえず
http://p2.chbox.jp/read.php?host=society6.2ch.net&bbs=gline&key=1165245437&ls=all
を
http://www.geocities.jp/mirrorhenkan/snapshot/
の正規表現その他でやってみたらdat変換出来たですが
例えばどのスレッドで出来なかったのでしょうか。
(スパムがひどくなったので この板、アドレスはh抜きでないと投稿出来ないです)
- 491 :名無しさん@勉強中 ★:08/02/17 19:32:46 ID:???
- ところでsnapshotdat化用の前処理は簡易版でばかりやってたので
すんげー遅いなと思ったですが
これどうしようもなさそうですね。
snapshotのリロードバーボン多発でp2todatも使えないケースが多くなったです
例えば下記スレッドってsnapshotには無いっぽいし
みみずんさんの所にも無さそうですし
23ch.infoさんの所からdat化させてもらって読んでみたり。
ブラック会社に勤めてるんだが、もう俺は限界かもしれない
http://yutori.2ch.net/test/read.cgi/news4vip/1195907887/
これってひろゆきさんが連絡をとりたがっておられたみたいだし
また書籍化されるんでしょうか。
http://qb5.2ch.net/test/read.cgi/operate/1199187475/911,965,971-
http://qb5.2ch.net/test/read.cgi/operate/1201205183/14,24,100
- 492 :名無しさん@勉強中 ★:08/02/17 20:03:22 ID:???
- 23ch.infoさんのdat化は>>407のでやったです
wshでのdat化は遅い遅い
で、このスレッドなんですが
nikaさんの所でも保管なさっておられるですが
今見たらdatのURL書式がマイナーチェンジされたみたいで
proxomitronのリダイレクトフィルタ経由ではエラーになってたです
URLはというと
html
http://com-nika.osask.jp/bbs/bbs.php?http://yutori.2ch.net/test/read.cgi/news4vip/1195907887/
dat
http://com-nika.osask.jp/test/dat.cgi/news4vip/1195907887/
このdatの書式なんですが
以前は確か
http://com-nika.osask.jp/test/dat.cgi/news4vip/1195907887.dat
だったような。
proxomitronフィルタの作り方忘れちゃったなー。
正規表現が独特だしなー。
で、それとは別に
そうなると
携帯版変換機の nikaさんとこのURL形式も直さないといかんのですか。
最近perlばかりでphpの書き方忘れちゃったなー。
- 493 :名無しさん@勉強中 ★:08/02/17 20:45:58 ID:???
- ソフトバンク、第3四半期決算は大幅な増収増益孫氏「今年はインターネット元年」と改めて強調 - しんさんの出張所 はてな編
http://d.hatena.ne.jp/shin/20080207/p5
http://k-tai.impress.co.jp/cda/article/news_toppage/38396.html
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
さらに、「私自身が、全ての端末機の企画にのめりこんでやっているので、
それなりの特徴と性能、アピールできる点がないと出さないという強い決意で
やっている。単に品揃えを増やすのではなく、良いものを増やしていく。(後略)」
・・・
トップ自らが端末の一つ一つにチェックをするという力のいれ方がよくわかる面白い内容でした。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
孫引きになるですが(ってまるでシャレみたいですが)
孫社長自らが携帯端末にチェックを入れているとの事ですが
絵文字コードの不統一さとかもわかってやっておられるのかなとか思ったです。
AUと絵文字コードが被るのはともかく(ってそれ自体も悩ましい事態ですが)
Shift_Jis第二水準(?)の漢字と文字コードが重複しまくってるのってどうなのよと。
例えば下のスレッド
漢字部分までSoftbank絵文字浸食しているのってどうなのよと
どうすりゃいいのさ濃い口醤油と
http://mirror.s151.xrea.com/emoji/test/read.cgi/emoji/1180412107/41
- 494 :名無しさん@勉強中 ★:08/02/17 21:01:06 ID:???
- AU絵文字との被り具合もすごいです
上下比較すると実に判りやすい
http://mirror.s151.xrea.com/emoji/test/read.cgi/emoji/1180412107/41
http://mirror.s151.xrea.com/emoji/test/readsb.cgi/emoji/1180412107/41
で、これらとは別に
Softbank3G絵文字を最優先表示するようなものも更に作らないといけないようで。
あんまりだ、あんまりだ。
- 495 :489:08/02/18 11:14:29 ID:dQ5deoi1
- >>490
せっかくレスを貰っていたのに遅くなって済みません。
該当のURLはこちらです。
ttp://p2.chbox.jp/read.php?url=ttp://love6.2ch.net/test/read.cgi/aasaloon/1197207826/all
元のアドレスはこちらです。
ttp://love6.2ch.net/test/read.cgi/aasaloon/1197207826/
エラー内容は 「1行が長すぎるか、正規表現が正しくないようです」 とでます。
- 496 :名無しさん@勉強中 ★:08/02/18 19:36:29 ID:???
- >>495
確かにsnapshotのdat変換ページのものでは出来ないですね。
何でだろ
配布版p2の最近のバージョンを見てみたですが
本文に到達するまでにJavaScriptやmetaタグその他が
んもうズラーっと200行くらいあるですね。
何かここまで長大な行となると
htmltodatの前処理で取り払うよりも
「○行目から○行目まではスルーする」
みたいなオプションがあったらいいなと思ったですが
どんなもんでしょうか(って誰に言ってるのよ)
それはそうと
自分で使ってたものだと変換出来てたので次レスにて。
もしyykakikoに書けなかったら したらばにでも書きますか。
- 497 :名無しさん@勉強中 ★:08/02/18 19:48:16 ID:???
- メモ
snapshotのdat化について
URL例
http://p2.chbox.jp/read.php?url=http://love6.2ch.net/test/read.cgi/aasaloon/1197207826/all
正規表現
m#<dt.*?>([0-9]+).+?(?:"mailto:\.?(.+?)">)?<b>(.*)</b>.*?:(.*?)</dt>.*<dd> ?(.*)<br><br></dd>#mik
前処理
s#\n(?:\t| +).+?\n##ig
s#\n<div.+?\n##ig
s#(<a )target=_top (href=)#$1$2#ig
s#(</a> )\[<a href="subject\.php\?host=.+?target="subject">板をp2で開く</a>\] #$1#ig
s#<title.*?>(.*?)/(.*?)</title>#<title>$2</title>#
s#\(<a href="read.php\?bbs=([^:]+?)ID:([^<]+?)(</a>(?:\(\d+\))?)#ID:$2#g
s#(\(p\))(h?ttp://)#$2#ig
s#(<><>)(.*?)( :)#<>$2<>#ig
s#\(<a href="http://be.2ch.net/test/p.php\?i=(\d+)&u=(.+?)\?(\#*)</a> *?</dt>#BE:$1-$3</dt>#g
s#<dd id=.*?\n##ig
s#</i></dd>##ig
s#<b>(.*?) </b>(.*):(.*?) :#<a href=\"mailto:$3\"><b>$1</b></a> :#ig
s#\(<a(.+?)\">p</a>\)##ig
s#<b>(.*?) </b>#<b>$1</b>#g
s#<a href="read.php\?host=.+?>(\d+)</a>#$1#ig
過度のレスアンカーやURLがある所とかだと
これでは対処できないかも。
- 498 :名無しさん@勉強中:08/02/18 20:19:59 ID:dQ5deoi1
- >>496-497
おかげさまで変換できました。
ありがとうございました。
- 499 :名無しさん@勉強中 ★:08/02/19 19:14:00 ID:???
- >>498
良かったです
でも何でマッチしなくなったのだろう。
調べるのも大変そうだ
ちなみにこれって
配布版p2スクリプトのhtmlをdat化する奴だもんで
p2.chbox.jpのhtmlであてはめても無意味な前処理も含まれてるですが
まあ動けばいいかなと。
これやってて思ったのは(って大分前ですが)
配布版p2では<a target=_top href=〜>というふうに記述される仕様になってるみたいで
このタグがhtmltodatでは自動削除してくれないみたいな事で。
というか
タグの書き方にも色んなバリエーションがあるんだなと。
- 500 :名無しさん@勉強中 ★:08/02/19 19:51:17 ID:???
- さて
いちおう
Softbank3G絵文字を最優先表示するようにやってみたです
http://mirror.s151.xrea.com/emoji/test/readsb1.cgi/emoji/1180412107/41
どこ変えたかというと
3つ並べれば分かり易いかも。
http://mirror.s151.xrea.com/emoji/test/read.cgi/emoji/1180412107/41
http://mirror.s151.xrea.com/emoji/test/readsb.cgi/emoji/1180412107/41
http://mirror.s151.xrea.com/emoji/test/readsb.cgi/emoji/1180412107/41
で、問題は
上下にあるページングのリンクなんですが
ここでつまづいております
ページングリンクってのは
「■掲示板に戻る■ 全部 1- 101- 201- 301- 401- 501- 601- 701- 801- 最新50」
これなんですが
「〜/read.cgi/〜」を「〜/readsb.cgi/〜」に変えたいだけなんですが
オブジェクト指向で書かれておるもんで
どこにこのサブルーチンがあるのかさっぱりわかんないのです
こういうのってどこに書いても「自分でやれ」と言われそうですし
さあ困った。
0chスクリプトのread.cgiやbbs.cgiやvalda.plその他あちこちにある
例えば
$Sys->{'SYS'}
の「$Sys」って どのモジュールで行われているのでしょう?
- 501 :名無しさん@勉強中 ★:08/02/20 20:29:02 ID:???
- 中国2chさんリニューアルしちゃった
http://cn2ch.cn/
Flashbbsスクリプトもお隠しになられたみたいで残念
JaneNidaで読み込んであるdatをどこかにバックアップしてみるかな
でもフェードアウトよりは全然いいですし
網頁空間的輪から別の網頁空間へと飛ぶと
うおおこんなに日本関係のもろもろの網頁空間があるのかと驚愕するです
国コードはcnで簡体字フォントを使っているですし
北京や広州とかみたいな地名が出てくるので間違いなく大陸中国のサイトだ
cn2chを見た時もそうでしたが
今回もかなり認識を改めたですよ
伊?美咲中文网BBS MISAKI,伊?美咲,bbs,??男,危?的姐姐,恋???,山女壁女,?迪生之母 - Powered by Discuz!
http://www.misaki-ito.com.cn/bbs2/index.php
广州源子文化?漫特区
http://www.yz.gz.cn/
_ANGEL DREAM_?? - [bbs.lmyangel.com] 制?┃素材┃?尚┃動漫┃音樂┃文字┃下載 - Powered by Discuz!
http://bbs.lmyangel.com/
RE-公式HP
http://yui.huming.com/RE/mine.htm
kkryuのもーそースペース
http://www.voiceblog.jp/kkryu/
- 502 :名無しさん@勉強中 ★:08/02/21 07:20:53 ID:???
- datとsubject.txtがあれば
わざわざdat2html等でhtml化せずともバックアップ出来そうですね。
http://mirror.sarashi.com/cn2ch/test/read.html/Otaku/1199585507/
香港版や韓国版geocitiesに上げようかなとやってみたら
拡張子datのファイルはブロックされてるですね
日本版のほうはOKなのになー。
- 503 :名無しさん@勉強中:08/02/21 14:05:15 ID:PHFkj0Vj
- >>500
> 0chスクリプトのread.cgiやbbs.cgiやvalda.plその他あちこちにある
> 例えば
>
> $Sys->{'SYS'}
$Sysには何かのオブジェクトが入っていると推測されます、それを調べるのはref関数を使います。
「ref $Sys」とすると、$Sysが何のオブジェクトのインスタンスなのかがクラス名が返されます。
ですから、「print ref $Sys;」とすると、何のオブジェクトのインスタンスなのか判るでしょう。
「print ref $Sys;」しないでも調べるためには、ソースを頑張ってたどって、コンストラクタが
呼ばれるところを探すしかありません。
と思っていまたどってみました。
read.cgiのPrintReadHeadサブルーチン内の$Sysをたどります。
すぐ上でmy($Sys,$Page)=@_;とあるので、サブルーチンの第一引数です。
PrintReadHeadサブルーチンを呼ぶのは、ReadCGIサブルーチンです。
PrintReadHead(\%SYS,$Page);とあるので、目的の$Sysはハッシュ%SYSのリファレンスです。
サブルーチンの定義のはじめに、my(%SYS,$Page,$err);とあるので、この時点では%SYSは空です。
Initializeサブルーチンにリファレンスが渡されていますので、Initializeサブルーチンの定義を調べます。
Initializeサブルーチンでは、先の%SYSのリファレンスは$pSYSに格納されるようです。
そのあと、%$pSYS = ('SYS'=> $oSYS,(中略) );とあるので、ここで、目的の$Sysはハッシュリファレンスであり、
その定義はInitializeサブルーチンでされている、と判明しました。
この場合、$Sysはオブジェクトのインスタンスではなく、ハッシュのリファレンスでした。
このようなときに「print ref $Sys;」を実行すると、「HASH」と出力されます。
- 504 :名無しさん@勉強中 ★:08/02/21 21:44:20 ID:???
- >>503
御丁寧にありがとうございます。
ひとつひとつはわからなくても流れを見てわかったような気になったような
・・とりあえずトレース方法は参考になります。
何で$Sysを求めていたかというと、PrintReadMenuサブルーチン中の
$pathMenu = $Sys->{'CONV'}->CreatePath($oSYS,0,$bbs,$key,"$st-$ed");
これで$pathMenuにナンバリングされたスレッドURLが入るところが判らなかったもので。
例えばここだと「http://yy14.kakiko.com/test/read.cgi/mirror/1186175383/1-100」が入るみたいで。
もっぺん書くと
$Sys->{'CONV'}->CreatePath($oSYS,0,$bbs,$key,"$st-$ed");
これのCreatePathサブルーチン(?)ってどこで行われているのだろう・・・。
適当な箇所で
$Page->Print(ref CreatePath);
としても何も表示されないですし。
それはそうと
さあ$Sysの復習だ なんちゃって
ごめんなさいごめんなさい
- 505 :名無しさん@勉強中:08/02/21 22:17:10 ID:PHFkj0Vj
- >>503
> $Sys->{'CONV'}->CreatePath($oSYS,0,$bbs,$key,"$st-$ed");
この場合は、$Sys->{'CONV'}に何が入っているのかを調べて、そのクラスのCreatePathメソッドを
調べることになります。
ちなみに、この場合のCreatePathはメソッドです。サブルーチンではありません。
Perlではサブルーチンもメソッドも定義の仕方は同じような感じですが、
オブジェクト指向用の作られていればメソッドと呼んだほうが良いです。
「$何か->ごにょごにょ();」←この形はメソッドの呼び方です。対して、
「&何か::ごにょごにょ();」または「何か::ごにょごにょ();」または「ごにょごにょ();」←これらはサブルーチンの呼び方です。
> $Page->Print(ref CreatePath);
ref関数の使い方が誤りだと思います。ref関数に渡すべきはインスタンスです。メソッド名を渡しても意味はありません。
「$Page->Print(ref CreatePath);」と書いた場合、perlは仕方なく、CreatePathを文字列、つまり"CreatePath"と解釈するでしょう。
これは何のインスタンスでも、リファレンスでもなく、ただの文字列です。ですから、ref関数は未定義値を返すでしょう。
正しくは「$Page->Print(ref $Sys->{'CONV'}」
また、$PageはTHORINクラスのインスタンスですが、THORINクラスのPrintメソッドはバッファに押し込むだけで
出力はされません。その点は考慮なさっていますか?
また、「$Page->Print(ref CreatePath);」の「CreatePath」のように、文字列をそのまま書くのはPerlの作法としては
推奨されません。シングルクォーテーションまたはダブルクォーテーションで囲むべきです。
なぜなら、perlは「CreatePath」を関数か、サブルーチンか、定数か、どれなのかと考え、どれでもないので
仕方がなく文字列と解釈するからです。また、後からこれを読む人にも同様の疑念を抱かせます。
これらによって、perlや後からこれを読む人も無駄な苦労をするでしょう。
したがって、明らかな文字列なので、明らかに文字列であるとわかるように、引用符でくくることが強く推奨されます。
- 506 :名無しさん@勉強中 ★:08/02/22 20:51:25 ID:???
- 公私共にいろいろあって疲れちゃった
だもんで一回休み
ちなみにこれ 携帯からです
いよいよ携帯ネットデビューσ(^◇^;)。。。
- 507 :名無しさん@勉強中 ★:08/02/23 18:27:53 ID:???
- ・・・よし、何とかなったかも。
泥縄式のツギハギですが。
えーと
他の所ではこんな事恥ずかしくて書けないですが
他ならぬ自分の板で自分の無知を晒すのは
自分が許す範囲でなら全然構わないと思うのです
という事で
>>505さん
ごめんなさい全然判らないですごめんなさいごめんなさい
> また、$PageはTHORINクラスのインスタンスですが、THORINクラスのPrintメソッドはバッファに押し込むだけで
> 出力はされません。その点は考慮なさっていますか?
ごめんなさい全然そこまで考えを行き届かせるレベルにすら達していないです
ごめんなさいごめんなさい
そもそもPerlに触れたのもほぼ2年振りですし
ほんと全然わかんないんです
今回はオブジェクト指向の書式に沿った書き方は棚上げにするです
それらは次の課題という事で。
一朝一夕には出来ない感じです。
ところで
Webでオブジェクト指向プログラミング
http://pc11.2ch.net/test/read.cgi/php/1133489897/342
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
342 名前:nobodyさん[sage] 投稿日:2007/03/28(水) 22:47:10 ID:???
2ch型掲示板を作る時はオブジェクト指向でやったなあ
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
これもしかして
0chスクリプトの作者さんなのかもとか思ったりして。
オブジェクト指向で書かれた2ch型掲示板って
今のところ0chしかわかんないですし
(って突っ込まれるかもですが)
- 508 :名無しさん@勉強中 ★:08/02/24 14:20:28 ID:???
- という事で更新したです
http://mirror.s151.xrea.com/emoji/
で
問い合わせがあったスレッドにも書き込んでと
http://pc11.2ch.net/test/read.cgi/php/1127896640/976
これでOKだったらいいですね。
これで駄目だったらどうしましょうか。
- 509 :名無しさん@勉強中 ★:08/02/24 14:21:07 ID:???
- 全くの別件でメール頂いた方もいらっしゃいますが
現実生活がとても忙しい事になってしまっているので
ごめんなさいしばらく停滞するです
- 510 :名無しさん@勉強中 ★:08/02/26 23:13:17 ID:???
- http://mesimarja.web.fc2.com/boon/html/200802/1203211106.html
懐かしいです
でも >>502をベースにしたほうが良いんじゃないかとか
僭越ながら思ったりしたです
これって株価【1550】 ▲▲▲▲ ◆cZfSunOs.Uさんがお作りになられたものを
使わせて頂いてるですが
.htaccess無しでも文字化けしないようにならないかなとあれこれやって
結局やりかけだったものだったなーと。
って これ↓ですが。
iswebでのテスト
ttp://mirrorhenkan.hp.infoseek.co.jp/cgi-bin/xml/test/read.html#html/1160652610/l50
以前たまたまお話させて頂いた凄い人に試してもらって
IE7対応にしてみたですが。
IE/Mozillaの分岐処理をもう少し詰めていけば
何とかなりそうな感じなんですが。
- 511 :名無しさん@停滞中 ★:08/03/01 19:45:22 ID:???
- http://pc11.2ch.net/test/read.cgi/php/1127896640/976-978n
自分の環境では
IEでもMozillaでも問題なくDL解凍アップ出来るのですが・・・。
2.6メガのzipで解凍したら3.6メガくらいになり
確かに解凍にえらく時間がかかったですが何の問題もなかったです
何よりも
要望をお出しになった方からの反応が無いので何とも。
というような程度の事でも
上記スレに書いて
また「ウザイ氏ね」
とか言われてもへこむだけでしょうし
- 512 :名無しさん@停滞中 ★:08/03/01 20:13:04 ID:???
- http://society6.2ch.net/test/read.cgi/gline/1165245437/547
とりあえず更新しましたけど
情報が少な過ぎるです
「変換できなくなっていました」だけでは手も足も出ないです
せめて該当スレッドなりミラーURLなり出して頂かない事には
しかし通信状態を逐一見ながらやってみると
2ch-imode.wsfって ほんと
作ってごめんなさいな感じのスクリプトですね・・・
本当にごめんなさい
- 513 :名無しさん@停滞中 ★:08/03/01 20:57:58 ID:???
- >>510ですが、今改めて見てみると
IEでは問題ないのですが
Mozillaではレス1だけしか表示されないですね。
少なくともBagelでは。
IEとMozillaって
改行コードの取得方法とかも違ってるのかな。
スクリプトをよく見てないですが、改行コードが
「Cr+Lf」「Cr」「Lf」のどれでもOKになるように書き換えればいいのかな。
あとスレタイ表示とレスアンカーポップアップと。
- 514 :名無しさん@停滞中 ★:08/03/01 21:27:20 ID:???
- 追記
>>510の最初のほうです
>>510の後のほうを使わせて頂いて
dat2html-7を設置してみようかな
- 515 :名無しさん@停滞中 ★:08/03/02 13:13:15 ID:???
- メモ
讃岐メニュー(http://s.s2ch.net/)のdat化について
URL例(そのうち消えると思いますが)
http://s.s2ch.net/test/---.uaY!FROM=&mail=&color=000000+efefef+0000FF+0000FF+FFFFFF&size=3&NG_NAME=&NG_MAIL=&NG_DATE=&NG_MESSAGE=/mamono.2ch.net/morningcoffee/1204168214/1-1001
正規表現
m#(?:<form action=i>|<br><br>)([0-9]+):<font color=.+?><b> ?(.+?) </b></font>(?::([^/]+?))?:(.+?)(?: |\(\d+\))?<br>(.+?)(<br><br>)#mik
前処理
s#<a href="http://be\.2ch\.net/test/p\.php\?i=(\d+).+?</a>(.+?)(<br>)#BE:$1-$2 $3#ig
変換結果式
メール欄逆転
後処理
s#(\n[^<]*?)<a.+?>(\d+)</a>#$1$2#igk
以前のものでは出来なくなっていましたので。
変更点は、正規表現部分の
「<font color=forestgreen>」を「<font color=.+?>」にしたです。
ちなみにこの箇所、讃岐メニューでは
「<font color="#228B22">」と数値に変更なさっておられるみたい。
- 516 :名無しさん@停滞中 ★:08/03/02 16:06:04 ID:???
- >>513の件
調べてみると なかなか厄介そうだ
改行の研究
http://www.umechando.com/tips/35.htm
これのテストをしてみると
IEだと22
Bagelだと21
になるですし
ブラウザ上にdatを表示させてソース表示させるブックマークレットを通すと
IEとBagelで全然違う表示になるみたいですし。
xmlhttpの場合は問題無いみたいなんですが
そっちだと文字化けの問題がありますし
さあどうしよう
- 517 :昼休み@@名無しさん@停滞中 ★:08/03/04 12:23:33 ID:???
- http://society6.2ch.net/test/read.cgi/gline/1193462528/336
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
【2】:スレッドのURL(1日2スレ以内)
http://anime.2ch.net/test/read.cgi/anichara2/1158025093/
その28で1001まであったので取得し、htmltodatで変換すると
「1行が長すぎるか、正規表現が正しくないようです」とエラーが出ます
正規表現はhttp://yy14.kakiko.com/test/read.cgi/mirror/1186175383/430-431nを使っています
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
dat化出来るけどなぁ・・・。
少なくとも「1行が長すぎるか、正規表現が正しくないようです」というエラーは出なかったです。
まあ上の場合は
レス71/80/126の3箇所で長文略がありますが。
もしかしたらOSやwshのバージョンの違いによって
返ってくるタグが変わってくるのかな。
少なくとも日本語OSでないと使えないでしょうし
(↑Shift_Jisがデフォルトだという前提で作ったスクリプトだもんで)
>>511の件といい
最近は、自分がやった事が伝わっているのかどうか
実に不安になるです
自分の説明不足なのかどうなのかが不明ですし。
- 518 :午後休憩@名無しさん@停滞中 ★:08/03/04 14:16:01 ID:???
- メモ
2ch-i(http://2ch-i.net/)のdat化について
html例
http://mirror.sarashi.com/htmltodat/1158025093.html
正規表現
m#<p>\[([0-9]+):(.+?)(?:≪(.+?)≫)? +\((.+?)\) ?(?:<a href=.+?>AA</a>)?\]<br> ?(.+?)<hr>#mik
前処理
s#(<title.*?): 2ch-i(</title>)#$1$2#k
s#<SCRIPT language="JavaScript">.+?</SCRIPT></body></html>##igk
変換結果式
メール欄逆転
後処理
s#(^|\n.*?)(◆.+?)<>(.*?)<>#$1</b>$2<b><>$3<>#igk
s#(▼)<A NAME=SKP1>(<>\r)#<font color="red">$1長文レスにつき略・・各自で補完して下さい http://www.geoticies.jp/mirrorhenkan/2ch-i/</font>$2#igk
s#</p>(?:<a.+?>)?(<>\r)#$1#igk
これですが、通常の2ch-iのhtmlでも使えますが
http://yy14.kakiko.com/test/read.cgi/mirror/1186175383/430-431n
で未変換行が出る場合だけ使ったほうがいいかも。(まあどちらでもOKですが)
上のhtmlの場合、レス71/80/126の3箇所で長文略になっており
>>430-431の正規表現ではそこをカバー出来ていなかったです。
今回のものなら省略部分は省略部分でdat化させるようにしたのでエラーも出ないかと。
省略部分を補完させたい場合は
dat化させたものを専用ブラウザで開いて
例えば「▼長文レスにつき略」でレス抽出すれば、省略レスの番号がわかります。
あとはその部分を差し替えれば良いのかなと。
上の場合、元URLが
http://anime.2ch.net/test/read.cgi/anichara2/1158025093/
で、
省略レスが71/80/126の3箇所あるので
http://2ch-i.net/&/anime.2ch.net/anichara2/1158025093/71-71.ni
http://2ch-i.net/&/anime.2ch.net/anichara2/1158025093/80-80.ni
http://2ch-i.net/&/anime.2ch.net/anichara2/1158025093/126-126.ni
をそれぞれ呼び出してdat化させて
該当行を各々差し替えれば良いと思うです
- 519 :名無しさん@停滞中 ★:08/03/05 18:26:40 ID:???
- 名前欄のように停滞中ですが
過酷な現実から目を背ける為に
まあ息抜き程度に
さて
またJavaScriptでdat2htmlでもやんべかと色々見てみたら
DOMって面白おすなあ
<script type="text/javascript">
<!--
function func() {
var oImg = document.createElement('img');
oImg.setAttribute("src", "xxx.gif");
var oDiv = document.getElementById("id123");
oDiv.appendChild(oImg);
var text = document.createTextNode('テスト');
oDiv.appendChild(text);
}
// -->
</script>
<div id="id123"></div>
<input type="button" value="OK" onclick="func()">
何したいかというと
容量が多いdatをJavaScriptでhtml表示する際に
今のものだと全部処理するまで表示されないものを
処理されたものをリアルタイムに反映してみたいなと。
こういうのって本家に立派なものがありますけど
まあいいじゃないかと
- 520 :名無しさん@停滞中 ★:08/03/06 18:23:11 ID:???
- appendChild
http://tomizawa-web.hp.infoseek.co.jp/method/appendChild.htm
- 521 :名無しさん@停滞中 ★:08/03/06 18:57:46 ID:???
- 上のスクリプトのポイントはこれっぽい
createTextNode()よりこっちのほうが良さそう
function fAppendChild() {
var oOl = document.getElementById('oOl');
var oLi = document.createElement('li');
oLi.innerHTML = 'LIオブジェクトを追加しました。'
; oOl.appendChild(oLi);
changeDisabled();
}
- 522 :名無しさん@停滞中 ★:08/03/07 18:14:45 ID:???
- http://pc11.2ch.net/test/read.cgi/php/1127896640/976-979n
これ見て
またまたDL解凍アップして
私の環境では何の問題も無かったんですけど
どうしたもんでしょうか。
他の方々も駄目なのかな
再アップしようにも2.5メガのzipだもんで
おいそれと置く場所が見当たらんのですが。
geocities.jpに置いたってーのは
例えば6年前(!)のmp3ファイルがまだ現役だったのでそこにしたですけど。
下記
http://academy4.2ch.net/test/read.cgi/gogaku/968412567/288
いっその事
sourceforge.jpとかvectorに
スペースを申し込んでみようかな
断られるかな
- 523 :名無しさん@停滞中 ★:08/03/07 19:04:03 ID:???
- ちょっとカッとなったのでリンクしたです
今さら直そうにも
さてどこをどういじったのやら
0chスクリプトread.html化(.htaccess不使用版)
http://mirrorhenkan.hp.infoseek.co.jp/0ch_html/
文字コードShift_Jisのdatをxmlhttpで呼び出し整形表示するようなものって
あんまり見ないんじゃないかなと。
検索すると、webのあちこちで
「文字コードUTF-8じゃないと文字化けすんだぜ 素人はこれだから困る」
とかいうのを目にするですが
(例えばhttp://pc11.2ch.net/test/read.cgi/hp/1127340053/300-301n)
色々調べるとそんな事もないようで。
で、上のスクリプト、IEだと変則的になるですが
今さら直そうにも さてどこをどういじったものやら。
あちこちのステータスコード確認の箇所を全部分岐処理すればいいんでしょうけど
んもー かったるいなー
- 524 :名無しさん@停滞中 ★:08/03/07 21:14:51 ID:???
- さて
tatsuさんのdat2htmlでの
レスアンカーポップアップのJavaScriptってどうやってるのかと
サイトに行ってみたら
DAT2HTML等サポート掲示板
http://tcup7109.at.infoseek.co.jp/tatsu01/bbs
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
テスト版リリース 投稿者:tatsu 投稿日:11月 8日(木)23時34分2秒
Ver.0.34bのリリースからかなり間が空きましたが、新機能の検討と追加は地道に行っています。
とりあえず、テスト版を公開してみます。
0.34c test071108
(中略)
・0ch for world2ch
http://mirror.s151.xrea.com/0ch_utf8/のログに対応
※テスト版のため予期せぬ不具合が発生する場合があります。
http://tatsu01.sakura.ne.jp/dat2html034c_test071108.lzh (672KB)
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
こんな僻地のものまでチェックされてたんですか。
というか world2chやtaiwan2chに対応されておられたので
自分とこのものも大丈夫なんじゃないかと思ってたですが。
ところで dat2htmlの次回追加機能としては
絵文字の画像リンク変換なんてのはどうでしょうか。
それなりに(UTF-8のくらいには)需要はあるかと思いますが。
全然関係ない別件ですが
Faceちゃんねるのスパム投稿がやたら多くて
管理人さんのレス削除が大変そうなので
何となく書いてみたです
http://justcallmeai.com/board/test/read.cgi/fch/1169914242/215
自分とこの配布サイトもreadmeも管理画面も日本語オンリーだったので
0ch-UTF8スクリプトを設置運用されているFaceちゃんねる管理人さんなら
日本語投稿でも問題ないだろうなと
- 525 :名無しさん@停滞中 ★:08/03/08 20:35:50 ID:???
- http://pc11.2ch.net/test/read.cgi/software/1201790889/253-258n
ちょっと試しにいろいろやってみたですが
少し後悔しております
http://mirror.s151.xrea.com/2ch/0chu/test/read.cgi/utf8/1141982526/45
- 526 :名無しさん@停滞中 ★:08/03/09 19:28:13 ID:???
- http://society6.2ch.net/test/read.cgi/gline/1193462528/370-371,374-375
これですが
http://mamono.2ch.net/test/read.html/newsplus/1197541637/
上のdatファイルは
http://mamono.2ch.net/newsplus/dat/1197541637.dat
で表示されます
IE6だとxml表示されますが、まあわかるかなと。
これの該当行をコピペすればいいかと思うです
気力が湧いたらこのdatリンクと説明も追加しますか。
今やったら泥沼に入り込みそうなので。
てか皆さん親切だなー。
dat化方法も「こんな説明でわかるのかな」と半信半疑でやってるですが
結構自力でdat化されておられるみたいで。
まだまだ世の中 捨てたもんじゃない感じですね。
絶望するには程遠い。(と思いたい)
失礼しました
- 527 :名無しさん@停滞中 ★:08/03/10 17:26:19 ID:???
- http://www.openspc2.org/reibun/javascript/window/006/
<html> <head>
<title>ウィンドウポップアップを表示する</title>
<script Language="JavaScript"><!--
function showPopup() {
wOBJ = window.createPopup(); popOBJ = wOBJ.document.body;
popOBJ.style.border = "solid blue 2px"; popOBJ.innerHTML = "サンプル"; wOBJ.show(-100,80,320,32,document.body);
}
function hidePopup(){
//どうすりゃいいのよ
}
// --></script>
</head> <body>
<a href="javaScript:showPopup()" onmouseover="showPopup()" onmouseout="hidePopup()">ポップアップを表示</a>
</body> </html>
- 528 :名無しさん@停滞中 ★:08/03/10 18:51:28 ID:???
- http://justcallmeai.com/board/test/read.cgi/fch/1169914242/184-185n
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
184 名前:Pr[] 投稿日:2008/03/10(月) 01:52:30
久しぶりに来たがすっげーガクブル -_-;;;;
NGワードはこの前設定したんだけど何かうまくできないようですね。もうちょっと追加しました
ところで中国語...って一体-;;;;
Googleでヒットしなくする方法はないんですか OTL
185 名前:Pr[] 投稿日:2008/03/10(月) 01:56:44
そして跡がとても汚なくて押し堅めました
おかげでこのスレは番号が台無しだからリンクがまともに出ないです
御了承ください黒
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
書いちゃった(^^;)
http://justcallmeai.com/board/test/read.cgi/fch/1169914242/186
- 529 :名無しさん@停滞中 ★:08/03/10 19:06:41 ID:???
- http://takatyan.ddo.jp/test/read.cgi/main/1192376543/59-62n
このやりとりを見て試してみたら
23ch.infoさんって 携帯にも対応されておられるみたいですね。
携帯端末から
http://www.23ch.info/
に接続すると、ステータス302を返して
http://mobile.23ch.info/
にリダイレクトしたです。
同様に
http://www.23ch.info/test/read.cgi/gline/1165245437/
に携帯からアクセスすると
http://mobile.23ch.info/test/read.cgi/gline/1165245437/
に繋がって読めるみたい
携帯用変換機にも追加するですか
しかし、携帯のパケット料金ってすごいですね。。
少しだけやっただけなのに、今朝見たら700円くらい使っちゃったみたいで。
W定額ライトというものに入ってるみたいなんで、上限4千円だそうだけど
んもう 携帯のネットは怖いです
4千円あったら他の事に使いたいですよ
- 530 :名無しさん@停滞中 ★:08/03/12 07:19:23 ID:???
- メモ
ユーザからの一行入力 - 獨習Python - pythonグループ
http://python.g.hatena.ne.jp/mhrs/20060519/p15
このメソッドがあれば
wshと同等のことがpythonでも出来そうだ
MacやLinuxの標準機能だけでdat化やdat2htmlとかに使えそうだなと
って ほとんどの人には関係なさそうだけど
- 531 :名無しさん@停滞中 ★:08/03/13 19:38:00 ID:???
- メモ
復活おめでとうです
台湾2ch
http://hinasakura02.xxking.com/mini02/
まだあちこち維修中みたいですが
とりあえずJaneNidaで文字コードBig5に設定して
subject.txtを読み込んでみたら文字化けしなかったです
あとはread.cgiの全部表示の方法かな。
abcorotiや米tripodや使えるネットみたいにpath_info表示出来ないサーバなのかもで
read.cgi?bbs=***&key=*****
でやってみてもうまくいかなかったです。
Flashcgiスクリプトのread.cgiを見てみてもよくわかんないですし。
スレッド表示方法が判れば、それをdat化取得すればいいだけなんですが。
それにしても
まだJaneNidaのリンクがトップにあるんですが
ならばdatを閲覧開放して欲しくあるです
- 532 :名無しさん@停滞中 ★:08/03/13 19:54:17 ID:???
- ところで
問い合わせさせて頂いたものに御返事頂いたのですが
それに対する御返事をするには込み入った事を解きほぐさなければならず
今の自分には少し難しいので
ぐああ困った
- 533 :名無しさん@停滞中 ★:08/03/16 18:02:45 ID:???
- FlachCGIのスクリプトを見てみたんですが
path_info表示出来ないサーバでは
スクリプト側でread.cgiの隣に「?」を付けるようになってるみたい
例えば
http://hinasakura02.xxking.com/mini02/qa/
の一番上
http://hinasakura02.xxking.com/mini02/test/read.cgi/qa/1141313329/
↑この場合は
http://hinasakura02.xxking.com/mini02/test/read.cgi?/qa/1141313329/
となるみたい。
でもエラーになるです
今年の3月10日の書き込み(というかスパム)があるので
その辺りまでは読み書き出来たのでしょうけど
管理人さんが意図的に止められたのかな。
http://hinasakura02.xxking.com/mini02/janetw%5B1%5D.png
みたいに読めれば面白いんですが。
あとオカルティカレーマニアさんの所も
スパムが出始めたですか
http://occultycurrymania.myhome.cx/bbs/index2.html
- 534 :名無しさん@停滞中 ★:08/03/16 18:41:53 ID:???
- 何となくdat2htmlの車輪の再発明をしてますが
http://www.geocities.jp/mirrorhenkan/dat2html-9/html/dat/read-pop.html?key=1159620853
http://www.geocities.jp/mirrorhenkan1/dat2html-7/test/read.html#dat2html7/1002458845
上はIE6やMozilla/OperaではOKですがIE7では文字化けするそう
下はNetScape4やNetScape7で駄目との事
NetScape9ではOKだそうなのでNN7等はあきらめよう
IE7対応は検討する箇所の見当がついてるので余裕が出来たら健闘しよう
あと>>519-521と
いやー面白いなー
- 535 :名無しさん@停滞中 ★:08/03/18 19:25:00 ID:???
- 自分とこが載ったです
[IronPython].Net Frameworkメソッド呼び出し urllibの代替
http://blogs.wankuma.com/mutaguchi/archive/2008/03/17/128160.aspx
Microsoft MVPの方のブログなので
これで少しは箔が付くかな(って全然つかないと思いますよ)
またpython勉強し直そうかな
- 536 :名無しさん@停滞中 ★:08/03/19 19:50:09 ID:???
- 縁あって技術的な事をお伺いさせて頂いていたのですが
IronPythonもおやりになられているとの事なので
>>279のスクリプトが使えるかどうか訊いたのでした
自分以外 誰も試してないので。
で、そのものズバリのスクリプトが無かったので試行錯誤した件をお話したら
URLを出して下さったという訳で。
これで少しは際物扱いもされなくなったらいいですね。
で
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
IronPython 1.1.1ではurllibが含まれておらず、
Python2.5.2に含まれているライブラリを使うのも互換性の問題で難しいようです。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
pythonスレだと
IronPython使いの方が何の問題もなくurllibをお使いになられているですが。
Pythonのお勉強 Part 24
http://pc11.2ch.net/test/read.cgi/tech/1203611273/700-704n
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
700 名前:デフォルトの名無しさん[sage] 投稿日:2008/03/16(日) 23:48:22
どなたか教えてください
t=urllib.urlopen("http://〜〜").read()
print type(t)
とするとstrとなるんですが。
utf-8のサイトの場合 tの型がunicodeになってほしいんです
どうしたらよいでしょうか。
python2.5の場合はstrのままテキストに落としたらutf-8として文字化けせずに表示されるのですが
ironpythonの場合テキストエディタで開いたらASCIIとして認識され文字化けされています。
utf-8としてそのファイルを保存し直しても文字化けしたままです。
解決策ご存じの方いましたらお願いします
701 名前:デフォルトの名無しさん[sage] 投稿日:2008/03/16(日) 23:52:27
t=urllib.urlopen("http://〜〜").read().decode("utf-8")
703 名前:700[sage] 投稿日:2008/03/17(月) 00:39:43
文字化けしない方法自己解決しました。すいません;
ファイルの側をバイナリモードで開いて突っ込むだけでした。
open("hoge","wb")
704 名前:700[sage] 投稿日:2008/03/17(月) 02:02:00
>>701
ちゃんとレスが表示されてなくて見てませんでした。
それだとAsciiキャラクタじゃないから変換できませんよーってエラーがでます。
ironpythonではutf-8なんて定義されてないって出ました
僕の環境だけでしょうか・・・・?
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
って別にどうこういう訳ではなく疑問に思ったもので。
まさしく「ソースは2ch」なのでブログにこの件出すのも何だしなーと。
- 537 :名無しさん@停滞中 ★:08/03/19 20:00:03 ID:???
- 読み直してみると
上の700さんはpython2.5とIronPythonの両方とも入れておられるみたいですね。
という事は urllibのパスも通してあるのかもしれないです
おまけ
ついさっきの書き込みみたい
http://pc11.2ch.net/test/read.cgi/tech/1203611273/768
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
768 名前:デフォルトの名無しさん[] 投稿日:2008/03/19(水) 19:43:08
人間の頭なんて大差ないんだよ。
やるか、やらないか、それだけの違い。
毎日少しずつでも前進してる奴と、
毎日言い訳を考えて何もしない奴とでは差がついて当然。
たいしたことを思いつこうが、思いつくまいがそんなのどうでもいい。
出来ない奴を馬鹿にする奴はどうせたいした事無いから。
出来ない奴に対して自慢したいだけなんだよ。
やりたい事、目標を見つけて少しでも前進する事。
覚える事がさしあたって100あるなら1つずつ覚えていけばいいだけじゃないか。
一度に100覚えられないから漏れは駄目なんだと思ってるんじゃないのか?
それは天才がやる事であって、凡人は1つずつやっていけば良いんだよ。
努力する癖を習得するんだ。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
読んでみて
ああ色々と恥ずかしい・・・
って 自分のていたらくがですが
- 538 :名無しさん@停滞中 ★:08/03/19 20:27:59 ID:???
- http://society6.2ch.net/test/read.cgi/gline/1165245437/550
書ーいちゃった
書いちゃった
ごめんなさい
- 539 :名無しさん@停滞中 ★:08/03/20 10:06:34 ID:???
- http://society6.2ch.net/test/read.cgi/gline/1165245437/551
また「ウザい氏ね」みたいな反応だけかもしれないなー
一介のまとめ人さんに試して貰うよう連絡させて頂こうかしら
てかほんと素人なので
すごい人に訊くのが怖いんですよ。
「そーんな事もわかんないのかいボク」みたいな事とか言われそうで
- 540 :名無しさん@停滞中 ★:08/03/20 12:12:03 ID:???
- さて次は
pythonでdat2htmlでもやってみますか。
python版html2datを参考にすれば
そんなに難しくもなさそうです
というか
python版html2datを出されているnanabit.netさん
何故python版dat2htmlをお出しになっておられないのでしょう
フォーマットが決まっている分 ずっと難易度が低いと思うんですが
- 541 :名無しさん@停滞中 ★:08/03/20 15:40:19 ID:???
- >>538-539ですが
御返事を頂けたら頂いたでまた大変だなーと。
府知事に立候補して開票1秒で当選した橋下知事の如くで
当選したらしたで 府政その他であれこれやんないといけないんで。
それはそうと
HTML2DAT @ 7bit
http://nanabit.net/softwares/html2dat.html
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
使用規約・ソースの取り扱い
* フリーウェア。
* アーカイブの内容を改変しない場合は、使用、譲渡は自由。
* アーカイブの内容を改変する場合は、改変した旨表示すること。
* ソースの流用は自由(著作権表示の必要なし)。
常にreadme最新版を優先
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
> * アーカイブの内容を改変する場合は、改変した旨表示すること。
>>337のって アウトかな セーフかな・・・
readmeをつけるか ソースに追記したほうがいいのかな
- 542 :名無しさん@停滞中 ★:08/03/20 18:02:59 ID:???
- ソースに追記したものと差し替えたです
ところでpythonって
テキストファイルだけでなく
バイナリファイルも扱えるみたいですね。
wshとは大違いだ(って優劣を言ってるみたいで何ですが)
あと>>535の方のお話だと
wshだとUTF-8のテキストファイルを扱えないとの事で
あーだからhtmltodat_for_cn2ch.wsfを作る時にひどく悩んだ訳だと納得したですが
これもpythonでは無問題。
だから簡単にhtml2dat.pyをUTF-8版に出来たんですが。
当方 .Net Framework や PowerShell はおろか ADODB.Streamも使えない環境なので
UTF-8のファイルを正規表現加工させるのもwshでやるしかなかったんですが
これって もしかして変態のやる事だったのかな。
やったところで「ふーんだから何」程度のものですが。
で 結局何書きたかったのかな>自分
- 543 :名無しさん@停滞中 ★:08/03/21 19:08:03 ID:???
- ●公開
http://namidame.2ch.net/test/read.cgi/news/1205977810/
さて
Fox★さん公認の お試し●アカウントが昨晩ありましたので
久しぶりに●ログイン取得するwshをやってみたです
まだいろいろやりかけですが ついさっきお試しアカウントが使えなくなったので出しとこう
http://www.geocities.jp/mirrorhenkan/others/maru/maru4.wsf.txt
何とかうまくいったっぽい。ただ問題がひとつ。
●のID/Passでログインして戻り値取得まではうまくいってるみたいです。
で、その戻り値をもとにofflaw.cgiにアクセスしてdatを取得するのですが
送信ヘッダに「Accept-Encoding: gzip,deflate」を付けなければdat取得出来ないのです。
自分の9x環境ではwshだけではどうしても付けられませんでした。
ちなみにproxomitronで強制的にヘッダをつけたら出来たです。(gz圧縮ファイルでしたが)
このヘッダ送信が出来ない件が
自分のレガシー環境に起因しているのか はたまたコードがまずいのか
どうも判然としない。
以前、maru2.vbsの件でメール頂いたのですが
それによると3回に1回は取得成功出来ていたそうなので
新旧OSによる違いがあるのかもしれない。
でも自分独りでは検証しようもないです。
●持ちの方、もし宜しかったら試して頂けませんでしょうか。
もしこれで他のwindows環境でもうまくいかなかった場合でも
ログインは成功しているようなので、その場合は別の方法を考えてます。
(時間があったらHTAでも作れば何とかなりそうですがちょっと余裕がないけど)
今回のものは公認のお試し●アカウントでやったものなので
まあ問題はないかなと。
delphi/php/perlで作られたスクリプトはありますが(あと「=2ch」はVBAですか)
wshで作ったものはまだ公になったものはなさそうなので
面白そうだなと思ってやってみただけです。
windows標準の機能だけでも●ログイン取得出来たらいいなあという事で。
- 544 :名無しさん@勉強中:08/03/21 19:40:36 ID:II86Gs0B
- >>543
お試し再開ktkr
qb5.2ch.net/test/read.cgi/operate/1206071602/83
- 545 :名無しさん@停滞中 ★:08/03/21 19:58:14 ID:???
- >>544
おおどうもです
教えて頂かなければ知りませんでした
いっちょ =2ch の●ログイン方法を見てみますか。
ただこのExcelマクロ
Excel97では使えない関数を使っておられるので(確かsplit関係)
自分とこでは使えないんだよなー。
Excel総合相談所 47
http://usamimi.info/~mirrorhenkan/2ch/excel/read.php/1152852610/905-911n
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
905 901 [ 2006/08/16(水) 22:27:24 ]
>>890
97はSplitはだめなのか
ちなみに月と日が一桁の場合は
2004.1.1となる?2004.01.01となる?
906 890 [ 2006/08/16(水) 22:29:28 ]
>>905
すみません
>>903
97はSplitがありませんでした。
月日は2004.1.1となります。
911 名無しさん@そうだ選挙にいこう [ 2006/08/16(水) 22:46:17 ]
>>906
97用split
http://kasamatusan.sakura.ne.jp/cgi-bin2/src/ichi48613.txt.h...
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
- 546 :名無しさん@停滞中 ★:08/03/21 20:13:05 ID:???
- 再度お試し●もせいぜい1〜2日くらいでしょうから
ちょっとスクリプト試すには時間が無いなー
今日は疲れちゃったし
- 547 :名無しさん@停滞中 ★:08/03/22 08:51:30 ID:???
- 有効期限は次の日銀総裁が決まるまでですか。
て事は土日はいちおう大丈夫なのかな
お試し●が使えるうちに修正したものを出しとくです
http://www.geocities.jp/mirrorhenkan/others/maru/maru5.wsf.txt
DLして拡張子wsfにして●ID/Passを入力して実行すればいいと思うです。
DLされたdatを開いて「-ERR もう使えません」とあったら失敗ですが
その場合、実行途中で●dat取得用URLのダイアログが出たものをコピペしておいて
User-Agent: Monazillaを指定できるツールでDLしてみて下さい。
身近なものだと(この板的にですが)
htmltodatの 受信オプション→HTTPヘッダの追加で
User-Agent: Monazilla/1.00(mirrorhenkan/20080322)
とか指定してURLを呼び出せば出来ると思うです。
- 548 :名無しさん@停滞中 ★:08/03/22 12:10:16 ID:???
- 上の奴
Vistaで2回試して2回ともいけたと連絡頂いたので
どうやらこれで良いようです。
あー良かった
ちなみに
+OK 362400/1024K Location:temp/
というのがdatの1行目に入ってるそうですが
取得出来ているみたいだから修正も簡単だろうなと。
Meでは駄目だったそうなので(98SEはwshバージョンが2.0なので検証不能との事)
やはり9x/MeとNTの違いがここにあるのかもですね。
んじゃ
ページを作ってリンクさせておきますか。
- 549 :名無しさん@停滞中 ★:08/03/22 15:24:29 ID:???
- http://www.keydb.info/
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
お知らせ
管理する時間的余裕が無くなってきた為このサイトは閉鎖します。
週明けまでは残しておきますので必要な方は使ってください。今までありがとうございました。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
そういえばshutdown.jpさんも404ですね
逆にデスクトップ2chさんの所は復活しているです
リンクを辿ってみると、デスクトップ2chの管理人さんって
megabbsや苺chのスクリプトをお書きになられた方みたい
A-round/2chTypeBBS
http://around.at.infoseek.co.jp/
- 550 :名無しさん@停滞中 ★:08/03/22 20:02:02 ID:???
- お試し●も使えなくなったですか。
=2chのコードを見たですが書き込み時のログインだけみたいで
dat取得はついてなかったです
で、せっかくなんで出しとこう
●ログイン & dat取得スクリプト by WSH
http://www.geocities.jp/mirrorhenkan/others/maru/
JavaScriptでのトリップ生成スクリプトの下あたりにつけますか。
「意味あんのこれ」という意味では同じカテゴリでしょうし。
誰も何も言わず触れられず無反応でしょうけど
JavaScriptやwshだけでこんな事が出来るんだよという事で
- 551 :名無しさん@勉強中:08/03/22 20:23:01 ID:PQIxB/Fp
- >>550
また・・・かな?ただ今度は結構難しそう。
qb5.2ch.net/test/read.cgi/operate/1206071602/
- 552 :名無しさん@勉強中:08/03/22 20:58:01 ID:PQIxB/Fp
- 私が使っているPerlスクリプトを一部改変したものを参考のためにおいておきます。
公開する前に自分のIDとパスワードをちゃんと消したか何度も何度も確認しました・・・。
takatyan.ddo.jp/maru_sid.txt
そのうち消すかも。
- 553 :名無しさん@停滞中 ★:08/03/23 15:09:36 ID:???
- 疲れちゃってたのでした
>>551-552
おお貴方でしたか。わざわざどうもです。
スパムさえ無ければURL貼れるようにしたいんですが。
まだ流石に●ログイン関係を覚えていたんで上げて下さったものを見たのですが
そうかperlではそこんとこそうやったりあそこをそうやるのかと。
エンコードを一発で済ませられるのはいいですね。
ただ ActivePerlは入れてますが
LWP::UserAgentとかCrypt::SSLeayを入れてなくて
入れるのも何だか大変そうなので頓挫しました
http://digit.que.ne.jp/work/wiki.cgi?Perl%E3%83%A2%E3%82%B8%E3%83%A5%E3%83%BC%E3%83%AB%2FLWPとか
http://d.hatena.ne.jp/rin_ne/20041127
それにしても、あちこち見てつくづく思うのは
追加モジュールが必要なスクリプトが多いなーと。
標準モジュールのみで出来たら良いのですが。(←スキルが足らない言い訳)
ここらへん突っ込み所かもしれないなとか思いますがまあいいや
お試し●もありがとうです。
FOX★さんの気まぐれ次第でしょうけど
この調子だと 次の日銀総裁が決まるまで続けそうですね。
- 554 :名無しさん@停滞中 ★:08/03/23 15:30:55 ID:???
- さて次は何やろうかな
お試し●がいつ使えなくなるのかわかんないんで
maru.wsfのバグ取りも何だか億劫だし
そもそもバグ取りしてもあまり意味あるものでもないですし
maru.pyやmaru.xlsをやってみようかなとか一瞬思ったけど
pythonやExcelVBAまだよく判んないんで
勉強しているうちに時間切れだろうし
そもそも意味あんのかおいコラ(逆ギレ)
何というか
知らないことが多すぎて これからの人生面白そうだぜ。
- 555 :名無しさん@停滞中 ★:08/03/23 16:29:47 ID:???
- と書いて少し反省
maru.wsfのバグ取りですが
3つほどあるかな
(1)取得したdatの一行目を削除
(2)9x/Me と NT の判別処理
(3)ダウンロードしたdatが「-ERR もう使えません」or「-ERR 使用時間が過ぎました」
の際の処理
(1)(3)はまあ難しくなさそう。
問題は(2)で
UAから判別は出来なさそう(ってか自分自身のUAってどう判断されるんでしょ)
Kernelのバージョンから調べるしかないのかな?
何か大変そうだ
あと、Meでは●ID/Passが正しいのにログイン出来ないと連絡頂いたですが
そうなのかな
- 556 :名無しさん@停滞中 ★:08/03/23 18:23:49 ID:???
- pythonでやってますが
urllib2を使えばUser-AgentとAccept-Encode:gzipの二つともヘッダ送信出来ますね。
ただ返ってくるファイルがgzipされてて自動解凍が出来ずにつまづいてます
時間が無いので ここまでかな・・・
- 557 :名無しさん@停滞中 ★:08/03/23 18:35:24 ID:???
- 追記
参考サイト
技術メモBlog: urllib2で、User-agentなどを設定
http://terapyon.blogspot.com/2007/01/urllib2user-agent.html
pythonでHTTPのgzipデータを読み込む
http://blog.kzfmix.com/entry/1187087731
前者はうまくいったんだけど
後者がうまく取り込めないです
上のはセッションID取り込み後のofflaw.cgiでのdat取得の件ですが
その前段階のhttps://2chv.tora3.net/futen.cgiにアクセスして●ログインするのはまだで。
これをやるには
pythonの正規表現のやり方と文字列エンコード方法とSSL通信の方法を理解しなければならなそうです
ひとつひとつ片付ければ何とかなるような気もするなー
まあ遊んでるだけなんで。
- 558 :名無しさん@停滞中 ★:08/03/24 19:14:44 ID:???
- 帰ってみたらお試し●使えなくなってましたか
むむむ
やっと●ログイン戻り値取得のほうもpythonで出来たんですが
ここまでかな・・・
て事で やりかけを出しとこう
自分用バックアップというのがメインだけど
http://www.geocities.jp/mirrorhenkan/python/maru/maruyarikake1.py.txt
http://www.geocities.jp/mirrorhenkan/python/maru/maruyarikake2.py.txt
上が●ログイン戻り値を取得するpythonスクリプト
下が●の戻り値を使ってofflaw.cgi経由でdatを取得するpythonスクリプト
あとは正規表現と文字列結合とエンコード方法を調べて追加修正すれば
一応完成だったんですが。
もう一日欲しかったです
- 559 :名無しさん@停滞中 ★:08/03/24 19:32:14 ID:???
- ちなみに
http://pc11.2ch.net/test/read.cgi/php/1127896640/976-980n
の件
偉い方にお訊ねしたら
> Noah(unzip32.dll使用)とVistaのエクスプローラで正常に解凍できました
との事なのでもういいかなと。
980さんはRainboardに絵文字変換導入出来たのでしょうか。
出来たとしても再配布不可のスクリプトですが>Rainboard
- 560 :昼休み@名無しさん@停滞中 ★:08/03/25 12:33:10 ID:???
- メモ
長文コピペごめんなさい
http://www.keydb.info/
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
※keydbは閉鎖しました※
突然閉鎖したので混乱した方もいるかもしれません。すみません。
閉鎖の理由は、特に圧力があったとかではありません。
このサイトのスタンスをちょっと書きますと、
権利者からの削除要請はちょくちょくありますが、私は基本的に削除要請には応じてきませんでした。
しかし犯罪の動画(レイプとか)などは要請があれば、公開してはいけない情報だと素人的直感で判断して消してました。
実際の所、法律も詳しくないし判例などの情報も少ないので、どうするのがベストかわかりませんでした。
閉鎖の理由は
・ダウンロードは違法になりそうでリスクを取りたく無い。
・あまり時間が無い中で管理してきましたが、4月からさらに無くなる。
・特に利益も無いのに管理するにはモチベーションが上がらない。これが本音かも。
皆様が書き込んでくれた情報ですが、整理なども大変なので、どうするかまだ決めてません。
ちなみに閉鎖と聞いて直ぐに「俺が引き継いでやるぜ!」って内容のアツいメールは一件もありませんでした。
あと、一応2chに書き込まれた情報を収集するプログラムは動かしておこうと思っています。
もしキー情報を検索するサイトが一つも無くなったら不便なので状況をみて復活させるかもしれません。
今のところ同じようなサイトがいくつかあるので、そちらを利用してください。
以上です。今までありがとうございました。
追記
3/25
・閉鎖直前はサイトの情報を取得するプログラムで過剰にアクセスしてくる人が何人もいたから鯖が瀕死だったので、一部のメールがちゃんと受信できなかった可能性があるかも
鯖から送信される情報メールが一部届いていなかったから、推測ですけど。
・知りたいってメールが何件かあったので、まとめて構成なんかを書くと
鯖構成は基本的にDELL祭りで安いときに買ったペンD1台に全部詰め込んでた。他にバックアップ用1台。レン鯖は無駄に金がかかるのでプログラムを改良して
小規模でもできるようにした。回線は光。PVは多くて50万PV/dayくらいじゃないだろうか。一日のクエリ数はあまり気にしてなかったのでわからない。
ピークになるとコネクションが限界に達してたから鯖を増やすかメモリ増設して限界値を上げるなど改良の余地はありました。
キー情報の自動取得機能は、dat落ちした昔のものは●を買って今までの全部のスレからキー情報を抽出しました。意外とスレは多くないので3〜4万スレくらいじゃなかったかな?そこまで時間はかからないよ。
新しいやつは10分毎にcronで動かして収集してた。
コメントは後から付けた機能だけど、ただカラムをtextで追加しただけ。これはちょっと駄目ですね、他にやり方があったと思う。まあ気軽に一言だけコメントをつけれれば
いいなあというアイデアからつけた後付機能なので。
アフィはそこまで力を入れてなく適当に張ってたけど、そんなに儲からない。とりあえずクリック率が低いし。アマゾン置いてもあまり買ってくれないしね。さすがダウン板住民www徹底してるwww
(でもこれは上手な方に言わせるとお前のやり方が悪いから成果がでないんだよって言われるかも。web収入板で勉強したけど駄目だった・・・)
しかし自鯖にしてプログラムを改良してからはそこまで費用はかからなかったので、ローコストローリターンですね。あと夜とか別パソから普通にネットを見るのに多少障害が、重い。ルータもいいやつ選んだほうがいい。
一応こんな感じ。この程度の負担なら続けろよって人がいるかもしれないけど、やっぱ逮捕は怖いよ。身元が割れてるのでshareに元データを流すこともしないです。
この規模のサイトを試行錯誤しながら普通のサイトと違ってデータベース系なので負担とも戦いながら一人で四年も続けたのは結構がんばったと思うんだがどうだろうか?
まあこんな所です。たぶんこれで最後かな。以上です。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
- 561 :昼休み@名無しさん@停滞中 ★:08/03/25 12:37:06 ID:???
- 関連スレ
keydbが閉鎖するらしい。share\(^o^)/オワタ
http://tmp7.2ch.net/test/read.cgi/download/1206095106/
keydb.infoを運営してた人に一言お礼をいうスレ
http://tmp7.2ch.net/test/read.cgi/download/1206097806/
keydb閉鎖
http://tmp7.2ch.net/test/read.cgi/download/1206097132/
ダウソ厨死亡keydb.infoが閉鎖
http://namidame.2ch.net/test/read.cgi/news/1206094856/
上の一番目のスレにsharedb.infoの管理人さんが書き込んでるですが
すごくとてつもなく大変なんだなーと。
他のミラー管理人さんの大変さも想像出来るです
トラフィックを増やしてしまって ごめんなさい
- 562 :昼休み@名無しさん@停滞中 ★:08/03/25 13:03:48 ID:???
- まあkeydbもsharedbもデータベース系のサイトといえるでしょうから
検索CGIが始終回りっぱなしなんだと思うので
やっぱり少し違うかな
で、みみずんさんも上京なさるそうで
みみずんさーばー移転のお知らせ (みみずんぶろぐ)
http://mimizun.com/blog/2008/03/post_447.html
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
突然ですが、みみずんさーばーを移転します。
これに伴い、休止する期間が数日程度できるかもしれません。やめるわけではないので、
ご安心ください。運が良ければ回線の光化だ。
さて、そんなこんなでちょっと都内を散策。不動産屋の軒先では季節がらか、物件情報に
見入っている方をちらほら見かけます。私も、めぼしいのを見つけてはデジカメで撮影。
〔中略)
ちなみに、4月1日から新しい赴任先での仕事になります。あと1週間。まぢやばい。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
> やめるわけではないので、ご安心ください。
安心したです
ってよく見てみたら
赴任先が東京とは限らないかも。
- 563 :昼休み終了@名無しさん@停滞中 ★:08/03/25 13:10:49 ID:???
- nikaさんの所も大変そうだし
みんな大変そうだ
OSASK(中略)掲示板の更新履歴
http://com-nika.osask.jp/test/read.cgi/bbs/1166882974/l49
- 564 :昼休み終了@名無しさん@停滞中 ★:08/03/25 18:28:29 ID:???
- http://takatyan.ddo.jp/test/read.cgi/main/1192376543/65
お疲れ様です
予告の段階ですが
- 565 :名無しさん@停滞中 ★:08/03/26 19:42:39 ID:???
- http://tmp7.2ch.net/test/read.cgi/download/1206095106/880
可能です
作れると思います
例によってwsh+●ですが
もし作って置いとけば
特定板の全スレッド過去ログ倉庫みたいなものを
取得公開してくれる人とか登場なさるかもですね
- 566 :名無しさん@停滞中 ★:08/03/28 19:44:40 ID:???
- メモ
http://touch.xrea.jp/janetouch/read/yutori.2ch.net/news4vip/1206547314/l
http://touch.xrea.jp/janetouch/read.php?host=yutori.2ch.net&bbs=news4vip&key=1206547314&start=l
上の二つですが
http://yutori.2ch.net/test/read.cgi/news4vip/1206547314/
が読めなくなっても閲覧可能だったら
どんなにか素晴らしい事でしょうか。
- 567 :名無しさん@停滞中 ★:08/03/28 19:48:50 ID:???
- たった今dat落ちしましたが
閲覧可能ですね
では追加させて下さいです
「その38」という事で
- 568 :名無しさん@停滞中 ★:08/03/29 12:33:25 ID:???
- >>562の理由で
みみずんさんの所繋がらないですが
金麦冷やして待ってる
- 569 :名無しさん@停滞中 ★:08/03/29 12:39:54 ID:???
- やはり上京なさるそうで
※※※※大森スレッドだよ〜ん フォルァ!! (その98)※※※※
http://tokyo.machi.to/bbs/read.pl?BBS=tokyo&KEY=1202773128&START=415&END=415
金麦冷やして待ってる
↓
まだ、待ってみる
↓
mimizun.com移転公開
↓
と、そう簡単なものじゃ無い
↓
金麦もう飲んじゃうから〜!
↓
と、いいつつおとなしく待つ
・・・みたいな事になっても仕方ないですが
うんきっと大丈夫
そのうちスレッドが立つかもしれないけど
たぶん大丈夫
- 570 :名無しさん@停滞中 ★:08/03/29 14:25:53 ID:???
- うん大丈夫だった
良かったー
http://jbbs.livedoor.jp/bbs/read.cgi/computer/682/1144317464/671-672n
IPアドレス移転によるバーボン頻発なんて事態には
多分なんないですよね
ごめんなさい
- 571 :名無しさん@停滞中 ★:08/03/30 18:42:13 ID:???
- >>566-567を追加させて頂いたです
dat化もですか
疲れちゃった
- 572 :名無しさん@停滞中 ★:08/04/01 17:32:21 ID:???
- イベントをしつらえられなければ馬鹿も出来ないなんて
年中ばかに馬鹿な事バカバカやってバカにされてる人間には困った日ですね
という事で気まぐれにやってみたです
反応を見るとIEの方が本当に多いなあと。
IEとそれ以外では見え方が全然違うもんで。
で、さっき少しだけ時間がとれたので差し替えたです
このページですが
ここは極東 日出づる国だもんで
地球のどこかで4月1日があるうちはまあいいじゃないかと
ワールドワイドウェブ 全世界からアクセス出来る訳だし
って いつ差し替えたらいいのかわかんないので良い言い訳になりますな
- 573 :名無しさん@停滞中 ★:08/04/05 17:41:29 ID:???
- http://society6.2ch.net/test/read.cgi/gline/1165245437/561-564n
今頃気付いたです
ありがとうです
少し考えをまとめてからと思うですが
・・・何か書き込みしづらいな。
- 574 :名無しさん@停滞中 ★:08/04/05 18:48:53 ID:???
- ところで
Win/Mac/Linuxのどれでも使えるような言語って何かないですかね?
JavaScriptなんかはどれでも同じように使えてるみたいで
だからMac環境でもミラーが見つかるんですが
それ以上のファイル加工その他(dat化等)はJavaScriptでは出来ないですし。
PythonだとMacから発祥したそうなので(http://sakito.s2.xrea.com/python/trypy/intro.html)
これで何とかなりそうな感じなんですが
コマンドラインを使わない方法がよくわかんないので棚上げっぽい。
ちょっと話がずれるですが
あと もしかしたら偉そうにみえたらごめんなさいなんですが
Windowsの場合、テキスト操作やダウンロードその他
大抵の事がけっこうWSHで賄えてしまえる感じなので
何だか他のアプリ作成ソフトにチャレンジする意欲が湧かないんですよ。
例えばDelphiやC++Builderをマスターして何かツールを作ったとしても
結局Windows環境でしか使えないですし
って やっぱり偉そうにみえるかも
ごめんなさい
- 575 :名無しさん@停滞中 ★:08/04/05 19:07:45 ID:???
- V2Cとか見ると
Javaがいいのかもしれない
Macだと標準で入ってるぽいですし
V2C Top
http://v2c.s50.xrea.com/
ただWindowsだとJDKを入れないといけないみたいで
自分のマシンには入れる余力が無さそうです
インストーラだけでも70メガくらいあるみたいですが
自分のHDDの残りを鑑みると入れられなさそう
まだ電話回線の時に下記ページを見てチンプンカンプンでしたが
ついさっきググって見てみたら結構何とかなりそうな感じ。
JAVAプログラミング講座「宇宙のJAVAさん」
http://bakuretuken.birdynet.com/sorajava/index.html
この講座開設当時のJDKインストーラは10メガくらいだったそうで
今 そのサイズのインストーラが切実に欲しいです。
それくらいなら入れられるので。
探せばあるのかな。
- 576 :名無しさん@停滞中 ★:08/04/05 19:19:18 ID:???
- あるいはRubyがいいのかな
MacでPython Part 1
http://pc7.2ch.net/test/read.cgi/mac/1105894574/10
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
10 名前:名称未設定 [sage] 投稿日:05/01/17 08:33:56 ID:cSlQLY5N
日本だとRuby使いのが多いかもねぇ。こちらもOS Xに標準で入ってるし。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
あと現役スレだと
下のとかありますし
RubyCocoa 初心者質問【Leopardバンドル記念】
http://pc11.2ch.net/test/read.cgi/mac/1193373811/l50
- 577 :名無しさん@停滞中 ★:08/04/06 11:47:24 ID:???
- やっぱpythonわかんない
「コマンドラインからの実行」ってどうやるんだろう・・・
誰に訊いてもバカにされそうだ。。
- 578 :名無しさん@停滞中 ★:08/04/06 12:11:40 ID:???
- あちこち覗いてみたけどよくわかんない。
あまりにも基本的すぎる事って
かえって訊けないものですね
*'``・* 。
| `*。
,。∩ * もうどうにでもな〜れ
+ (´・ω・`) *。+゚
`*。 ヽ、 つ *゚*
`・+。*・' ゚⊃ +゚
☆ ∪~ 。*゚
`・+。*・ ゚
- 579 :名無しさん@停滞中 ★:08/04/06 15:28:40 ID:???
- 2005-10-11 - とあるカフェの片隅で -In the corner of a certain cafe
http://d.hatena.ne.jp/toypoo/20051011
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
Pythonをインストールしただけでは、Pathが通っていなかったので、
Autoexec.batに以下の一文を追加した。
set PATH="c:\python23;%PATH%"
ちなみに、OSは、Windows 98 SE。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
やってみたです
関連づけとPathは違うのかな
- 580 :名無しさん@停滞中 ★:08/04/06 15:51:55 ID:???
- これも
Python入門 Windows用環境の準備 福田洋一
http://tibet.que.ne.jp/otani/2005program/install.html
どうやら大いに思い違いをしていたようです
ああ恥ずかしい
- 581 :名無しさん@停滞中 ★:08/04/06 18:47:07 ID:???
- 何とかパスを通して
コマンドプロンプトから起動出来るようになったです
というか
OS毎に呼び名や操作が異なるようで
自分のPCでは「コマンドプロンプト」ではなく「MS-DOSプロンプト」じゃないかー。
ルートディレクトリ変更方法も違うみたいで大分調べたですよー。
コマンドプロンプト(DOSプロンプト)の使い方
http://www.geocities.co.jp/zsnes_123/command/command.html
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
Windows2000, XPにはコマンドプロンプトが、WindowsMe以前のOSにはMS-DOS
プロンプトが備わっています。起動方法は、
* XP:Windowsの「スタート」ボタン→すべてのプログラム→アクセサリ→コマンドプロンプト
* 2000:Windowsの「スタート」ボタン→プログラム→アクセサリ→コマンドプロンプト
* Me以前:Windowsの「スタート」ボタン→プログラム→アクセサリ→MS-DOSプロンプト
となっています。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
その2:カレントディレクトリのあるドライブとは違うドライブにあるディレクトリを
カレントディレクトリにする際は、「cd」とパスの間に、「/d」というオプション(コマ
ンドの実行内容を変化させるために書くもの)を記述する必要があります。例え
ば、カレントディレクトリがC:ドライブにある時に、D:\folderAをカレントディレクト
リにしたい時は、
cd /d D:\folderA
と入力しなければいけません(「cd」と「/d」と「パス」の間には半角スペースを入
れます)。ただし、この方法はコマンドプロンプトでしか使えないので、DOSプロ
ンプトの時は、
D:
のようにまず、カレントディレクトリにしたいディレクトリがあるドライブのドライブ
レターを入力してから、
cd D:\folderA
と入力しなければいけません。この方法はコマンドプロンプトでも利用できます。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
このページに辿り着くまで
すんげードツボにはまってたです。
いやー疲れた
で、nanabitさんの所にある
nicovideo.jpのflv/xmlをダウンロードするスクリプトとかコマンドラインから試してみたら
ちゃんと使えるですね。
こりゃすごいや
メモ
コマンドプロンプトを使ってみよう!
http://ykr414.com/dos/
コマンドプロンプト:『cd』コマンドの使用例
http://cmd-pro.com/com_00.html
- 582 :名無しさん@停滞中 ★:08/04/06 19:14:03 ID:???
- 何とかMS-DOSプロンプトから実行する方法が判ったので
次はMacでのpythonスクリプトの実行方法ですが
これはもう精通している方に伺うしかないです
恥を忍んで専門スレで訊いてみようかな
「ウザい氏ね」みたいな事はないと思うですが
下のような反応は大井松田にダイソーが
もとい おおいにありそうな
お前ら、wsh使ってますか? Part7
http://pc11.2ch.net/test/read.cgi/win/1190548945/175-176n
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
175 名前:名無し~3.EXE[sage] 投稿日:2008/04/06(日) 13:59:10 ID:AOV8Fp3G
先生、どこから突っ込んでいいのか分かりません!
176 名前:名無し~3.EXE[sage] 投稿日:2008/04/06(日) 18:02:36 ID:sJp4hCiu
175よ、お前のスルー力が試されておる。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
- 583 :名無しさん@停滞中 ★:08/04/06 19:19:36 ID:???
- メモ
python入門
http://word.starword.org/python/index.html
Pythonを始めよう:CodeZine
http://codezine.jp/a/article/aid/1617.aspx?p=1
- 584 :昼休み@名無しさん@停滞中 ★:08/04/07 12:38:16 ID:???
- Macでのコマンドプロンプト画面は
「ターミナル」と言うみたいですね。
Mac用 実況向けスレッド型掲示板ビューアー Palloo - Programming Must Go On
http://d.hatena.ne.jp/kenkitii/20070922/p1
学務情報システム成績自動入力
http://enju.pc.uec.ac.jp/ohfuti/gakumu/index.html
JavaFlavor Weblog: SISInfo - Symbian 9.1 S60 3rd対応のSISファイル解凍ツール
http://javaflavor.cocolog-nifty.com/blog/2007/09/sisinfo_symbian_7e45.html
MACのDOSプロンプトでWindowsのipconfig /releaseと同じコマンドは? - 教えて!goo
http://oshiete1.goo.ne.jp/qa2625482.html
コマンドプロンプトを使ってみよう! - Windows・Macの便利・無料のツール・ソフトウェア情報まとめ
http://tools.rightclicksright.net/data/9972.aspx
MacWiki - UNIXの基本コマンド
http://macwiki.sourceforge.jp/wiki/index.php/UNIX%E3%81%AE%E5%9F%BA%E6%9C%AC%E3%82%B3%E3%83%9E%E3%83%B3%E3%83%89
ターミナルはじめの一歩 - [Mac OSの使い方]All About
http://allabout.co.jp/computer/macos/closeup/CU20030210tam/
で、実行方法がわかんない。
これかな?
http://usamimi.info/~mirrorhenkan/2ch/python/prog/read.php/1053955472/858n
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
858 デフォルトの名無しさん [ 03/11/06 02:04 ]
現行のPythonでも,ファイル名を指定してPythonインタプリタを起動することが
できます.
Windowsを使っている場合:
コマンドプロンプトで,
python.exe helloworld.py
MacOSXを使っている場合:
アプリケーション/ユーティリティ/Terminal.app を起動して
python helloworld.py
Linuxを使っている場合:
シェルで
python helloworld.py
です.上の記述はIDLEやPythonシェル (>>> を表示するウィンドウ)
で行う操作ではありません.
http://www.python.jp/pipermail/python-ml-jp/2003-October/004988.html
から始まるスレッドも参考にしてください.
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
GUIに慣れた者にとっては
ダブルクリックで実行出来ればいいのですが。
WindowsだとエクスプローラからのWクリックで実行出来るんだけどなー。
- 585 :名無しさん@停滞中 ★:08/04/07 18:57:57 ID:???
- またはこれかな。
Mac OS X初心者質問用スレ 24.5
http://pc11.2ch.net/test/read.cgi/mac/1206375011/2
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
2 名前:名称未設定[sage] 投稿日:2008/03/25(火) 01:11:07 ID:AjJPMnQr0
よくある質問1
(中略)
Q. ファイルをゴミ箱に捨てることができない、またはゴミ箱を空にすることができない
A. 再起動する、または Optionキーを押したままゴミ箱を空にする、
または
1. Terminal を起動する
2. rm と入力する (rm の後に半角スペース)
3. 消したいファイルを Terminal のウインドウにドラッグ&ドロップする
4. return を押す
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
これを応用すると
MacOSでのpythonスクリプトの実行方法は
1. Terminal を起動する
2. python と入力する (python の後に半角スペース)
3. 実行したいpyファイルを Terminal のウインドウにドラッグ&ドロップする
4. return を押す
という事になるですが。
さてこれでOKなのかどうなのか。
・・・てか、これ見て
MS-DOSプロンプトにpyスクリプトをD&Dしたら
Windowsでも使えるじゃないですか!!
いちいち打ち込むこたあなかったのか!!
- 586 :DinoSwift ◆m7TsEz1c5. :08/04/08 14:04:53 ID:GxFpUjbx
- (へ´ω`) >>581
昔はDOSプロンプトって言ってました。
今はms-dosを下地にしてないのでコマンドプロンプトという名称になってます。
dosコマンドは種類が少ないので一回覚えたら後は簡単だよ。
ただしlinuxみたいにいろいろ出来ない難点があるけども。
md(ディレクトリ/フォルダ作成)
rd(ディレクトリ削除)
del(ファイル削除)
copy(コピー・新規ファイル作成)
type(ファイルの中身表示)
dir(unixでいうところのls。カレントディレクトリ内の一覧表示)
cd(ディレクトリの移動)
大体、MS-DOS時代の主なコマンドはこんなもん。
それ以外の「ipconfig」や「tree」なんかはwindows時代になってからのものなので
バージョンによってはないかもしれない。
- 587 :DinoSwift ◆m7TsEz1c5. :08/04/08 14:08:41 ID:GxFpUjbx
- (へ´ω`) なんだdosそのものの話じゃなかったのか。
失礼しました。
- 588 :名無しさん@停滞中 ★:08/04/08 19:55:24 ID:???
- >>586-587
いえいえおおいに頭の整理になったですです
http://society6.2ch.net/test/read.cgi/gline/1165245437/574-575n
スレッドのお題に即した事しか書いてないつもりですが
でもやっぱり茶々が入りそうだなとか思ったけど
まあ色々仕方がないです
- 589 :名無しさん@停滞中 ★:08/04/08 20:08:41 ID:???
- メモ
すごいやすごいや
スレタイ検索
http://mirror.takatyan.info/title_search/title_search.cgi
2ちゃんねる過去ログ倉庫スレタイ検索 情報画面
http://mirror.takatyan.info/title_search/crawl_schedule.cgi
2ちゃんねる過去ログ倉庫スレタイ検索 説明
http://mirror.takatyan.info/title_search/about.html
全板全過去ログからのスレタイ検索とかしたら
何ギガバイト必要になるのかな。
1板1メガとしても700板で700メガですし
1板10メガで均らしたとしたら7ギガですし
news4vipなんかだとsubject.txtだけでも例えばex14サーバだけで200メガ以上ある訳だし
ほんと何ギガ必要なのかなと考えると
気が遠くなりそうです
- 590 :名無しさん@停滞中 ★:08/04/11 18:11:50 ID:???
- その39を追加させていただいたです
mirrorhenkanのぽっぷちゃっとに管理人さん自ら公開されておられたので
まあいいかなと。
http://www.geocities.jp/mirrorhenkan/sono39/?u=http://society6.2ch.net/test/read.cgi/gline/1165245437/
サイトのURLはこちら
けっこう古いログも保管されておられるですね。
2ch過去ログ
http://123.225.123.197/index2.htm
固定IPという事なのかな。
URLが数字だと何か味気ないので
どこか無料のダイナミックDNSをつけて貰えたら嬉しいなー。
あとサイトの名称と。
とりあえずぽっぷちゃっとのアカウント名は「2xxcache」みたいですが
http://popchat.nu/users/2xxcache/
上記のフレーム内の
http://2xx.dyndns.org/
は 何だか繋がらないです
まだDNS浸透していないだけかもですが
- 591 :名無しさん@停滞中 ★:08/04/11 18:41:58 ID:???
- メモ
L'eclat des jours(2008-03-17)
http://arton.no-ip.info/diary/20080317.html
Rubyist Magazine - Rubyist Hotlinks 【第 15 回】 arton さん
http://jp.rubyist.net/magazine/?0015-Hotlinks
ホワイの(感動的)Rubyガイド
http://www.aoky.net/articles/why_poignant_guide_to_ruby/
From a Far East Island
http://d.hatena.ne.jp/norisuke3/
Lisp プログラマのための Python 人門
http://www.unixuser.org/~euske/doc/python/python-lisp-j.html
How To Become A Hacker: Japanese
http://cruel.org/freeware/hacker.html
- 592 :名無しさん@停滞中 ★:08/04/12 15:56:49 ID:???
- datをUTF8にするのはどうだろうスレッド
http://qb5.2ch.net/test/read.cgi/operate/1207973589/
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
1 名前:ひろゆき@どうやら管理人 ★[] 投稿日:2008/04/12(土) 13:13:09 ID:???0 (PC) ?S★(1017889)
datをUTF8にするのはどうだろうスレッドです。
影響があるのは、AA周りすかねぇ。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
うっひょー
まあ自分が何か書き込んでも
完全スルーなんでしょうな。
- 593 :名無しさん@停滞中 ★:08/04/12 16:25:50 ID:???
- そういう板もあったらいいなとは思ってたですが
他ならぬひろゆきさんが書いておられるので
文字コードUTF-8のdatを使う掲示板も実現するんだろうなと。
ただ
http://qb5.2ch.net/test/read.cgi/operate/1207973589/32
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
32 名前:ひろゆき@どうやら管理人 ★[] 投稿日:2008/04/12(土) 14:08:38 ID:???0 (PC) ?S★(1017889)
anydat.soみたいなサーバ処理がいらないものだけで、
回せないかなと。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
前にやりかけたですけど
文字コードShift_Jisのdatでも出来るんじゃないかなぁ・・・
- 594 :名無しさん@停滞中 ★:08/04/12 18:02:06 ID:???
- メモ
どう書く?org
http://ja.doukaku.org/
プログラミングスレまとめ in VIP - プログラミングスレまとめ in VIP
http://vipprog.net/wiki/
VIP de Programming
http://vipprog.tumblr.com/
プログラミングでもやろうよ
http://ex14.vip2ch.com/test/read.cgi/part4vip/1180409126/
- 595 :でめ:08/04/12 18:16:58 ID:4spp4fiv
- お初にお目に掛かります。>>590 のサーバの運用をしています「でめ」と言います‥‥
URL中ののIPアドレスでクグッたらこの掲示板がヒットしたのですっ飛んでまいりました。
>その39を追加させていただいたです
>mirrorhenkanのぽっぷちゃっとに管理人さん自ら公開されておられたので
>まあいいかなと。
webのログを見たら‥何じゃこりゃー 直リンの雨あられ(以下略
そんでもってrefer見たらその39が作られている‥( ゚o゚)
‥自分もまあいいかなと思ってます。
- 596 :でめ:08/04/12 18:17:49 ID:4spp4fiv
- 以下>>595 の続き
URL中のIPアドレスは固定ではないです(通常のダイヤルアップ)。動的IPなので
ルーターの電源をカーチャンが掃除機で(ry となる可能もあります。
いざとなったら、夜逃げもしやすいし。
夜逃げしたあと、今のIPアドレスを使う人がいたら
その人のルーターのport80は火の車(以下自重
2週間程度を目処にデバックを兼ねたテスト公開をしたいと思ってます。
まだあっちこっちバグだらけでwebサービス部分がまだ相当ダメダメ。特に検索機能
がヤバいです。さっさと作り直さねば‥
おおっDino氏もいらっしゃる。その節はお世話になりました‥って覚えてないか(ry
5秒以下の間隔でクローリングするとバボられると書き込んだアレです。
- 597 :名無しさん@停滞中 ★:08/04/13 10:56:46 ID:???
- >>595-596
これはこれはどうもです
そんなにアクセスあったですか。
何だか色々すみません。
DinoSwiftさんの所の書き込みというと下記ですか。
http://wannabe.fam.cx/index.cgi?mode=blog&page=1201533481
3年前からクローリングなさっておられたとは。
動的IPなのに3日間変わってないということは
安定したサーバ運営の技術をお持ちなのですね。
すごいなー
では今後共宜しくお願い致します。
- 598 :名無しさん@停滞中 ★:08/04/14 19:50:23 ID:???
- メモ
暇だからdatの補完とかしてみる
http://dat.hitobashira.org/
マカーの方みたい
ようこそバーボンハウスへ
http://hitobashira.org/
- 599 :名無しさん@停滞中 ★:08/04/16 12:43:31 ID:???
- 紹介マニア->Pythonメモ->Python基本メモ
http://sakito.s2.xrea.com/detail/python/pybase.html
python面白いです
ただ 標準で入っているMacでのpython使用方法が
まだわかんない。
あまりにも当然過ぎる事って却って説明とかも無いのかも。
考えてみれば、Windowsでのエクスプローラ使用方法とかも
説明ページがなかなか無さそうです
この板だって、トリップはともかくとして
キャップ(★)の付け方とか最初よくわかんなかったですし
いっぺん
馬鹿にされるのを承知で訊いてみるですか
- 600 :名無しさん@停滞中 ★:08/04/16 17:05:30 ID:???
- http://nicowiki.com/tools.html
http://www.virtual-pop.com/tearoom/archives/000183.html
http://site.halfmoon.jp/movielist/75.html
http://zapanet.info/blog/item/931
- 601 :名無しさん@勉強中:08/04/17 03:21:07 ID:CDFimzvZ
- こんにちは。暇つぶし2chのeucalyptus.と申します。
>>153 死ぬほど亀レスですが。
明示的に「dat落ち変換機」とは謡っておりません。
ので、あんな書き込みになっておりますが、どうかお気になさらず。。。
もし可能でしたら、以下項目について、調整頂けると助かります。
・BBSPINKについて
BBSPINKは、ホスト名に識別フラグをつけて管理しております。
識別フラグは、「ホストネーム」+「bbspink」です。
ex : ( perl )
$url = 'mobile.seisyun.net/cgi/read.cgi/'.$bbs.'/'.$hostname.'bbspink_'.$bbs.'_'.$key.'/1';
or
$hostname .= 'bbspink';
・携帯端末用URLについて
以下のURLにて、携帯端末用のサイトを公開しております。
よろしければどうぞです。
tp://mobile.seisyun.net/cgi/agate/$hostname/$bbs/$key/a
hostnameのBBSPINKフラグは、上記実装と同様です。
以上です。
- 602 :名無しさん@停滞中 ★:08/04/17 20:13:22 ID:???
- >>601
今日は。わざわざ有り難うございます。
今晩は余裕が無いのでレスのみにて
BBSPINKの件 ありがとうございます。完全にノーチェックでした。
makimo.toさんの所のBBSPINKの条件分けより遙かに簡単なので
後ほど修正させて頂くです
# メモ
# 前→ http://mobile.seisyun.net/cgi/read.cgi/set/set_avideo_1204860044
# 後→ http://mobile.seisyun.net/cgi/read.cgi/set/setbbspink_avideo_1204860044
携帯用URLもありがとうございます。
携帯用変換機のほうも全然直してなかったので
これを機に何とかしてみようかなと思います。
携帯用URLについてなのですが
レス1と最終レス(を含む数レス)を同時に開くようなオプションはありますでしょうか。
もしあれば御教示頂けたら嬉しいです(無ければ無いで別に構いません)
とりあえず
イナバウアーの如くのけぞりつつ
失礼致しますです
- 603 :名無しさん@勉強中:08/04/17 23:22:02 ID:CDFimzvZ
- >>602
BBSPINKの件、お手数をおかけします・・・。
携帯用URLですが、ご提案のオプションは、残念ながら実装していません。
ので、先ほど実装しました。
URL呼び出しは、以下のとおりです。
mobile.seisyun.net/cgi/agate/$hostname/$bbs/$key/ia
以上、よろしくお願いします。
- 604 :名無しさん@停滞中 ★:08/04/18 19:27:36 ID:???
- という訳で
PC版のほうはeucalyptus.さんから御指摘頂いた書式に変換したです
> 携帯用URLですが、ご提案のオプションは、残念ながら実装していません。
>
> ので、先ほど実装しました。
> URL呼び出しは、以下のとおりです。
> mobile.seisyun.net/cgi/agate/$hostname/$bbs/$key/ia
ありがとうございます。
携帯用のもぼちぼち取りかかろうと思いますです
# メモ
# http://mobile.seisyun.net/cgi/agate/society6/gline/1165245437/ia
# http://mobile.seisyun.net/cgi/agate/yomibbspink/801/1198984252/ia
- 605 :名無しさん@停滞中 ★:08/04/18 19:42:55 ID:???
- さて
pythonのpathを通したのを参考にして
perlのpathも通してみたです。
このpath通しをしなかったから あちこちのperl説明サイトも訳わかめだったのだなーと。
PCのコヤシに成り果てていたのだなーと>perl
で、早速
http://2ch.eucaly.net/monazilla/dattotext/
をダウンロードして実行してみたら
datがtext化されてローカル保存されるじゃないですか!!
すっげー!!
すっげー!!
ところで、大した事のない重箱の隅ですが
> ・動かし方
> perl texttotext.pl
> とやってみましょう。
> 自動的にDATを取りに行き、HTMLファイルを作ります。
これ「TEXTファイルを作ります」ですよね。
って ごめんなさいごめんなさい
ちなみに
http://2ch.eucaly.net/monazilla/dattohtml/
も同様に実行しようとしたら
「warning.plが無いよ」とエラーが出たです。
use warning: の箇所なのでしょうか。
まあ古ーいperlだから仕方なさそうです。
- 606 :名無しさん@勉強中:08/04/19 01:25:33 ID:EsxJ2WcO
- こんにちは。eucalyptus.と申します。
>>605
ご利用&ご感想ありがとうございます。。。
6年も前のソフトなので、動くかどうかアレだったのですが、無事動いたようでなによりです。
ただし、今このソフト動かしてしまうと、リロードバーボンに引っ掛かってしまうかもです。
なので、もし常用するのであれば、dat記述ファイルを以下の通り書き換えると安全かと。
hoge.txt[TAB]bg20.2ch.net/hostname.2ch.net/bbsname/keyid/
dattotextとdattohtmlは、ほぼ同じスクリプトなので、片方動けばなんとかなる
予感がするのですが・・・、、、。
#ご指摘の箇所、直しておきました・・・。
- 607 :名無しさん@停滞中 ★:08/04/19 19:57:26 ID:???
- 鬼のように疲れちゃったです
>eucalyptus.さん
もう一度DLし直してやってみたらうまく動いたですごめんなさいごめんなさい
みみずんさんの所のdattohtml.plは此方のものを改造されてるのかな。
perlもローカル環境で色々出来そうですが
最近の使えそうなperlスクリプト、例えばnicovideo.jpのflv取得するものなどを試してみると
何だか色々追加モジュールを入れなければならないみたいなので
二の足を踏んでるです
この場合はwshやpythonで同等の事が出来るのでいいのですが。
それにしてもperlはどうしても苦手意識が消えないなあ・・・。
ところで
eucalyptus.さんのお名前ですが
藤岡弘、さんや
モーニング娘。さんのように
eucalyptus.さんなのですか。
ってどうでもいい事ですねごめんなさいごめんなさい
- 608 :名無しさん@停滞中 ★:08/04/20 15:24:40 ID:???
- >>589を追加させて頂いたです
makimo.toさんのスレタイ検索フォームの下
589の段階では試してみても全然ヒットしませんでしたが
99%クロールされた今だとすごくあれこれヒットしますですね。
すごいやすごいや
- 609 :名無しさん@停滞中 ★:08/04/20 16:48:17 ID:???
- http://qb5.2ch.net/test/read.cgi/operate/1207973589/316-320n
316は私じゃないです><
まあ別にいいですが
実験板でも何でもいいですから
とりあえず早いとこ
datがUTF-8の板を設置して試してみて下さいです><
ひょっとしたら 瓢箪から駒かもしれないじゃないですか。
0chのUTF-8版を出してみたら、身も知らぬ異国の方々が使ってるのを見て
何だか感動したですよ
管理画面はまだ日本語のままだったのに。
でもまあ
ひろゆきさんの思惑はその辺りには無さそうなので
ここまでの話なんですかね。
5年前には下のような事を書かれてはいましたが
今の現実は予想を上回っていると思うのです
http://mirror.s151.xrea.com/2ch/0chu/test/read.cgi/utf8/1048754153/25
というような文章を
http://qb5.2ch.net/test/read.cgi/operate/1207973589/l50
に投稿しようかなとか思ったですが
まあいいや
打たれ弱いので、煽られるとへこみますし
- 610 :名無しさん@停滞中 ★:08/04/20 16:59:32 ID:???
- ついでに書くと
海外ドメイン規制ってどれくらいつけてあるんでしょうか。
下のスレッドの書き込みとか見ると何だかなあと思ったですが
って外野があれこれ言っても無駄でしょうけど
http://qb5.2ch.net/test/read.cgi/operate/1207973589/64-65n
> 海外ドメイン規制(fr)。2ちゃんねるビューアを使うと書き込めます。
> ホストm69.net81-66-109.noos.fr
>
> (中略)
>
> frドメイン全部禁止とはひどいなぁ
>
> ホテルの有料回線は.netだからいけるみたい
他の板のスレッドでの書き込みとか見ると
台湾や韓国やカナダやアメリカやフランスやスウェーデンやアルゼンチンはOKなのに
何でフランスのドメインからは書き込めないのでしょう。
どれくらいの範囲の板でこうなのでしょう
海外生活板とかは大丈夫なのでしょうか。
いえ、単に
フランスの人が「萌え〜☆」とか書いてるのを見て
和んでみたいだけなんですが。
- 611 :名無しさん@停滞中 ★:08/04/20 17:54:21 ID:???
- > 台湾や韓国やカナダやアメリカやフランスやスウェーデンやアルゼンチンはOKなのに
フランスは入ってないってば
ちなみにスウェーデンやアルゼンチンは例えば下
【外人専用】Welcome to Hello! Project "Wolf" @ 2ch BBS ! 【for foreigner's exclusive use】
http://ex23.2ch.net/test/read.cgi/morningcoffee/1194292498/
【外人専用】Welcome to Hello! Project "Wolf" @ 2ch BBS !【for foreigners' exclusive use】2
http://ex23.2ch.net/test/read.cgi/morningcoffee/1194544402/
【外人専用】Welcome to Hello! Project "Wolf" @ 2ch BBS !【for foreigners' exclusive use】3
http://ex23.2ch.net/test/read.cgi/morningcoffee/1194950987/
【外人専用】Welcome to Hello! Project "Wolf" @ 2ch BBS !【for foreigners' exclusive use】4
http://ex23.2ch.net/test/read.cgi/morningcoffee/1195116775/
モーニング娘。って欧米でも人気あるんだね
http://mamono.2ch.net/test/read.cgi/morningcoffee/1200384865/
というか
>>608であれこれ検索すると(例えば「カナダ人だけど」とか「台湾人だけど」等)
すっげーわんさか出てきますね。
makimo.toさんの所のだと実況板はあまり出てこないですが
takatyanさんの所だと実況板の突発的な単発スレも沢山ヒットするです
- 612 :名無しさん@停滞中 ★:08/04/20 18:50:17 ID:???
- さて
eucalyptus.さんがいらっしゃったのですが
リンクから飛んだスレが下記
【Hikkyの友?】お好みスレをメール配信 datchecker
http://pc.2ch.net/test/read.cgi/mobile/1024280588/
http://pc.2ch.net/mobile/kako/1024/10242/1024280588.html
> 2chの任意のスレッドを監視し、更新があるとメールで知らせます。
> perl + 常時接続が必要で敷居は高いですが、スレの書き込みチェックなんかに便利かも。
これwshでも出来そうですね。
更新チェックしたいdat一覧を別途テキストにまとめておいて
スレッドのdatにhead送信して
返って来たレスポンスからdatの更新時間を調べて
更新があったらメールすると。
チェックするインターバルはタスクスケジューラを使ってもいいですし
以前datgetでやったようにループ構造にしても良さそう。
問題は、wshでメール送信する方法なんですが
BASP21を使うしかないかなとか思って検索したら
標準機能だけでも可能みたいですね。
何とかなりそうじゃないですか。
wsh メール - Google 検索
http://www.google.co.jp/search?hl=ja&q=wsh+%E3%83%A1%E3%83%BC%E3%83%AB&lr=
WSH(JScript)でメールを送信する | Weboo! Returns.
http://yamashita.dyndns.org/blog/358/
VBScript でメールの送信:ある nakagami の日記:So-net blog
http://nakagami.blog.so-net.ne.jp/2005-11-27
あと上記スレの派生元スレですが
2chテキストでじっくり読み
http://pc11.2ch.net/test/read.cgi/mobile/1022865453/l50
これも同様にwshで出来そうです
それにしても現役スレッドなのですか。。
- 613 :名無しさん@勉強中:08/04/20 20:35:13 ID:ToiV6qHB
- 23ch.infoさんの過去ログをhtmltodatで
変換するにはどうすればいいのですか?
- 614 :出がけ@名無しさん@停滞中 ★:08/04/21 07:35:48 ID:???
- >>613
「read.cgi7.00?」でどうでしょうか。
>>610のURLはこっちでした
http://etc7.2ch.net/test/read.cgi/charaneta2/1207815243/64-65n
- 615 :名無しさん@勉強中:08/04/21 20:46:58 ID:SYHh6dp7
- >>614
レスありがとうございます。ですが
「read.cgi7.00?」だけでは分かりません。
もう少し詳しく教えてもらえませんか?
- 616 :疲労コンパイル@名無しさん@停滞中 ★:08/04/21 21:06:58 ID:???
- >>615
えーと
ごめんなさい
うまいこと説明する自信が全くありませんです
申し訳ないですが他の方お願いします
htmltodat作者のmukiyuさんに振っても御迷惑でしょうから
下のスレッドあたりで訊いてみるのが一番いいかも。
ただ煽られたり無反応だったりしても気にせずに。
読めないdat落ちスレのhtmlミラー避難所[2]
http://society6.2ch.net/test/read.cgi/gline/1165245437/l50
図解を交えたhtmltodatの使い方の説明サイトとかどこかにないもんですかね。
自分とこだと
http://pasoport.jp/blog/2007/12/post-230.html
みたいな。(ってこれ↑以外にも幾つかあったけど すぐ出てこないや^^;)
誰か作ってないのかな(他力本願)
- 617 :名無しさん@勉強中:08/04/22 01:42:56 ID:qL4H1sOI
- ちょっと思ったんだけどhtmltodatを
ttp://www.geocities.jp/mirrorhenkan/htmltodat/
のことだと思われてるってことはない?w
でも冗談でなく、ttp://www.geocities.jp/mirrorhenkan/から明示的にリンク貼られてるわけでもないし
知らない人が初めて来たらそっちに行っちゃっても不思議じゃないかと思って。
- 618 :涙は心のアセンブラ@名無しさん@停滞中 ★:08/04/22 18:33:17 ID:???
- >>617
なーるほど
それは確かに
アリエール
てなわけで
リンクをつけて
みましたの
ついでにね
検索結果も
追記して
疲れたよ
心身共に
ダルビッシュ
- 619 :内山理奈ックス@名無しさん@停滞中 ★:08/04/22 20:13:32 ID:???
- ところで
http://www.geocities.jp/mirrorhenkan/htmltodat/
ですが
試しに23ch.infoさんの所のhtmlソースを貼り付けてやってみたら
今でもちゃんと使えますね。
ただし、正規表現内の「<dt>」を「<dt.*?>」に変えないといけないですが。
気が向いたら直しておきますか。
って結構使えるじゃないですかこれ。
何故かLinux板で貼られてるのを見た事があるですけど
Mac環境でも使えるんじゃないかな。
- 620 :渡辺満Linux@名無しさん@停滞中 ★:08/04/22 20:35:08 ID:???
- ついでに
みみずんさんの所の全文検索フォームも使えるようにしたです
使えなくなっていたので(ってだいぶ前からでしたけど)
試してみると
新Mac板でpythonの事について触れられているのは
現在17スレッドみたいですね
けっこう活発でみんな楽しそう。
で、目についたのがこの↓レス
【WebKit】Dashboard - Part 7【ウィジェット】
http://pc11.2ch.net/test/read.cgi/mac/1178316285/167-168
> WorseTVはYahooのサイトの仕様が変わったせいみたいね。
> Python全然わからん上に、しょぼいハックですが一応動いたので報告。
> ホーム/ライブラリ/Widgets/WorseTV.wdgt内のloadtv2csv.pyに以下のパッチをあててください。
>
> *** loadtv2csv.py.org 2005-07-28 20:03:06.000000000 +0900
> --- loadtv2csv.py 2007-10-02 07:34:35.000000000 +0900
こういうスレッドとかでMac環境でのpython使用方法とか真摯に伺ったら
けっこう御教示頂けるかもしれないなとか思ったりして。
- 621 :鈴木紗Linux@名無しさん@停滞中 ★:08/04/22 21:07:47 ID:???
- きいてみたいのは
MacOSXを使っている場合:
アプリケーション/ユーティリティ/Terminal.app を起動して
python -h
と入力してエンターを押せば
pythonのヘルプ画面が表示されるのかというだけの事ですが。
もしかしたら
%python -h
とするのだろうかとか
標準でpythonが入っていても
Pathを通す作業を先にしなければならないのか とか
ターミナルでpythonスクリプトを実行出来るとしたら
そのやりかたを pythonを使った事のないMac環境の方に伝える方法とか
実際に使えたとしたら
html2dat.pyでhtmlをdat化出来るのかとか
getimg.pyでWeb上のデータをローカル保存出来るのか とか。
- 622 :eucaly:08/04/22 22:23:03 ID:UuqUwhZr
- >>621 横レスしてみる。
Mac OS X Server 10.5.2では、
usage: /System/Library/Frameworks/Python.framework/Versions/2.5/...
て表示されました。
バイナリは/usr/bin/pythonにリンクされているので、パス通っていると解釈してよさげです。
#Serverと普通ので違ったらどうしよう・・・。
- 623 :名無しさん@停滞中 ★:08/04/23 20:17:17 ID:???
- うわー
>>622
横レスありがとうございますです。
もし良かったら、幾つか確かめて頂けないでしょうか。
(1) 適当なフォルダ(ディレクトリ?)を作って
下のファイルをダウンロード(Macでも「右クリック→対象保存」でいいのかな違うのかな)して
http://www.geocities.jp/mirrorhenkan/python/getimg.py.txt
拡張子をpyにリネームしてから
1. Terminal を起動する
2. cd と入力する (cd の後に半角スペース)
3. 実行したいpyファイルがあるフォルダを Terminal のウインドウにドラッグ&ドロップする
4. return (enter ?) を押す
これで、カレントディレクトリが
pyファイルがあるフォルダに移動したでしょうか。
(2) 上のpyスクリプトの実行について
1. Terminalのカレントディレクトリがpyファイルがあるフォルダにあるか確認してから
2. python と入力する (python の後に半角スペース)
3. 実行したいpyファイル(getimg.py)を Terminal のウインドウにドラッグ&ドロップする
4. return を押す
Terminalに何か表示されたでしょうか。
また、pyファイルと同じ場所にyahooの画像が保存されているでしょうか。
rubyのバージョンが出て来ますでしょうか。
- 624 :名無しさん@停滞中 ★:08/04/23 20:32:26 ID:???
- 上の最終行は忘れて下さい・・
ここまで書いて力尽きたですが
あと簡単に二つほど
(3) Macでのzip解凍について
下のzipファイルは、Macでも解凍出来ますでしょうか。
(中身の実行方法については(1)(2)のように書く気力が今日は残ってないです^^;)
ttp://www.geocities.jp/mirrorhenkan/python/html2dat.zip
ttp://www.geocities.jp/mirrorhenkan/python/html2dat1.zip
ttp://www.geocities.jp/mirrorhenkan/python/htmltodat_for_cn2ch.zip
(4) MacOS X でのrubyのインストール状況
以前>>576で出したスレッドによると
MacOS Xにはrubyが標準で入っているとの事なので
確かめて頂けませんでしょうか。
Terminalで
ruby -v
と入力してエンターして
rubyのバージョンが出て来ますでしょうか。(←>>623の最終行はこれを消し忘れただけで)
以上、もし宜しかったら試して頂けたら幸いです
というか幸せになります
では失礼します
- 625 :eucaly:08/04/23 23:10:16 ID:YozRwvHc
- (1) 無事移動しました。
(2) 無事起動しました。ネットワーク周りも動作しました。
(3) ダウンロード→Finder経由で解凍できるようです。
(4) ruby 1.8.6 だそうです。
オマケ : ryファイルは、テキストエディタに関連付けされているみたいです。
以下にキャプチャ画面置いておきますね。
dempamusic.com/musictemp/mox_py.jpg
- 626 :出がけ@名無しさん@停滞中 ★:08/04/25 08:10:02 ID:???
- >>625
ありがとうございます。
動きましたか!
ネット上のデータ取得も出来るという事は
今までwshで作ったものもpythonに書き換える事とか出来そうですね。
たぶん同様にrubyでも可能なのだろうなと。
や、何でこんな事やってるかというと
「Mac/Linuxだからwsh使えないよ」というような事があったら癪なだけですが。
取り急ぎ行ってきます
- 627 :名無しさん@停滞中 ★:08/04/25 19:23:16 ID:???
- さて
>>624の続きですが宜しいでしょうか。
(5) htmltodat100.pyの実行可否について
(3)のzipですが、1番目と2番目の中身は同じです(圧縮ソフトを変えただけ)
これを(2)と同じ要領でターミナルから実行すると
同梱の2つのhtmlファイルからそれぞれdat生成されますか?
(6) ターミナルからのデータ入力
http://www.geocities.jp/mirrorhenkan/python/getfile.py.txt
上のファイルをDLして拡張子pyにして
ターミナルから実行すると「URL please :」と表示されると思いますので
適当なURLを入力実行してみて下さい。
pyと同じフォルダに「test.txt」という名前でローカル保存されていますでしょうか。
(7) dat化したファイルを用いた dat2html.rb の実行可否について
Script/Ruby
http://www.moonwolf.com/ruby/
上記URLの下のほうにあるdat2html(URLはttp://www.moonwolf.com/ruby/archive/dat2html-0.1.tar.gz)
をDL解凍して(MacOSXでは標準でtar.gz解凍出来るでしょうか)
(5)でdat化したファイルと同じフォルダにdat2html.rb/sage.rbの2ファイルを置いて
(1)の要領でdat2html.rbがあるフォルダをターミナルのカレントディレクトリにして
ruby dat2html.rb
と入力エンターすると、
datがhtml化生成されるでしょうか。
- 628 :名無しさん@停滞中 ★:08/04/25 19:30:18 ID:???
- MacOSXで試して頂きたく思うのはこのくらいなのですが
あと些細な質問を。(検索してもよくわからなかったので)
(a)「Finder」は、windowsのエクスプローラに該当するものなのでしょうか。
wikipedia等を見るとそれっぽい感じですが。
Finder - Wikipedia
http://ja.wikipedia.org/wiki/Finder
(b) ターミナルではクリップボードのデータを右クリック貼りつけとか出来るのでしょうか。
(c) MSDOSプロンプトでは入力キーが英語キーボード配列固定みたいで
例えば「http://」と入力しようとしても「http'//」となったり
「\」が入力出来ないのですが
Macのターミナルではどうなっていますか?
(d) Macでは「エンター」「リターン」のどちらですか?
また「フォルダ」「ディレクトリ」のどちらが普通の呼び方なのでしょうか。
今のところは取り急ぎこんな所です。
質問が多くて申し訳ありませんです。
ごめんなさい
# 質問責め って・・・それってどんなプレイ?
- 629 :名無しさん@停滞中 ★:08/04/26 21:27:05 ID:???
- http://www.geocities.jp/mirrorhenkan/htmltodat/
を少し直したです
って2年半ぶりですか
といっても>>619の微調整だけですが
という事で
>>613
23ch.infoさんのhtmlソースを上のフォームに貼り付けて
変換ボタンを押せばdat化されるかも
あんまりよく見てないんで何ですが
これって頭をひねれば
前処理・後処理等も何とかなりそうですね。
変換の進捗状況も
JavaScriptのAppendChildを用いれば出来ない事もなさそうです
というか
正規表現その他も
本家htmltodatと同様にしたほうがいいかも。
「m#<dt.*?>([0-9]+).+?(?:"mailto:(.+?)">)?<b>(.+?)</b>(?:</font>|</a>) ?:(.*?)<dd> ?(.*?)<br><br>(<dt.*?>|</dl>)#mik」
みたいに。
まあ JavaScriptでmコマンドとかやっても全然意味ないんですが。
- 630 :名無しさん@停滞中 ★:08/04/27 16:21:45 ID:???
- http://society6.2ch.net/test/read.cgi/gline/1193462528/461-463n
いよいよ携帯用のに手をつけますかね
あれから40個くらいミラーが増えたので実に大変なのだよ明智君
実際どうしたものかと途方にくれてるですが。
まあ手をつけられる所からやるしかないんですが。
- 631 :名無しさん@停滞中 ★:08/04/27 18:33:09 ID:???
- みみずんさーばー移設完了 (みみずんぶろぐ)
http://mimizun.com/blog/2008/04/post_454.html
http://qb5.2ch.net/test/read.cgi/operate/1208353361/399
うむ
反応が段違いです
すごいやすごいや
それはそうと、携帯から
http://mimizun.com/や
http://122.249.88.230/
にアクセスすると携帯用ページが表示されるですが
「準備中」の表示がいつか消えるのを
金麦冷やして待ってる
- 632 :名無しさん@停滞中 ★:08/04/27 19:32:03 ID:???
- みみずんさんが復活されてから探してみると
>>630のリンク先のdat落ちスレッドも みみずんさんの所にありましたね。
とはいえやはり色々追加するべきかなと(>携帯用)
でも例えば
iMonaとかみたいなもの等はそれ用のスクリプトを携帯用に
また車輪の再生産しなければならないのでしょうか
それはそうと
tmkkの物置き
http://tmkk.hp.infoseek.co.jp/index.html
Macをお使いの方みたいですね。
アーカイブはtar.gz形式になってますが、Macではこの形式が汎用的なのかな。
で、下のほう
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
・2chブラウザ的Greasemonkeyスクリプト (Firefox用、Safari用)
(中略)
○ DAT落ちしたスレッドを開いた時に検索ページhttp://www.geocities.jp/mirrorhenkan/index0.html
へのリンクを表示
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
やはりMac環境でも使えているみたいですね。
あとはhtmlをdat化する方法がわかればそれでOKだろうなと。
「Python何それ食えるの」「Rubyといえば指輪だよね」
というような方々に試してもらってうまくいったら嬉しいんですが
これがどうもなかなかどうしてさてどうしたものかどうしましょう
windows/Mac/携帯のどれでも無問題になったら
それこそ本当にやる事なくなっちゃうかもですが
まだ他にもあるかな。
LinuxはWindowsから流れた方が多いでしょうし
Wineでhtmltodatが動けばいいんですがどんなものかと。
下のスレとか見ると、Janeは動いたみたいですが。
【動きます】JaneでLinuxを使ってみよう【起動確認】
http://jane.s28.xrea.com/test/read.cgi/bbs/1173371571/
あと何だろうなー
WiiとかXBOXとかPS2とかなのかな
- 633 :名無しさん@停滞中 ★:08/04/27 21:53:25 ID:???
- 車輪の再生産→車輪の再発明
あったあった
今夜も Wine で乾杯! - 12本目
http://pc11.2ch.net/test/read.cgi/linux/1206139518/116-118n
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
116 名前:login:Penguin[sage] 投稿日:2008/04/19(土) 16:30:53 ID:W4ZaPxsw
jnae doe style使えるんだけど日本語でスレ検索するとエラーで開けないのは仕様なのかな?
117 名前:login:Penguin[sage] 投稿日:2008/04/19(土) 17:02:42 ID:Hhj580oz
JaneDoeStyleはIEコンポーネントを使ってないという触れ込みだが実際はIEs4Linuxが必要だし、
自分の環境だけかもしれないが無限ループっぽいフリーズするし、
画像ビューアの表示が変だしでWineだといまいち
Wineで使うならJaneDoeViewが素直に使えて良いよ
日本語検索もmigemoも問題無く使える
118 名前:login:Penguin[sage] 投稿日:2008/04/19(土) 17:45:26 ID:W4ZaPxsw
>>117
d
やってみます
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
htmltodatはWine上で実行可能なのでしょうか
と一応書いてみる
http://society6.2ch.net/test/read.cgi/gline/1165245437/400
- 634 :名無しさん@停滞中 ★:08/04/28 23:37:45 ID:???
- メモ
http://popchat.nu/users/mirrorhenkan/7.pop
http://popchat.nu/cgi-bin/nph-p.cgi?mirrorhenkan
http://popchat.nu/users/f.js
http://popchat.nu/users/mirrorhenkan/s.css
- 635 :名無しさん@停滞中 ★:08/04/29 09:09:23 ID:???
- http://popchat.nu/users/mirrorhenkan/iframe.js
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
var popchatID = 'mirrorhenkan';
var popHeight = '150';
if (!popWidth) var popWidth = '600';
document.write('<TABLE BORDER=1 CELLSPACING=0 CELLPADDING=0 WIDTH=' + popWidth + '><TR><TD>');
document.write('<IFRAME HEIGHT=' + popHeight + ' WIDTH=100% SRC=http://popchat.nu/cgi-bin/nph-start.cgi?' + popchatID + '>');
document.write('</IFRAME></TD></TR></TABLE>');
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
http://popchat.nu/cgi-bin/nph-start.cgi?mirrorhenkan
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
<HTML><HEAD><TITLE>2ch DAT落ちスレ ミラー変換機</TITLE>
<BASE HREF="http://popchat.nu/"></HEAD>
<FRAMESET ROWS="100%,*" BORDER=0 FRAMEBORDER=0 FRAMESPACING=0>
<FRAMESET ROWS="2,*" BORDER=0 FRAMEBORDER=0 FRAMESPACING=0>
<FRAME NAME="c_top" SRC="./users/mirrorhenkan/bg.html" SCROLLING="NO" NORESIZE MARGINWIDTH=0 MARGINHEIGHT=0>
<FRAMESET COLS="2,*,2" BORDER=0 FRAMEBORDER=0 FRAMESPACING=0>
<FRAME NAME="c_left" SRC="./users/mirrorhenkan/bg.html" SCROLLING="NO" NORESIZE MARGINWIDTH=0 MARGINHEIGHT=0>
<FRAMESET ROWS="*,24,15" BORDER=0 FRAMEBORDER=0 FRAMESPACING=0>
<FRAME NAME="chat" SRC="./users/mirrorhenkan/7.pop" FRAMEBORDER=1 SCROLLING="NO" NORESIZE MARGINWIDTH=0 MARGINHEIGHT=0>
<FRAME NAME="form" SRC="./users/mirrorhenkan/form.html" SCROLLING="NO" NORESIZE MARGINWIDTH=0 MARGINHEIGHT=0>
<FRAMESET COLS="*,140" BORDER=0 FRAMEBORDER=0 FRAMESPACING=0>
<FRAME NAME="popstatus" SRC="./users/mirrorhenkan/status.html" FRAMEBORDER=0 SCROLLING="NO" NORESIZE MARGINWIDTH=0 MARGINHEIGHT=0>
<FRAME NAME="banner" SRC="./cgi-bin/ads.cgi?id=mirrorhenkan&ct=0&bc=F0F0F0&tc=333333&st=1" SCROLLING="NO" NORESIZE MARGINWIDTH=0 MARGINHEIGHT=0></FRAMESET></FRAMESET>
<FRAME NAME="c_right" SRC="./users/mirrorhenkan/bg.html" SCROLLING="NO" NORESIZE MARGINWIDTH=0 MARGINHEIGHT=0></FRAMESET></FRAMESET>
<FRAME NAME="gate" SRC="gate.html" NORESIZE></FRAMESET></HTML>
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
http://popchat.nu/users/mirrorhenkan/status.html
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
<HTML><HEAD><TITLE>popchat.nu</TITLE>
<STYLE TYPE="text/css">
<!--
INPUT {
position:absolute;
top:0px;
left:1px;
background-color:transparent;
color:#333333;
height:15px;
width:100%;
font-size:12px;
border:0px
}
-->
</STYLE>
<SCRIPT LANGUAGE="JavaScript">
<!--
defaultStatus=' ';
// -->
</SCRIPT>
</HEAD>
<BODY BGCOLOR="#F0F0F0" oncontextmenu="return false;">
<FORM><INPUT TYPE="text" onFocus="document.forms[0].elements[0].blur();"></FORM>
</BODY></HTML>
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
- 636 :名無しさん@停滞中 ★:08/04/29 19:51:25 ID:???
- http://society6.2ch.net/test/read.cgi/gline/1165245437/578-581n
超長文を投稿してしまった
他所だと叩かれるだけだろうなと思ったので其方に投稿した
反省してはいないが 無反応でもしょうがなかろうと思っている
あと「〜まで読んだ」みたいな一行レスがあっても
まあそんなもんだろうなと
- 637 :名無しさん@停滞中 ★:08/04/30 21:25:46 ID:???
- 携帯用ミラーURLについて覚え書き
(1)携帯専用ページ存在
・2ch-i
・讃岐メニュー
・暇つぶし2ch
・nikaさんの所
・デスクトップ2ch
・23ch.info
・べっかんこ
・公式p2
(2)datアクセス可能
・みみずん検索
・syoboon
・wannabe
・takatyan
・オカルティカレーマニア
・heiwaboke
・W2Ch中間サーバ
・2ch_cache
・モナメント
(3)PC用ミラーのみ
・snapshot
・みみずん検索(一部)
・remix2ch
・Jane touch
・ムッハー
(4)特殊
・iMona中間サーバ
やっつけで書いてるんで漏れその他あるかも。
makimo.toさんの所とか今どうなっておられるのかなとか。
それぞれについて考えると
(1)そのままURL変換すれば良さそう。
(2)携帯用dat2html.phpl経由でのURLにすればいいのかな
(3)ファイルシークやgoogle携帯プロキシ経由にすればいいのかな
(4)専用の携帯用iMona.phpを作ればいいのかな
ここで少し問題なんですが
DinoSwiftさんの所と2chcacheさんの所の二つの所のミラーURLですが
元スレのURLだけでは出来ないという事で。
まあ作ってしまえばいいだけの話なんですが
imonaと共に 何とも億劫だな。。
phpの書き方からまた思い出さなければならないですし。
- 638 :名無しさん@停滞中 ★:08/04/30 21:33:21 ID:???
- 確認メモ
携帯からどう見えるか
http://p2.chbox.jp/read.php?url=http://society6.2ch.net/test/read.cgi/gline/1165245437/
http://p2.2ch.net/p2/read.php?url=http://society6.2ch.net/test/read.cgi/gline/1165245437/
- 639 :名無しさん@停滞中 ★:08/05/01 19:34:05 ID:???
- URL直飛びでやってみると
snapshotはc-others.2ch.netのクラシックメニュー
公式p2はそのまま読めたかもしれないです
でも確かかどうかわかんない
さて
いろいろ見てみたら
下のスレッドが優しい方が多いように見えましたので
教えて頂けるかもしれないと思い 書き込んでみたです
くだすれPython(超初心者用)
http://pc11.2ch.net/test/read.cgi/tech/1207878910/133
無反応ならともかく、煽られたりしたらどうしましょうか。
まあそんなもんさと自分に思い聞かせるしかないですか。
もし無反応だったらどうしましょうか。
mirrorhenkanのトップページで訊いてみますかね。
popchatを見てみると 今現在60人接続者がいるみたいですし
全然接点のない別分野の方が反応してくれるかもですし。
- 640 :名無しさん@停滞中 ★:08/05/02 18:53:21 ID:???
- 休みって何それおいしいのそうよおいしいのよ
まあ無縁ですが
疲れちゃったので簡単に
http://123.225.123.197/memo.htm
ありがとうございますです。
では要望というか独り言を
xrea.comもアクセス遮断対象から除外して頂けると嬉しいです(私が)
下記のようになりますので。
http://mirror.k2.xrea.com/dat2html/read1.php?url=http%3A%2F%2F123.225.123.197%2Ftech%2Fdat%2F1203874045.dat&btnG=%95%CF%8A%B7
いちおう手持ちのjpドメインの無料サーバだとアクセス可能ですが
取得してずーっと放置していたところなので
いきなりアクセス過多になると消滅してしまうかもなので。
http://409.jp/~szk/dat2html/i/read2.php?url=http://123.225.123.197/tech/dat/1203874045.dat&st=80&to=89#saisyo
おやすみなさい
- 641 :名無しさん@停滞中 ★:08/05/03 14:35:03 ID:???
- さあ連休するぞ連休するぞ
だからおらにはむえんなはなしなんだってば
という訳で
対応ありがとうございます
表示されておるです
で、懸念される問題なんですが
携帯用dat2htmlでのアクセスがどれくらいあるんだろうかと。
xreaのanalogの見方とかもあんまりよくわかんないですし。
まあやってみなけりゃわかんないですが。
あと自分用メモなんですが
何かread1.phpだと表示が変ですね。
read2.phpだと無問題ですが。
http://mirror.k2.xrea.com/dat2html/read1.php?url=http://123.225.123.197/tech/dat/1203874045.dat
http://mirror.k2.xrea.com/dat2html/read2.php?url=http://123.225.123.197/tech/dat/1203874045.dat
1番目のだとレス4の本文中でバグってるです。
1と2の違いは
単にリモートファイル取得の際にUser-AgentをMonazillaで送信するかしないかだけの違いの筈で
それ以外は何も変えてないんだけどなー。
makimo.toさんの所のファイルをdat取得して携帯用表示出来ないかという事でやってみたんですが
makimo.toさんから取得出来なくなった今となってはあんまり意味ないですなこれ。
ちなみに下記サイトのコードを使わせて頂いたのですが
php関係がフォーマットされた今の頭で読むと
暗号だぞこりゃ
さあ勉強するぞ勉強するぞと
PHP TIPS Vol.3
http://www.spencernetwork.org/memo/tips-3.php
- 642 :名無しさん@停滞中 ★:08/05/03 14:41:00 ID:???
- http://pc11.2ch.net/test/read.cgi/tech/1207878910/133-138n
御返事頂いたので138を書いてみたのですが
読み返すと
何だか失礼な事を書いたのかもと思い
少々自己嫌悪
- 643 :名無しさん@停滞中 ★:08/05/03 14:56:56 ID:???
- メモ
2ちゃんねるブラウザ
http://www.love-season.net/
これですが
http://www.love-season.net/yutori.2ch.net/news4vip/1209687609/
上のURLで
http://yutori.2ch.net/test/read.cgi/news4vip/1209687609/
がdat落ちしても閲覧可能だったら
どんなに有り難い事でしょうか。
- 644 :名無しさん@停滞中 ★:08/05/03 15:58:18 ID:???
- 現時点では閲覧出来ないみたいです
残念
さて
>>642の関連
2ch過去ログ倉庫にあるスレッドを見たい -OKWave
http://okwave.jp/qa3924622.html
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
初歩的な質問ですみません。
Mac10.4.9、safari2.0.4を使っています。
2chの「このスレッドは過去ログ倉庫に格納されています」と表示される
スレッドを見たいのですが、ブラウザで見る方法を教えていただけますでしょうか。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
質問自体はともかく
下まで読んだら
いやその何というか実にまあ素っ頓狂に唐突な感じに
少しだけ驚いたりして
- 645 :名無しさん@停滞中 ★:08/05/03 17:58:46 ID:???
- >>1toURL
http://www.geocities.jp/hiko_bae/ichi2url.html
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
2chのスレッドの>>1からスレッドのURLを算出します。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
date2keyみたいなものかなとDLして見てみたです
readmeを見てみると
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
>>1の名前と発言日時を含む1行を>>1に貼り付け、変換(&C)をクリッ
クしてください。スレッドのURLを表示します。>>1が「名無し」でない
場合や複数の板で使われている「名無し」名の場合はスレッドIDのみと
なります。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
という事は
日付からキーを
名無し名から板名をそれぞれ算出して
その日付の時の掲示板のサーバ名を割り出しているのかな。
だとしたらJavaScriptでもやれそうです。
心配になって(←?)公開日時を見てみたら
「(2006/8/23)」との事。
で、http://www.geocities.jp/mirrorhenkan/key/key2date.htmlを見てみたら
公開日時を出してないじゃないですかバカバカバカ
とりあえず前々スレ395で出したみたいで
日付を見ると「05/12/13(火) 20:13:40」 でした。
あー良かった(何が)
- 646 :名無しさん@停滞中 ★:08/05/03 19:19:40 ID:???
- 業務連絡(カッケー!)
http://www.value-domain.com/svip.php?action=all
によると
k2.xrea.comのIPアドレスは
「210.196.176.182」固定みたいです
ところで
mirror.k2.xrea.comみたいなサブドメインの場合って
IPアドレス表示させるにはどうすればいいのでしょうか。
以前、dumper.jpさんのところがなかなか繋がらないのでIPアドレス表示させようとしたですが
2ch.dumper.jpみたいなサブドメインだったので
どうやればいいのか全然わかんなかったまま今に至るんですが。
- 647 :名無しさん@停滞中 ★:08/05/03 20:01:07 ID:???
- >>637続き
結果表示の順番試案
・べっかんこ(その26)
・みみずん(その6・その7・その7a)
・nikaさんの所(その20)
・23ch.info(その31)
・2ch-i(その28)
・讃岐メニュー(その24)
・暇つぶし2ch(その27)
・2ch_cache(その39)
・デスクトップ2ch(その23)
今のところこのくらいでどうかなと。
携帯用ページを用意しておられる所・ミラーが多い所を並べただけですが。
ただ あまりこういう事書いても何ですが
大抵はべっかんこで事足りるような感じがするです。
もっともらしい噂によると
ひろゆきさん べっかんこに対してダメ出しされてるそうで。
URLも何もかも違いますし(2ch.netではない)
そこの広告はひろゆきさんとは無関係とかで以下略
いやようわからんだけなんですけど
- 648 :名無しさん@停滞中 ★:08/05/04 15:51:05 ID:???
- くだすれPython(超初心者用)
http://pc11.2ch.net/test/read.cgi/tech/1207878910/139
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
139 ★返答 名前:デフォルトの名無しさん[sage] 投稿日:2008/05/03(土) 20:43:48
>>138
Mac板で聞けばいいんじゃね?
なんでMacを持ってない(使える環境がない)人が
検証を必要としてるのか興味あるけどね。
「問題なくできましたよ」ってレスがあれば、それを信じちゃうわけ?
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
胸がドキドキしちゃった。
これって恋?
とりあえず自分が書いた事を読み直してみましたが
139さんの「なんで〜」の件については過不足なく書いてあると思うんですが。
読解力が足りないなー。
あと何でこのスレッドで訊いたかというと
直前に
http://pc11.2ch.net/test/read.cgi/tech/1207878910/130-132n
のやりとりがあったからで。
にしても世界が狭いなー。
pythonってクロスOS言語の筈ですよね。 (だから覚えようとしてる訳で>自分)
Mac環境がないならスルーすりゃいいのに。
まあこの方がMac使いな可能性もありますが
そういう人は「Mac板で聞けばいいんじゃね?」なんて書かないでしょうし
もしそれでそういう事書いていたら実に何とも意地が悪い。
いやーこれどうするかなー。
あとレス140は自分じゃないです
そういえば、2ch-iさんのhtmlをdat化させようとした時も
最初は実に面倒なやり方しか思いつかなかったんですが
今ではまあ何とかなってますし
同様に何とかなるんじゃないかと。
http://www.geocities.jp/mirrorhenkan/2ch-i/
スクロールした下のほうに最初のやり方が残ってますが
今見ても何だかめんどくさい。
あと 新旧どちらのスクリプトもwshなので
windows限定なのが 何だかなあという感じですな
- 649 :名無しさん@停滞中 ★:08/05/04 16:37:10 ID:???
- http://mirror.takatyan.info/test/read.cgi/title_search_bbs/1208011907/76
とあるサイトさんとしては
「ごめんよメンフラハップ」(古)というしかないです
ごめんなさい
という事でたった今
文字を変えてみたです
これで「読めないdat」「仲間由紀恵」「熟女」「援交」等を含むスレッドが一掃されるのではないかと
しかし熟女とか一体
・・・って もう一掃されかかってる
早い
- 650 :名無しさん@停滞中 ★:08/05/04 19:51:17 ID:???
- 粛々と>>647実装(カッケー!)
他もまあおいおいと
ところで
Peaceful japonica - プログラム
http://www.heiwaboke.net/PHP/
ここ↑の「うんかむ」って404なのでしょうか。
http://www.heiwaboke.net/m/unkam.php
- 651 :名無しさん@停滞中 ★:08/05/04 20:00:35 ID:???
- ところでスレ違いという事はないですが(自分で言ってどうする)
「暇つぶし何其」って実にいいですね。
他の方のブックマーク(というかチェックスレ)をあれこれ見れたり
熱いスレ一覧とかあったり。
暇つぶしwikipediaや暇つぶし青空文庫もすごいです
色々小説とか読んでみたりして
- 652 :名無しさん@停滞中 ★:08/05/05 15:05:23 ID:???
- 携帯で色々見てみましたが(コピペとか面倒ですが仕方ない^^;)
みみずんさんの所がすっげー爆速だもんで
すごくストレスレスですね。
で、色々見ていて思ったのは
携帯用dat2htmlをもう少し改良したいかなと。
とりあえず3つくらい
(1)レスアンカーからジャンプしたい
(2)AASをちゃんと使えるように
(3)文章コピペ出来るように「写」の項目があれば
まだあるかな
どれもこれも 頭を絞れば何とかなりそうな感じがするです
- 653 :名無しさん@停滞中 ★:08/05/05 17:41:43 ID:???
- 質問?ボコボコにしてやんよ!
http://bokoboko.dip.jp/bokoboko/
以前見た時は 他にやりたい事があるので閉鎖します とあったのですが
再開しておられるですか
クロールして現在進行中ですか
日付や時間を見るとついさっきのとかありますし
質問?ボコボコにしてやんよ! 15歳の時に子供産んだけど何か質問ある?
http://bokoboko.dip.jp/bokoboko/index.py/1209965985
てかリンクを見ると
何だかパワーアップしとるです
ブログ執筆中
http://d.hatena.ne.jp/tomity/
大学・大学院研究室検索のラボナビ
http://labnavi.sytes.net/
ラボナビ開発日記
http://d.hatena.ne.jp/lab_navi/
いやーpythonで構築したサイトの実例だなー
すごいや
- 654 :名無しさん@停滞中 ★:08/05/06 09:50:07 ID:???
- メモ
WisdomSoft
http://www.wisdomsoft.jp/
知らない事が多過ぎて、これからの人生わくわくするぜ。
- 655 :名無しさん@停滞中 ★:08/05/06 12:01:24 ID:???
- 技術資料も分かり易い感じがしますし
論文フォルダの下記とか面白かったー。
未来が創られた時
http://wisdom.sakura.ne.jp/essay/pioneer/index.html
写真の有無によって全然印象が変わりますね。
偉人伝.com↓もプロフィール画像があったらいいなと
コンピュータ偉人伝 ちえの和WEBページ
http://www.ijinden.com/index.html
- 656 :名無しさん@停滞中 ★:08/05/06 13:17:12 ID:???
- 2ちゃんエディタ
http://edit.2chmap.com/
これですが
http://edit.2chmap.com/read/yutori.2ch.net/news4vip/1210004050.dat/1
http://yutori.2ch.net/test/read.cgi/news4vip/1210004050/l50
がdat落ちしても閲覧出来ていたら
どんなにか嬉しい事でしょうか
- 657 :名無しさん@停滞中 ★:08/05/06 16:09:53 ID:???
- 閲覧可能ですね。
では追加させて下さい
「その40」という事で
ここですが、トップの下部を見てみると
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
追加予定機能
・過去ログ
過去ログの表示対応
・携帯対応
携帯からも閲覧できるようにする
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
との事なので
dat落ち後も保存して下さったら嬉しいです。
dat化は次レスにて(まだ完全ではないですが)
- 658 :名無しさん@停滞中 ★:08/05/06 16:23:10 ID:???
- メモ
2ちゃんエディタ(http://edit.2chmap.com/)のdat化について
URL例
http://edit.2chmap.com/read/yutori.2ch.net/news4vip/1210004050.dat/1
(http://mirror.sarashi.com/htmltodat/1210004050.html)
正規表現
m#<dt><a.+?>([0-9]+)</a> ()<b.+?>(.+?)</b> 投稿日:(.+?)</dt><dd>(.+?)<br><br></dd>(<dt>|</dl>)#mik
前処理
s#(<title>)2ちゃんエディタ \[(.+?)\](</title>)#$1$2$3#ik
s#( 投稿日:.+?ID:)<a.+?>(.+?)</a>(</dt>)#$1$2$3#igk
s#<a.+?>((?:&gt;)?&gt;\d+)</a>#$1#igk
s#\n(?:ref|pop).+?(\n)#$1#igk
前処理の3つ目の「&」は半角にして下さいです
終了後に「一行が長すぎるか〜」エラーが出ますが、これでいちおうdat化出来るかと。
エラーがなかなか消えないのでソースを見てみると
全く同じ文章がポップアップ用に出力されているみたいです。
これを省くために前処理の4番目をつけてみたんですが、まだエラーが消えないなぁ・・・。
何でなんだろう。
dat化には問題ないかなとは思いますが。
あとメール欄は元のhtmlの段階から消えているみたいで(生禿さんのところみたいに)
これは我慢するしかないかも。
- 659 :名無しさん@停滞中 ★:08/05/07 20:29:38 ID:???
- ちょっと面白かったのでメモ
DCOSHA - Direct Connection for Override System of Hardcopy Archives
http://www4.atpages.jp/mnk/
まあいわゆるdatアップローダなんですが
実にデザインがクールだなと
で、これの元サイトのリンクを辿ってみたら
下のになってたですよ
エロ絵♀
http://haruhix.mad.buttobi.net/
- 660 :名無しさん@停滞中 ★:08/05/07 23:02:28 ID:???
- DinoSwiftさんいよいよ上京ですか。
頑張って下さいです
- 661 :昼休み@名無しさん@停滞中 ★:08/05/08 12:52:33 ID:???
- サーバPCもお休みになられたみたい
>>659ですが
http://pc11.2ch.net/test/read.cgi/hosting/1193869295/681,685,687
から知ったです
サイトを見れば見るほど
何というか 才能(技術)の無駄遣いだなーと。
いやすごいほめてるんですが。
- 662 :昼休み@名無しさん@停滞中 ★:08/05/10 06:44:57 ID:???
- http://popchat.nu/users/mirrorhenkan/7.pop
なことかいてどうしろと
なにかあったらきけんがあぶない
いのちがしんだらどうしてくれる
- 663 :名無しさん@停滞中 ★:08/05/10 16:09:31 ID:???
- ログインが必要なWebページをダウンロードするには?
http://homepage1.nifty.com/MADIA/vb/vb_bbs2/200412/200412_04120009.html
XMLhttpにてYahooにログインするには?
http://hpcgi1.nifty.com/MADIA/VBBBS2/wwwlng.cgi?print+200606/06060001.txt
XMLHttpRequestまとめ - Archiva
http://archiva.jp/web/javascript/XNLHttpRequest.html
proxyサーバーを通すインターネット接続をおこなうにな?
http://hpcgi1.nifty.com/MADIA/VBBBS/wwwlng.cgi?print+200511/05110047.txt
- 664 :名無しさん@停滞中 ★:08/05/12 07:57:41 ID:???
- 各人ニ告グ
掲示板一覧ニ下記二板ガ【ネタ雑談】ニ追加サレタノデ、
閲覧専用機種ヲ使用ノ住人ハ速ヤカニ板一覧更新サレタシ
http://bubble6.2ch.net/dejima/ dejima
http://bubble6.2ch.net/senji/ 戦時
ところでこの二板なんですが
もしかして投稿時に
ひらがな→ローマ字
ひらがな→カタカナ
にそれぞれ変換保存とかしてるんでしょうか。
投稿テストしてみればわかりそうなもんですが。
・・と書いてから見回すと
そんな事はなさそうでした
http://bubble6.2ch.net/test/read.cgi/senji/1210161012/31
- 665 :名無しさん@停滞中 ★:08/05/12 12:10:12 ID:???
- 戦時板だけでしたか。
試しに書いてみたら
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
--------------------
書込み中・・・
--------------------
ERROR!
漢字とカタカナしか受け付けていません
ホスト****************************
名前: 名無シサン@ヲ腹イッパイ。
E-mail: sage
内容:
ひらがなではだめですか
★ アクセス規制中でも書ける板たち ★
こちらでリロードしてください。 GO!
アクセス規制・プロキシー制限等規制は、2ちゃんねるビューアを使うと回避できます。自分で解決してみよう! 書き込めない時の早見表
分からないことがあったら2ちゃんねるガイドへ。。。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
50音と濁点半濁点促音の変換くらいはサーバ側でやったらいいのになと思ったり。
- 666 :名無しさん@停滞中 ★:08/05/12 12:14:48 ID:???
- あと曜日も
月月火水木金金
と表示されるのか・・
- 667 :名無しさん@停滞中 ★:08/05/12 18:19:11 ID:???
- メモ
CGI...写メール日記
http://www.kit.hi-ho.ne.jp/t-sonoda/mobdiary/
レッツPHP!
http://php.s3.to/bbs/bbs7.php
- 668 :名無しさん@停滞中 ★:08/05/13 16:44:35 ID:???
- 業務連絡
http://bubble6.2ch.net/dejima/ dejima
このdejima板なんですが
世界情勢カテゴリに入ったようで。
書き込もうとすると
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
--------------------
書込み中・・・
--------------------
ERROR!
日本語は受け付けていません
ホスト**************************
名前: maji
E-mail: sage
内容:
日
★ アクセス規制中でも書ける板たち ★
こちらでリロードしてください。 GO!
アクセス規制・プロキシー制限等規制は、2ちゃんねるビューアを使うと回避できます。自分で解決してみよう! 書き込めない時の早見表
分からないことがあったら2ちゃんねるガイドへ。。。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
ひらがなカタカナ漢字はいけないんだそうな。
だったらUTF-8にして欲しかったかも。
ところで戦時板ですが
同様の事とか0chですっげー簡単に出来ますね。
更にdatの平仮名をhtml表示時にカタカナにする事とかも
jcode.pl/Jcode.pmのどちらかを使えばあっけなく出来るのでは。
0chを見てみるとmoduleフォルダ内にjcode.plがあるんで
valda.plとgaladriel.plあとread.cgiの該当個所を変えれば良さそう。
例えば下のを参考に
require "./jcode.pl";
$line = "あいうえお\n";
&jcode::tr(\$line, 'あ-ん', 'ア-ン');
print $line;
メモ
jcode.pl official page
http://srekcah.org/jcode/
- 669 :名無しさん@停滞中 ★:08/05/13 20:48:49 ID:???
- テナ訳デ
突貫工事デ
ヤッテミタ
戦時@0ch掲示板
http://mirrorhenkan.hp.infoseek.co.jp/senji/cgi-bin/senji/
やっつけなのであちこち適当だもんで
本当は書き込み確認や各種エラーもカタカナ化しようと思ったですが
まあいいやと。
表示をjcode.plでひらがな→カタカナ変換してるだけなので
datにある文章はひらがな混じりになっておるです。
書き込み時にもひらがなをカタカナ化しようかなと思ったですが
まあいいやと。
- 670 :名無しさん@停滞中 ★:08/05/13 21:02:58 ID:???
- ところでjcode.plでのひらがな→カタカナ変換なんですが
呈示されていたサンプル
&jcode::tr(\$line, 'あ-ん', 'ア-ン');
これだと、例えば
「あなたのおじい様の戦争体験を教えて」
が
「アンンンンンん様ン戦争体験ン教んん」
と変換されてしまったです。
あちこち検索してみたですけど、どうやったらいいのかわからない。
仕方なく
&jcode::tr(\$line, 'あいうえおかきくけこさしすせそたちつてとなにぬねのはひふへほまみむめもやゆよらりるれろわをんがぎぐげござじずぜぞだぢづでどばびぶべぼぱぴぷぺぽぁぃぅぇぉゃゅょっ',
'アイウエオカキクケコサシスセソタチツテトナニヌネノハヒフヘホマミムメモヤユヨラリルレロワヲンガギグゲゴザジズゼゾダヂヅデドバビブベボパピプペポァィゥェォャュョッ');
とやったです(長すぎるので改行してます)
意味ないなー。
「A-Za-z」みたいには出来ないんでしょうか。
そんな事はないと思うんですが・・・。
- 671 :名無しさん@停滞中 ★:08/05/14 12:41:12 ID:???
- >>670の件
たぶんこれが原因なのかも
jcode.pl の私的な解説書
http://mikeneko.creator.club.ne.jp/~lab/kcode/jcode.html#h2-10
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
「-」による範囲指定は、$line の文字コード及びスクリプト自身が、JIS か EUC でなければなりません。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
変換しようとしている文字コードがShift_Jisだからなのであろうか。
もしこれがビンゴだとしたらまあお恥ずかしい事で。
で、もし更にあきらめずにこの方法でやるとしたら
下のが参考になるかも。
http://usamimi.info/~mirrorhenkan/2ch/perl/php/read.php/1022731565/196-204n
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
'ァ-ン', 'ぁ-ん'をEUC-JPの文字コードで書けばいいんじゃない?
&jcode'tr(*s, "\xHH\xHH-\xHH\xHH", "\xHH\xHH-\xHH\xHH");
HHのとこは16進の文字コードで。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
ただし、199でやっておられるように
いったんShift_JisをEUCまたはJISに変換してからやんないといけないみたいなんで
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
&jcode'sjis2euc(*ss);
&jcode'tr(*s, "\xHH\xHH-\xHH\xHH", "\xHH\xHH-\xHH\xHH");
&jcode'euc2sjis(*ss);
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
というようにせねばならぬようで。
結局>>670で自分的にはよさそうだ。
- 672 :名無しさん@停滞中 ★:08/05/14 20:00:16 ID:???
- さて
拡張子binのMacバイナリアーカイブを解凍して中のテキストを見たいのだが、
Aladdin Expanderがレジストリや関連づけをいじるみたいで。
少なくともzipの関連付けをこのソフトに変えるみたいですし
Macでのzipはこれまたwinとは様相がかなり違う予感。
そういえばMacバイナリの2バイトゴミを除去するソフトとかあったっけなと
という訳で
マカーはいねがー!?
DL解凍してwinでも開けるような形式にして頂けたら嬉しいのです(私が)
ちなみにファイルは
http://www.vector.co.jp/soft/mac/writing/se036415.html
であり
決して怪しいものではありません。
- 673 :名無しさん@停滞中 ★:08/05/14 20:21:35 ID:???
- メモ
丸谷君の遺言
http://hp.vector.co.jp/authors/VA005156/
むだじゃ、むだじゃ
http://hp.vector.co.jp/authors/VA022533/
「正(旧)仮名遣ひ⇔現代(新)仮名遣い」相互変換〜まるやるま君
http://hp.vector.co.jp/authors/VA022533/tate/komono/Maruyaruma.html#pos
misima 旧仮名遣い・旧字変換支援
http://yasuda.homeip.net/misima/misima.html
みんなの知識【ちょっと便利帳】 - 旧字体(旧漢字)と新字体(新漢字)の相互変換
http://www.benricho.org/moji_conv/13.html
はてなブックマーク - 男だってバラが好き: 旧字体、正字変換用データ
http://b.hatena.ne.jp/entry/3591857
はてなブックマーク - FeZn/Sinfonia / 旧字体変換
http://b.hatena.ne.jp/FeZn/%E6%97%A7%E5%AD%97%E4%BD%93%E5%A4%89%E6%8F%9B/
漢字ピンイン変換
http://www.lib.hit-u.ac.jp/~ono/pinyin.html
Text Converter drpl
http://www.yk.rim.or.jp/~tomoto/archives/drpl/
>>672ですが、作者さんのブログが現役なので
作者さんにお願いするという方法もありますが
もんのすんごい勇気と努力と精神力が必要になるです
ぐああ
帝國ニュウス電信
http://ameblo.jp/bap
- 674 :名無しさん@停滞中 ★:08/05/14 20:35:44 ID:???
- 因に何を遣り度いのかと言ふと
0chで舊假名遣ひ及び正字體變換するやうな物が出來たら面白いなと云ふ事で。
原理的には繪文字變換とさう變はらないんぢやないかなと。
勿論、正確にやらうとすると
形態素解析やマルコフ連鎖のやうな頭痛が痛くなるやうな勉強が必要でせうけど、
まあ其処まではハハハ。
てかさう云ふのも面白いぢやないですか。
下のとか讀ませて戴くといやー實に興味深い。
phaのニート日記
http://d.hatena.ne.jp/pha/
- 675 :名無しさん@停滞中 ★:08/05/14 21:18:24 ID:???
- 日本語の改革
http://www.geocities.jp/kokuminbunka_3776/japanese.html
- 676 :名無しさん@停滞中 ★:08/05/15 18:29:00 ID:???
- 取り敢へずやつてみましたがどうでせうか。
途中經過
ttp://mirrorhenkan.hp.infoseek.co.jp/meiji/cgi-bin/test/read.cgi/meiji/1025000169/l50
適當な箇所をピックアップ
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
982 :名無し三等兵:02/11/06 23:32 ID:l/FMz7Y5
親父の爺ちゃんはどこに所屬してゐたか忘れたが滿洲に居たさうだ。日本が壱番景氣の
良い時に行つて惡くなる直前に徴兵滿期で實家に歸つたさうだ。本人は『炊事軍曹』
とか言われてゐたらしい。終戰後、暫くして『また滿洲行きてぇなぁ』とか言つて家蔟全員から
『それは無理だつて』とか突込みを受けた摸樣。詳しくは判らないが滿洲で相當いい思いを
して來たと思われる。自分が小學棲の時に屍んでしまつたが。
母方の祖父は終戰時暢嵜の近くの工場で竹と木で出來た蜚行機を作つてゐて『これじゃ日本は
負けるな』と思つたさうだ。暢嵜の原爆のきのこ雲も目撃して、後片附けにもいつたさうだ。
此方も既に鬼籍にはいつてしまつてゐるが。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
「長嵜」(新字で云ふと「長崎」)が「暢嵜」と誤變換されてゐますが
其れ以外は結構上手くいつてるんぢやないかなと
只、やつてみて思つたですが
矢張り單なる置き換えだけでは限界がありますね。
前後の女子もとい助詞及び副詞の各活用形もですし
變格活用即ちサ變ラ變等の特殊型も考慮せねばならぬ。
いやー面白いなーワクワクするぜ。
さう言へば 主觀的時間が實に緩やかに流れてゐた頃に百人一首を覺えたものでしたが
お陰で古文の文法は適當にやつて何とか成つたもんだつたつけなと。
此れでは如何と理詰めで覺えていつたら泥沼状態のチンプンカンプンになつちやつて
現在に至るんですが。
百人一首の中でも特に好きな歌。
情景が浮かんでくるやうに思ひませんか?
君が爲春の野に出て若菜摘む我が衣手に雪は降りつつ
- 677 :名無しさん@停滞中 ★:08/05/15 18:50:20 ID:???
- −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
504 :名無し三等兵:02/08/25 00:33 ID:Kzrj+qr/
母方のじいさんは、中國で戰つてゐたらしい。
あまりよく話は聞けなかつたけど、砲兵部隊にゐたらしく
そのせいで難聽になつたさうだ。
空襲に來た敵機を塹壕から野戰砲(砲兵に野戰砲つて、正しいのかは分かりません。ご容赦ください)
で偶然にも撃ち落としたら、次の日から倍以上の敵機が襲つてきたらしい。
あるときマラリアにかかつて、軍醫にも抛つて置かれたが軍醫のところまで這つて行つて
必屍で頼んで治療してもらつた。
しかし、そのおかげで最前綫で戰わなくてすんで棲きて歸つてこられた。
復員してきても、戰場での經驗はトラウマになつたらしく、漏れが中學になつた頃でも夜中にうなされて
叫んで蜚び起きることがあつたさうだ。
そのじいさんも、漏れが嵩3の時に亡くなつた。
亡くなる前に病院のベッドの上で、もう意識が無いのに苦しそうなうめき聲をあげたことがあつた。
よっぽど苦しいことだつたんだと、改めて思つた。
じいさん、安らかに。ばあさんも、暢棲きしてな。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
どうも「長生き」の變換が變ですね。「暢棲き」になってら。
長→暢(チョウ)
生→棲(セイ)
と機械的に變換されてるみたいです。
>>673のJavaScriptを參考にして判る範圍でperlに入れてみたんですが
前後關係で元に戻してゐる箇所のうちの一つが此れみたい。
然し何と云ふか歴史的假名遣ひつて臨場感があるやうに思ふですが
自分だけでせうか。
暫くかう云ふ文章で書いてみますかね。
其の内飽きるでせうけど。
- 678 :名無しさん@停滞中 ★:08/05/15 19:14:17 ID:???
- 接続元別アクセス1日統計
http://123.225.123.197/accessIP.htm
どうも自分と此の携帶用dat2html經由で
750アクセス191メガバイトの轉送量があるみたいで
何だか御免なさい
みみずんさんの所とかもつとあるんでせうけど
一體どれくらゐなのでせうか。
てか 携帶用ページが一刻も速く公開されるのを
金麥冷やして待つてる
- 679 :名無しさん@勉強中:08/05/15 23:36:25 ID:SFRx6ZXl
- >672のものを解凍して、Mac以外では不要なリソースフォークを削除して、
lhaで圧縮したものをご用意しました。
ご入り用でしたら返信願います。
- 680 :名無しさん@停滞中 ★:08/05/16 07:21:12 ID:???
- おはようございます
出掛けに取り急ぎ
>>679さん
おお!ありがとうございます!
是非お願い致します。
- 681 :名無しさん@停滞中 ★:08/05/16 12:21:49 ID:???
- メモ
歴史的仮名遣ひ教室
http://www32.ocn.ne.jp/~gaido/kana/index.htm
正字正假名遣ひの爲のリンク集(一覽)
http://www.hat.hi-ho.ne.jp/funaoto/link/link.html
- 682 :名無しさん@停滞中 ★:08/05/16 16:24:10 ID:???
- 下の記事を見てみると
MacOS Xっていいじゃないですか。
プログラマーを引き付けるMac OS Xの魅力 − @IT
http://www.atmarkit.co.jp/flinux/special/mac/macosxa.html
- 683 :名無しさん@停滞中 ★:08/05/16 18:36:26 ID:???
- いろいろ見ていると
間違った仮名遣いを使っているかもと不安になりますね。
旧仮名づかひでレスしたまへ。
http://academy6.2ch.net/test/read.cgi/kobun/1015845434/
★★★★舊字、舊假名遣ひで話すスレッド 四箇目
http://academy4.2ch.net/test/read.cgi/gengo/1092597931/
ところで「舊」で検索したら
makimo.toさんの所では幾つか出るのですが
29ch - 【検索】キーワード「舊」を探しました
http://makimo.to:8000/cgi-bin/search/search.cgi?q=%E4p&andor=AND&sf=2&H=&view=table&all=on&shw=
takatyanさんの所では一つも出てこないです
何でなんでしょう
2ちゃんねる過去ログスレタイ検索
http://mirror.takatyan.info/title_search/title_search.cgi?query=%E4p&query_host=&query_board=&res_min=0&res_max=0&key_min=0&key_max=0&sort=score&hana=mogera
- 684 :名無しさん@勉強中:08/05/16 19:02:20 ID:KLZgAJj8
- >>683
それは検索処理方法によるものです。
確かに、完全一致検索では0件、との結果が得られます。
それは、「舊」なる単語を含むスレッドは確かに一つもないためです。
「舊字」を完全一致検索で検索をするといくつか出てきますが、
これらは「舊」なる単語を含むわけではないので「舊」で検索しても出てきません。
恐らく、単語とか関係なく、ただ「舊」なる文字を含むスレッドを探したかったのでしょうと推測いたします。
そのような場合には部分一致検索をご利用ください。多少お時間を頂戴しますが、お望みの結果となります。
上記のような単語ベースの検索になっているのは、
例えば「京都」で検索したときに「東京都」が出てくる、などという現象を防ぐため、
及び高速化のためです。
・・・検索結果数に応じて自動的に完全・部分一致などを切り替えるようにしたほうがいいかもしれませんね。
- 685 :名無しさん@停滞中 ★:08/05/16 19:53:37 ID:???
- >>684
おお、そういう事でしたか。
いつもお世話になっておりますです
という訳で、検索処理方式も選ぶものをつけさせて頂いたです
あとは板名入力ボックスもつけてみるですか
というか
何だかごめんなさい
日々反省の毎日です
- 686 :名無しさん@勉強中:08/05/16 20:42:13 ID:KLZgAJj8
- >>685
>>684の
> ・・・検索結果数に応じて自動的に完全・部分一致などを切り替えるようにしたほうがいいかもしれませんね。
を実装しておきました。
ですが具体的にどういうときにどう切り替わるのかは良く判りません。
なんとなーく、完全一致で検索して何もないと部分一致に切り替わるとかそういうのだと思います。
- 687 :名無しさん@勉強中:08/05/16 23:03:43 ID:HoF9RAbp
- >>678 どうも 123.225.123.197の管理人です
1日 750アクセス程度なら気にする程でもないかと思います。
iriaで自鯖にアタック掛けてみましたが、毎秒10ファイル位は処理
出来たのでまだ余裕かと‥
プロバイダもトラフィック管理とか、ちゃんやっているのか
いまいち‥?なOCNを使っているので大丈夫?だと思います。
- 688 :679:08/05/17 09:46:25 ID:VTJcRomI
- >680
下記にアップロードしました。
http://ranobe.com/up/src/up273052.lzh
- 689 :名無しさん@停滞中 ★:08/05/17 17:40:32 ID:???
- 土曜って何それおいしいのそうよとてもおいしいのよ
土曜って平日ですよね
>>686
追随させて頂きましたです。ついでに板名選択ボックスもつけてみたりして
ところで、検索結果ページのtitleタグに検索ワードが含まれていたら嬉しいかもです
「何の単語で検索したんだっけ」という時がありますし(って自分だけ)
あとタイトルに検索ワードが含まれていたらブラウザの履歴一覧で検索した単語が判りますし。
>>687
どうもです。お気を遣って頂いて感謝です
そういえばみみずんさん
転送量の関係でプロバイダ変更されたそうですね
http://qb5.2ch.net/test/read.cgi/operate/1210140086/322
>>688
ありがとうございます。感謝感謝です
ばっちり解凍閲覧出来ていますです
しかしすごい力技のデータベースだな・・。
- 690 :名無しさん@勉強中:08/05/17 17:53:08 ID:tdaTGfYX
- >>689
> ところで、検索結果ページのtitleタグに検索ワードが含まれていたら嬉しいかもです
実装しました
- 691 :名無しさん@停滞中 ★:08/05/17 19:26:39 ID:???
- 早っ
どうもです
メモ
JavaScript で形態素解析もどき - エブログ
http://ablog.seesaa.net/article/20969848.html
マルコフ連鎖で文章生成(JavaScript) - エブログ
http://ablog.seesaa.net/article/20987336.html
JavaScript で人工無脳 マルコフ連鎖で返答 - エブログ
http://ablog.seesaa.net/article/21513007.html
- 692 :名無しさん@停滞中 ★:08/05/17 20:19:05 ID:???
- 読めるようにして頂いた>>672のデータを見ているんですが
これ本当にすごいですね。
品詞とか助詞とか何も考えずに
機械的に全置換すれば歴史的仮名遣いになってしまうみたい
ただ、10890種類もの置換文をgスイッチで行うというのは
どう考えてもサーバ負荷が甚大っぽい。
というか 試しに1000個くらいやってみたら
サーバエラーになったです。
500くらいに減らしたらOKになったので、過負荷が原因なんだろうなと。
勿論「表」や「能」みたいなダメ文字はエスケープしてやってみたですが。
てか
ダメ文字って正字に多いですね。
ソ
ー
噂
浬
欺
圭
構
蚕
十
申
曾
箪
貼
能
表
暴
予
禄
兔
喀
媾
彌
拿
杤
歃
濬
畚
秉
綵
臀
藹
觸
軆
鐔
饅
鷭
x
x
\
\
- 693 :名無しさん@停滞中 ★:08/05/17 20:43:37 ID:???
- うーむ
漢字変換のほうはなんとかなりそうですが
送り仮名等の変化がどうも。
やはり品詞解析や各活用形を解釈して変換させるほうが
遠回りのように見えて実は近道なのかな
- 694 :名無しさん@停滞中 ★:08/05/18 09:07:00 ID:???
- http://academy6.2ch.net/test/read.cgi/kobun/1015845434/66
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
66 名前:名無氏物語[] 投稿日:04/09/29(水) 21:17:35 ID:08QD583M
(オリムピツク板に此のやうなスレがありました)
1 名前:クーベルタン男爵さん 投稿日:04/09/01 00:11
昨日の閉會式にも姿を見せなかつたやうだが。
やはり日本人にはマラソン競技は無理なのだらうか。
21 名前:クーベルタン男爵さん 投稿日:04/09/08 20:26
>>20
朝鮮は今は日本の領土なのですが。。。
ところで、朝鮮には孫基禎君と云ふ將來有望な少年がゐるさうですよ。
聲を掛けてみてはいかがでせう?
32 名前:クーベルタン男爵さん 投稿日:04/09/18 11:28:32
>>31
竹取物語でもあるまひし、人類が月に逝くなどあるものか。
其れより、歐州の戰爭が世界大戰とも云へる様相を呈して來たことで、
1916年に豫定してゐた伯林オリムピツク大會の開催が危ういさうだよ。
金栗にはストツクホルム大會の雪辱を果たして欲しかつたのだが。
33 名前:弐拾六 投稿日:04/09/18 13:11:22
>>参拾弐殿
人が月へ往くのと、我が帝都でオリムピツクが開催されるのは、
どちらが先でせうか。
34 名前:クーベルタン男爵さん 投稿日:04/09/20 18:15:16
>>33
あるひは月に行く方が先となるやも知れませぬ。
近ごろ獨逸で發明されたと云ふロケツトは、將來は月への到達も考へてゐるさうです。
それに對して、オリムピツクで日本がメダルを取るのさへ夢物語の現状では、
帝都での開催などあらう筈も無いではありませぬか。
日本が金メダルを1つでも取る時代が來れば別ですが、まず考へられませぬ。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
URLを書いて下さいです
読みたくても読めませぬ
とりあえずレス1の日付からキーを推測するに
2004/09/01 00:11:00〜2004/09/01 00:11:59の間に立てられたものと思われるので
キーは1093965060〜1093965119のどれかなのかなと。
60回ググるのも悲しいので該当過去ログ倉庫を推定すると
名無し名からオリンピック板であり
日時からhttp://sports7.2ch.net/olympic/kako/o1093/のどれかではなかろうかと。
で、この中には当キーの範囲のスレッドがなさそう。
残念ながらここまでかな
- 695 :名無しさん@停滞中 ★:08/05/21 18:48:54 ID:???
- http://2c.ath.cx/memo.htm
追随させて頂きましたです
というか
追随させて頂いた途端にIPが変わったのですか。
http://124.87.104.56/
- 696 :名無しさん@停滞中 ★:08/05/21 19:15:05 ID:???
- ところでnikaさんの所が繋がらないとの事でしたが
繋がったので良かったです
そういえばデスクトップ2chさんの所も長い事ダウンしてたですが
復活なさいましたし
makimo.toさんのスレタイ検索が復活した時は狂喜乱舞したっけだなーと
DinoSwiftさんも落ち着いたら再稼働して下さるでしょうし
前途洋々です
未来は明るい
ビバ21世紀
それと
dumper.jpさんの所も
いつか再開なさる事をいつまでも待ってる
googleページランクやはてなブックマークを追加されたり
レスアンカーポップアップやID抽出もつけられた矢先に閲覧出来なくなった感じなので。
例えば下記スレとか
コーラを自分で作りたい - 2ちゃんねるみらー
http://web.archive.org/web/20070107152447/2ch.dumper.jp/0000103506/
- 697 :名無しさん@停滞中 ★:08/05/21 19:24:13 ID:???
- ところで見ておられる方で余裕がある方に見て頂きたいのですが
(1)ルクダルさんの所と
(2)2chdat.netさんの所と
(3)dumper.jpさんの所の
webarchiveに残っているURLを集めてみたのですが
URLはそれぞれ下記
(1) http://mirror.sarashi.com/webarchive/ruku.txt
(2) http://mirror.sarashi.com/webarchive/2chpop.txt
(3) http://mirror.sarashi.com/webarchive/dumper.txt
このうち
(1)(2)はURLに元スレッドの9or10桁のキーがあるので元スレの類推が可能なのですが
(3)のdumper.jpさんのミラーではそれが全くわからないです。
>>696のwebarchiveだと開いて「最新」の箇所に
http://web.archive.org/web/20070107152447/http://food6.2ch.net/test/read.cgi/juice/1041091682/
とあるのでやっと判るという程度で。
元スレとの突き合わせをしないとどうにもならない。
1000スレッドくらいあるみたいなんですが
何方かやって頂けないでしょうか。
- 698 :名無しさん@停滞中 ★:08/05/22 19:01:53 ID:???
- どうも百度掲示板が中国版2ch状態になっているみたいで。
【2ch】ネタちゃんねる m9( ゚д゚)っ 中国の掲示板の書き込みを訳したら、おまいらそっくりだった
http://2channel2.blog32.fc2.com/blog-entry-55.html
中国の大規模掲示板の書き込みを訳してみた - 大陸浪人のススメ 〜迷宮旅社別館〜
http://blog.goo.ne.jp/dongyingwenren/e/f21f241f0c7d925bd458e70f549f7993
という訳で
例えば下記スレッド等をdat化してみたりしたら面白いかも。
百度_地震?_祝日本救援?平安!都来?
http://tieba.baidu.com/f?kz=379156270
文字コードはgb2312ですがJaneNidaでは非公式にサポートしておられるそうなので
まあ無問題。
問題は、gb2312だとhtmltodat.phpでは認識してくれなさそうな事で。
ちょっと心気を澄ます余裕が無いのでひとまずメモ
CJCODE v1.00
http://bjkoro.net/download/cjcode/
多言語CGIダウンロード
http://bjkoro.net/download/index.php?mode=open&cate=4&no=34
中国語の文字コード
http://ash.jp/code/code_zh.htm
ところで上のcjcode.plなんですが
以前DLして色々試してみたらどうも繁体字変換出来なくてかなりてこずったです。
で、コードを追っていったら
単に作者さん 変数名を間違っておられるだけみたい。
× bgi5 → ○ big5
とか変えてみたら動いたです
サポート掲示板を見ても全然その事が書いてなかったので不思議に思ったっけでした
って記憶を頼りに書いてるので此方が間違っているかもですが。
- 699 :名無しさん@停滞中 ★:08/05/23 18:46:36 ID:???
- とりあえずhtmlの村下孝蔵を把握せねば話にならぬ
百度_凉宮春日《分裂》??地点求助??
http://tieba.baidu.com/f?kz=190540976
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
<table width="72%" border="0" bgcolor="#FFFFFF">
<tr>
<td height="17" align="center" width="3%" class="gray">1</td>
<td class="p14" align=left >
<a name="1774431698"></a>
<font color=#0000cc>《分裂》??地点求助?? </font>
</td></tr>
<tr><td></td>
<td align=left width="97%" >
<table class="wr" border="0" cellspacing="0" cellpadding="0"><tr><td class="gray14">
<cc>?...
<br>不??来自何方,只要是?找不到?《分裂》的地点就?迎在此求助。
<br>不??来自何方,只要是知道能?到《分裂》的地点就?迎在此回答。</cc>
</td></tr></table>
</td></tr>
<tr><td height="17"></td><td class="p14"></td></tr>
<tr><td height="17"></td>
<td align=left >作者: <a href="http://passport.baidu.com/?detail&aid=6&default_tab=1&un
=%9B%F6%8Cm%A5%CF%A5%EB%A5%D2%A4%CE%9B%E6" target=_blank> 涼宮ハルヒの涙</
a> <a href="http://hi.baidu.com/suzumiya%5Ftear" target="_blank"><img src="http
://img.baidu.com/passport/space_open.gif" border="0" align="absmiddle"></a>&nbsp;
<font class="gray12"> 2007-4-13 14:04 </font>
<a href="#sub" class=t onclick="ResetReplyTitle('1','《分裂》??地点求助?? ');">回?此?言</a>
</td></tr>
<tr><td></td><td><hr align=left width="87%" size=1 >
</td>
</tr></table><a name="#2"></a>
<table width="72%" border="0" bgcolor="#FFFFFF">
<tr>
<td height="17" align="center" width="3%" class="gray">2</td>
<td class="p14" align=left >
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
一レス一レステーブルタグで閉じてるみたい。
ところで、簡体フォントは??になるので
同じ文章を0chUTF8化の板に貼ろうとしたら「NGワードが含まれてます」と出たですが
キャップ付きでもNGワードが含まれていたら投稿出来ないのかな。
- 700 :名無しさん@停滞中 ★:08/05/23 18:59:25 ID:???
- メモ
PHP: html_entity_decode - Manual
http://php.benscom.com/manual/ja/function.html-entity-decode.php
「環境」の検索結果 - 猫(=・ω・=)顔 1.0β
http://d.hatena.ne.jp/nyagao/searchdiary?word=%B4%C4%B6%AD
ところで
Twitterたのしーよ@むたぐち の てづくりぶろぐ
http://winscript.jp/blog/diary.asp?id=5
を拝見したのでtwitterなるものを始めてみたのですが
適当にFollowして頂いても頂かなくても。
http://twitter.com/mirrorhenkan/
で、>>698の件をお聞き(というか独り言)してみたら
nishioさんからpythonでのやり方を教えて頂いたのでとても感激したです
・・・凄い人だな。
http://twitter.com/nishio/
- 701 :名無しさん@停滞中 ★:08/05/24 20:32:09 ID:???
- なかなか難しいものだ
encode, decodeのおさらい - ヒトヲノロワバ アナフタツ ニッキ
http://d.hatena.ne.jp/shrkw/20071129/1196353733
Python で日本語を扱う基本をまとめてみるメモ(その2) - 猫(=・ω・=)顔 1.0β
http://d.hatena.ne.jp/nyagao/20070808/1186581885
日/中/韓のためのPython
http://cjkpython.berlios.de/index-ja.html
- 702 :名無しさん@停滞中 ★:08/05/24 20:43:23 ID:???
- >>699のdat化用正規表現をやろうと思ったんだけど
なにこの怒濤のようなテーブルタグ・・・
こんがらがり過ぎて手もつけられないです
誰か助けてー
- 703 :名無しさん@停滞中 ★:08/05/25 11:56:12 ID:???
- 業務連絡
隠し板になるかどうかわかんないけど
こんな板が出来たようで
VIP避難所
http://yutori.2ch.net/news4vip/
で
■ VIP避難所できました。
http://yutori.2ch.net/test/read.cgi/news4vip/1211443449/
で調べてみてみたら
みみずんさんの所は既にクロールされておられるようで
さすがだ
2ch-i.netも対応されておられるです
すごい
ゴージャス
それはそうと
板名も同じだしサーバも以前のyutoriを使っているとなると
どうすればいいのかな・・・
- 704 :名無しさん@停滞中 ★:08/05/25 12:09:14 ID:???
- いちおうJaneで隠し板フォルダに板追加出来たですが
通常のyutoriサーバのnews4vip板の過去スレをサルベージする時には
これどうなるんでしょうか
あとp2todatとかも大変になっちゃうのかなとか
外部コマンド Part5
http://jane.s28.xrea.com/test/read.cgi/bbs/1180559017/515
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
515 名前:Jane使いの名無しさん[sage] 投稿日:2007/09/21(金) 20:31:22 ID:yiiQv+xZ0
>>513
それでした
というかこちらが板名でしか調べてなかったので
http://ex14.vip2ch.com/news4vipニュー速VIP避難所
http://wwwww.2ch.net/news4vipニュー速VIP
これらを同じモノとして認識していたのが原因でした
とりあえず面倒なので暫定処理だけ
http://members.jcom.home.ne.jp/nemu-i-yo/p2todat.zip
これでVIPもちゃんとした場所に保存されます
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
ただ現状のp2todatって
レガシーOSだと何か追加インストールしなければならないみたいなので
自分は使えないんですが。
- 705 :昼休み@名無しさん@停滞中 ★:08/05/28 12:44:45 ID:???
- やりかけメモ
http://modoki.mine.nu/log/read.php/gline/1165245437/
正規表現
m#<dl><dt><a.+?>([0-9]+)</a>: 名前:(?:<a href="mailto:(.+?)">)?<b>(.+?)</b></a> \[.*?\] 投稿日:(.+?)<dd>(.+?)<br><br></dl>#mik
前処理
s#(ID:)<a href="read.php/.+?>(.+?)</a> (?:\(\d+\))?(<dd.*?>)#$1$2<dd>#igk
ちょっと集中出来ないのでやりかけメモ
デバッグは余裕が出来た時に
それにしても、onmouseoverが消してないもんで
htmltodatのプレビュー部分にマウスを動かすとエラーダイアログが頻繁に出るんですが
何とかなりませんかね?
- 706 :名無しさん@停滞中 ★:08/05/29 21:17:53 ID:???
- http://society6.2ch.net/test/read.cgi/gline/1165245437/592
ちょっと面倒だったのでずっとやってなかったですが
html化されたURLでの入力変換にもいちおう対応させたつもり
あと「その18a」を追加
そこ知らなかったです
- 707 :名無しさん@停滞中 ★:08/05/31 12:18:39 ID:???
- メモ
もどきもどき(http://modoki.mine.nu/)のdat化について
URL例
http://modoki.mine.nu/log/read.php/gline/1165245437/1-9999
正規表現
m#<dl><dt><a.+?>([0-9]+)</a>: 名前:.*?(?:<a href="mailto:(.+?)">)?<b>(.+?)</b>.+? \[.*?\] 投稿日:(.+?)<dd>(.+?)<br><br></dl>#mik
前処理
s#<a href="read.php/.+?>(.+?)</a>(?: \(\d+\))?#$1#igk
s#(ID:)( BE:\d+.+?\(\d+\))(.+?)(<dd>)#$1$3$2$4#igk
s#<a target.+?>-キャッシュ-</a>##igk
s#<a target.+?>(.+?)</a>#$1#igk
s#<i>.+?\n##igk
s#</i></dd>###igk
s#<dd class.+?>##igk
s#<img.+?>##ig
- 708 :名無しさん@停滞中 ★:08/06/01 10:56:24 ID:???
- 上の前処理中で
s#</i></dd>###igk
は
s#</i></dd>##igk
の間違いでした。
大勢に影響ありそうな気がしますがとりあえず変換出来てるのかな。
まあ「変換出来ないぞこら」という反応はあっても
うまく変換出来た場合は無反応な場合が多いかなと
勿論「変換出来ましたかっこいい素敵キャー!」みたいな反応があってもいいけど
あと思ったのは
<a href 〜>hoge</a>の形式のタグはhtmltodat側で削除してくれますが
<a target 〜>hoge</a>のほうは自分でやらないといけないみたいですね。
これが可能なら上の前処理も2行減らせるんですが。
- 709 :名無しさん@停滞中 ★:08/06/01 11:02:52 ID:???
- DinoSwiftさん復活おめでとうございますありがとうございます
あまり無理なさらずに
ところで最近
http://www.nicovideo.jp/watch/sm2242781
を見たんですが
もしかしてサイトのタイトルは
リリィ・シュシュの「Glide」の一節から取っておられるのかなとか
- 710 : ◆/vmukiyuzw :08/06/01 21:00:08 ID:N7t4xUrt
- >>708
> s#</i></dd>###igk
変換できるかどうか以前に「セパレータの数がマッチしてません」エラーになるかと思ったのですが
特にエラーにはならないし処理も正常に行われるようですね。
ここはbregexp.dllに丸投げの処理なんで、アルゴリズムを推測するしかないのですが
sコマンドで3つめの#(セパレータ)を見つけた時点でセパレータ終了とみなし
以降はオプションとして解析してるんじゃないですかね。
で「#」なんてオプションは存在しないので無視されてるという状況ではないかと。
> <a href 〜>hoge</a>の形式のタグはhtmltodat側で削除してくれますが
> <a target 〜>hoge</a>のほうは自分でやらないといけないみたいですね。
単純に<a 〜> は全部削除するようにしちゃえばいいのかなあ・・・
今<a href 〜>しか削除してないのは単にそれ以外のものを見かけたことがない
だけの理由なんで。
- 711 :名無しさん@停滞中 ★:08/06/02 19:43:56 ID:???
- >>710
> 変換できるかどうか以前に「セパレータの数がマッチしてません」エラーになるかと思ったのですが
自分もそう思ってたので「おっ」と思ったです
> 単純に<a 〜> は全部削除するようにしちゃえばいいのかなあ・・・
> 今<a href 〜>しか削除してないのは単にそれ以外のものを見かけたことがない
> だけの理由なんで。
>>497でも出していますが
最近のsnapshot(てかrep2)のhtmlでは
<a target〜>形式のもの混じりになってるみたいです。
対処して頂ければ嬉しいです。
まあこの場合は今のままでも前処理で対処出来るのですが
現状では対処できない
http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/498-499
を思い出して頂けると小躍りしますです。
MegaBBSや苺BBS等のdat化の際にも使えますので。
・・・自分に出来ない事を要望するのは後ろめたいもんです。
- 712 :名無しさん@停滞中 ★:08/06/03 07:29:48 ID:???
- メモ
PHPでutf-8へのURLエンコードをする方法について WikipediaやGoogleで使われているURLエンコードはutf-8のようです $keyword ="緑茶"; と変数に入っているとします。 これ.. - 人力検索はてな
http://q.hatena.ne.jp/1196772104
PHP基礎:文字のエンコードを変更する|webnote
http://a-cot.jp/webnote/2007/05/php_2.html
phpのmb_convert_encodingでutf-8からgb2312に変換したいと考えています。 utf-8で書かれたページのフォームから入力し、gb2312で書かれたページに文字を表示したいのです.. - 人力検索はてな
http://q.hatena.ne.jp/1172565776
大猩猩的後花園:PHP中GB2312轉UTF-8的三種方法 - livedoor Blog(ブログ)
http://blog.livedoor.jp/chrisliu/archives/50799724.html
猿頁
http://salv.miscnotes.com/
やっつけ
http://dexi.sytes.net/log/
百度_日本文化?_日本的2CH相当于中国的什??
http://tieba.baidu.com/f?kz=385040063
- 713 :名無しさん@停滞中 ★:08/06/03 19:19:40 ID:???
- さて
>>699のhtmlをdat化する正規表現を考えたんですが
前処理がうまく合致しないです
元html
http://tieba.baidu.com/f?kz=190540976
のままだと文字化けが激しいので
とりあえずShift_Jisで保存し直してアップ
http://mirror.sarashi.com/htmltodat/190540976.html
htmltodatで呼び出したら
3行目からbodyタグ直前の404行目あたりまで削除して
下記を実行
正規表現
m#<td.+?>([0-9]+)</td>.+?<cc>(.+?)</cc>.+?作者: (?:<a href="(.+?)".+?>)? ?(.+?)(?:</a>)? .+?<font class="gray12">(.+?)</font>#mik
変換結果式
$4<>$3<>$5<>$2<>
これでいちおうdat化出来るです
- 714 :名無しさん@停滞中 ★:08/06/03 19:29:14 ID:???
- 正規表現は&nbspが変換表示されてしまっとるです
m#<td.+?>([0-9]+)</td>.+?<cc>(.+?)</cc>.+?作者: (?:<a href="(.+?)".+?>)? ?(.+?)(?:</a>)?&nbsp.+?<font class="gray12">(.+?)</font>#mik
↑これなんですが
最初「〜&nbsp;〜」とやったらレス3がマッチしなくて
「〜&nbsp〜」とコロン「;」を消したらマッチしたです
何でだろう
不思議だ
で
問題は前処理ですが
s#\n(?:<meta|<link|</?style|div|a|\.|</?script).+?\n#\n#ig
s#\n\..+?\n#\n#ig
s#\n .+?\n#\n#ig
s#\n +formname.+?\n#\n#ig
w C:\My Documents\テスト.html
これだけやってC:\My Documentsに生成された「テスト.html」を開いてみても
3行目から404行目までのガラガラが全然消えてない。
いったいどこが悪いのだろう
何でだろう
不思議だ
- 715 :名無しさん@停滞中 ★:08/06/03 20:15:10 ID:???
- 念のため書いておくと
これ文字化けは承知の上でやっており
正規表現その他が何とか確定したら
htmltodat.phpでdat化させてJaneNidaで読み込んでみようかなと。
スレッド一覧からsubject.txtを生成するスクリプトも何とかなりそうですが
その生成したsubject.txtを該当フォルダに放り込む為には
板一覧で外部コマンドが実行出来るようになれば良いのですが
残念ながらkoreawatcher ◆Nida.eneRAさんのほうでは実装予定は無いそうで。
http://pc11.2ch.net/test/read.cgi/software/1201790889/254
そういえばtatsuさんのdat2html最新版をDLさせて頂いたのですが
内部処理をUTF-8にされたみたいで。
Delphiでは難しいのかな
http://pc11.2ch.net/test/read.cgi/win/1202424797/840
- 716 : ◆/vmukiyuzw :08/06/04 19:04:14 ID:mjeajOrF
- >>714
例えば
s#\n\..+?\n#\n#ig
ですが、
.p14{font-size:14px;}
.gray{color:#0033cc;}
〜
のような繰り返しを削除したいのだと思いますが、意図に反して
1行目は削除できるけど2行目はできないと思います。
2つめの\nにマッチした時点で正規表現の検索のポインタは次の文字へと
進んでしまうので、2行目にマッチさせようとしてせっかく変換した\nは
読み飛ばされてしまうのです。
これに対処するには「先読み」の機能(?=文字列)を使うといいと思います。
マッチはするけどポインタは進めない、ような感じで処理されます。
s#\n\..+?(?=\n)##ig
だと意図した結果が得られると思います。
# 実をいうと先読み機能はオリジナルのbregexp.dllでは
# サポートされてないのではないかと思っていたのです。ドキュメントにも書いてませんし。
# でもやってみたらたまたまできちゃった、てな次第です
- 717 :名無しさん@停滞中 ★:08/06/04 22:29:15 ID:???
- >>716
おお!
すっげー!
変換できたです!
ありがとうございます!
先読み使えるのですか。
先読み記号で指定した部分はマッチするだけで置換する際に削除も何ももされないんですか(って自分で書いてても意味不明ですが)
しかし正規表現は奥が深いです
ミノフスキー粒子が濃すぎて先が見えません
中国繋がりでいうと
今日は天安門事件19周年だそうですが
何かニュースで触れられてるのかな。
てか19年前なのか…
- 718 :名無しさん@停滞中 ★:08/06/05 08:20:06 ID:???
- PHPリファレンス−PHP基本構文 > 基本その他 > $_SERVER["QUERY_STRING"]
http://www.yaskey.cside.tv/php/referdb/index.php?mode=detail&KEY=95
$_SERVER["QUERY_STRING"]の仕様について - 教えて!goo
http://oshiete1.goo.ne.jp/qa1060139.html
- 719 :名無しさん@停滞中 ★:08/06/05 12:09:54 ID:???
- http://com-nika.osask.jp/test/read.cgi/bbs/1166882974/194
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
[194] nika@管理人★◆nika/si95E : 2008/06/04(水) 19:33:57 ID:TJP3rFKX0
重要なお知らせ
現在このサイトは自宅サーバーで運営されていますが、
今後も継続的に自宅サーバーで運営することが困難になるため、
外部掲示板の保管機能は2008年6月中に終了することになりました。
継続的に利用されている方には申し訳ありませんが、
終了後には基本的にdat落ちしたスレッドは見られなくなりますので
ご了承頂けますよう、お願いいたします。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
お疲れ様でした。
- 720 :名無しさん@停滞中 ★:08/06/05 19:51:21 ID:???
- まあ色々ありますが
そうそう落ち込んでいる余裕もなく
万が一
http://tmp6.2ch.net/test/read.cgi/download/1164164363/269
のように「お前のせいだ」とか言う人が居ても
ただただ困惑するのみで
- 721 :名無しさん@停滞中 ★:08/06/05 20:05:58 ID:???
- という事で
ガラガラを取り除いたhtmlを出力出来たかなと
元URL
http://tieba.baidu.com/f?kz=386794671
ガラガラ除去(ソースを御覧あれ)
http://mirror.s206.xrea.com/x/cn/string.php?http://tieba.baidu.com/f?kz=386794671
で、次の問題は
>>714の正規表現にある2バイト文字で。
具体的に書くと
m#<td.+?>([0-9]+)</td>.+?<cc>(.+?)</cc>.+?作者: (?:<a href="(.+?)".+?>)? ?(.+?)(?:</a>)?&nbsp.+?<font class="gray12">(.+?)</font>#mik
上の「作者:」という箇所で詰まっているみたい。
文字コードgb2312なのでShift_Jisでの「作者:」とは全く違うのでそりゃマッチしないでしょうねと。
簡体字コード一覧表
http://ash.jp/code/cn/gb2312tbl.htm
を見て照合してみると
作 D7F0
者 D5D0
: A3B0
みたいなので
htmltodat.php中の正規表現中の「作者:」部分を
〜\xD7\xF0\xD5\xD0\xA3\xB0〜
と変えてもマッチしない。
しょうがないので「作者:」直線のタグ「<td align=left>」を使ってhtmltodat風に書くと
m#<td.+?>([0-9]+)</td>.+?<cc>(.+?)</cc>.+?<td align=left >.+? (?:<a href="(.+?)".+?>)? ?(.+?)(?:</a>)?&nbsp.+?<font class="gray12">(.+?)</font>#mi
としてやってみたけどマッチしない。
難しいものだ
ちなみにこのスレッドですが
下のエントリーを見て興味が湧いたという訳で。
中国のヲタたちの囁き〜声優編〜 - 大陸浪人のススメ 〜迷宮旅社別館〜
http://blog.goo.ne.jp/dongyingwenren/e/cd06d43c4755f8a377cbf98a39a1721d
- 722 :名無しさん@停滞中 ★:08/06/05 21:41:51 ID:???
- やりかけ
http://mirror.s206.xrea.com/x/cn/htmltodatbaidu.php?http://tieba.baidu.com/f?kz=386794671
22レスあるスレッドなのに20行しかないのは何故なのだ
$1の連続関係を調べるとレス20と21が抜けてるみたいなのだが
今日はここまで
私の頭脳CPUの限界を越えてるようです
ソースを出しときますので
識者の方 見ておられたら原因を究明して頂きたく。
スクリプトの文字コードがShift_Jisだったりコメントを変えてなかったりと
突っ込みどころ満載ですが。
http://mirror.s206.xrea.com/x/cn/htmltodatbaidu.phps
- 723 :名無しさん@停滞中 ★:08/06/06 19:16:30 ID:???
- ああ余裕ない
>>722の件ですが
今見てみたら該当レス二つ
透明あぼーんされてるだけでした
ハハハ
どうしよう
あと
レス2の画像URLも本文に入れるように
前処理考えるだなー
いちおうJaneNidaで外部板を設けて
文字コードgb2312で設定して
datを該当フォルダに放り込んで読み込んだら
文字化けせずに読めたです
ばんざーいい
それと
http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/544
小躍りしてます
ありがとうございました
ああそれにしても余裕ない
- 724 :あぼーん:あぼーん
- あぼーん
- 725 :あぼーん:あぼーん
- あぼーん
- 726 :名無しさん@停滞中 ★:08/06/07 07:53:21 ID:???
- おはようございます
朝からずっこけました
大いに笑かせて頂きました
今日は楽しい一日になりそうです
実際のところ自分はというと
あちこち見てるばかりであまり書き込んだりしませんなー。
というか 見てるだけで精いっぱいお腹いっぱい僕乾杯
- 727 :名無しさん@停滞中 ★:08/06/07 18:16:58 ID:???
- >>725のほうは消さなくても良かったかも。
なんの事やらまぢわかんないとなってるかもだけど
大した事ないです
というか、JaneNidaだと
ツール→設定→書き込みで
「誤爆警告」「コテハン警告」「Beログイン警告」
のチェック欄があるのですが
他の派生Janeではどうなのでしょう。
ありそうなものですが。
ところでJaneNidaなのですが
スレッド一覧で外部コマンドを使用可能にして下さって
大いに活用させて頂いているです
すごいです
で
左ペインの板一覧でも外部コマンド使えるようになったら
更に選択肢が拡がるのですが。
- 728 :名無しさん@停滞中 ★:08/06/07 18:24:50 ID:???
- ところで
nikaさんの所をwebarchiveで検索してみたら
9938ページ保存されてるみたいです
Internet Archive Wayback Machine
http://web.archive.org/web/*sr_1nr_9938/http://com-nika.osask.jp/*
k1とボクシング板が多い・・
htmlばかりでなく
http://web.archive.org/web/20070322190441/com-nika.osask.jp/bbs/bbs.php?http://ex9.2ch.net/test/read.cgi/k1/1099631963/
datもあるのですか
http://web.archive.org/web/20070322133640/com-nika.osask.jp/wom/dat/1130303803.dat
このhtmlも
dat化用正規表現を考えといたほうがいいのかな
- 729 :名無しさん@停滞中 ★:08/06/08 19:50:54 ID:???
- htmltodat.phpでも透明あぼーんを補うようなコードを追記してみたです
http://mirror.s206.xrea.com/x/cn/htmltodatbaidu.php?http://tieba.baidu.com/f?kz=386794671
次は添付画像のURLを本文に含めるようにしたいなと。
具体的に書くと
http://tieba.baidu.com/f?kz=386794671
のレス2・15・17にある画像URLを本文に含めるように出来ればいちおう完成ですが
これがなかなかマッチしない。
Shift_Jis化してアップし直したものが下記で
正規表現その他は>>713-714で出来るです
http://mirror.sarashi.com/htmltodat/386794671.html
ただ本文は<cc>〜</cc>中にあるんですが画像URLはその中にはなく
直後に
<cc>〜</cc>
</td></tr></table>
</td></tr>
<tr><td height="17"></td><td class="p14">?子相??片: <br><img src=
"http://hiphotos.baidu.com/%CF%E0%C0%C7%D7%DA%BD%E9/pic/item/05592bf09cab92d07931aaa3.jpg"
border="0" onerror="checkErrorImage(this)"></td></tr>
<tr><td height="17"></td>
<td align=left >作者: 121.32.233.*
となっておるです
これを</cc>直前にする為に
前処理で
s#(</cc>).+?(?:<img src="(.+?)".+?>)?.+?(<td align=left >)#$2<br>$1 $3#ig
とかやっても全然マッチせず。
改行コードをまたいだりしてるのとかも問題なのかな。
- 730 :名無しさん@停滞中 ★:08/06/09 20:15:50 ID:???
- 御冥福をお祈りします
関連で
百度_日本文化_秋叶原で通り魔 白昼の惨劇【組図・転載】
http://tieba.baidu.com/f?kz=403408591
をdat化して読み込みたいんですが
やはり添付画像を本文に含めるやり方がうまくいかぬ
http://mirror.s206.xrea.com/x/cn/htmltodatbaidu.php?http://tieba.baidu.com/f?kz=403408591
御冥福をお祈りします
- 731 :名無しさん@停滞中 ★:08/06/10 20:30:08 ID:???
- メモ
「日中文化交流」と書いてオタ活動と読む:ニコニコ動画のパクリと言われる「AcFun.cn 天下漫友是一家」について - livedoor Blog(ブログ)
http://blog.livedoor.jp/kashikou/archives/51145664.html#comments
阿?海姆株式会社
http://hi.baidu.com/tentamashi
大陸浪人のススメ 〜迷宮旅社別館〜
http://blog.goo.ne.jp/dongyingwenren
繁体字→簡体字変換
http://www.tulips.tsukuba.ac.jp/misc/export/cat/hankan/
AOL Q&A広場 中国語簡体字 ←→ 中国語繁体字 変換
http://aol.okwave.jp/qa2976707.html
漢字変換道具 [JavaScript版]
http://homepage3.nifty.com/jgrammar/ja/tools/tradkan0.htm
Wikipedia:?繁一多??校?表 - Wikipedia
http://zh.wikipedia.org/wiki/Wikipedia:%E7%AE%80%E7%B9%81%E4%B8%80%E5%A4%9A%E5%AF%B9%E5%BA%94%E6%A0%A1%E9%AA%8C%E8%A1%A8
hao123网址之家--在?繁体字??
http://www.hao123.com/haoserver/jianfanzh.htm
文字化け何とかならないものか。
0ch掲示板のUTF-8化スクリプトのほうを使えばそりゃ化けなくなるけど
専用ブラウザで文字化けする人ばかりだろうし
って 専用ブラウザでここ見てる人 どれくらい居るのかな
- 732 :名無しさん@停滞中 ★:08/06/10 20:57:52 ID:???
- 中国語と日本語の対応表 -OKWave
http://okwave.jp/qa1732315.html?ans_count_asc=20
とある研究者の余録: 繁体字変換は便利だけど
http://voyage-log.seesaa.net/article/62271244.html#more
Chinese Core Simplified Chars
http://xahlee.org/lojban/simplified_chars.html
インクジェットプリンターのKGK紀州技研工業|豆知識_文字コードの話/簡体字の世界
http://www.kishugiken.co.jp/cn/code10.html
インクジェットプリンターのKGK紀州技研工業|豆知識_文字コードの話/簡体字対照リスト(あいうえお順)
http://www.kishugiken.co.jp/cn/code10c.html
中文−広東語対応表(基本編) - Thank you for the music
http://blog.goo.ne.jp/ico3/e/23780e9b4cb8286bbf7b2a230f70e765
- 733 :名無しさん@停滞中 ★:08/06/11 21:35:45 ID:???
- 【かちゅ】2chブラウザ「Katju88」Part10【クローン】
http://pc11.2ch.net/test/read.cgi/software/1140337471/l50
170さんすげー!
しかもレス175でこんな事↓書いてるのにすげー!
> 自分はC++歴はそれなりにあるんだけど、Delphiはまったく知らないし。
> いきなり挫折・・・
有形無形問わず、実際に物を作っている人って
すごい謙虚で研究熱心で探求心豊かで
新しい時代の流れに呑み込まれず
確かな目つきと落ち着いた判断を備えていて
さもない質問にも真摯に対応される紳士なのだなーと。
さらにいろいろ書こうかなと思ったら
そうかこれこそまさしく
「実るほど頭を垂れる稲穂かな」
だなーと。
その態度見習わなきゃです
- 734 :名無しさん@停滞中 ★:08/06/12 21:33:56 ID:???
- >>729の件
やっとマッチしたです
URL例
http://mirror.sarashi.com/htmltodat/386794671.html
正規表現
m#<td.+?>([0-9]+)</td>.+?<cc>(.+?)</cc>.+?作者: (?:<a href="(.+?)".+?>)? ?(.+?)(?:</a>)? .+?<font class="gray12">(.+?)</font>#mik
前処理
s#\r##ig
s#\n##ig
s#(</cc>)</td></tr></table></td></tr><tr><td height="17"></td><td class="p14">[^<]+?<br><im
g src="(.+?)".+?></td></tr><tr><td height="17"></td>#<br><br>$2$1#ig
変換結果式
$4<>$3<>$5<>$2<>
ポイント(つか悩みどころ)は二つ。
(1) 複数行にまたがる箇所を置換する為には
いったん改行コードを全削除する必要があるみたい
(2) 前処理の3番目は最初
〜<td class="p14">.+?<br>〜
としたら何故か最大マッチ(?)してしまっていたので
やむなく
〜<td class="p14">[^<]+?<br>〜
としたら上手くいったみたい
突っ込み所多数あるでしょうけど
これで百度掲示板の添付画像URLを本文に含められそうです
- 735 : ◆/vmukiyuzw :08/06/13 01:40:02 ID:u/UqlNCi
- 正規表現の.(ドット)は「改行を除く」一文字にマッチということらしいので
無理やりかもしれませんが(?:.|\n)とか使うと多少シンプルにできるかも・・・
試してないのでわかりませんけど。(\rもいるかも)
- 736 :名無しさん@停滞中 ★:08/06/13 20:37:32 ID:???
- という事でやってみたです
http://mirror.s206.xrea.com/x/cn/htmltodatbaidu.php?http://tieba.baidu.com/f?kz=386794671
JaneNidaの該当フォルダにこのdatを入れて読み込んでみると
画像ビューアや外部コマンド翻訳もうまくいってるみたい
http://mirror.sarashi.com/img/janebaidu.png
という事で
次は一覧のsubject.txt化ですか
>>735
> 正規表現の.(ドット)は「改行を除く」一文字にマッチということらしいので
そうだったのかー!!
ところで、htmltodatでメニューhtmlからsubject.txtを作成するオプションとか
あったらいいなーという要望とか思ったんですがどうでしょうか。
- 737 : ◆/vmukiyuzw :08/06/13 21:33:02 ID:cARXftE6
- >>736
> ところで、htmltodatでメニューhtmlからsubject.txtを作成するオプションとか
> あったらいいなーという要望とか思ったんですがどうでしょうか。
メニューhtmlてのが何のことを言ってるのかよくわからないですが
subback.htmlからsubject.txtを作るのは前処理で容易にできる気がします
- 738 :名無しさん@停滞中 ★:08/06/14 12:44:26 ID:???
- >>737
えーと、言葉が足りませんでしたが
> subback.htmlからsubject.txtを作るのは前処理で容易にできる気がします
いちおう出来るには出来ますが
ヘッダとフッタが残ってしまい
それらを手動で消さなければならないように思うですが。
http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038409548/72
のように。
頭の体操的に無理矢理に考えてみると
ヘッダ除去
s#^(?.|\n|\r)+?(\n.+?<>)#$1#ik
フッタ除去
s#(<>(?:\r)?\n)(?:.|\n|\r)+?$#$1#igk
とかなるのかな。。
先読みの使い方ってこれでいいのかな。
具体的には
http://www.ichigobbs.net/cgi/aska_list.cgi?bo=economy
とか
http://tieba.baidu.com/f?kw=%C8%D5%B1%BE%CE%C4%BB%AF
からsubject.txtを生成したいのですが
試行錯誤するツールがあったら嬉しいなと思ったのです
- 739 :名無しさん@停滞中 ★:08/06/14 13:33:49 ID:???
- 特殊文字は
タブ(\t)とかもあるですか。
他にもあるかな。
あと使ってないのに先読み云々とか
なに口走ってるんだろ
ところで>>716で教えて頂いた先読みですが
htmltodat正規表現の$6に該当する部分を
まるまるこれと差し替えられそうですね。
具体的に書くと、例えば
m#<dt.*?>([0-9]+).+?(?:"mailto:(.+?)">)?<b>(.+?)</b>(?:</font>|</a>) ?:(.*?)<dd> ?(.*?)<br><br>(<dt.*?>|</dl>)#mi
これを
m#<dt.*?>([0-9]+).+?(?:"mailto:(.+?)">)?<b>(.+?)</b>(?:</font>|</a>) ?:(.*?)<dd> ?(.*?)<br><br>(?=<dt.*?>|</dl>)#mi
とやっても良さそうです。(Bregexp.dllでは非推奨でしょうけど)
「何の意味が?」とか言われそうですけど
新たにhtmltodatのようなスクリプトを組む時にかなり楽になりそうだなと。
JavaScriptやwsh・phpでやってみた時
正規表現でマッチした$6を残す処理が少し(というか結構)面倒だったので。
- 740 :名無しさん@停滞中 ★:08/06/14 18:53:18 ID:???
- ところで 秋葉原の件以降
やたらにxreaのサーバ負荷率が上がってるです
特に週半ば以降が顕著で。
−−−−−−−−−−−−−−−−−
20080614
▽アカウントの負荷率
3) 313 pt - mirror.s151.xrea.com
20080613
▽アカウントの負荷率
2) 519 pt - mirror.s151.xrea.com
20080612
▽アカウントの負荷率
8) 154 pt - mirror.s151.xrea.com
20080611
▽アカウントの負荷率
7) 73 pt - mirror.s151.xrea.com
20080610
▽アカウントの負荷率
4) 329 pt - mirror.s151.xrea.com
20080609
▽アカウントの負荷率
0 pt
20080608
▽アカウントの負荷率
0 pt
20080607
▽アカウントの負荷率
0 pt
20080606
▽アカウントの負荷率
0 pt
20080605
▽アカウントの負荷率
0 pt
20080604
▽アカウントの負荷率
0 pt
−−−−−−−−−−−−−−−−
負荷率とかよくわかんないんですが
13・14とすごい。
14日って今日なのでもっと数字増えるかもです
調べてみるとこれが原因かな。
追記でimona.phpへのリンクがあって
そこからどわーっと来てるみたい
【秋葉原連続殺傷事件外伝】 まりえったの歌日記♪さん さきほど閉鎖:Birth of Blues
http://birthofblues.livedoor.biz/archives/50661072.html
xreaのアカウントが消されなければ自分的にはどうでもいいんですが
そうなってからでは後の祭りなので
何かやっといたほうが良いのかもしれないのかなと。
一時的にimona.phpを待避させてみますか
- 741 : ◆/vmukiyuzw :08/06/14 20:08:44 ID:RgmD5VXT
- >>738
もちろんヘッダやフッタも前処理で取り除く前提で考えてたんですが
> http://www.ichigobbs.net/cgi/aska_list.cgi?bo=economy
> http://tieba.baidu.com/f?kw=%C8%D5%B1%BE%CE%C4%BB%AF
前者はともかく後者はヘッダが長すぎて一発のsコマンドでは
fatal errorを起こしてしまうので何回かに分けて地道にやるしか
なさそうですね。
しかし、このアプローチで出来ないんであれば、すでに私の力及ばずというか
> ところで、htmltodatでメニューhtmlからsubject.txtを作成するオプションとか
> あったらいいなーという要望とか思ったんですがどうでしょうか。
単なるhtmltodatのオプション追加でできるレベルとは思えないのです。
例にあげていただいた2つでも形式がまったく違いますし。
それこそ個別のスクリプト書くか、汎用的にしたいならhtmltosubみたいな
別ツール作ったほうがいいのではと思う次第です。
私はやる気が湧かないので、いっそご自分で作ってみてはいかが?
- 742 :名無しさん@停滞中 ★:08/06/14 21:56:07 ID:???
- > > http://www.ichigobbs.net/cgi/aska_list.cgi?bo=economy
> > http://tieba.baidu.com/f?kw=%C8%D5%B1%BE%CE%C4%BB%AF
>
> 前者はともかく後者はヘッダが長すぎて一発のsコマンドでは
> fatal errorを起こしてしまうので何回かに分けて地道にやるしか
> なさそうですね。
うーむ
とりあえずUTF-8にしてアップしてみたです
http://mirror.sarashi.com/htmltodat/subjecttest.html
前処理で
s#\n(?:<meta|<link|</?style|div|a|\.|</?script|<input|[^<]).+?(?=\n)##ig
s#\r(?=\n)##ig
s#\n(?=\n)##ig
これでガラガラと空行がある程度省けたので
かなり見通しがよくなったかな
で、肝心のデータ部分は
<td class="d">80037</td>
<td class="d">354</td>
<td class="s"><a class=t href="/f?kz=22542052" target=_blank > 初到?京的感
受~~(ZT) </a>[<font class="red">精品</font>]&nbsp;[<font class="red">置?</fon
t>]&nbsp;</td>
なので以下略
後で考えてみますか
- 743 : ◆/vmukiyuzw :08/06/15 02:14:11 ID:TDdn/yNm
- 前処理とかはなんとかなりそうですね
あと問題になりそうなのはスレ番号をどうやって決めるか
これはスレ保存をどうやってやるかによるのでなんとも言えないです
- 744 :名無しさん@停滞中 ★:08/06/15 20:06:15 ID:???
- 疲れちゃったので一回休み
やってて思ったのですが
前処理がうまくいったかどうかwコマンドで保存して
保存したものをエディタで開いて
駄目なのでエディタを閉じて保存したファイルを消して
またやり直して保存したものをエディタで開いて確認して
・・という作業がなかなか煩雑に思えたので
wコマンドはそれとして
簡易的に下窓に前処理変換結果が出たら楽かもなーと夢想したです
おやすみなさい
- 745 : ◆/vmukiyuzw :08/06/15 21:12:50 ID:TDdn/yNm
- >>744
まあおっしゃることはわかりますし自分でもあったらいいかなと思うことはあるのですが
簡易的表示ではあまり意味をなさないというかやっぱ改行マークとかは表示したいなあと
そしたらそれなりに面倒な改造になる上あまり使い勝手がいいものに仕上げる自信もないので
wコマンドで逃げてるってのが正直なところで。
ところで
> 保存したものをエディタで開いて
> 駄目なのでエディタを閉じて保存したファイルを消して
自分が主に使ってるエディタは秀丸ですがこんな手間はかからないです。
ファイルを開いた状態でも他から上書きは可能ですし、「再読み込み」という機能を使うと
最新の状態で読み直してくれるのでワンアクションで済みさほど煩雑には感じないのです。
エディタにもいろいろあるしどれをお使いかわからないですけどそれほど特殊な機能とも思えないので
可能かどうか調べてみては。
- 746 : ◆/vmukiyuzw :08/06/15 23:40:11 ID:TDdn/yNm
- 補足ですが
> ファイルを開いた状態でも他から上書きは可能ですし、
これは排他制御関連の設定で、大抵のエディタにはついてるのではと思います。
> 「再読み込み」という機能を使うと
これはアンドゥ系の機能で、名前は違えどやはり実装されてるものが多いと思います。
ちなみにxyzzyでは「最初からやり直し」という機能名でありました。
# おっともうすぐ500KBですね。余計な書き込みはこれまでにて
- 747 :名無しさん@停滞中 ★:08/06/17 20:03:20 ID:???
- リアルよりバーチャルが大事、と思いたい
戦わなくちゃ非現実と
二次元こそリアルワールドという友人がうらやましい
でも余裕が無い
>>745-746
> 簡易的表示ではあまり意味をなさないというかやっぱ改行マークとかは表示したいなあと
いやーそんなに考えなくてもいいような。
改行マークとかなくても意味あると思うです
エディタですが、TeraPadを主に使ってるですが
「TeraPad 排他制御」で検索して
TeraPad_help
http://web.archive.org/web/20070807212724/http://www.harpy.org/delfy/tpadhelp/tips51.html
読んでみて設定を色々試してみて
何とか反映する事が出来たです
すごいです
ただ、このTeraPadってUTF-8対応されてますが
簡体字・繁体字・ハングル等が文字化けするのが何だかななのですが
秀丸ではそれらも問題ないのでしょうか。
あと色々な文字コードのファイルを読み書き保存出来るのかな
シェアウェアみたいなので怖くて(?)試せないです
xyzzyにまたチャレンジしてみますか
それとやっていて思ったのですが
前処理でwコマンド込みの式を入れて
「dat変換をしない」にチェックして変換ボタンを押すと
データを呼び出したりコピペしたりしていなくても
サイズ0のファイルが生成されるみたい。
まあ大した事ではないです
ところで下のエントリーを読んで
内モンゴルと草原の誘い【前篇】 - 大陸浪人のススメ 〜迷宮旅社別館〜
http://blog.goo.ne.jp/dongyingwenren/e/645fe944a3e53c92e97f337e46d33c94
紹介されてる元スレッドの画像がいたく美しく
dat化して読んでみたく思ったです
外部コマンドで文章翻訳とか出来るので。
百度_呼????_原?-美?的呼???
http://tieba.baidu.com/f?kz=312028377
で、これ現在173レスあるみたいなんですが
50区切りで表示されているもんでどうしようか。。
全部表示するやり方とかあるのかな
えーと
ここって500KBだったか512KBだったか。
どちらにしてもまた1000まで到達出来ないのか
500KB
新着レスの表示
掲示板に戻る 全部 前100 次100 最新50