PC用眼鏡【管理人も使ってますがマジで疲れません】 解約手数料0円【あしたでんき】 Yahoo 楽天 NTT-X Store

無料ホームページ 無料のクレジットカード 海外格安航空券 ふるさと納税 海外旅行保険が無料! 海外ホテル

告知欄です


■掲示板に戻る■ 全部 1- 101- 201- 301- 401- 501- 601- 701- 最新50
メモ3

1 :名無しさん@勉強中 ★:07/08/04 06:09:43 ID:???
またまた思いついた事など

347 :名無しさん@勉強中 ★:07/12/14 20:37:51 ID:???
http://pc2.2ch.net/test/read.cgi/win/1022248379/635
PC等 [Windows] “お前ら、wsh使ってますか? Part2”
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
635 名前:624 [sage] 投稿日:03/03/02 13:01 ID:ZynoVCOP
しまった、GMT - JST = -9 やん。
そのままでは恥ずいので、www.yahoo.co.jpサーバからGMTを取得するScript

Set xh = WScript.CreateObject("Microsoft.XMLHTTP")
xh.Open "HEAD", "http://www.yahoo.co.jp/", False
xh.send Null
sDate = xh.getResponseHeader("Date")
sDate = Replace(Mid(sDate, 6, 20), " ", "-", 1, 2)
datGreenwich = CDate(sDate)
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

348 :名無しさん@勉強中 ★:07/12/15 10:25:26 ID:???
うーむ
UTF-8のhtml取得って結構厄介だなー。
下のファイルをtest.jsにして実行しても簡体字フォント部分は文字化けしとるです。
保存する文字コードをUTF-8やUTF-8NやUnicodeにしても結果は同じ。


−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
var strUrl = "http://cn2ch.cn/bbs/test/read.cgi/tongren/1195601732/";

var oXMLHttpRequest = new ActiveXObject("Microsoft.XMLHTTP");
with(oXMLHttpRequest)
{
Open("GET", strUrl, false);
Send();
}
var str=oXMLHttpRequest.responseText;

WScript.echo(str);
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


どこかで読んだですが
UnicodeとUTF-8って別物なんだなーと。


どうしても解決出来なかったら
pythonでやってみますか。
Web上のデータの読み込み部分を追加すれば良さそうなので。

349 :名無しさん@勉強中 ★:07/12/15 10:48:08 ID:???
と書いたけど
win2000以上とかだと文字化けしないかもですが
何方か試して頂けないかなと

350 :名無しさん@勉強中 ★:07/12/15 11:26:56 ID:???
HTTP Get -- 各キャラクタセットのWebページの読込み ( IXMLHTTPRequest )
http://winofsql.jp/VA003334/smalltech040206011410.htm
まさか解決策不在なのか? OperaのXMLHttpRequestオブジェクトのresponseTextが文字化けする問題の更なる深み 【▲→川俣晶の縁側→ソフトウェア→技術雑記】
http://mag.autumn.org/Content.modf?id=20051210160430

351 :名無しさん@勉強中 ★:07/12/15 11:37:51 ID:???
>>348
> どうしても解決出来なかったら
> pythonでやってみますか。

その前に
ADODB.streamを使う奴と
BASP21を使う奴をやってみますか。
自分の環境では後者しか確認出来ないですけど。

352 :名無しさん@勉強中 ★:07/12/15 12:26:01 ID:???
いやー文字コードよくわかんないや


お前ら、wsh使ってますか? Part4
http://pc8.2ch.net/test/read.cgi/win/1100489339/269,367
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
269 名前:名無し~3.EXE[sage] 投稿日:05/01/14 22:04:18 ID:9FAifjvD

>>266
たしか、ResponseBodyはUTF-16BEになってると思う。



367 名前:名無し~3.EXE[sage] 投稿日:05/02/19 09:06:43 ID:PxBwsUtK
>>366
対象のhtmlファイルの文字コードと、
どう元ファイルを開いてるか、保存ファイルをどう作ってるかのコードを。

UTF16/UTF8なら、OpenTextFileの第4引数に-1、CreateTextFileの第3引数にTrueを入れればいけると思うけど。
//UTF8をUTF8のままで保存してくれるのは良いけど、なんでUTF16用のBOM付きなんだ……? >FileSystemObject
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


上の366さんの書き込みも面白いです

−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
366 名前:名無し~3.EXE[sage] 投稿日:05/02/19 05:26:30 ID:5E0bL9lX
中国語のHTMLテキストを整形しているのですが、ReadLineやReadAllを使うと一部の中国語が勝手に変換されてしまいます。
どのような対策が考えられるでしょうか?

370 名前:366[sage] 投稿日:05/02/21 03:19:16 ID:y0/zN+N5
コード = gb2312

例えば、
ttp://www.eg365.com/disp.asp?boardid=12&typeid=237
をIEからファイル保存して、Q237.HTMという名前を付ける。

以下VBS。

IN_FNAME = "Q237.HTM"
set FS = CreateObject("Scripting.FileSystemObject")
set in_file = FS.GetFile(IN_FNAME)
set in_text_file = in_file.OpenAsTextStream(1) ''' 1 = for read
str = in_text_file.ReadAll
in_text_file.Close

OUT_FNAME = "Q237X.HTM"
FS.CreateTextFile OUT_FNAME
set out_file = FS.GetFile(OUT_FNAME)
set out_text_file = out_file.OpenAsTextStream(2) ''' 2 = for write
out_text_file.Write(str)
out_text_file.Close

VBSおわり。

"FC Q237.HTM Q237X.HTM"などすると違っている。(Windows98)
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

353 :名無しさん@勉強中 ★:07/12/15 12:39:51 ID:???
あ、出来たです。

>>352
> UTF16/UTF8なら、OpenTextFileの第4引数に-1、CreateTextFileの第3引数にTrueを入れればいけると思うけど

これやったらOKになったですよ。
チュートリアル見てもよくわかんないんですけど。

−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
var strUrl = "http://cn2ch.cn/bbs/test/read.cgi/tongren/1195601732/";

var oXMLHttpRequest = new ActiveXObject("Microsoft.XMLHTTP");
with(oXMLHttpRequest)
{
Open("GET", strUrl, false, -1);
Send();
}
var str=oXMLHttpRequest.responseText;

WScript.echo(str);

var moto = "testsample.html";

fs = WScript.CreateObject("Scripting.FileSystemObject");
abc = fs.OpenTextFile(moto, 2, true, -1);//2=ForWriting, true=create
abc.Write(oXMLHttpRequest.responseText);//改行コード入らない
abc.Close();
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


結果表示のポップアップでは文字化けしてるですが
生成したtestsample.htmlでは直ってるみたい。

354 :名無しさん@勉強中 ★:07/12/15 13:32:41 ID:???
よっしゃ
では対象htmlがShift_JisとUTF-8の場合の分岐処理をすればいいのかな。

URLや保存先は
WScript.Arguments()で取り出せば良さそうです

355 :名無しさん@勉強中 ★:07/12/15 16:35:50 ID:???
うむむ

上手くいったぜベイビーと思ってJaneNida該当フォルダに入れてみたら
「ここ壊れてます」ばかりで
生成したdatの文字コードを見たら
UTF-8ではなくUnicode(って何よ)になってるのが原因みたい。
datの文字コードをUTF-8に変換したら読み込めたです。

文字コードをUnicodeからUTF-8にして保存するにはどうすりゃいいんだ
ぐああ

356 :名無しさん@勉強中 ★:07/12/15 18:23:29 ID:???
えーと

つまり>>353で生成されたhtmlの文字コードが
UTF-8ではなく
Unicodeなのがネックのようで。

どうしても駄目なら
御返事はあまり期待せず
偉い人に伺ってみるしかないかな

357 :名無しさん@勉強中 ★:07/12/15 19:46:25 ID:???
仕方ないので目先を変えて
pythonでやってみますか。

とりあえず>>279のスクリプトで
http://cn2ch.cn/bbs/test/read.cgi/tongren/1195601732/
を取得してみると
文字化けもせずUTF-8だったので
これを>>337のhtml2datに追加してみようかなと。
見よう見真似で何とかなりそう。

ただ問題は、これをJaneNidaで使う場合
getlog.wsfのような保存先フォルダ自動指定が出来ないのです

だってpython全然わかんないんだもん
ごめんなさいごめんなさい

358 :名無しさん@勉強中 ★:07/12/16 13:28:04 ID:???
>>351
> ADODB.streamを使う奴と
> BASP21を使う奴をやってみますか

まず前者
下のをtestADODB.vbsとでもして保存

−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

sSource = "http://cn2ch.cn/bbs/test/read.cgi/tongren/1195601732/" 'ダウンロード元
sDest = "testsample.html" 'コピー先

test = GetHTMLDocumentADODB(sSource, sDest)

Function GetHTMLDocumentADODB(sSourcr, sDest)
Set oHTTP = WScript.CreateObject("microsoft.xmlhttp")
oHTTP.Open "GET", sSource, False
oHTTP.Send

Set Stream = WScript.CreateObject("Adodb.Stream")
Const adTypeBinary = 1
Const adSaveCreateNotExist = 1
Const adSaveCreateOverWrite = 2
Stream.Type = adTypeBinary
Stream.Open
Stream.Write oHTTP.responseBody
Stream.Savetofile sDest, adSaveCreateOverWrite
End Function
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

これを実行して
同じフォルダにtestsample.htmlが出来ていたらいいなと。
自分の環境では試せないので何方か試して頂きたく。

これって>>52のスクリプトを手直ししただけなので
バイナリモードで取得するようになってますが
取得出来たらいいじゃないか(出来なかったら残念だけど)

359 :名無しさん@勉強中 ★:07/12/16 13:34:29 ID:???

BASP21を使う場合

testBASP21.vbs
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
test = GetHTMLDocumentBASP21("http://cn2ch.cn/bbs/test/read.cgi/tongren/1195601732/", "testsample.html")

Function GetHTMLDocumentBASP21(sURL, sFileName)
Set Fs = WScript.CreateObject("Scripting.FileSystemObject")
Set bobj = WScript.CreateObject("basp21")
sRoot=Fs.BuildPath(Fs.GetParentFolderName(WScript.ScriptFullName),"\") 'スクリプトのあるフォルダ
WScript.echo sRoot & sFileName
'hozontest = sRoot & sFileName

'rc = bobj.W3get("-d " & sRoot & " " & sURL)
rc = bobj.W3get("-d " & sRoot & " -o " & sFileName & " " & sURL)
End Function
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

BASP21は下からDL出来るです
1.44メガあるですがアンインストールも出来るので安心安心

http://www.hi-ho.ne.jp/babaq/basp21.html


どうしてもUTF-8のhtmlをローカル保存出来なかったら
これを使うしかないのかも。

でも、ふと思ったんですが
外国の方々も当然wshを使ってると思うですが
こういう場合 みんなどうしてるんでしょうか。
babaqさんがお作りになられたBASP21やBregexp.dllだって
日本ローカルのものでしょうし。

360 :名無しさん@勉強中 ★:07/12/16 13:37:09 ID:???
>>358のコード スペルミス

×Function GetHTMLDocumentADODB(sSourcr, sDest)

○Function GetHTMLDocumentADODB(sSource, sDest)

だって自分で試せないんだもの
だもんでまだあるかも

361 :名無しさん@勉強中 ★:07/12/16 14:43:25 ID:???
>>359補足(言い訳)

> babaqさんがお作りになられたBASP21やBregexp.dllだって
> 日本ローカルのものでしょうし

これ別に他意や含意は全く無くて
勿論外国の方々で使っておられる方も居るとは思いますが
例えばBregecp.dllはShift_Jisでしか使えないという制約が未だにある訳で
もしUTF-8やUnicodeやBig5やgb2312でも使えたら
私が 無い頭をうんうん唸らせる事もないのですが。

鬼車のUnicode対応版も出ていますが
自分では何も出来ないですし。

K.Takata's software : bregonig.dll
http://homepage3.nifty.com/k-takata/mysoft/bregonig.html


例えば下のhtmlは文字コードBig5ですが
正規表現を考えればそれなりにdat化出来ると思うです

建議改用UTF-8編碼取代Big5編碼
http://web.archive.org/web/20050113190336/www.comic.com.tw/mini02/test/read.cgi/operate/1078772150/l25

362 :名無しさん@勉強中 ★:07/12/16 15:02:33 ID:???
と書いたけど
英語版もあるという事は
何とかなるのかな>Bregexp.dll

BREGEXP.DLL
http://www.hi-ho.ne.jp/babaq/eng/bregexp.html

363 :名無しさん@勉強中 ★:07/12/16 20:21:46 ID:???
文字列を UTF-8 に変換
http://www.geocities.co.jp/SilkRoad/4511/vb/utf8.htm

参考になるかな
なったらいいな

JavaScriptでファイルの書き込みをUTF-8で行う(htaまたは、wsh用) - jiroの日記
http://d.hatena.ne.jp/sukesam/20070922/1190400851

364 :名無しさん@勉強中 ★:07/12/16 20:47:13 ID:???
うむむ
BASP21のWgetでUTF-8のhtmlを取得するようにしたら
それを読み出して変換保存する箇所も変えなければいけないみたい
いやー面白いなー
文字コードって愉快だなー
あはは

365 :名無しさん@勉強中 ★:07/12/17 18:47:01 ID:???
ちょうどBASP21に文字コード変換する命令があって
UnicodeからUTF-8に変換出来たです
より詳しく書くと
「UNICODE UCS2」から「UNICODE UTF8」への変換ですが。

簡単に変換スクリプトを書くと
仮に
文字コードUnicodeのtestsample.htmlを
文字コードUTF-8のtestsample1.htmlに保存するなら

testKconv.vbs
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
Set bobj = WScript.CreateObject("basp21")
test = bobj.KconvFile("testsample.html","testsample1.html",5,4) ' UNICODE からUTF-8に変換
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

この2行だけで済んでしまうです
何て楽なんだ

という訳で
wsh標準機能のみでの変換はひとまず棚上げにして
これで一息つこうかなと。

366 :名無しさん@勉強中 ★:07/12/17 18:54:44 ID:???
それにしても
Bregexp.dllがShift_Jis以外ではうまくいかないからって色々やって
結局babaqさんがお作りになられたBASP21を使うっていうのは
お釈迦様の手の掌から一歩も出られなかった孫悟空みたいなもんですかね。
でもまだ他に手はあるかもと思いはしますが。


次なんですが
ADODB.streamでUnicode→ UTF-8変換するような方策はないものかなと。
これがあればwsh標準の機能だけで出来るようになるので。
(ただ私は確認も何も出来ないので・・・ってもういいか)

367 :名無しさん@勉強中 ★:07/12/17 20:13:10 ID:???
ADODB.streamの文字コード変換って
検索すると実にわんさかあるですね。
ありすぎてよくわかんない


それはそうと
これ↓もしかして使えないかな。

Unicode ⇔ UTF-8 by AOK
http://homepage3.nifty.com/aokura/jscript/utf8.html

368 :名無しさん@勉強中 ★:07/12/18 07:40:18 ID:???
http://tmp7.2ch.net/test/read.cgi/download/1190839251/363

htmltodat.wsfでも出来ますが
wshでの変換はCやDelphiのと比べて格段に遅いでしょうし
わざわざ作って「おせーぞばか」とか言われても割に合わないし
ただでさえあちこち迷惑しまくり千代子なのにまた負荷をかけるのも何だし
やめとこかな
公開しても後悔するだけだろなと

てか現状でも
htmltodat-convert.wsfで何とかなるんじゃないかなと

369 :名無しさん@勉強中 ★:07/12/18 07:57:37 ID:???
中日翻訳(簡体字)=$CHOTTO http://www.excite.co.jp/world/chinese/?before=$TEXTIU&wb_lp=CHJA&big5=no&start=%E7%BF%BB+%E8%A8%B3&after=

これで中国2chのわかんないとこを外部コマンド翻訳して読んでるです
にしても 台湾の掲示板と違って ほとんど日本語出てこない感じですね。
「毒男板」「御宅族」とかは明らかに日本語由来でしょうけど
ってcn2chの存在自体が日本由来でしょうけど。

「有閑倶楽部板」って
今オンエア中のドラマの板なのかな
どうやって見てるんだろ
ジャニーズの画像(ですよね)が結構あるですが
日本じゃないから大丈夫なのかな

370 :名無しさん@勉強中 ★:07/12/18 08:06:26 ID:???
VBScriptで文字コード変換 [Design For Life]
http://www.inaba.vc/item/5
[WSH] - Fioの素敵な日々
http://d.hatena.ne.jp/Fio/searchdiary?of=5&word=*%5BWSH%5D

371 :名無しさん@勉強中 ★:07/12/18 19:44:56 ID:???
メモ

2ちゃんねる等可視化計画
http://v2ch.media.t-kougei.ac.jp/v2ch.php?r=XfW96eYtDjTL9CD6

これ
http://money6.2ch.net/test/read.cgi/haken/1197438526/
がdat落ちした後も閲覧可能だったら
どんなにか嬉しい事でしょうか。

372 :名無しさん@勉強中 ★:07/12/18 19:51:12 ID:???
詳細あったです

Vis2ch - MediaArtWiki
http://wiki.media.t-kougei.ac.jp/index.php/Vis2ch
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
本文のキャッシュは元DATが倉庫入りした後もローカルに7日間だけ保持される。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−

373 :名無しさん@勉強中 ★:07/12/18 20:13:35 ID:???
さて
BASP21でUnicode→UTF-8変換出来たので
今度はADODB.streamでのUnicode→UTF-8変換ですか。
自分には未知の分野なのでどうしたものか。

とりあえずコードを出しとくです

http://www.geocities.jp/mirrorhenkan/wsh/htmltodat/htmltodat006.wsf.txt

上のをダウンロードしてhtmltodat006,wsfにリネームして実行してみて下さい。
cn2chのスレッドがdat化されると思うです。

具体的に書くと
testsample.htmlとsample.datの2ファイルが生成されます。
前者はcn2chのhtmlそのもので
後者はそれをdat化したもの。

ただ、問題は
これらの文字コードがUTF-8ではなくUnicodeな点で。
ちなみにUTF-8だとdat化の際 正規表現が全然ヒットしないので
Unicodeのままdat化した訳で。

私が手を出せない箇所は
253-261行にある
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
if(Uni2UTF8=="0"){
WScript.echo("文字コードShift_Jis");//何もしない
}else if(Uni2UTF8=="1"){
//ADODB.streamでUnicode→UTF-8変換
WScript.echo("ADODB.streamでUnicode→UTF-8変換");
}else if(Uni2UTF8=="2"){
WScript.echo("BASP21でUnicode→UTF-8変換");
BASP21ConvUni2UTF8(moto);//BASP21でUnicode→UTF-8変換
}
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

この
> //ADODB.streamでUnicode→UTF-8変換
の箇所で。

文字コードUnicodeのdatファイル「moto」をUTF-8に変換したいのですが
ADODB.streamでどのようなコードを書けばよいのか全然わからんのです。
自分のマシンで使えるのなら試行錯誤のしようもあるのですが。


反応があったら
おら 舞い上がっちまうで
ほんま

374 :名無しさん@勉強中 ★:07/12/19 17:48:28 ID:???
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
たる さん 2001年 10月 19日 23時 46分 46秒


To:らしゅ さん

SJISのテキストを上書きしてEUCに変換します。
IE5.0以上必須です。

未検証ですがUCS2でも少し変えれば出来るかなぁと思います。
あれ?utf-8でしたっけ(←あいまいな奴)
本当は文字列をベタでノードにするより、createCDATASectionメソッドでノードにした方が
< > & 辺りの制限が無くて良いんですが(それでもまだ]]>という制限はあるけど)
他にも何か改良の余地がありそうなのでそこら辺も含め後でと言うことにして。
文字列の切り落としがあまりうまくないです。何かいい方法があったら教えてください〜(逃げ)
↑こんなこと仕事じゃ…やらない…はず。(汗)

Option Explicit
Const csFile = "./fileStock/dataText.txt"
Dim objFS, objTS, sRead, sXML,objXML

Set objFS = CreateObject("Scripting.FileSystemObject")
Set objTS = objFS.OpenTextFile(csFile,1)
sRead = objTS.ReadAll
objTS.Close
Set objXML = CreateObject("Microsoft.XMLDom")
objXML.async = False
sXML="<root>" & vbCrLf & _

sRead & vbCrLf & _
"</root>"

objXML.loadXML(sXML)
objXML.insertBefore objXML.createProcessingInstruction("xml","version=""1.0"" encoding=""euc-jp"""), objXML.documentElement
objXML.save("./fileStock/dataText.xml")
Set objTS = objFS.OpenTextFile("./fileStock/dataText.xml",1)
objTS.Skip(49)
sRead = objTS.ReadAll
objTS.Close
objFS.DeleteFile("./fileStock/dataText.xml")
sRead = Left(sRead,Len(sRead)-11) 'あれ?EUCって漢字3バイトだっけ?
Set objTS = objFS.CreateTextFile(csFile, True, False) '同じ名前にする事で上書きします
objTS.Write sRead
objTS.Close
Set objXML = Nothing
Set objFS = Nothing
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

375 :名無しさん@勉強中 ★:07/12/19 17:49:14 ID:???
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
つちや さん 2002年 09月 22日 14時 04分 20秒


唐突ですが、
UTF-8のテキストファイルを、Shift-JISに変換するサンプルです。
Microsoft ActiveX Data Object (ver2.5以上)が必要です。
なお、指定可能な文字コードは、ISO-2022-JP、EUC-JP、UNICODE、UTF-7など。
MSXMLのXMLHTTPを使う場合は、Srcストリームの方に修正が必要ですが、
結構手軽で応用範囲が広いかも。
(改行コードの指定が必要な場合はLineSeparatorを使います)


Const adTypeText = 2
Const adSaveCreateOverWrite = 2



Set Src = CreateObject("ADODB.Stream")
Src.Open
Src.Type = adTypeText
Src.Charset = "UTF-8"
Src.LoadFromFile "C:\UTF8.txt"



Set Dst = CreateObject("ADODB.Stream")
Dst.Open
Dst.Type = adTypeText
Dst.Charset = "Shift_JIS"
Src.CopyTo Dst
Src.Close

Dst.SaveToFile "C:\SJIS.txt", adSaveCreateOverWrite
Dst.Close

Set Src = Nothing
Set Dst = Nothing

−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

376 :名無しさん@勉強中 ★:07/12/19 21:13:51 ID:???
>>374のスクリプト
一時保存のxmlファイルはちゃんとEUC=jpやUTF-8になってますね。
でも読み込み元ファイルがUNICODEだとスクリプトエラーになってしまう・・・

377 :名無しさん@勉強中 ★:07/12/20 19:55:11 ID:???
三流君VBA:IE 操作 .ExecWB でコマンド実行(検索したかったけど)
http://www.ken3.org/vba/backno/vba112.html

378 :名無しさん@勉強中 ★:07/12/21 07:55:52 ID:???
あー
IEのExecWBでOLECMDID_SAVEを使えば何とかなるっぽいですが
サンプルスクリプトを理解して
そこから該当個所をコピペするってえのは大変だー
だがそこがいい(マゾ)(マジ?)

379 :名無しさん@勉強中 ★:07/12/21 18:00:57 ID:???
よし
ExecWBを使って
Unicode→UTF-8変換出来たぞ
何とかADODB.streamを使わずに済んだかも

IE5.5以上必須になったですが
IEが入ってないWindowsってすっげーレアケースだと思うので
まあいいかなと。


あとはこれをプロシージャ化してhtmltodat.wsfに組み込んで
テストランしたものをJaneNida該当フォルダに入れて調べてみて
文字化けその他もなくてOKっぽかったら
WScript.Arguments()のデータ渡しの辺りと
該当フォルダ指定の箇所に取りかかるだな
いやー面白い

380 :名無しさん@勉強中 ★:07/12/21 19:45:29 ID:???
メモ

2000年 02月 25日 02時 38分 30秒

381 :名無しさん@勉強中 ★:07/12/22 16:34:11 ID:???
よっしゃ
htmltodat.wsfに組み込んでdat化UTF-8化したものを
JaneNida該当フォルダに入れて読んでみたですが
文字化けしてないようだ

382 :名無しさん@勉強中 ★:07/12/22 17:55:40 ID:???
ついでに
htmltodat.phpでdat化したもの(通常こっちを使ってますが)と比べると

php版でdat化したものをエディタで開くと文字化けしたですが
調べてみるとこちらのほうはUTF-8である事のヘッダ目印(BOM)が付いてないのが原因みたい。
wsh版のほうはというと、スクリプト作者様がちゃんと付けるようにしてあったので
文字化けしなかったでした
いやーすごい

383 :名無しさん@勉強中 ★:07/12/22 19:02:20 ID:???
お前ら、wsh使ってますか? Part2
http://pc2.2ch.net/test/read.cgi/win/1022248379/728-730n
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
728 名前:名無し~3.EXE[] 投稿日:03/03/24 01:56 ID:ZmE7iov5
WSHにはDOSの
・ファイル結合
copy /b a.txt+b.txt c.txt

・リネーム
ren a.txt b.txt

に当たる処理を容易に行える命令はないの?


729 名前:名無し~3.EXE[sage] 投稿日:03/03/24 03:46 ID:zcvTmdSc
Dim WSH
Set WSH = CreateObject("WScript.Shell")

WSH.Run "cmd /c copy /b a.txt+b.txt c.txt",1,True
WSH.Run "cmd /k ren a.txt b.txt",1,True


730 名前:名無しさん募集中。。[sage] 投稿日:03/03/24 04:34 ID:MV8cQtQK

>728
そこら辺の(内部、外部問わず)コマンドアプリとして用意されている物は、無理にWSHでやる必要ないんじゃないのかな。
それらをWSH標準で用意されているコマンドで行うには各々3〜4行は必要だよ。

>729
Runメソッドの第2引数を0にすると裏でやっている感じでいいかもね。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

384 :名無しさん@勉強中 ★:07/12/23 10:04:46 ID:???
上のリネーム
何だかうまくいかない・・・




メモ
htmltodat.pyで使えるかなと

pythonでHTML解析 - 清水川Web
http://www.freia.jp/taka/blog/169

385 :名無しさん@勉強中 ★:07/12/23 14:03:01 ID:???
別の方法で何とかなったです


'http://q.hatena.ne.jp/1166525285
Function riname(before, after)
Set Fs = WScript.CreateObject("Scripting.FileSystemObject")
Set f = Fs.getFile(before)
f.name = Fs.getFileName(after)
End Function


で、何でこんな事したいかというと
ExecWBで文字コード変換する場合
IEの拡張子設定に左右されるみたいで
拡張子がdatのままではエラーが出るからで。
なるべく標準機能だけで何とかしたいですし。

386 :名無しさん@勉強中 ★:07/12/23 16:32:29 ID:???
よしこれ↑も組み込めた
あとは外部コマンド用にURL取得と保存先フォルダ指定かな

変換結果式並べ替えと前処理・後処理はどうしようか。
必要性を感じたらつけるかな。
どうせ自分しか使わないんだし

387 :名無しさん@勉強中 ★:07/12/23 17:26:48 ID:???
ところで少し悩みが。

datキーなのですが
URLを解析(カッケー!)して9桁or10桁の数字があったらそれをdatキーにしてみたのですが
例えば>>361で出したwebarchiveのURLとかだと

http://web.archive.org/web/20050113190336/www.comic.com.tw/mini02/test/read.cgi/operate/1078772150/l25

はじめのほうの「20050113190336」に先にマッチしそうです。
どうすればいいのだろう。

現状は下のようにしてますが(test1にURLが入るです)

if(test1.match(/.*?(\d{9,10}).*?/i)){
var datkey = RegExp.$1;
}else{
var datkey = "sample";
}

泥臭くなりますが

if(test1.match(/.*?(9\d{8}|1\d{9}).*?/i)){

としたほうがまだマシなのかな。
9桁の場合、先頭数字が9
10桁の場合、先頭数字が1
という事になるですが。

388 :名無しさん@勉強中 ★:07/12/23 20:16:52 ID:???
うーむ
保存先フォルダ指定との絡みもあるのだなぁ>datキー取得

389 :名無しさん@勉強中 ★:07/12/23 20:41:20 ID:???
これまでの途中経過

http://www.geocities.jp/mirrorhenkan/wsh/htmltodat/htmltodat001.wsf.txt
http://www.geocities.jp/mirrorhenkan/wsh/htmltodat/htmltodat002.wsf.txt
http://www.geocities.jp/mirrorhenkan/wsh/htmltodat/htmltodat003.wsf.txt
http://www.geocities.jp/mirrorhenkan/wsh/htmltodat/htmltodat004.wsf.txt
http://www.geocities.jp/mirrorhenkan/wsh/htmltodat/htmltodat005.wsf.txt
http://www.geocities.jp/mirrorhenkan/wsh/htmltodat/htmltodat006.wsf.txt
http://www.geocities.jp/mirrorhenkan/wsh/htmltodat/htmltodat007.wsf.txt

バックアップという事で。
これでローカルのファイルをお掃除出来るです

390 :名無しさん@勉強中 ★:07/12/23 22:23:56 ID:???
おお
そういえばhtmltodat-convert.wsfでも保存先を指定してたっけだ
これのコードをコピペすれば良かったっけだなー
よしクリスマスに片付けてしまおうか

391 :名無しさん@勉強中 ★:07/12/24 08:55:44 ID:???
と書くとプレッシャーがかかるので
前言撤回

392 :名無しさん@勉強中 ★:07/12/24 11:46:40 ID:???
>>245の2ch-imodeのhtmlですが
タイトルに付くものが「2ch-imode」から「2ch-i」に変更されたみたいですね。
前処理部分を下記に変更すれば良さそう

s#(<title.*?): 2ch-imode(</title>)#$1$2#k
 ↓
s#(<title.*?): 2ch-i(</title>)#$1$2#k


最近 2ch-imodeの管理人さん
更新が立て続けですね。
「IPv6対応」とか 検索してもよくわかんない

393 :名無しさん@勉強中 ★:07/12/24 18:34:38 ID:???
よし
htmltodat.wsfが出来たっぽい。


ただ、経路的問題なのか何なのかわかんないですが
cn2chが私のホストからだととても重いです。
htmltodat.phpだとスムーズだったので
試しにアメリカのプロキシ経由でやってみたらうまくいったのですが。

394 :名無しさん@勉強中 ★:07/12/25 17:52:25 ID:???
メモ

独身男が毒づくスレ
http://cn2ch.cn/bbs/file/1159788900.html

上記dat化
正規表現
m#<DT><A.*?>([0-9]+).+?<B>(?:<A HREF='mailto:(.+?)'>)?(.*?)(?:</A>)?</B>.*?:(.*?)<DD>(.*?)<BR><BR>#mi

395 :名無しさん@勉強中 ★:07/12/25 18:05:30 ID:???
上の正規表現を
htmltodat007.wsf中のそれと差し替えてdat化させたもの(あっという間に出来たです)を
JaneNida該当フォルダに入れて読んでるんですが
日本語なのは見事にタイトルだけですね。
台湾の掲示板とかだと日本語も結構出てたりするんですが。
ビバ外部コマンド

こういう、何というか
外部向けでない内輪向けの生の声って面白いですね。
台湾や韓国の方々とはまた雰囲気が全然違うですし。

396 :名無しさん@勉強中 ★:07/12/25 19:27:10 ID:???
todoメモ

・変換結果式並べ替え対応
・ドラッグ&ドロップ対応
・フォルダ内一括変換対応
・正規表現各自入力対応(だってソースいちいち見て変えるの面倒なんだもん)
・前処理・後処理対応(「この箇所に各自で入れて下さい」の場所を設ける)

こんなもんですか。
これらは何とか出来そうです。
必要性を感じたらですが。


あと個人的に切実に欲しいのが
文字コードBig-5やgb2312やEuc-krのhtml対応なんですが
今の自分にはwshでは無理っぽい。
phpでもよくわかんない。
pythonのほうで模索してみるかなと。
現地の方でこういう事やってる解説サイトがあったら一発なんですが
まあ適当にやってみますか。


いやー
独り遊びってほんとに楽しいもんですね。

397 :名無しさん@勉強中 ★:07/12/26 08:02:46 ID:???
JaneNida外部コマンド組み込み用のhtmltodat.wsfを出しとくです

http://www.geocities.jp/mirrorhenkan/wsh/htmltodat/htmltodat008.wsf.txt

DLしたhtmltodat008.wsf.txtを拡張子wsfにリネームしてJane2ch.exeと同じフォルダに入れ
外部コマンド登録は下記

htmltodat008=wscript "$BASEPATHhtmltodat008.wsf" "$LINK"

外部板として例えば
http://cn2ch.cn/bbs/tongren/
を適当な板名で登録して
birdconf.iniにUTF-8である旨登録して
例えば下記スレッドを右クリックからコマンド呼び出ししてみて下さい
dat化されて該当フォルダに保存されて、読み込めるようになると思うです

中国語読めない><
http://cn2ch.cn/bbs/test/read.cgi/tongren/1195601732/


この呼び出しがタイトル一覧から出来れば嬉しいなと。
つまりタイトル一覧で外部コマンド呼び出し出来たら有り難いと思うです。
そうすれば

htmltodat008=wscript "$BASEPATHhtmltodat008.wsf" "$URL"

と登録し直して
タイトル右クリックでdat化取得とか出来ると思いますので。





・・・要望の下書きのつもりはなかったんですが
これをもとに要望してみますか。
だとしたらあと2〜3点あるですが。

398 :名無しさん@勉強中 ★:07/12/26 21:54:59 ID:???
書いたです

http://pc11.2ch.net/test/read.cgi/software/1195310686/552-553n

打たれ弱いので
煽られたらへこむです

399 :名無しさん@勉強中 ★:07/12/28 13:08:16 ID:???
メモ

用WSH 想ASP 一???数据?
http://www.pcdog.com/edu/asp/27/11/d267812.html

文字コードgb2312のファイルをwshで使いたいのですが
参考になったらいいなと。


あとここ

jisaku
http://ha1.seikyou.ne.jp/home/akairingosaita/hangul/jisaku.htm

400 :名無しさん@勉強中 ★:07/12/28 18:38:14 ID:???
ときどきの雑記帖 リターンズ 2007年1月
http://www.kt.rim.or.jp/~kbk/zakkicho/07/zakkicho0701.html
The Past Times
http://lyrics.meicho.com.tw/modify.htm

401 :名無しさん@勉強中 ★:07/12/28 19:09:42 ID:???
上の「ときどきの雑記帖」さんの所、すごく面白いですね。

で、そこ経由

旗旗 - ブログ「旗旗」 : 日本語CGIを韓国語で動かす by 草加耕助
http://bund.jp/modules/wordpress/index.php?p=326

402 :名無しさん@勉強中 ★:07/12/28 20:12:18 ID:???
WEB開發 | HTML | XML | VBScript | JavaScript | CGI/perl | ASP | PHP | JSP | ASP.NET | DreamWeaver
http://big5.chinaz.com:88/book.chinaz.com/others/web/web/index.htm

403 :名無しさん@勉強中 ★:07/12/28 21:51:10 ID:???
さて
文字コードbig5やgb2312のサイトを
そのまんま取得する方法がわかんない・・・。
ADODB.streamを使ってResponse.bodyをcharset指定して読み込めばいいっぽいんですが
(って間違ってるかも^^;)
私のマシンでは敵わぬ夢なので。

タグ崩れるの承知で
IE経由でDLしてみるかな。

404 :名無しさん@勉強中 ★:07/12/29 20:39:52 ID:???
メモ
http://www.megabbs.com/
のsubject.txtとdatファイルについて



http://www.megabbs.com/mac/

subject.txt(に該当するもの)
http://www.megabbs.com/mac/mac_newb.txt

dat(に該当するもの)
http://www.megabbs.com/mac/txt/mac_1008509845a.txt
http://www.megabbs.com/mac/txt/mac_1008509845b.txt

dat一覧リスト表示
http://www.megabbs.com/mac/txt/

405 :名無しさん@勉強中 ★:07/12/30 13:07:10 ID:???
ついさっき
ホットゾヌ2をDLして
proxomitron経由で
http://www.ichigobbs.net/
の板一覧取得とスレッド一覧およびスレッド取得してみたですが
どうもhtmlを取得してそれをsubject.txt化したりdat化したりされてるみたいですね。


で、メモ
ichigoBBSのdat化

スレッド例
http://www.ichigobbs.net/cgi/15bbs/2ch/0115/

正規表現
m#<DT>([0-9]+): *?<font.+?><b>(?:<a href="mailto:(.*?)">)?(?:<font.+?>)?(.*?)(?:</font></a>)?</B></font>(?:  )(.*?)<DD>(.*?)(<br> <dt>)#mik

前処理
s#<a rel.+?>(.+?)</a>#$1#igk


これでdat化出来ますが
例えばレス136等は透明消去されているみたいです。
元のhtmlの段階からしてレス番不在で。

http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/498-499n
の機能追加が欲しいなと思うんですが。

406 :名無しさん@勉強中 ★:07/12/30 15:22:22 ID:???
メモ
remix2ch(http://contents-factory.net/remix2ch/)のdat化について

URL例
http://contents-factory.net/remix2ch/read.php?url=http://live23.2ch.net/test/read.cgi/liventv/1176376861/

正規表現
m#<dt>([0-9]+) :<span class="name">(?:.+?"mailto:(.+?)"><b>)?(.+?) ?(?:</b></a>)?</span>:(.*?)\(スコア.+?<dd> ?(.*?)<br></dd><hr>(<dt>|</dl>|<script)#mik

前処理
s#(<title>.+?) - remix2ch(</title>)#$1$2#

受信オプション→HTTPヘッダ
Cookie: preview_limit=zero; design=2ch; normal_view=on


これでいけるかと思います。
クッキー送信が必要な所なので注意して下さい

407 :名無しさん@勉強中 ★:07/12/30 15:34:31 ID:???
で、ついでなんですが
このスレッド snapshotにも1001まで残っていますね。
後で直しておきますか。

http://ss.chbox.jp/dat.php?url=http://live23.2ch.net/test/read.cgi/liventv/1176376861/


chbox.jpのサーバですが
むむむさんのページのサーバ一覧を見てみると(って今URL探すの面倒ですが)
讃岐メニューさんや公式p2さんのように
運営の方から貸与されたものみたいです。
だもんでp2todatとかが出てもそうレスポンスが重くならないみたいで。
いや自分を棚にあげてる訳じゃなくて わざわざ書くのも何ですし。

外部コマンドで23ch.infoさんのログを取得するhtmltodat.wsfもやってみたら簡単に出来たですが
これ以上あちこちに負担をかけるのも何なので
自分 出すのはやめとくです
p2todatの作者さんはどうされるのか判りませんが。

408 :名無しさん@勉強中 ★:07/12/30 17:55:41 ID:???
ホットゾヌですが
メガBBSのほうもhtml経由でdat化subject化されてるみたい。

なるほど、こりゃ安易に
「メガビ対応まだー(後略)」「苺対応(後」
というような要望に
皆反応しない訳だなと。

メガBBSはよう知らんですが
苺BBSのほうは経済板とかたまに覗いたっけだなー
すげーレベルたけーと思ったでしたっけでした
ドラエモンさんとかまだ居られるのかなとか。

409 :名無しさん@勉強中 ★:07/12/30 20:28:00 ID:???
>>406-407
done(カッケー!)

今年も至らないながら色々遊んだっけだなー
ここで出してリンクさせてないやつとか結構あるですが
気が向いたら何とかしますか
まあ自己満足だし別にどうでもいいや
自己満足といえば
>>407で作ったついでに
23ch.infoさんのログをかちゅdatとかちゅidxに取得変換する
htmltokatjudat.wsfも出来たっぽいですが
また出してこじれてもイヤなのでやめとくです

にしても
年々きつくなってくるなー

410 :名無しさん@勉強中 ★:08/01/01 11:33:44 ID:???
新年おめでとうございます

苺BBSをJaneNidaで読めるように出来ないか画策中。
変換してdat格納&読み込みは>>409のものの流用で簡単に出来たですが
>>405の欠番補完にまだ手をつけとらんです。
もひとつパラメータを追加して
ループ中でレス番(htmltodat.wsfだと$i)との数値比較をして
その差が1より大きかったらその数だけあぼーん行を追加するループをつければ何とかなりそう。
それほど面倒な作業でもなさそうです(そう思わなきゃやっとれん)

問題はsubject.txt生成で
>>404のメガBBSのようなURLが該当しなさそう。
ホットゾヌ2の場合は例えば
http://www.ichigobbs.net/cgi/aska_list.cgi?bo=economy&page=0
からsubject.txt化されてるみたいなんですが
自分でやるとなると次ページ次ページと順繰りにアクセスしてマージしないといかんですし
そうやってsubject.txt化するのも時間がかかりそう。

ここはタイトル取得を諦めて
http://www.ichigobbs.net/economy/economy_new.txt
からsubject.txt生成してみるかな。
でもタイトルが無いというのはやはりなと思うですし
subject.txt都度書き換えで消えてしまうかなとか悶々と


新年早々、何だかもうどうでもいい気がしてきたです
てか苺BBS経済板のドラエモンさん お元気そうで何よりです

411 :名無しさん@勉強中 ★:08/01/01 18:03:11 ID:???
メモ
http://www.ichigobbs.net/cgi/aska_list.cgi?bo=economy&page=0
のsubject.txt化

マッチ用正規表現
<b>[0-9]+</b> : * *(\([0-9]+\)) <a href="/cgi/15bbs/[^/]+/([0-9]+)/L30">(.+?)(</a> <font .+?\n)

変換式
$2.dat<>$3$1\n

412 :名無しさん@勉強中 ★:08/01/03 14:28:06 ID:???
メモ
http://makimo.to:8000/i/
のdat化について

URL例
http://makimo.to:8000/i/d.cgi/livebase/2ch.net/live24/1187671540/?i=1001

正規表現
m#<hr>([0-9]+):(.+?):(.+?)(?:\[(.+?)\])?<br>(.*?)(<hr>)#mki

前処理
s#(<title>)29-(.+?</title>)#$1$2#ik
s#<a href=/i/d.cgi/.+?>(.+?)/(2ch\.net|bbspink\.com)/(.+?)/(\d+?)(/.*?)?</a>#http://$3.$2/test/read.cgi/$1/$4$5#igk
s#<a href=http://www\.google.+?>([^h\&].+?)</a>#http://$1#igk
s#<br><font color=\#000080>▼\d\d/\d\d/\d\d\(.\) \d\d:\d\d</font>##igk

変換結果式
$2<>$4<>$3<>$5<>

後処理
s#((?:^|\n).*?)(◆.+?)<>(.*?)<>#$1</b>$2<b><>$3<>#igk



これって>>111>>115の再掲になるですが、これでdat化出来るかも。
ただ注意点が二つ。

(1) beリンクがはじめから消えている
(2) 連続スペース等はマージ(カッケー!)されてしまっているので
  AAが崩れてしまう

上2点は我慢するしかなさそうです。

413 :名無しさん@勉強中 ★:08/01/03 15:13:48 ID:???
年月日の欄も省略されてるですか。
「2007/」ってのを日付の前に付ければ良いのなら
後処理で

s#((?:^|\n).+?<>.*?<>)#$1 2007/#igk

でその場しのぎにはなるですが。

ところでこれって

s#((?:^|\n).+?<>.*?<>)#$12007/#igk

ってやると「$12007」の部分で駄目だったのでやむなく半角スペース入れたですが
この場合どうやればいいんでしょうね。

あと、後処理でも
前処理の$serverや$boardみたいなものが欲しいなと思ったです
上のような事をやるのに結構使えるのではないかと。

414 :名無しさん@勉強中 ★:08/01/03 15:47:07 ID:???
>>413の対処案
その場しのぎに変わりないですが。

s#((?:^|\n).+?<>.*?<)>#$1>2007/#igk

年をまたぐ場合はどうしましょう。
実況スレのようにせいぜい数日で終わる場合なら何とかなりますが
そうじゃない場合は・・・わかんない。

415 : ◆/vmukiyuzw :08/01/04 01:25:46 ID:070Pexro
dat→htmlに変換する時点で元データが加工もしくは改竄(?)されてしまってる場合、
どこまで元データに近づけるよう復元したいかは、個人的な割り切りしかない、と思います。
# その割り切りレベルが自分にはわからなかったのでmakimo.toにはなるたけ近づきたくなかった、
# と思うことはあります

で、>>413-414のように、「年」を復元するような作業も、力を入れても不毛かもとか思います。
板によっては数年かけて続いてるようなスレもありますし・・・
これもどこで割り切るか、という話になるかと思います。

416 : ◆/vmukiyuzw :08/01/04 02:39:50 ID:070Pexro
すみません。↑は私の板のほうに書くべきことだったような気がします。
申し訳ありません。

417 :名無しさん@勉強中 ★:08/01/04 18:40:57 ID:???
8時から18時までみっちりと立ち回った後で
現在一息ついてますが
こういう毎日がまた始まると思うと
なんか何もかもどうでもよくなってきますね

>>415-416
自分もそう思うです。
ただ、>>318-335であれこれ考えた事と同様
何となくやってみただけの事なので
別にそんな大した事でもないです

ただ、思うんですが
意味のある事にしか意味がないという事はないと思うんですよ。
一見 無意味に見える事にも 必ず意味があるのではないかと。
そう思わなかったら意味がないじゃないですか。

ところで
私がやっている事って 意味があるんですかね?
もっというと
私が存在している意味ってあるのかなと。

別に誘い受けという訳でもないですが
こういう考えって 袋小路に迷い込みますね。

418 :名無しさん@勉強中 ★:08/01/05 12:01:48 ID:???
最下部にぽっぷちゃっとをつけてみたのですが
同時接続人数を見て驚いたです
超人気ブログとかと同じくらいアクセスがあるではないですか
別にカウント数をごまかしてる訳でもないですし

と同時に
自前設置してある入室者表示スクリプトとの差異が気になったです
この違いは何なのだ

スクリプトは
http://myako.net/
の「入室者数表示スクリプト」を使わせて頂いてるのですが
もしかしたらホスト取得の箇所で
ほぼ同一アドレスのものが丸められているのかなとか素人は考えたですが
それ以上はなんとも。

該当個所は

# −−−−−−−−−− ホスト情報の取得 −−−−−−−−−−
sub host{
local ($host);
$addr = $ENV{'REMOTE_ADDR'};
$host = gethostbyaddr(pack("C4",split(/\./,$addr)),2);
if ($host eq ''){ $host = $addr;}
$host =~ s/,/./g;
return($host);
}

なので
$ENV{'REMOTE_ADDR'}に同じ数値が入る場合があるのだろうかと。
同じアパートの隣室同士とかどうなんでしょうか。

419 :名無しさん@勉強中 ★:08/01/05 12:52:13 ID:???
ふと思ったですが
nicovideo.jpの時報と同様の事が
mirrorhenkanでも出来そうですね。
トップ右上で現在時刻と対応キーを現在形で表示させてありますが
そこの所でキリがいい時刻の時には
例えば「jihou.wav」をembedさせるようにする とか。
まあやんないですけど。

420 :名無しさん@勉強中 ★:08/01/09 19:09:01 ID:???
http://society6.2ch.net/test/read.cgi/gline/1165245437/506

done(カッケー!)
でも使ってる人居るのかな

421 :名無しさん@勉強中 ★:08/01/09 19:25:08 ID:???
syoboon - マイピクチャの整理
http://syoboon.asks.jp/78938.html
−−−−−−−−−−−−−−−−−−−−−−−
スレとかに貼られている画像や、ニュースとかの画像をしょっちゅう保存している割に
2006年から全く整理をしていないせいでマイピクチャを開くだけで
CPU100%になってしまうので、そろそろ整理でもしようかと。

ジャンルで分けると恐ろしく面倒になるので、タイムスタンプで分けようと思ったんですが、
ちょっと探した感じじゃそんなソフトは無いみたいですね、、、
−−−−−−−−−−−−−−−−−−−−−−−


ファイルをタイムスタンプで分けるようなソフトもどこかにあるとは思いますが
とりあえずwshで簡単に出来る(語弊があるけど)と思うです。

何らかの規則を設けてフォルダ分けする事にして
振り分けるフォルダが存在しなかったら作成するようにして
振り分け対象のフォルダを指定してその中のファイルのそれぞれについて
FileSystemObject(だったかな)でそれぞれのタイムスタンプを取得して
ファイル移動orファイルコピーすれば良さそうな感じ。

でもsyoboonさん もしかしたらLinuxオンリーの方なのかもしれず。
もしそうだとしたら、wshでスクリプトをこさえたとしても無意味なのかもしれず。
というか phpでも同様な事が出来るでしょうし
だもんでこの件 とっくに解決済みな事なのかもしれず。
まあスクリプト作ってもあたしゃチキンですから。



syoboon - liveb1終わってた
http://syoboon.asks.jp/79456.html

うわー。

422 :名無しさん@勉強中 ★:08/01/11 19:30:23 ID:???
メモ

アニ関西Wiki
http://anikan.tv/

423 :名無しさん@勉強中 ★:08/01/11 19:40:55 ID:???
http://society6.2ch.net/test/read.cgi/gline/1193462528/210-212n

「Linux使いなのでdat化出来ません」という御返事が返ってきたら
どうすればいいのでしょうか


そういえば
http://society6.2ch.net/test/read.cgi/gline/1165245437/502-503n
でMac使いの方も書き込んでおられるのですが
どうすればいいのでしょうか


まあどちらの件も
元気になったら考えてみようという事で。

424 :名無しさん@勉強中 ★:08/01/11 19:44:34 ID:???
ところでもしかしたら
2ch-imodeの管理人さん 上記スレッドを見て
気が向いた時にアップされておられるのかもしれず。


だとしたら ありがとうございます

425 :名無しさん@勉強中 ★:08/01/12 18:09:32 ID:???
メモ

2nv - 2ch News View
http://nika.sakura.ne.jp/2nv/index.html

管理人さんのお名前やブログを見てみると
どこかの研究室に所属されておられる理系の女性なのでしょうか。

426 :名無しさん@勉強中 ★:08/01/13 13:37:33 ID:???
メモ

読めないdat落ちスレのhtmlミラー避難所[2] 2ch過去ログ保管予約
http://2ch.free4seo.com/reserve/view/369

これのdat化および
元URLからの表示が出来たら嬉しいです(私が)

dat化は何とかなるような気もしますが
一見したところ
本文の改行部分が全部なくなっているような。

あと 元URLからの表示のほうは
上記サイト管理人さんにお訊きしないとわかんない感じです。

427 :名無しさん@勉強中 ★:08/01/13 14:07:04 ID:???
メモ
2ch過去ログ保管予約(http://2ch.free4seo.com/)のdat化について

URL例
http://2ch.free4seo.com/reserve/view/369

正規表現
m#<div class="author"><a name="\d+">([0-9]+)</a>名前:( ) Mail: (.*?) 投稿日: (.*?)</div>.+?<div class="post">(.*?) </div>#mik

前処理
s#(<title>.+?) 2ch過去ログ保管予約(</title>)#$1$2#ik


名前と本文改行がhtmlの段階からないみたいです。

あと前処理がうまくいかない感じなのは何でなのでしょうか。

428 :名無しさん@勉強中 ★:08/01/13 14:09:20 ID:???
書き忘れ

変換結果式
メール欄逆転

429 :名無しさん@勉強中 ★:08/01/13 18:45:32 ID:???
えーと
2ch-imodeさんの所なのですが
やはりこっそりとアップして下さっておられるようで
こっそりとありがとうございます

それはそうと
また少しhtml部分を手直しされたようで

http://mirror.sarashi.com/htmltodat/968412567.html

AASのリンクがあったりなかったりというのは今まで無かったですし
名前や日付あたりの半角スペースの有無もまた少し以前と異なっておられるような。



ちょっとまたこんがらがってしまってるので正規表現やりかけメモ
これだとレス11でストップひばり君です

m#<p>\[([0-9]+):(.+?) (?:≪(.+?)≫)? \((.+?)\) ?(?:<a href=.+?>AA</a>)?\]<br> ?(.*?) </p>.*?<hr>#mik

430 :名無しさん@勉強中 ★:08/01/13 19:22:52 ID:???
メモ
2ch-i(http://2ch-i.net/)のdat化について

正規表現
m#<p>\[([0-9]+):(.+?)(?:≪(.+?)≫)? +\((.+?)\) ?(?:<a href=.+?>AA</a>)?\]<br> ?(.+?)</p>.*?<hr>#mik

前処理
s#(<title.*?): 2ch-i(</title>)#$1$2#k
s#<SCRIPT language="JavaScript">.+?</SCRIPT></body></html>##igk

変換結果式
メール欄逆転

後処理
s#(\n.*?)(◆.+?)<>(.*?)<>#$1</b>$2<b><>$3<>#igk

431 :名無しさん@勉強中 ★:08/01/14 12:00:11 ID:???
また後処理直すの忘れてた・・
上のだとレス1の名前欄にトリップがある場合にヒットしないです

後処理
s#((?:^|\n).*?)(◆.+?)<>(.*?)<>#$1</b>$2<b><>$3<>#igk

432 :名無しさん@勉強中 ★:08/01/14 18:32:14 ID:???
http://pc11.2ch.net/test/read.cgi/software/1195310686/851

しこしこ書いて一応投稿してみたのですが
「PC替えろ」で終わったら悲しいなと

433 :名無しさん@勉強中 ★:08/01/16 20:26:57 ID:???
ふと思ったんですが

名前欄に

#fusianasan

とか

#山崎渉

とか書いて投稿したら
どう表示されるんですかね?
自分とこのホスト名なのか
それとも
それぞれに対応するトリップなのか。

ちなみにトリップ表示された場合
上は「◆M2TLe2H2No」
下は「◆RB/pr3SWUk」
となるみたいですが。


まあ試せばわかるでしょうけど
しかしそれにしても実に何とも限りなくどうでもいい話だ

434 :名無しさん@勉強中 ★:08/01/19 19:51:52 ID:???
2ch-imodeさんの所なんですが
dat化したい際に問題がある場合があるみたい

http://mirror.sarashi.com/htmltodat/1171967272.html
http://mirror.sarashi.com/htmltodat/1200134001.html

例えばこの二つとかだと>>430で未変換行が出るです
上だとレス5と6
下だとレス258

で、調べてみると
どちらも超長文なので略されているみたいで。
これはちょっとどうしようもなさそうですね。

幸い、未変換行がすぐわかるので
それで省略レスを突き止めて各自手直しして頂くしかないのかな とか。

435 :名無しさん@勉強中 ★:08/01/21 18:02:12 ID:???
メモ

ムッハー(*゚∀゚)=3 (http://muha.xrea.jp/
のdat化について

URL例
http://muha.xrea.jp/?q=http://society6.2ch.net/test/read.cgi/gline/1165245437/

正規表現
m#<div.+?><dt.+?><input.+?> ([0-9]+) : <label.+?>()<b class="name">(.+?)</b> (.+?)</label></dt><dd>(.*?)</dd></div>#mik

前処理
s#<title.+?/title>##ik
s#<h2>(.+?)</h2>#<title>$1</title>#ik

後処理
s#(<><>)\[(.*?)\](.+?)(<>)#$1$3 $2$4#igk
s#((?:^|\n).*?)(◆.+?)(<>)#$1</b>$2<b>$3#igk


ほんの4日前に開設なさった所みたい。
メール欄は省略しておられるようです。

436 :名無しさん@勉強中 ★:08/01/21 18:43:33 ID:???
とかいって
仕様を見てみると
そうでもないようで

http://muha.xrea.jp/template.txt

ごめんよくわかんないです

437 :名無しさん@勉強中 ★:08/01/21 19:03:06 ID:???
スレッドタイトルとかあんまり気にしないように

ギンギンに勃起した娘。メンバーたちにマワされたい2
http://f57.aaa.livedoor.jp/~moshimo/moshimo_log/moshimo475.htm

検索してたらこれが出てきたんですが
最下部を見てびっくりしたですよ

438 :名無しさん@勉強中 ★:08/01/22 18:20:01 ID:???
>>435でやったものですが、後処理が間違ってたですね。
これだとIDが表示されないです。

こうかな

後処理
s#(<><>)\[(.+?)\](.+?)(<>)#$1$3 ID:$2$4#igk
s#(<><>)\[\](.+?)(<>)#$1$2$3#igk
s#((?:^|\n).*?)(◆.+?)(<>)#$1</b>$2<b>$3#igk

439 :名無しさん@勉強中 ★:08/01/22 18:27:38 ID:???
このサイトですが
Web製作板でお見かけしたです

まとめサイト運営してる人 Part2
http://pc11.2ch.net/test/read.cgi/hp/1148609976/704
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
704 名前:Name_Not_Found[sage] 投稿日:2008/01/17(木) 05:44:10 ID:???
こんなもの作ってみたよ。
とりあえず抽出機能だけ付けた
ttp://muha.xrea.jp
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−



で、まあ
色々な人が居るですが
下の方とか

−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
750 名前:Name_Not_Found[sage] 投稿日:2008/01/21(月) 21:40:16 ID:???
プログラミングとしては初級だろうな
ただこの板にプログラミングかじった奴が居なさすぎるから神なんて言われる
こりゃただの文字列操作に過ぎない
誰でも作れるから、誰も作ろうとしなかっただけさな
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

こういうのって見ないほうがいいだけなんでしょうけど
本物のすごい人はわざわざこんな事書かないだろうなと

440 :名無しさん@勉強中 ★:08/01/22 19:28:53 ID:???
メモ

Internet Archive Wayback Machine
http://web.archive.org/web/*sr_1nr_2653/http://2ch.dumper.jp/*

dumper.jpさんの所のファイルですが
webarchiveにだいたい1500スレ前後残っているみたいなので
スクリプトでスクレイピング(カッケー!)すれば
ある程度 半自動でリスト生成出来るかもです

って そんなスクリプト 誰が作ってくれるんでしょ

441 :名無しさん@勉強中 ★:08/01/22 20:47:36 ID:???
少し考えてみると

上のソース(http://web.archive.org/web/*sr_1nr_2653/http://2ch.dumper.jp/*
から拾い上げたいリンクは例えば下記

<a href="http://web.archive.org/web/20050614012049/2ch.dumper.jp/0000015881/">2ch.dumper.jp/0000015881/</a><br>
<span class="mainSearchText">1 page from Jun 14, 2005</span><br><br>
<a href="http://web.archive.org/web/*hh_/2ch.dumper.jp/0000017733/">2ch.dumper.jp/0000017733/</a><br>
<span class="mainSearchText">~2 pages between Jan 07, 2007 and Jan 12, 2007</span><br><br>

このうち
(1) 上は1ページしか保存されてない(1 page from Jun 14, 2005)ので
 http://web.archive.org/web/20050614012049/2ch.dumper.jp/0000015881/
 をDLするなりして分析すれば良いと思うですが

(2) 下は2ページ保存されている(2 pages between Jan 07, 2007 and Jan 12, 2007)ので
 http://web.archive.org/web/*hh_/2ch.dumper.jp/0000017733/
 へ行って各々のアーカイブを見てみる必要がありそうです。

とりあえず(1)と(2)の区分けですが
リンク先URLの正規表現で何とかならないかな?

並べると
http://web.archive.org/web/20050614012049/2ch.dumper.jp/0000015881/
http://web.archive.org/web/*hh_/2ch.dumper.jp/0000017733/
となり
複数ページ保存の場合のURLは「〜/+hh_/〜」というのが他にもついているので

1ページしかないものは
http://web\.archive\.org/web/\d+/2ch\.dumper\.jp/\d+/
複数ページ保存されているものは
http://web\.archive\.org/web/\*hh_/2ch\.dumper\.jp/\d+/
とやって
上にマッチしたらDL
下にマッチしたら別個リストに追加 とか。

442 :名無しさん@勉強中 ★:08/01/23 20:59:36 ID:???
>>435>>438ですが
beや株主優待や●みたいなのがIDの後に付くような所だと
これではよくないっぽいですね。
試してないですがレス1とか多分よくないかもです

いやー奥が深いなぁ (←勝手に深くしてるだけだったりして)

443 :名無しさん@勉強中 ★:08/01/23 21:27:02 ID:???
メモ
2chミラー計画(http://web.archive.org/web/*/http://fun.kz/
のdat化について

URL例
http://web.archive.org/web/20050221015734/http://fun.kz/test/read.cgi/comic/1085912649/

正規表現(「行が長い」と出たので適当に改行してます)
m#<div class="day"><a.+?>([0-9]+)</a> 名前:(.*?) ?\[(.*?)\] 投稿
日:(.*?)<br><div class="body"> ?(.*?) </div></div>(<div class="day">|[  ]+(?:<hr.*?>|<div align="center">))#mik

変換結果式
メール欄逆転


前スレ651のコピペですが。

444 :名無しさん@勉強中 ★:08/01/23 23:29:49 ID:???
http://pc11.2ch.net/test/read.cgi/software/1195310686/910

更新なさったですが
http://pc11.2ch.net/test/read.cgi/software/1195310686/870-872n
の要望は見送られたみたいで。

駄目なのかなあ

445 :名無しさん@勉強中 ★:08/01/26 20:15:00 ID:???
更にをミラーを3つ追加してみたりして

あと
(1) http://ruku.qp.tc/
(2) http://2ch.dumper.jp/
(3) http://2ch.pop.tc/

消えてしまったそれぞれのhtmlミラーの
http://web.archive.org/に保存されているもののリストでも作ってみようかなと。

446 :名無しさん@勉強中 ★:08/01/27 12:28:54 ID:???
http://society6.2ch.net/test/read.cgi/gline/1193462528/247-249n

ふむ
その1bでも1001レスあるみたいですし
少しだけ携帯用のも追加してみますか

447 :名無しさん@勉強中 ★:08/01/27 13:16:41 ID:???
というか
その20にもあるなあ

でも公式p2にはdatが存在してないですし
色んなケースがあるんだなーと。


ちなみに

http://society6.2ch.net/test/read.cgi/gline/1193462528/245-246n



http://etc3.2ch.net/test/read.cgi/charaneta/1107347770/

も、dat落ち保管所さんがアップなさったものがwebarchiveに残ってるみたい。

天使のしっぽ3 トラウマなんてこわくない!
http://web.archive.org/web/20060723021603/http://2ch.pop.tc/log/05/10/05/0723/1107347770.html

500KB
続きを読む

掲示板に戻る 全部 前100 次100 最新50
名前: E-mail(省略可)

0ch BBS 2006-02-27