楽天モバイル[UNLIMITが今なら1円]
ECナビでポインと Yahoo 楽天
LINEがデータ消費ゼロで月額500円〜!
無料ホームページ 無料のクレジットカード 海外格安航空券 解約手数料0円【あしたでんき】
海外旅行保険が無料! 海外ホテル
■掲示板に戻る■ 全部 1- 101- 201- 301- 401- 501- 601- 701- 最新50
メモ3
- 1 :名無しさん@勉強中 ★:07/08/04 06:09:43 ID:???
- またまた思いついた事など
- 375 :名無しさん@勉強中 ★:07/12/19 17:49:14 ID:???
- −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
つちや さん 2002年 09月 22日 14時 04分 20秒
唐突ですが、
UTF-8のテキストファイルを、Shift-JISに変換するサンプルです。
Microsoft ActiveX Data Object (ver2.5以上)が必要です。
なお、指定可能な文字コードは、ISO-2022-JP、EUC-JP、UNICODE、UTF-7など。
MSXMLのXMLHTTPを使う場合は、Srcストリームの方に修正が必要ですが、
結構手軽で応用範囲が広いかも。
(改行コードの指定が必要な場合はLineSeparatorを使います)
Const adTypeText = 2
Const adSaveCreateOverWrite = 2
Set Src = CreateObject("ADODB.Stream")
Src.Open
Src.Type = adTypeText
Src.Charset = "UTF-8"
Src.LoadFromFile "C:\UTF8.txt"
Set Dst = CreateObject("ADODB.Stream")
Dst.Open
Dst.Type = adTypeText
Dst.Charset = "Shift_JIS"
Src.CopyTo Dst
Src.Close
Dst.SaveToFile "C:\SJIS.txt", adSaveCreateOverWrite
Dst.Close
Set Src = Nothing
Set Dst = Nothing
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
- 376 :名無しさん@勉強中 ★:07/12/19 21:13:51 ID:???
- >>374のスクリプト
一時保存のxmlファイルはちゃんとEUC=jpやUTF-8になってますね。
でも読み込み元ファイルがUNICODEだとスクリプトエラーになってしまう・・・
- 377 :名無しさん@勉強中 ★:07/12/20 19:55:11 ID:???
- 三流君VBA:IE 操作 .ExecWB でコマンド実行(検索したかったけど)
http://www.ken3.org/vba/backno/vba112.html
- 378 :名無しさん@勉強中 ★:07/12/21 07:55:52 ID:???
- あー
IEのExecWBでOLECMDID_SAVEを使えば何とかなるっぽいですが
サンプルスクリプトを理解して
そこから該当個所をコピペするってえのは大変だー
だがそこがいい(マゾ)(マジ?)
- 379 :名無しさん@勉強中 ★:07/12/21 18:00:57 ID:???
- よし
ExecWBを使って
Unicode→UTF-8変換出来たぞ
何とかADODB.streamを使わずに済んだかも
IE5.5以上必須になったですが
IEが入ってないWindowsってすっげーレアケースだと思うので
まあいいかなと。
あとはこれをプロシージャ化してhtmltodat.wsfに組み込んで
テストランしたものをJaneNida該当フォルダに入れて調べてみて
文字化けその他もなくてOKっぽかったら
WScript.Arguments()のデータ渡しの辺りと
該当フォルダ指定の箇所に取りかかるだな
いやー面白い
- 380 :名無しさん@勉強中 ★:07/12/21 19:45:29 ID:???
- メモ
2000年 02月 25日 02時 38分 30秒
- 381 :名無しさん@勉強中 ★:07/12/22 16:34:11 ID:???
- よっしゃ
htmltodat.wsfに組み込んでdat化UTF-8化したものを
JaneNida該当フォルダに入れて読んでみたですが
文字化けしてないようだ
- 382 :名無しさん@勉強中 ★:07/12/22 17:55:40 ID:???
- ついでに
htmltodat.phpでdat化したもの(通常こっちを使ってますが)と比べると
php版でdat化したものをエディタで開くと文字化けしたですが
調べてみるとこちらのほうはUTF-8である事のヘッダ目印(BOM)が付いてないのが原因みたい。
wsh版のほうはというと、スクリプト作者様がちゃんと付けるようにしてあったので
文字化けしなかったでした
いやーすごい
- 383 :名無しさん@勉強中 ★:07/12/22 19:02:20 ID:???
- お前ら、wsh使ってますか? Part2
http://pc2.2ch.net/test/read.cgi/win/1022248379/728-730n
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
728 名前:名無し~3.EXE[] 投稿日:03/03/24 01:56 ID:ZmE7iov5
WSHにはDOSの
・ファイル結合
copy /b a.txt+b.txt c.txt
・リネーム
ren a.txt b.txt
に当たる処理を容易に行える命令はないの?
729 名前:名無し~3.EXE[sage] 投稿日:03/03/24 03:46 ID:zcvTmdSc
Dim WSH
Set WSH = CreateObject("WScript.Shell")
WSH.Run "cmd /c copy /b a.txt+b.txt c.txt",1,True
WSH.Run "cmd /k ren a.txt b.txt",1,True
730 名前:名無しさん募集中。。[sage] 投稿日:03/03/24 04:34 ID:MV8cQtQK
>728
そこら辺の(内部、外部問わず)コマンドアプリとして用意されている物は、無理にWSHでやる必要ないんじゃないのかな。
それらをWSH標準で用意されているコマンドで行うには各々3〜4行は必要だよ。
>729
Runメソッドの第2引数を0にすると裏でやっている感じでいいかもね。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
- 384 :名無しさん@勉強中 ★:07/12/23 10:04:46 ID:???
- 上のリネーム
何だかうまくいかない・・・
メモ
htmltodat.pyで使えるかなと
pythonでHTML解析 - 清水川Web
http://www.freia.jp/taka/blog/169
- 385 :名無しさん@勉強中 ★:07/12/23 14:03:01 ID:???
- 別の方法で何とかなったです
'http://q.hatena.ne.jp/1166525285
Function riname(before, after)
Set Fs = WScript.CreateObject("Scripting.FileSystemObject")
Set f = Fs.getFile(before)
f.name = Fs.getFileName(after)
End Function
で、何でこんな事したいかというと
ExecWBで文字コード変換する場合
IEの拡張子設定に左右されるみたいで
拡張子がdatのままではエラーが出るからで。
なるべく標準機能だけで何とかしたいですし。
- 386 :名無しさん@勉強中 ★:07/12/23 16:32:29 ID:???
- よしこれ↑も組み込めた
あとは外部コマンド用にURL取得と保存先フォルダ指定かな
変換結果式並べ替えと前処理・後処理はどうしようか。
必要性を感じたらつけるかな。
どうせ自分しか使わないんだし
- 387 :名無しさん@勉強中 ★:07/12/23 17:26:48 ID:???
- ところで少し悩みが。
datキーなのですが
URLを解析(カッケー!)して9桁or10桁の数字があったらそれをdatキーにしてみたのですが
例えば>>361で出したwebarchiveのURLとかだと
http://web.archive.org/web/20050113190336/www.comic.com.tw/mini02/test/read.cgi/operate/1078772150/l25
はじめのほうの「20050113190336」に先にマッチしそうです。
どうすればいいのだろう。
現状は下のようにしてますが(test1にURLが入るです)
if(test1.match(/.*?(\d{9,10}).*?/i)){
var datkey = RegExp.$1;
}else{
var datkey = "sample";
}
泥臭くなりますが
if(test1.match(/.*?(9\d{8}|1\d{9}).*?/i)){
としたほうがまだマシなのかな。
9桁の場合、先頭数字が9
10桁の場合、先頭数字が1
という事になるですが。
- 388 :名無しさん@勉強中 ★:07/12/23 20:16:52 ID:???
- うーむ
保存先フォルダ指定との絡みもあるのだなぁ>datキー取得
- 389 :名無しさん@勉強中 ★:07/12/23 20:41:20 ID:???
- これまでの途中経過
http://www.geocities.jp/mirrorhenkan/wsh/htmltodat/htmltodat001.wsf.txt
http://www.geocities.jp/mirrorhenkan/wsh/htmltodat/htmltodat002.wsf.txt
http://www.geocities.jp/mirrorhenkan/wsh/htmltodat/htmltodat003.wsf.txt
http://www.geocities.jp/mirrorhenkan/wsh/htmltodat/htmltodat004.wsf.txt
http://www.geocities.jp/mirrorhenkan/wsh/htmltodat/htmltodat005.wsf.txt
http://www.geocities.jp/mirrorhenkan/wsh/htmltodat/htmltodat006.wsf.txt
http://www.geocities.jp/mirrorhenkan/wsh/htmltodat/htmltodat007.wsf.txt
バックアップという事で。
これでローカルのファイルをお掃除出来るです
- 390 :名無しさん@勉強中 ★:07/12/23 22:23:56 ID:???
- おお
そういえばhtmltodat-convert.wsfでも保存先を指定してたっけだ
これのコードをコピペすれば良かったっけだなー
よしクリスマスに片付けてしまおうか
- 391 :名無しさん@勉強中 ★:07/12/24 08:55:44 ID:???
- と書くとプレッシャーがかかるので
前言撤回
- 392 :名無しさん@勉強中 ★:07/12/24 11:46:40 ID:???
- >>245の2ch-imodeのhtmlですが
タイトルに付くものが「2ch-imode」から「2ch-i」に変更されたみたいですね。
前処理部分を下記に変更すれば良さそう
s#(<title.*?): 2ch-imode(</title>)#$1$2#k
↓
s#(<title.*?): 2ch-i(</title>)#$1$2#k
最近 2ch-imodeの管理人さん
更新が立て続けですね。
「IPv6対応」とか 検索してもよくわかんない
- 393 :名無しさん@勉強中 ★:07/12/24 18:34:38 ID:???
- よし
htmltodat.wsfが出来たっぽい。
ただ、経路的問題なのか何なのかわかんないですが
cn2chが私のホストからだととても重いです。
htmltodat.phpだとスムーズだったので
試しにアメリカのプロキシ経由でやってみたらうまくいったのですが。
- 394 :名無しさん@勉強中 ★:07/12/25 17:52:25 ID:???
- メモ
独身男が毒づくスレ
http://cn2ch.cn/bbs/file/1159788900.html
上記dat化
正規表現
m#<DT><A.*?>([0-9]+).+?<B>(?:<A HREF='mailto:(.+?)'>)?(.*?)(?:</A>)?</B>.*?:(.*?)<DD>(.*?)<BR><BR>#mi
- 395 :名無しさん@勉強中 ★:07/12/25 18:05:30 ID:???
- 上の正規表現を
htmltodat007.wsf中のそれと差し替えてdat化させたもの(あっという間に出来たです)を
JaneNida該当フォルダに入れて読んでるんですが
日本語なのは見事にタイトルだけですね。
台湾の掲示板とかだと日本語も結構出てたりするんですが。
ビバ外部コマンド
こういう、何というか
外部向けでない内輪向けの生の声って面白いですね。
台湾や韓国の方々とはまた雰囲気が全然違うですし。
- 396 :名無しさん@勉強中 ★:07/12/25 19:27:10 ID:???
- todoメモ
・変換結果式並べ替え対応
・ドラッグ&ドロップ対応
・フォルダ内一括変換対応
・正規表現各自入力対応(だってソースいちいち見て変えるの面倒なんだもん)
・前処理・後処理対応(「この箇所に各自で入れて下さい」の場所を設ける)
こんなもんですか。
これらは何とか出来そうです。
必要性を感じたらですが。
あと個人的に切実に欲しいのが
文字コードBig-5やgb2312やEuc-krのhtml対応なんですが
今の自分にはwshでは無理っぽい。
phpでもよくわかんない。
pythonのほうで模索してみるかなと。
現地の方でこういう事やってる解説サイトがあったら一発なんですが
まあ適当にやってみますか。
いやー
独り遊びってほんとに楽しいもんですね。
- 397 :名無しさん@勉強中 ★:07/12/26 08:02:46 ID:???
- JaneNida外部コマンド組み込み用のhtmltodat.wsfを出しとくです
http://www.geocities.jp/mirrorhenkan/wsh/htmltodat/htmltodat008.wsf.txt
DLしたhtmltodat008.wsf.txtを拡張子wsfにリネームしてJane2ch.exeと同じフォルダに入れ
外部コマンド登録は下記
htmltodat008=wscript "$BASEPATHhtmltodat008.wsf" "$LINK"
外部板として例えば
http://cn2ch.cn/bbs/tongren/
を適当な板名で登録して
birdconf.iniにUTF-8である旨登録して
例えば下記スレッドを右クリックからコマンド呼び出ししてみて下さい
dat化されて該当フォルダに保存されて、読み込めるようになると思うです
中国語読めない><
http://cn2ch.cn/bbs/test/read.cgi/tongren/1195601732/
この呼び出しがタイトル一覧から出来れば嬉しいなと。
つまりタイトル一覧で外部コマンド呼び出し出来たら有り難いと思うです。
そうすれば
htmltodat008=wscript "$BASEPATHhtmltodat008.wsf" "$URL"
と登録し直して
タイトル右クリックでdat化取得とか出来ると思いますので。
・・・要望の下書きのつもりはなかったんですが
これをもとに要望してみますか。
だとしたらあと2〜3点あるですが。
- 398 :名無しさん@勉強中 ★:07/12/26 21:54:59 ID:???
- 書いたです
http://pc11.2ch.net/test/read.cgi/software/1195310686/552-553n
打たれ弱いので
煽られたらへこむです
- 399 :名無しさん@勉強中 ★:07/12/28 13:08:16 ID:???
- メモ
用WSH 想ASP 一???数据?
http://www.pcdog.com/edu/asp/27/11/d267812.html
文字コードgb2312のファイルをwshで使いたいのですが
参考になったらいいなと。
あとここ
jisaku
http://ha1.seikyou.ne.jp/home/akairingosaita/hangul/jisaku.htm
- 400 :名無しさん@勉強中 ★:07/12/28 18:38:14 ID:???
- ときどきの雑記帖 リターンズ 2007年1月
http://www.kt.rim.or.jp/~kbk/zakkicho/07/zakkicho0701.html
The Past Times
http://lyrics.meicho.com.tw/modify.htm
- 401 :名無しさん@勉強中 ★:07/12/28 19:09:42 ID:???
- 上の「ときどきの雑記帖」さんの所、すごく面白いですね。
で、そこ経由
旗旗 - ブログ「旗旗」 : 日本語CGIを韓国語で動かす by 草加耕助
http://bund.jp/modules/wordpress/index.php?p=326
- 402 :名無しさん@勉強中 ★:07/12/28 20:12:18 ID:???
- WEB開發 | HTML | XML | VBScript | JavaScript | CGI/perl | ASP | PHP | JSP | ASP.NET | DreamWeaver
http://big5.chinaz.com:88/book.chinaz.com/others/web/web/index.htm
- 403 :名無しさん@勉強中 ★:07/12/28 21:51:10 ID:???
- さて
文字コードbig5やgb2312のサイトを
そのまんま取得する方法がわかんない・・・。
ADODB.streamを使ってResponse.bodyをcharset指定して読み込めばいいっぽいんですが
(って間違ってるかも^^;)
私のマシンでは敵わぬ夢なので。
タグ崩れるの承知で
IE経由でDLしてみるかな。
- 404 :名無しさん@勉強中 ★:07/12/29 20:39:52 ID:???
- メモ
http://www.megabbs.com/
のsubject.txtとdatファイルについて
板
http://www.megabbs.com/mac/
subject.txt(に該当するもの)
http://www.megabbs.com/mac/mac_newb.txt
dat(に該当するもの)
http://www.megabbs.com/mac/txt/mac_1008509845a.txt
http://www.megabbs.com/mac/txt/mac_1008509845b.txt
dat一覧リスト表示
http://www.megabbs.com/mac/txt/
- 405 :名無しさん@勉強中 ★:07/12/30 13:07:10 ID:???
- ついさっき
ホットゾヌ2をDLして
proxomitron経由で
http://www.ichigobbs.net/
の板一覧取得とスレッド一覧およびスレッド取得してみたですが
どうもhtmlを取得してそれをsubject.txt化したりdat化したりされてるみたいですね。
で、メモ
ichigoBBSのdat化
スレッド例
http://www.ichigobbs.net/cgi/15bbs/2ch/0115/
正規表現
m#<DT>([0-9]+): *?<font.+?><b>(?:<a href="mailto:(.*?)">)?(?:<font.+?>)?(.*?)(?:</font></a>)?</B></font>(?: )(.*?)<DD>(.*?)(<br> <dt>)#mik
前処理
s#<a rel.+?>(.+?)</a>#$1#igk
これでdat化出来ますが
例えばレス136等は透明消去されているみたいです。
元のhtmlの段階からしてレス番不在で。
http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/498-499n
の機能追加が欲しいなと思うんですが。
- 406 :名無しさん@勉強中 ★:07/12/30 15:22:22 ID:???
- メモ
remix2ch(http://contents-factory.net/remix2ch/)のdat化について
URL例
http://contents-factory.net/remix2ch/read.php?url=http://live23.2ch.net/test/read.cgi/liventv/1176376861/
正規表現
m#<dt>([0-9]+) :<span class="name">(?:.+?"mailto:(.+?)"><b>)?(.+?) ?(?:</b></a>)?</span>:(.*?)\(スコア.+?<dd> ?(.*?)<br></dd><hr>(<dt>|</dl>|<script)#mik
前処理
s#(<title>.+?) - remix2ch(</title>)#$1$2#
受信オプション→HTTPヘッダ
Cookie: preview_limit=zero; design=2ch; normal_view=on
これでいけるかと思います。
クッキー送信が必要な所なので注意して下さい
- 407 :名無しさん@勉強中 ★:07/12/30 15:34:31 ID:???
- で、ついでなんですが
このスレッド snapshotにも1001まで残っていますね。
後で直しておきますか。
http://ss.chbox.jp/dat.php?url=http://live23.2ch.net/test/read.cgi/liventv/1176376861/
chbox.jpのサーバですが
むむむさんのページのサーバ一覧を見てみると(って今URL探すの面倒ですが)
讃岐メニューさんや公式p2さんのように
運営の方から貸与されたものみたいです。
だもんでp2todatとかが出てもそうレスポンスが重くならないみたいで。
いや自分を棚にあげてる訳じゃなくて わざわざ書くのも何ですし。
外部コマンドで23ch.infoさんのログを取得するhtmltodat.wsfもやってみたら簡単に出来たですが
これ以上あちこちに負担をかけるのも何なので
自分 出すのはやめとくです
p2todatの作者さんはどうされるのか判りませんが。
- 408 :名無しさん@勉強中 ★:07/12/30 17:55:41 ID:???
- ホットゾヌですが
メガBBSのほうもhtml経由でdat化subject化されてるみたい。
なるほど、こりゃ安易に
「メガビ対応まだー(後略)」「苺対応(後」
というような要望に
皆反応しない訳だなと。
メガBBSはよう知らんですが
苺BBSのほうは経済板とかたまに覗いたっけだなー
すげーレベルたけーと思ったでしたっけでした
ドラエモンさんとかまだ居られるのかなとか。
- 409 :名無しさん@勉強中 ★:07/12/30 20:28:00 ID:???
- >>406-407
done(カッケー!)
今年も至らないながら色々遊んだっけだなー
ここで出してリンクさせてないやつとか結構あるですが
気が向いたら何とかしますか
まあ自己満足だし別にどうでもいいや
自己満足といえば
>>407で作ったついでに
23ch.infoさんのログをかちゅdatとかちゅidxに取得変換する
htmltokatjudat.wsfも出来たっぽいですが
また出してこじれてもイヤなのでやめとくです
にしても
年々きつくなってくるなー
- 410 :名無しさん@勉強中 ★:08/01/01 11:33:44 ID:???
- 新年おめでとうございます
苺BBSをJaneNidaで読めるように出来ないか画策中。
変換してdat格納&読み込みは>>409のものの流用で簡単に出来たですが
>>405の欠番補完にまだ手をつけとらんです。
もひとつパラメータを追加して
ループ中でレス番(htmltodat.wsfだと$i)との数値比較をして
その差が1より大きかったらその数だけあぼーん行を追加するループをつければ何とかなりそう。
それほど面倒な作業でもなさそうです(そう思わなきゃやっとれん)
問題はsubject.txt生成で
>>404のメガBBSのようなURLが該当しなさそう。
ホットゾヌ2の場合は例えば
http://www.ichigobbs.net/cgi/aska_list.cgi?bo=economy&page=0
からsubject.txt化されてるみたいなんですが
自分でやるとなると次ページ次ページと順繰りにアクセスしてマージしないといかんですし
そうやってsubject.txt化するのも時間がかかりそう。
ここはタイトル取得を諦めて
http://www.ichigobbs.net/economy/economy_new.txt
からsubject.txt生成してみるかな。
でもタイトルが無いというのはやはりなと思うですし
subject.txt都度書き換えで消えてしまうかなとか悶々と
新年早々、何だかもうどうでもいい気がしてきたです
てか苺BBS経済板のドラエモンさん お元気そうで何よりです
- 411 :名無しさん@勉強中 ★:08/01/01 18:03:11 ID:???
- メモ
http://www.ichigobbs.net/cgi/aska_list.cgi?bo=economy&page=0
のsubject.txt化
マッチ用正規表現
<b>[0-9]+</b> : * *(\([0-9]+\)) <a href="/cgi/15bbs/[^/]+/([0-9]+)/L30">(.+?)(</a> <font .+?\n)
変換式
$2.dat<>$3$1\n
- 412 :名無しさん@勉強中 ★:08/01/03 14:28:06 ID:???
- メモ
http://makimo.to:8000/i/
のdat化について
URL例
http://makimo.to:8000/i/d.cgi/livebase/2ch.net/live24/1187671540/?i=1001
正規表現
m#<hr>([0-9]+):(.+?):(.+?)(?:\[(.+?)\])?<br>(.*?)(<hr>)#mki
前処理
s#(<title>)29-(.+?</title>)#$1$2#ik
s#<a href=/i/d.cgi/.+?>(.+?)/(2ch\.net|bbspink\.com)/(.+?)/(\d+?)(/.*?)?</a>#http://$3.$2/test/read.cgi/$1/$4$5#igk
s#<a href=http://www\.google.+?>([^h\&].+?)</a>#http://$1#igk
s#<br><font color=\#000080>▼\d\d/\d\d/\d\d\(.\) \d\d:\d\d</font>##igk
変換結果式
$2<>$4<>$3<>$5<>
後処理
s#((?:^|\n).*?)(◆.+?)<>(.*?)<>#$1</b>$2<b><>$3<>#igk
これって>>111や>>115の再掲になるですが、これでdat化出来るかも。
ただ注意点が二つ。
(1) beリンクがはじめから消えている
(2) 連続スペース等はマージ(カッケー!)されてしまっているので
AAが崩れてしまう
上2点は我慢するしかなさそうです。
- 413 :名無しさん@勉強中 ★:08/01/03 15:13:48 ID:???
- 年月日の欄も省略されてるですか。
「2007/」ってのを日付の前に付ければ良いのなら
後処理で
s#((?:^|\n).+?<>.*?<>)#$1 2007/#igk
でその場しのぎにはなるですが。
ところでこれって
s#((?:^|\n).+?<>.*?<>)#$12007/#igk
ってやると「$12007」の部分で駄目だったのでやむなく半角スペース入れたですが
この場合どうやればいいんでしょうね。
あと、後処理でも
前処理の$serverや$boardみたいなものが欲しいなと思ったです
上のような事をやるのに結構使えるのではないかと。
- 414 :名無しさん@勉強中 ★:08/01/03 15:47:07 ID:???
- >>413の対処案
その場しのぎに変わりないですが。
s#((?:^|\n).+?<>.*?<)>#$1>2007/#igk
年をまたぐ場合はどうしましょう。
実況スレのようにせいぜい数日で終わる場合なら何とかなりますが
そうじゃない場合は・・・わかんない。
- 415 : ◆/vmukiyuzw :08/01/04 01:25:46 ID:070Pexro
- dat→htmlに変換する時点で元データが加工もしくは改竄(?)されてしまってる場合、
どこまで元データに近づけるよう復元したいかは、個人的な割り切りしかない、と思います。
# その割り切りレベルが自分にはわからなかったのでmakimo.toにはなるたけ近づきたくなかった、
# と思うことはあります
で、>>413-414のように、「年」を復元するような作業も、力を入れても不毛かもとか思います。
板によっては数年かけて続いてるようなスレもありますし・・・
これもどこで割り切るか、という話になるかと思います。
- 416 : ◆/vmukiyuzw :08/01/04 02:39:50 ID:070Pexro
- すみません。↑は私の板のほうに書くべきことだったような気がします。
申し訳ありません。
- 417 :名無しさん@勉強中 ★:08/01/04 18:40:57 ID:???
- 8時から18時までみっちりと立ち回った後で
現在一息ついてますが
こういう毎日がまた始まると思うと
なんか何もかもどうでもよくなってきますね
>>415-416
自分もそう思うです。
ただ、>>318-335であれこれ考えた事と同様
何となくやってみただけの事なので
別にそんな大した事でもないです
ただ、思うんですが
意味のある事にしか意味がないという事はないと思うんですよ。
一見 無意味に見える事にも 必ず意味があるのではないかと。
そう思わなかったら意味がないじゃないですか。
ところで
私がやっている事って 意味があるんですかね?
もっというと
私が存在している意味ってあるのかなと。
別に誘い受けという訳でもないですが
こういう考えって 袋小路に迷い込みますね。
- 418 :名無しさん@勉強中 ★:08/01/05 12:01:48 ID:???
- 最下部にぽっぷちゃっとをつけてみたのですが
同時接続人数を見て驚いたです
超人気ブログとかと同じくらいアクセスがあるではないですか
別にカウント数をごまかしてる訳でもないですし
と同時に
自前設置してある入室者表示スクリプトとの差異が気になったです
この違いは何なのだ
スクリプトは
http://myako.net/
の「入室者数表示スクリプト」を使わせて頂いてるのですが
もしかしたらホスト取得の箇所で
ほぼ同一アドレスのものが丸められているのかなとか素人は考えたですが
それ以上はなんとも。
該当個所は
# −−−−−−−−−− ホスト情報の取得 −−−−−−−−−−
sub host{
local ($host);
$addr = $ENV{'REMOTE_ADDR'};
$host = gethostbyaddr(pack("C4",split(/\./,$addr)),2);
if ($host eq ''){ $host = $addr;}
$host =~ s/,/./g;
return($host);
}
なので
$ENV{'REMOTE_ADDR'}に同じ数値が入る場合があるのだろうかと。
同じアパートの隣室同士とかどうなんでしょうか。
- 419 :名無しさん@勉強中 ★:08/01/05 12:52:13 ID:???
- ふと思ったですが
nicovideo.jpの時報と同様の事が
mirrorhenkanでも出来そうですね。
トップ右上で現在時刻と対応キーを現在形で表示させてありますが
そこの所でキリがいい時刻の時には
例えば「jihou.wav」をembedさせるようにする とか。
まあやんないですけど。
- 420 :名無しさん@勉強中 ★:08/01/09 19:09:01 ID:???
- http://society6.2ch.net/test/read.cgi/gline/1165245437/506
done(カッケー!)
でも使ってる人居るのかな
- 421 :名無しさん@勉強中 ★:08/01/09 19:25:08 ID:???
- syoboon - マイピクチャの整理
http://syoboon.asks.jp/78938.html
−−−−−−−−−−−−−−−−−−−−−−−
スレとかに貼られている画像や、ニュースとかの画像をしょっちゅう保存している割に
2006年から全く整理をしていないせいでマイピクチャを開くだけで
CPU100%になってしまうので、そろそろ整理でもしようかと。
ジャンルで分けると恐ろしく面倒になるので、タイムスタンプで分けようと思ったんですが、
ちょっと探した感じじゃそんなソフトは無いみたいですね、、、
−−−−−−−−−−−−−−−−−−−−−−−
ファイルをタイムスタンプで分けるようなソフトもどこかにあるとは思いますが
とりあえずwshで簡単に出来る(語弊があるけど)と思うです。
何らかの規則を設けてフォルダ分けする事にして
振り分けるフォルダが存在しなかったら作成するようにして
振り分け対象のフォルダを指定してその中のファイルのそれぞれについて
FileSystemObject(だったかな)でそれぞれのタイムスタンプを取得して
ファイル移動orファイルコピーすれば良さそうな感じ。
でもsyoboonさん もしかしたらLinuxオンリーの方なのかもしれず。
もしそうだとしたら、wshでスクリプトをこさえたとしても無意味なのかもしれず。
というか phpでも同様な事が出来るでしょうし
だもんでこの件 とっくに解決済みな事なのかもしれず。
まあスクリプト作ってもあたしゃチキンですから。
syoboon - liveb1終わってた
http://syoboon.asks.jp/79456.html
うわー。
- 422 :名無しさん@勉強中 ★:08/01/11 19:30:23 ID:???
- メモ
アニ関西Wiki
http://anikan.tv/
- 423 :名無しさん@勉強中 ★:08/01/11 19:40:55 ID:???
- http://society6.2ch.net/test/read.cgi/gline/1193462528/210-212n
「Linux使いなのでdat化出来ません」という御返事が返ってきたら
どうすればいいのでしょうか
そういえば
http://society6.2ch.net/test/read.cgi/gline/1165245437/502-503n
でMac使いの方も書き込んでおられるのですが
どうすればいいのでしょうか
まあどちらの件も
元気になったら考えてみようという事で。
- 424 :名無しさん@勉強中 ★:08/01/11 19:44:34 ID:???
- ところでもしかしたら
2ch-imodeの管理人さん 上記スレッドを見て
気が向いた時にアップされておられるのかもしれず。
だとしたら ありがとうございます
- 425 :名無しさん@勉強中 ★:08/01/12 18:09:32 ID:???
- メモ
2nv - 2ch News View
http://nika.sakura.ne.jp/2nv/index.html
管理人さんのお名前やブログを見てみると
どこかの研究室に所属されておられる理系の女性なのでしょうか。
- 426 :名無しさん@勉強中 ★:08/01/13 13:37:33 ID:???
- メモ
読めないdat落ちスレのhtmlミラー避難所[2] 2ch過去ログ保管予約
http://2ch.free4seo.com/reserve/view/369
これのdat化および
元URLからの表示が出来たら嬉しいです(私が)
dat化は何とかなるような気もしますが
一見したところ
本文の改行部分が全部なくなっているような。
あと 元URLからの表示のほうは
上記サイト管理人さんにお訊きしないとわかんない感じです。
- 427 :名無しさん@勉強中 ★:08/01/13 14:07:04 ID:???
- メモ
2ch過去ログ保管予約(http://2ch.free4seo.com/)のdat化について
URL例
http://2ch.free4seo.com/reserve/view/369
正規表現
m#<div class="author"><a name="\d+">([0-9]+)</a>名前:( ) Mail: (.*?) 投稿日: (.*?)</div>.+?<div class="post">(.*?) </div>#mik
前処理
s#(<title>.+?) 2ch過去ログ保管予約(</title>)#$1$2#ik
名前と本文改行がhtmlの段階からないみたいです。
あと前処理がうまくいかない感じなのは何でなのでしょうか。
- 428 :名無しさん@勉強中 ★:08/01/13 14:09:20 ID:???
- 書き忘れ
変換結果式
メール欄逆転
- 429 :名無しさん@勉強中 ★:08/01/13 18:45:32 ID:???
- えーと
2ch-imodeさんの所なのですが
やはりこっそりとアップして下さっておられるようで
こっそりとありがとうございます
それはそうと
また少しhtml部分を手直しされたようで
http://mirror.sarashi.com/htmltodat/968412567.html
AASのリンクがあったりなかったりというのは今まで無かったですし
名前や日付あたりの半角スペースの有無もまた少し以前と異なっておられるような。
ちょっとまたこんがらがってしまってるので正規表現やりかけメモ
これだとレス11でストップひばり君です
m#<p>\[([0-9]+):(.+?) (?:≪(.+?)≫)? \((.+?)\) ?(?:<a href=.+?>AA</a>)?\]<br> ?(.*?) </p>.*?<hr>#mik
- 430 :名無しさん@勉強中 ★:08/01/13 19:22:52 ID:???
- メモ
2ch-i(http://2ch-i.net/)のdat化について
正規表現
m#<p>\[([0-9]+):(.+?)(?:≪(.+?)≫)? +\((.+?)\) ?(?:<a href=.+?>AA</a>)?\]<br> ?(.+?)</p>.*?<hr>#mik
前処理
s#(<title.*?): 2ch-i(</title>)#$1$2#k
s#<SCRIPT language="JavaScript">.+?</SCRIPT></body></html>##igk
変換結果式
メール欄逆転
後処理
s#(\n.*?)(◆.+?)<>(.*?)<>#$1</b>$2<b><>$3<>#igk
- 431 :名無しさん@勉強中 ★:08/01/14 12:00:11 ID:???
- また後処理直すの忘れてた・・
上のだとレス1の名前欄にトリップがある場合にヒットしないです
後処理
s#((?:^|\n).*?)(◆.+?)<>(.*?)<>#$1</b>$2<b><>$3<>#igk
- 432 :名無しさん@勉強中 ★:08/01/14 18:32:14 ID:???
- http://pc11.2ch.net/test/read.cgi/software/1195310686/851
しこしこ書いて一応投稿してみたのですが
「PC替えろ」で終わったら悲しいなと
- 433 :名無しさん@勉強中 ★:08/01/16 20:26:57 ID:???
- ふと思ったんですが
名前欄に
#fusianasan
とか
#山崎渉
とか書いて投稿したら
どう表示されるんですかね?
自分とこのホスト名なのか
それとも
それぞれに対応するトリップなのか。
ちなみにトリップ表示された場合
上は「◆M2TLe2H2No」
下は「◆RB/pr3SWUk」
となるみたいですが。
まあ試せばわかるでしょうけど
しかしそれにしても実に何とも限りなくどうでもいい話だ
- 434 :名無しさん@勉強中 ★:08/01/19 19:51:52 ID:???
- 2ch-imodeさんの所なんですが
dat化したい際に問題がある場合があるみたい
http://mirror.sarashi.com/htmltodat/1171967272.html
http://mirror.sarashi.com/htmltodat/1200134001.html
例えばこの二つとかだと>>430で未変換行が出るです
上だとレス5と6
下だとレス258
で、調べてみると
どちらも超長文なので略されているみたいで。
これはちょっとどうしようもなさそうですね。
幸い、未変換行がすぐわかるので
それで省略レスを突き止めて各自手直しして頂くしかないのかな とか。
- 435 :名無しさん@勉強中 ★:08/01/21 18:02:12 ID:???
- メモ
ムッハー(*゚∀゚)=3 (http://muha.xrea.jp/)
のdat化について
URL例
http://muha.xrea.jp/?q=http://society6.2ch.net/test/read.cgi/gline/1165245437/
正規表現
m#<div.+?><dt.+?><input.+?> ([0-9]+) : <label.+?>()<b class="name">(.+?)</b> (.+?)</label></dt><dd>(.*?)</dd></div>#mik
前処理
s#<title.+?/title>##ik
s#<h2>(.+?)</h2>#<title>$1</title>#ik
後処理
s#(<><>)\[(.*?)\](.+?)(<>)#$1$3 $2$4#igk
s#((?:^|\n).*?)(◆.+?)(<>)#$1</b>$2<b>$3#igk
ほんの4日前に開設なさった所みたい。
メール欄は省略しておられるようです。
- 436 :名無しさん@勉強中 ★:08/01/21 18:43:33 ID:???
- とかいって
仕様を見てみると
そうでもないようで
http://muha.xrea.jp/template.txt
ごめんよくわかんないです
- 437 :名無しさん@勉強中 ★:08/01/21 19:03:06 ID:???
- スレッドタイトルとかあんまり気にしないように
ギンギンに勃起した娘。メンバーたちにマワされたい2
http://f57.aaa.livedoor.jp/~moshimo/moshimo_log/moshimo475.htm
検索してたらこれが出てきたんですが
最下部を見てびっくりしたですよ
- 438 :名無しさん@勉強中 ★:08/01/22 18:20:01 ID:???
- >>435でやったものですが、後処理が間違ってたですね。
これだとIDが表示されないです。
こうかな
後処理
s#(<><>)\[(.+?)\](.+?)(<>)#$1$3 ID:$2$4#igk
s#(<><>)\[\](.+?)(<>)#$1$2$3#igk
s#((?:^|\n).*?)(◆.+?)(<>)#$1</b>$2<b>$3#igk
- 439 :名無しさん@勉強中 ★:08/01/22 18:27:38 ID:???
- このサイトですが
Web製作板でお見かけしたです
まとめサイト運営してる人 Part2
http://pc11.2ch.net/test/read.cgi/hp/1148609976/704
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
704 名前:Name_Not_Found[sage] 投稿日:2008/01/17(木) 05:44:10 ID:???
こんなもの作ってみたよ。
とりあえず抽出機能だけ付けた
ttp://muha.xrea.jp
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
で、まあ
色々な人が居るですが
下の方とか
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
750 名前:Name_Not_Found[sage] 投稿日:2008/01/21(月) 21:40:16 ID:???
プログラミングとしては初級だろうな
ただこの板にプログラミングかじった奴が居なさすぎるから神なんて言われる
こりゃただの文字列操作に過ぎない
誰でも作れるから、誰も作ろうとしなかっただけさな
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
こういうのって見ないほうがいいだけなんでしょうけど
本物のすごい人はわざわざこんな事書かないだろうなと
- 440 :名無しさん@勉強中 ★:08/01/22 19:28:53 ID:???
- メモ
Internet Archive Wayback Machine
http://web.archive.org/web/*sr_1nr_2653/http://2ch.dumper.jp/*
dumper.jpさんの所のファイルですが
webarchiveにだいたい1500スレ前後残っているみたいなので
スクリプトでスクレイピング(カッケー!)すれば
ある程度 半自動でリスト生成出来るかもです
って そんなスクリプト 誰が作ってくれるんでしょ
- 441 :名無しさん@勉強中 ★:08/01/22 20:47:36 ID:???
- 少し考えてみると
上のソース(http://web.archive.org/web/*sr_1nr_2653/http://2ch.dumper.jp/*)
から拾い上げたいリンクは例えば下記
<a href="http://web.archive.org/web/20050614012049/2ch.dumper.jp/0000015881/">2ch.dumper.jp/0000015881/</a><br>
<span class="mainSearchText">1 page from Jun 14, 2005</span><br><br>
<a href="http://web.archive.org/web/*hh_/2ch.dumper.jp/0000017733/">2ch.dumper.jp/0000017733/</a><br>
<span class="mainSearchText">~2 pages between Jan 07, 2007 and Jan 12, 2007</span><br><br>
このうち
(1) 上は1ページしか保存されてない(1 page from Jun 14, 2005)ので
http://web.archive.org/web/20050614012049/2ch.dumper.jp/0000015881/
をDLするなりして分析すれば良いと思うですが
(2) 下は2ページ保存されている(2 pages between Jan 07, 2007 and Jan 12, 2007)ので
http://web.archive.org/web/*hh_/2ch.dumper.jp/0000017733/
へ行って各々のアーカイブを見てみる必要がありそうです。
とりあえず(1)と(2)の区分けですが
リンク先URLの正規表現で何とかならないかな?
並べると
http://web.archive.org/web/20050614012049/2ch.dumper.jp/0000015881/
http://web.archive.org/web/*hh_/2ch.dumper.jp/0000017733/
となり
複数ページ保存の場合のURLは「〜/+hh_/〜」というのが他にもついているので
1ページしかないものは
http://web\.archive\.org/web/\d+/2ch\.dumper\.jp/\d+/
複数ページ保存されているものは
http://web\.archive\.org/web/\*hh_/2ch\.dumper\.jp/\d+/
とやって
上にマッチしたらDL
下にマッチしたら別個リストに追加 とか。
- 442 :名無しさん@勉強中 ★:08/01/23 20:59:36 ID:???
- >>435>>438ですが
beや株主優待や●みたいなのがIDの後に付くような所だと
これではよくないっぽいですね。
試してないですがレス1とか多分よくないかもです
いやー奥が深いなぁ (←勝手に深くしてるだけだったりして)
- 443 :名無しさん@勉強中 ★:08/01/23 21:27:02 ID:???
- メモ
2chミラー計画(http://web.archive.org/web/*/http://fun.kz/)
のdat化について
URL例
http://web.archive.org/web/20050221015734/http://fun.kz/test/read.cgi/comic/1085912649/
正規表現(「行が長い」と出たので適当に改行してます)
m#<div class="day"><a.+?>([0-9]+)</a> 名前:(.*?) ?\[(.*?)\] 投稿
日:(.*?)<br><div class="body"> ?(.*?) </div></div>(<div class="day">|[ ]+(?:<hr.*?>|<div align="center">))#mik
変換結果式
メール欄逆転
前スレ651のコピペですが。
- 444 :名無しさん@勉強中 ★:08/01/23 23:29:49 ID:???
- http://pc11.2ch.net/test/read.cgi/software/1195310686/910
更新なさったですが
http://pc11.2ch.net/test/read.cgi/software/1195310686/870-872n
の要望は見送られたみたいで。
駄目なのかなあ
- 445 :名無しさん@勉強中 ★:08/01/26 20:15:00 ID:???
- 更にをミラーを3つ追加してみたりして
あと
(1) http://ruku.qp.tc/
(2) http://2ch.dumper.jp/
(3) http://2ch.pop.tc/
の
消えてしまったそれぞれのhtmlミラーの
http://web.archive.org/に保存されているもののリストでも作ってみようかなと。
- 446 :名無しさん@勉強中 ★:08/01/27 12:28:54 ID:???
- http://society6.2ch.net/test/read.cgi/gline/1193462528/247-249n
ふむ
その1bでも1001レスあるみたいですし
少しだけ携帯用のも追加してみますか
- 447 :名無しさん@勉強中 ★:08/01/27 13:16:41 ID:???
- というか
その20にもあるなあ
でも公式p2にはdatが存在してないですし
色んなケースがあるんだなーと。
ちなみに
http://society6.2ch.net/test/read.cgi/gline/1193462528/245-246n
の
http://etc3.2ch.net/test/read.cgi/charaneta/1107347770/
も、dat落ち保管所さんがアップなさったものがwebarchiveに残ってるみたい。
天使のしっぽ3 トラウマなんてこわくない!
http://web.archive.org/web/20060723021603/http://2ch.pop.tc/log/05/10/05/0723/1107347770.html
- 448 :名無しさん@勉強中 ★:08/01/27 14:54:47 ID:???
- メモ
Internet Archive Wayback Machine
http://web.archive.org/web/*sr_1nr_1368/http://www.2chdat.net/*
http://web.archive.org/web/*sr_1nr_1929/http://user.ftth100.net/mirrorhenkan/*
- 449 :名無しさん@勉強中 ★:08/01/27 18:23:32 ID:???
- http://qb5.2ch.net/test/read.cgi/operate/1201374777/25-26+40-43
再び
キャッシュサーバを用意して下さるのでしょうか
- 450 :名無しさん@勉強中 ★:08/01/27 20:01:16 ID:???
- >>445で書いたwebarchiveに保存されているhtmlですが
いちおうやってみたらそれぞれ
(1) http://ruku.qp.tc/
→18108
(2) http://2ch.dumper.jp/
→1527
(3) http://2ch.pop.tc/
→4880
という事のようで。
>>195で出したwshとhtmltodatが大活躍してくれました。
- 451 :名無しさん@勉強中 ★:08/01/28 20:40:27 ID:???
- 上の間違ってるっぽい
dumper.jpさんのはちょっと見てないですが
他二つやり直してみたです
(1) http://ruku.qp.tc/
→19901
(3) http://2ch.pop.tc/
→4864
たぶんこれで合ってるんじゃないかと。
リストを出しとくです
http://mirror.sarashi.com/webarchive/ruku.txt
http://mirror.sarashi.com/webarchive/2chpop.txt
http://mirror.sarashi.com/webarchive/dumper.txt
「URLリストを出されてもそれでどうしろと」とか言われそうですが
さあこっちでもどうしたものか。
全部合わせて2メガくらいのデータになるので
JavaScriptで検索するのはちと重そうですし
これ以上増える事もなさそうな静的ファイルなので
適当な検索CGIと連動させるようにでもしてみますか。
- 452 :名無しさん@勉強中 ★:08/01/28 21:02:27 ID:???
- ミラーをも一つ追加してみたです
>>451のリストファイルですが
dumper.jpさんのものはそのままでは使えないですね。
それぞれのミラーに対応するdatキーを拾わなければならなそうです
1500スレッドという事なので
手動でいちいち覗いて元スレを探すのはとてもとても。
それ用にスクリプトを考えたほうが速そうだ(って 出来るのかいな自分)
「急がば回れ」という奴ですか。
「労力を惜しむ為の労力を惜しまない」という言い回しもありますな
- 453 :名無しさん@勉強中 ★:08/01/29 19:29:03 ID:???
- メモ
JavaScriptによる全文検索エンジン - llameradaの日記
http://d.hatena.ne.jp/llamerada/20070123/1169566034
- 454 :名無しさん@勉強中 ★:08/01/29 19:58:53 ID:???
- JavaScript を用いて Brass Band Podcasting の全エントリを検索
http://blechmusik.xrea.jp/brasscast/search/
- 455 :名無しさん@勉強中 ★:08/01/30 21:46:19 ID:???
- 何かリロードバーボンがきついみたいなので
一時的にプレビュー表示をやめてみたです
何か言われてもへこむのでここで
ところで
このバーボン回避は他の方々どうされておられるのかとあちこち見てたら
けっこうミラーや中間サーバを出されている方もいらっしゃるんですね。
という訳でまた追加してみたです
こんな状態でこんな事するなんて
私は鬼か鬼なのか
- 456 :名無しさん@勉強中 ★:08/01/31 20:12:52 ID:???
- キャッシュサーバがカタチになられたようで。
【Love Affair】携帯からのアクセスに対する考察・次の一手 Part4 - ボーリング場
http://qb5.2ch.net/test/read.cgi/operate/1201374777/l50
調べようと思ったらsyoboonさんの所に。
syoboon - r.so
http://syoboon.asks.jp/82970.html
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
datはこっち
http://bg20.2ch.net/test/r.so/{server}/{dir}/{key}/
subject.txtはこっち
http://bg20.2ch.net/test/p.so/{server}/{dir}/
↑必ず最後のスラッシュは必要みたい。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
DinoSwiftさんの所もこれでリロードバーボン回避出来るようになるかも。
で、落ち着いたら自分のとこも
datget関係のスクリプトを全部見直してみますか。
- 457 :名無しさん@勉強中 ★:08/02/02 11:53:38 ID:???
- 何か本当に色々あるだなぁ・・・
【スレッド】2ch型掲示板 14 【フロート型】
http://pc11.2ch.net/test/read.cgi/php/1127896640/950-952n
いちおう書いてはみたですが
その前にまず
すっげー大事な事がひとつあるのです
これやるとしたら
まずPerlスクリプトの読み方からまず思い出さないと。
というか
勉強し直さないといかんです
付け焼き刃はこれだから。
- 458 :名無しさん@勉強中 ★:08/02/02 19:27:50 ID:???
- MOONGIFT: ≫ JavaScriptを使ってSQL調にデータを検索「JsonSQL」:オープンソースを毎日紹介
http://www.moongift.jp/2008/02/jsonsql/
VBAエンジン
http://www2s.biglobe.ne.jp/~iryo/java/java1/engform.html
最速インターフェース研究会 :: Ajaxを使ったシンプルなチャット
http://la.ma.la/blog/diary_200507290022.htm
- 459 :名無しさん@勉強中 ★:08/02/02 19:34:06 ID:???
- [JSAN] JavaScriptライブラリ検索 - JSAN Search Kawa.netブログ(川崎有亮)/ウェブリブログ
http://kawa.at.webry.info/200605/article_4.html
- 460 :名無しさん@勉強中 ★:08/02/03 09:23:59 ID:???
- 中国2chさん
トップに行ってみたら
http://cn2ch.cn
−−−−−−−−−−−−−−−
応該結束的遅早還是会結束
byebye
−−−−−−−−−−−−−−−
簡体字の読解力がそう高くないのでgoogle翻訳で繁体字に直して
本字を現代日本で使ってる文字に直してやっと理解出来たんですが
「ここ遅かれ早かれ終わりですバイバイ」って書いてあるのかなと。
掲示板をJaneNidaに登録してたんで知らなかったです。
ブログその他 リンクがないですがアクセス出来るですけど
何だか残念だなあ・・・
- 461 :名無しさん@勉強中 ★:08/02/03 12:01:43 ID:???
- メモ
実験中の何か
http://bbs.bp.to/
ボード一覧がずっと更新されておられないみたいですが
今まで読み込んだものでdat落ちしているものが読めたら嬉しいです(私が)
よく見てないですが。
2ちゃんねるログ勝手に保管所
http://metabolism.que.jp/logs/
- 462 :名無しさん@勉強中 ★:08/02/03 16:44:58 ID:???
- http://wota.jp/morningcoffee/maiha/read.php/1189468917/l10
http://2ch.auken.jp/?
http://cm.umu.cc/2ch.php
- 463 :名無しさん@勉強中 ★:08/02/04 20:12:34 ID:???
- >>457のスレッドで御返事があったので
また書いたですが
http://pc11.2ch.net/test/read.cgi/php/1127896640/950n-
そろそろ
「日本語でおk」
「○○まで読んだ」
みたいな茶々があってもおかしくないかなと。
てか
誰か替わってくんないもんかなー。
引き継いでくれる人が出てこないかなと切実に思うです
自分 Perlも携帯も絵文字もよくわかんないんで。
- 464 :名無しさん@勉強中 ★:08/02/04 20:24:44 ID:???
- メモ
携帯絵文字関連
日本語処理・携帯絵文字処理関係のperlモジュール
http://www.kawa.net/works/perl/i18n-emoji/i18n-emoji.html
プログラミング
http://onlyaffiliate.blog43.fc2.com/blog-category-33.html
絵文字を使いこなして見るためのページ
http://trialgoods.com/emoji/
おまけ
結構売れてるのね
Webプログラム制作【Potora】
http://potora.dip.jp/
- 465 :名無しさん@勉強中 ★:08/02/04 20:44:18 ID:???
- これがうまくいったら
絵文字表示出来る2chタイプのphpスクリプトもやってみますか
ってまた追い込もうとしてるのか自分
絵文字データベースと相互変換マッピングデータベースのJSONファイルを公開します。 : アシアルブログ
http://blog.asial.co.jp/330
- 466 :名無しさん@勉強中 ★:08/02/05 20:03:36 ID:???
- さて
Softbank携帯の絵文字の文字コード範囲を特定しようとしたら
何だか本家オフィシャルにも載ってないような。
まあ んなこたあないですよね。
私の目は節穴なので見つからなかっただけでしょう。
で
SoftBank携帯でShift_JISページのフォームから飛んでくる絵文字のバイナリコード - ゆどうふろぐ
http://d.hatena.ne.jp/Yudoufu/20071102/1193992749
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
ただ、自分で色々調べてて、どこにもこの件の情報がないので
あとからまたやる人は苦労するんじゃないかなーと思ってちょっとメモしとく事にしました。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
ゆどうふさんの心の広さ優しさに感動したです!ありがとうありがとう!
感謝感激ヒデキ還暦あと8年!
−−−−−−−−−−−−−−−−−−−−−−−
で、絵文字の範囲は、SoftBankの絵文字番号順に
1. [0xF9][0x41-0x9B]
2. [0xF7][0x41-0xF3]
3. ここでNo.264 - No.270がスキップ。
4. [0xF9][0xA1-0xED]
5. [0xFB][0x41-0xD1]
で、No.1 - No.478まで、でした。
−−−−−−−−−−−−−−−−−−−−−−−
- 467 :名無しさん@勉強中 ★:08/02/05 21:08:31 ID:???
- メモ
これでどうだろうか
$sjis = '[\x81-\x9F\xE0-\xEF\xFA-\xFC][\x40-\x7E\x80-\xFC]|[\x00-\x7F]|[\xA1-\xDF]';
$emoji_sb = '[\xF9][\x41-\x9B]|[\xF7][\x41-\xF3]|[\xF9][\xA1-\xED]|[\xFB][\x41-\xD1]';
$elem[3] =~ s/\G((?:$sjis)*)($emoji_sb)/$1.''.unpack('n',$2).';'/ego;
open(SBDATA,"<softbanksjisdata.txt") || die "can not open file02";
foreach(<SBDATA>){
chop;
@_ = split(/\t/);
$elem[3] =~ s/$_[1]/'<img src=..\/..\/..\/imgs\/j\/'.$_[0].'.gif>'/eg;
}
close(SBDATA);
どうだ全然わかんないだろう
自分も何が何やら。
まだ覚えていた頃に書いたコードを真似しただけですが
これで良いのかどうか。
とりあえず
$elem[3] =~ s/\G((?:$sjis)*)($emoji_sb)/$1.''.unpack('n',$2).';'/ego;
のunpack部分は違ってるかも。
これで合ってたとしても
softbanksjisdata.txtに書く変換表を478行用意しないとならないかも。
頭が痛くなりそうだ。
imodeとezwebの変換表の時はというと
公式にあったpdfファイルを印刷して一つ一つ手入力したですが
softbankにもそういう公式情報があったら嬉しいのですが。
- 468 :名無しさん@勉強中 ★:08/02/05 22:09:25 ID:???
- http://pc11.2ch.net/test/read.cgi/php/1127896640/961
投稿した直後から少し後悔してるです
尾を引きそうだ
- 469 :名無しさん@勉強中 ★:08/02/06 17:30:41 ID:???
- >>467
どうやらunpackで良さそうですね。
単に16進数表示させるようにしたいだけなんで。
http://tohoho-web.com/wwwperl2.htm#unpack
ところで、このコード中の$elem[3] ってーのにはdatファイル中の本文部分が入ってるんですが
名前やタイトルにも絵文字がある場合があるんで
その場合は$elem[0]と $elem[4]に書き換えれば良さそうですが
いっその事サブルーチンにしてしまえば楽なのかもです。
- 470 :名無しさん@勉強中 ★:08/02/06 20:16:33 ID:???
- さて
ReplaceStr.txtでも$EXTRACTを使えるようにして頂けたら
youtubeやnicovideoその他のサイトで
flvファイルへのリンクを出来るようになると思うんですが
要望してスルーされると寂しくなるしなー。
ImageViewURLReplace.datで代用出来たらいいんですが
画像のみみたいですし
うーむ・・・
- 471 :名無しさん@勉強中 ★:08/02/09 18:39:32 ID:???
- http://pc11.2ch.net/test/read.cgi/php/1127896640/963
絵文字コードを画像リンクにする方法ですが
薄皮を剥ぐように
うっすらと少しづつ
思い出してきたような気がします
覚えているうちに何かしておかないと
また虚空へかき消されてしまう
でも現実生活のほうでいろいろやらなければならなくて
余分な事する余裕が無さそう
ああこのジレンマ
- 472 :名無しさん@勉強中 ★:08/02/10 12:27:49 ID:???
- あれこれ調べながら読んでみて
ああこれ間違いなく私が書いたコードだなあと。
勿論あちこちのサンプルコードからコピペしたツギハギなんですが。
で、今までのコードだと
imode10進数とvodaphoneのそれが混同してしまってたっぽいのでちょっと手直し。
それにしても、vodaphoneって旧j-phoneにして現softbankって事になるんで
いやー目まぐるしいなあ。
で、色々見てみると
http://www.45ch.tv/
で出されていたEZwebビルトインアイコンの追加箇所がわかったので
それも追加してコードも変えてみようかなと。
ただ、コード範囲がよくわかんない。誰かまとめてないかなー。
まとめた方も居られるかもですが、見つからない場合は下のから特定しようかと思うです
EZwebの絵文字(全部)
http://cgi.wap2.jp/emoji/ezweb/?act=table
ついでに見てみると
DocomoとAUはうまく絵文字コード住み分けされてるんだなあと。
EZwebの絵文字(全部)
http://cgi.wap2.jp/emoji/ezweb/?act=table
開発者(カッケー!)側からしてみると
softbank絵文字ってほんとエイリアン来襲みたいな感じだと思ったり思わなかったり。
- 473 :名無しさん@勉強中 ★:08/02/10 13:48:36 ID:???
- >>471の全部コードから書き出してやってみたら
うまくいっている模様。
>>466のゆどうふさんに倣い書いとくです
EZwebの絵文字コード範囲は
[0xF3][0x40-0x7E,0x80-0xFC]
[0xF4][0x40-0x7E,0x80-0x93]
[0xF6][0x40-0x7E,0x80-0xFC]
[0xF7][0x40-0x7E,0x80-0xA8,0xAC-0xFC]
みたいです。
- 474 :名無しさん@勉強中 ★:08/02/10 17:48:54 ID:???
- いちおう出来たっぽいのでお伺いしてみたです
http://pc11.2ch.net/test/read.cgi/php/1127896640/965-966n
ウザいですかそうですかごめんなさい
- 475 :名無しさん@勉強中 ★:08/02/10 18:41:00 ID:???
- http://pc11.2ch.net/test/read.cgi/php/1127896640/967
まあ予想出来ていたので別にいいです
まともな反応が無ければこの件それまでという事で
関係ないですが
後の推移を見るにつけ
「作るんじゃなかったなーこれ」
というものが結構ありますね。
具体的にはよう言わんですが
500KB
続きを読む
掲示板に戻る 全部 前100 次100 最新50