テレワークならECナビ Yahoo 楽天
LINEがデータ消費ゼロで月額500円〜!
無料ホームページ 無料のクレジットカード 海外格安航空券 海外旅行保険が無料! 海外ホテル
■掲示板に戻る■ 全部 1- 101- 201- 301- 401- 501- 601- 701- 801- 最新50
メモ4
- 1 :名無しさん@停滞中 ★:08/06/17 20:07:26 ID:???
- はてさて思いついた事など
- 200 :名無しさん@停滞中 ★:09/01/31 22:26:47 ID:???
- dat落ちと共に見えなくなりました
ははははは
最近あちこち不調な感じで
当方もけっこう影響されている予感。
無意味な事を書いてるのもそのひとつなのかも
- 201 :名無しさん@停滞中 ★:09/02/04 21:50:57 ID:???
- 備忘メモ
並び替え
37a
41
51
52
- 202 :名無しさん@停滞中 ★:09/02/06 20:08:30 ID:???
- http://mirrorhenkan.hp.infoseek.co.jp/senji/cgi-bin/test/read.cgi/senji/1218847084/3
今頃気付イタデスガ
デハマトメテミマスカ
ニシテモ需要アルンデセウカコレ
- 203 :名無しさん@停滞中 ★:09/02/08 10:50:06 ID:???
- いろいろ読み散らかしてるのですが
で 不確定でガセネタかもなのですが
どうもカタカナ書きの場合は「音写」といって
実際に発音するような書き方をするものらしいようなそうでないような。
つまり カタカナでは歴史的送り仮名は使わないのが本筋なのかも。
>>202の場合
×需要アルンデセウカ
○需要アルンデショウカ
という事なのかもしれないです
・・・と書いてから大日本帝国憲法を見てみたら
やはりガセなのかなとか。
噂を信じちゃいけないのかも
http://www.houko.com/00/01/M22/000.HTM
- 204 :名無しさん@停滞中 ★:09/02/08 10:56:12 ID:???
- えーと
2chcacheさんの所とDinoSwiftさんの所とbokoboko.jpさんの所がしばらく工事中みたいですが
自分に言われてもわかんないですごめんなさい
という事で返信に代えさせて頂きたく。
- 205 :名無しさん@停滞中 ★:09/02/08 12:17:44 ID:???
- >>186のようなブックマークレットを自分も考えてみたりして
一番シンプルにやろうとするとこうなるかな
これ以上削れないですよね
javascript:location='http://www.geocities.jp/mirrorhenkan/url?u='+location;
ついでに別窓表示用も
javascript:(function(){y=window;hoge='http://www.geocities.jp/mirrorhenkan/url?u='+location;y.open(hoge,'_blank','');})()
別窓表示用なんですが
何かかなり込み入ってしまって美しくないなぁ
おいおいもっと判りやすく出来んのかコラと
あとポップアップ抑制が働いてるとてんで駄目駄目(ってこれに限らないんですが)
- 206 :名無しさん@停滞中 ★:09/02/13 17:21:50 ID:???
- メモ
http://epinkcartridges.com/reference0150/030.html
- 207 :名無しさん@停滞中 ★:09/02/18 19:13:51 ID:???
- 思うところあり
live5サーバのものの場合はアラート表示させるようにしてみたりして
あとクラシックメニューなんですが
キャッシュが以前と比べてかなり長いこと残っているようになってきたような。
前は半日も保たなかったように思うですが。
誤解を恐れずに無礼な言い方をすると
他のミラーサイトのように 天狗の仕業なのかもしれないかもしれない
まあ気のせいかもしれないかもしれない
まあ色々ありますわな
- 208 :名無しさん@停滞中 ★:09/02/18 19:21:24 ID:???
- あと一応出してみたです
indexを作ってリンクさせてみただけ
零局掲示板を正假名遣ひ表示せしむる試み
http://mirrorhenkan.hp.infoseek.co.jp/meiji/
これの變換辭書ですが
http://yy14.kakiko.com/test/read.cgi/mirror/1186175383/672,679,688
で助けて戴いたものを參考にさせて戴きましたです
ありがたう御坐いました
でもまだまだだ
送り仮名とかさっぱりだし
品詞分解とか調べれば調べるほど泥沼な感じで
ぐああああ
- 209 :名無しさん@停滞中 ★:09/02/20 09:15:27 ID:???
- 疑問メモ
ある文章の中にある単語を全て別の単語に置換するには
(1)一文字づつ取り出して比較してマッチしなかったらさらに一文字追加してというループ
(2)正規表現置換
のどちらのほうが負荷が少ないのだろうか?
具体的に書くと
文章str中にある変数orgを全部distに置換するのを
JavaScriptでやるなら
(1) 正規表現を使わない場合
function s(str,org,dist){
var j=pt=0;
var bef;
var res = "";
while((pt=str.indexOf(org))>-1){
// if(str=="")break;// for NN2 重要!!
bef=str.substring(0,pt);
str=str.substring(pt+org.length,str.length);
res+=bef+dist;
}
return res+str;
}
(2) 正規表現置換
function s(str,org,dist){
while(str.match(org)){
str=str.replace(org,dist);
}
return str;
}
(1)は「まるやるま君」から引用させて頂いたです。
(2)はもっと簡略化して一行で出来るかもですが、ちょっと今の所の自分の知識ではわかんなかったです
で、これらを慣れないPerlで書き直したとして
どちらのやり方のほうが良いのかと。
http://yy14.kakiko.com/test/read.cgi/mirror/1186175383/672,679,688
の辞書だと11000種類くらい置換することになるのですが
それだと流石にサーバエラーになりましたし。
もちろん登録辞書の取捨選択がまだまだ必要なんでしょうけど。
- 210 :名無しさん@停滞中 ★:09/02/21 20:54:10 ID:???
- ちなみに前も出したですが
まるやるま君はこれ
「正(旧)仮名遣ひ⇔現代(新)仮名遣い」相互変換〜まるやるま君
http://hp.vector.co.jp/authors/VA022533/tate/komono/Maruyaruma.html
これすごい。
何がすごいって、使っているJavaScriptのソースを見てみると
正規表現を一切使ってないっぽい。
サブルーチンが28個あるんですが
どれもこれも 上で出したように
「一文字づつ取り出して比較してマッチしなかったらさらに一文字追加してというループ」
を使ってるみたい。
だもんで パッと見だけだと何やってるコードなのかとかよくわかんなかったです
って自分のスキルを棚に上げて何言ってるのだろう
いや、もちろん漢字等の変換データベースはもっとすごいんですが。
すっげー参考になるです
漢字変換とか送り仮名とか
- 211 :名無しさん@停滞中 ★:09/02/22 19:00:46 ID:???
- nicovideo.jpですが
何で台湾版のページだけレイアウトや色使いが違うのかなと思ったです
あと動画が自動スタートするのも。
それはそうと
是非プラグインを更新して欲しかったりします
有被寫入ニコニコ大百科的台灣人們
http://tw.bbs.nicovideo.jp/test/read.cgi/user/1234452580/
上のスレッドを
プラグイン更新したら下のように表示されるので。
http://mirror.s151.xrea.com/2ch/0chu/test/read.cgi/utf8/1213148768/9n
あと思ったのは
ニコニコ大百科って引用用(←何これ)のフレームリンクタグとか用意してないのかな。
そのタグがわかれば
http://tw.bbs.nicovideo.jp/test/read.cgi/user/1234452580/1-3
のようなものもフレーム表示可能になるんですが。
- 212 :名無しさん@停滞中 ★:09/02/23 17:31:23 ID:???
- メモ
http://pc11.2ch.net/test/read.cgi/php/1207196460/171-173n
- 213 :名無しさん@停滞中 ★:09/02/24 07:50:12 ID:???
- メモ
unkar.jpさんのdatの在所
http://unkar.jp/read/dubai.2ch.net/ghard/1231972881
↓
http://unkar.jp/2ch/dat/dubai.2ch.net/ghard/1231/1231972881.dat
もどきもどきさんの所も
dat取得出来るようにして下さったですね。
- 214 :850:09/02/24 17:38:15 ID:RKeU6iwY
- 某所の plugin をひっそり更新。
- 215 :名無しさん@停滞中 ★:09/02/24 22:28:31 ID:???
- うおっ
>>214さん
どうもです。
ひっそり確認させて頂きましたです
ありがとうございます
あと思ったのですが
http://tw.bbs.nicovideo.jp/test/read.cgi/user/1235447290/
上の方のTDLが「net」になっているです
たぶんhttp://hinet.net/のプロバイダの方だと思うので
これをtw表示に変更するとするなら
/test/module/vara.pl の140行目あたり
−−−−−−−−−−−−−−−−−−−−−−−−
@domain2 = split(/\./,$domain);
if ($domain2[-2] eq "bbtec" || $domain2[-1] eq "jp"){
$country = "jp";
}else{
$country = $domain2[-1];
}
−−−−−−−−−−−−−−−−−−−−−−−−
上記コード2行目を下のものに直して頂けたら
tw表示されるようになるのではないかと。
というか やって頂けたら嬉しいです
−−−−−−−−−−−−−−−−−−−−−−−−
@domain2 = split(/\./,$domain);
if ($domain2[-2] eq "hinet" || $domain2[-1] eq "tw"){
$country = "tw";
}else{
$country = $domain2[-1];
}
−−−−−−−−−−−−−−−−−−−−−−−−
ちなみにこのトリップの方ですが
http://jbbs.livedoor.jp/bbs/read.cgi/otaku/12064/1225372121/
でも同じものを使って投稿されているですね。
Shift_Jis/UTF-8のどちらでも同じトリップという事は
2バイト文字(or3バイト文字)を使ってないのかな。
それにしてもTLD表示されるのは見てて面白いです(読めないけど)
http://es.bbs.nicovideo.jp/test/read.cgi/user/1223541658/とか見ると
スペイン・チリ・メキシコ・アルゼンチン・イタリア・コロンビア・カナリア諸島
・・の各所から本当に見てるんだなーと。
- 216 :名無しさん@停滞中 ★:09/02/25 20:13:05 ID:???
- 面白そうだったのでメモ
http://mirror.s151.xrea.com/2ch/0chu/test/read.cgi/utf8/1213148768/10n
これ投稿する為に管理画面から投稿文字数制限を一旦緩和したのですが
キャップ付きだとそういうのスルーして投稿出来るようにとかなってないのかな>0ch
- 217 :名無しさん@停滞中 ★:09/02/28 01:17:55 ID:???
- 久しぶりにperlのスクリプトを見てみたですが
他所のスレッドの歴史的仮名遣い変換プロキシCGIとか
偽AASを普通に使えるようにプチハック(カッケー!)するとか
時間と余裕があれば何とかなりそうだなと思ったですが
時間も余裕も何もないというのは何とも悲しいものですな。
後者とか
ほんとに何とかしときたいものです
- 218 :名無しさん@停滞中 ★:09/03/01 23:38:36 ID:???
- 0chのyoutube/nicovideoプラグインを更新したです
youtubeのユーザーページも表示させるように
http://mirror.s151.xrea.com/2ch/0chu/test/read.cgi/utf8/1213148768/11-12n
このプラグインなんですが
文字コードをShift_Jisにすれば普通の0chスクリプトでも使えるですけど
誰か使ってるのかな
- 219 :名無しさん@停滞中 ★:09/03/04 17:19:35 ID:???
- 長々書いて一晩ほっぽらかした文章を読み返したら
何とも子供っぽい事書いてる感じ。 あー恥ずかし
何だかいろいろ恥ずかしい
でも折角なので投稿
Perlの勉強がてらdat2html-9を設置してみたです
面白かったし勉強になったんで車輪の再発明でも何でもいいや
というかごめんなさいごめんなさい
http://mirror.s151.xrea.com/dat2html/dattohtml.pl
これやるのにPerlでのwebデータ取得方法いろいろ見たですけど
いやーLWPってSocketと比べると楽ですね。
ところで
偽AASをやってる時はまったくもって全然わかんなかったもんで
phpで取得したデータをperlスクリプトに渡して画像生成してたのですが
その時のデータ渡しにquery_stringを使っているのが原因で
肝心の携帯からはほとんど使えないものになっているのかなと。
今回やった事をこっちにも応用すればもっと何とかなりそうな気がするです
って何書いてるのだろう
そういえば
前スレ552でtakatyanさんが●取得のperlスクリプトを見せて下さって実に勉強になってるのですが
最初の宣言で
use Socket; # Socket モジュールを使う
use PerlIO;
use File::Temp;
use LWP::UserAgent;
とあるのですが
至らぬ頭でスクリプト本文を見てみてるですが
どの辺りでSocketを使っておられるのかよくわかんなかったですごめんなさいごめんなさい
何だか通信部分はみんなLWPモジュールのような
って見当違いの事書いてるかもですが。
もしかしたらLWPモジュール使うためにはSocketモジュールも必要なのかな
- 220 :名無しさん@停滞中 ★:09/03/04 19:31:59 ID:???
- メモ
Perfume@2ch - 2ch Perfumeスレ 過去ログ保管サイト
http://www9.atpages.jp/perfume2ch/
実に興味深いです
プログラマー板の該当スレッドから出てこられたですし
開発メモとか充実してきそう
プログラマならPerfume好きだよな?
http://pc11.2ch.net/test/read.cgi/prog/1192077471/438n-
生datも出しておられたので
dat2html-9のお試しをしてみたりして
http://mirror.s151.xrea.com/dat2html/dattohtml.pl?http://www9.atpages.jp/perfume2ch/dat/1235998833.dat
- 221 :名無しさん@停滞中 ★:09/03/04 20:05:38 ID:???
- どうでもいい追記
まとめをまとめるんなら
下のも追加してもいいのではと思ったり思わなかったり
BEE-HIVE寮生中継@実況ch 過去ログ
http://www.geocities.co.jp/Hollywood-Cinema/4394/bhive/
- 222 :名無しさん@停滞中 ★:09/03/04 23:42:30 ID:???
- メモ
過去ログ検索
http://gline.zapto.org/log/
スレッドのhtmlを見ると、もどきもどきさんと同じシステムっぽいので
同じ方の所なのかな
- 223 :名無しさん@停滞中 ★:09/03/04 23:57:03 ID:???
- メモ
なんにもないところ
http://wmalhmgkw.asks.jp/
象牙の塔+
http://yy13.kakiko.com/ivorytowerplus/
【amour】AASで携帯からも長編AAを楽しもう―Ascii Art Scope Part1
http://qb5.2ch.net/test/read.cgi/operate/1109904456/
【amour】AASで携帯からも長編AAを楽しもう―Ascii Art Scope Part2
http://qb5.2ch.net/test/read.cgi/operate/1116860602/
- 224 :名無しさん@停滞中 ★:09/03/06 19:08:50 ID:???
- http://tw.bbs.nicovideo.jp/test/read.cgi/user/1234597813/9-11n
を見ると
>>215の件 こっそり対応して頂けたみたいで
ありがとうございます
にしても
そろそろまたperlを忘れはじめてきてるようだ
自分が何書いたのかよくわかんなくなってきてるみたいだし
あとあれだ
>>215をざっと読んでて突っ込み入れたくなったのだが
「TDL」って何よと。東京ディズニーランドがこことどう関係あるのよと
スペルミスどころか 何もわかってない証拠ではないかと
java.lang.NullPointerExceptionを経験せずに「ぬるぽ」と常用してるようなものではないかと
だがだが
.NET FrameworkではNullReferenceExceptionなのだすなわちぬるり
ごめんなさいです
- 225 :名無しさん@勉強中:09/03/07 08:55:57 ID:52qSZAW5
- >>219
●セッションID取得スクリプトを書いた者ですが・・・
確かにSocketモジュール使ってませんね・・・
で、Socketモジュールのuse文を消しても動いたので要らないみたいです
あははは・・・
そのスクリプトは「動けばいいや」という考えで作ったのでムダが多いようです。
- 226 :名無しさん@停滞中 ★:09/03/08 22:06:46 ID:???
- 非常に忙しいのです
今夜は徹夜かな
>>225
いえ、何だかすみません
別にクレームとかでは全然ないのです
ごめんなさいごめんなさい
動けばいいのです
ムダがあっても構わないのです
私からムダを取り除いたら残るのは無だ
あははははは
「遊びをせんとや生まれけり」とか言いますな。
そういえば以前 情報処理の教科書を見た事があるですが
もし自分が今遊んでるような事を授業で教わってたとしたら
どうなってたかな
ズルズルと苦手意識を引きずり続けていたかもしらないな
とか思ったりしたです
とにかく自分は理解が遅い
1年や2年放ったらかしにしてやっと理解出来たような事が結構あるですし
即戦力とか何それと
- 227 :名無しさん@停滞中 ★:09/03/08 22:25:24 ID:???
- 関連
【2ch】ニュー速クオリティ:勉強を『趣味』とする若者・オッサンが増加
http://news4vip.livedoor.biz/archives/51262819.html
todoメモ(カッケー!)
・クラシックメニュー説明文の文字を小さく
・その20のdat化説明リンク追加
・その37aのdatリンク追加
・その31のdatリンクに注釈追加
・その41のdatリンク追加
・その35をdattohtml.pl経由に
まだありそうだがこのくらいにしとこうか
- 228 :名無しさん@停滞中 ★:09/03/08 22:54:49 ID:???
- メモ
2ch画像まとめbeta
http://pic2ch.giox.org/
GIOの日記
http://d.hatena.ne.jp/gioext/
Ruby使いの方みたい。日記が面白いです
でも皆考える事は同じなのだなと。
perlだと下の2スレッドとかありますし
2ちゃん画像落としまくりスクリプト
http://pc11.2ch.net/test/read.cgi/unix/1003833552/l50
【Perl】勉強したい人協力したい人ドゾー【PHP】
http://pc11.2ch.net/test/read.cgi/php/1160569533/l50
2番目のスレッドなんですが
残念な事にサイトが消えてるみたいです
そこで配布されていたスクリプトを自分とこに設置したものが生きてたですが
サーバ移動とかで今の所動かないみたい
2ch IMAGE thumbnail -Top-
http://mirror.s11.x-beat.com/im/
あとこういうのも
ゆーすけべー日記: いかにして効率よく大量のおっぱい画像をダウンロードするか
http://yusukebe.com/archives/07/10/15/174049.html
Kawasaq通信 いかにして効率よく大量のおっぱい画像をダウンロードするか。おっぱいマニア編
http://kawasaq.blog56.fc2.com/blog-entry-97.html
こういうのってADODB.streamを使ってwshでも出来そうです
余裕が出来たらやってみようかな
- 229 :名無しさん@停滞中 ★:09/03/09 01:13:08 ID:???
- メモ
nika's forum(http://nika-2ch.net/)のdat化について
URL例
http://nika-2ch.net/bbs/bbs.php?http://jfk.2ch.net/test/read.cgi/news4vip/1226231604/
http://nika-2ch.net/bbs/bbs.php?http://ex21.2ch.net/test/read.cgi/tv/1160283735/
正規表現
m#<dt><a.+?>\[(\d+)\] <font.+?>(.+?)</font>(?:\[<a.+?>(.+?)</a>\])? : (.+?)<dd> (.+?)(<dt>|</dl>)#mik
前処理
s#( )<a target="_blank" href="http://be\.2ch\.net/test/p\.php\?i=(\d+)&u=.+?>\?(.+?\(\d+\))</a>(<dd>)#$1$3-BE:$2 $4#igk
s#(<dd> ?)<img src="http:/?/(img\.2ch\.net/ico/.+?)">#$1sssp://$2#igk
;s#<table.+?><tr><td><table.+?><tbody><tr><td.+?><a.+?>ニコニコ動画</a><br><a href="(http://.+?\.nicov
ideo\.jp/watch/)" target="_blank">.+?</a></td></tr></tbody></table></td></tr></table>#$1#igk
変換結果式
メール欄逆転
後処理
s#(^|\n)(.*?)<font.+?>(◆.+?)</font>(<>)#$1$2</b>$3<b>$4#igk
>>185で出したものを少し手直し。
beアイコンをsssp://に変換出来てなかったものを出来るように。
あとタグが変わったみたいで
>>185のものだと前処理が原因でマッチしなくなっていたのでそこをコメントアウトしたです
なのでニコニコ動画の<table>タグがそのままになっちゃってるんですが(上のレス342等)
そこのタグ構造がやたら入れ子状態になっててややこしいので今の所は棚上げという事で。
- 230 :名無しさん@停滞中 ★:09/03/12 01:57:09 ID:???
- >>229
> >>185のものだと前処理が原因でマッチしなくなっちゃっていたので
の件ですが、該当部分をメモしておくと
s#(<dd>)<img src="http://(img\.2ch\.net/ico/.+?)">#$1sssp://$2#igk
の部分。
IEやFireFoxやBagelやChromeでは問題ないのですが
Janeだとhttp://の後のカッコが下のように「%28」と表示されちゃうです
s#(<dd>)<img src="http://%28img\.2ch\.net/ico/.+?)">#$1sssp://$2#igk
これでマッチしなくなってしまったと。
で、しょうがないのでJaneでも数値参照表示にならないように無意味に「?」を入れてみたという事で
s#(<dd> ?)<img src="http:/?/(img\.2ch\.net/ico/.+?)">#$1sssp://$2#igk
それはそうと
http://pc11.2ch.net/test/read.cgi/software/1168136526/88-
を読み直して
猛烈に凹んでしまったです
ってあれから2年2ヶ月経ったのですか
- 231 :名無しさん@停滞中 ★:09/03/14 21:35:18 ID:???
- 私的メモ(ほんとにメモ)
http://kr.geocities.com/tokumeikiboh2002/nida-utf8.png
http://kr.geocities.com/tokumeikiboh2002/janenida20090314.png
http://kr.geocities.com/tokumeikiboh2002/janenida20090314a.png
ひろゆき基礎be番号
例
http://qb5.2ch.net/test/read.cgi/operate/1207973589/1
元http://be.2ch.net/test/p.php?i=25722
現在 21
基礎be番号変更
http://pc11.2ch.net/test/read.cgi/software/1178892330/962
- 232 :名無しさん@停滞中 ★:09/03/14 22:47:13 ID:???
- という事で投稿
http://pc11.2ch.net/test/read.cgi/software/1235576863/272-273n
またへこむ事になるかな
- 233 :名無しさん@停滞中 ★:09/03/15 11:46:45 ID:???
- >>227の件
別窓用のものだけやってみたです
ついでにタグも見直していろいろ直して
疲れちゃった
http://pc11.2ch.net/test/read.cgi/software/1235576863/275
えーと
疲れちゃったので後で
(ってココ見ておられるかもなので何ですが)
JaneNida070202では確かに表示されてるですね
http://kr.geocities.com/tokumeikiboh2002/janenida20090315.png
- 234 :名無しさん@停滞中 ★:09/03/16 20:10:06 ID:???
- http://pc11.2ch.net/test/read.cgi/software/1235576863/282
結局長々と書いてしまったかと思ったが
かといってどのようにすればもっと簡潔になったのかとか考えても泥沼だなと
結局長々と以下ループ
長々と書くのも何なので書かなかったけど
Janeやかちゅ〜しゃやホットぞぬやえまのんを使っている海外の方々というと
すぐ出てくるものでいえば例えば下のものとか。
http://mamono.2ch.net/test/read.cgi/morningcoffee/1202812325/169
http://wwwww.2ch.net/test/read.cgi/news4vip/1185818693/216
http://wwwww.2ch.net/test/read.cgi/news4vip/1124860158/243,249
http://dubai.2ch.net/test/read.cgi/morningcoffee/1234358772/222
つくづく思ったのだけど
自分は何て思慮が浅いのだろうと恥ずかしくなったです
注意力と忍耐力が決定的に足りない
体力持久力など言わずもがな
- 235 :名無しさん@停滞中 ★:09/03/17 19:09:34 ID:???
- メモ
ヴァルダ速報(http://varda2.com/)のdat化について
http://varda2.com/~eila/gsearch.cgi
URL例
http://varda2.com/~eila/read.cgi?sure=1237205224
http://varda2.com/~eila/read.cgi?sure=1237112092
http://mirror.sarashi.com/htmltodat/1237112092.html
正規表現
m#<DT>(?:<A.*?>)?([0-9]+).+?<B>(.*?)</B></FONT>\[(.*?)\].+?:(.*?)<DD>(.*)<BR><BR>#mik
変換結果式
メール欄逆転
beアイコンは最初から省略してあるみたい。
例えばURL例1を見てみると
(元スレhttp://tsushima.2ch.net/test/read.cgi/news/1237205224/)
生datにはレス1の本文最初に「sssp://img.2ch.net/ico/kantoku.gif」があるんですが
ヴァルダ速報さんのところで生成したhtmlでは該当するものが見当たらない感じです
- 236 :名無しさん@停滞中 ★:09/03/18 00:26:44 ID:???
- メモ
http://logs.dreamhosters.com/new2ch/ のdat化について
URL例
http://logs.dreamhosters.com/new2ch/datview.php?res_id=all&thread_id=1212582636&board=news
http://logs.dreamhosters.com/html/1/212/582/news_1212582636.shtml
http://mirror.sarashi.com/htmltodat/1212582636.html
正規表現
m#(?:</h1>|<br><br>)([0-9]+):()<span.+?> ?(.+?)<?/span>:(.+?)<br>(.+?)(<br><br>)#mik
前処理
s#(<span.+?>.*?)(◆.+?)( ?<?/span>)#$1</b>$2<b>$3#igk
s#(<span.+?>)([^◆]+?)(<?/span>)#$1</b>$2<b>$3#igk
前処理2行目は名前欄がランダム名無しの場合用なので
不要な場合(ランダム名無しでない場合)は消して下さいです
あと 上の元スレ(http://namidame.2ch.net/test/read.cgi/news/1212582636/)を見ると
レス3にsageがあったりしますが
こちらのhtmlには無いので、メール欄は最初から省略されてるみたい
- 237 :ソー ◆ROCKET7pV2 :09/03/20 17:49:04 ID:oWniSr2R
- 初めまして、>>8のサイトの中の者です。
たまたまココ見付けちゃいました。
ご意見、参考にさせていただきます。
正規表現を使った理由は、bbs2chreaderでスレを開いた時のためだったりします。
ちなみにVC++は人に教えられるほど詳しくはないです。
- 238 :名無しさん@停滞中 ★:09/03/21 04:15:59 ID:???
- おおこれは
>>237
はじめまして。見付けられちゃいましたか。
何だかごめんなさい
修正なさったブックマークレット、勉強になりましたです。
RegExpそのままで使えるんですか。いつも変数代入ばかりで知らなかったです
そういえばbbs2chreaderってUTF-8の外部板の読み込みとかも出来るのかな。
改造とかもやれば出来るのかな
最近、いろいろと自分が無知で身の程知らずなのだなあと痛感し反省する毎日なので
勉強しなければいかんなあと。勉強するぞ勉強するぞと。
うむやはり何が言いたいのだと
- 239 :名無しさん@停滞中 ★:09/03/21 09:04:34 ID:???
- メモ
pinkちゃんねる過去ログ倉庫(http://pink2ch.net/)のdat化について
URL例
http://pink2ch.net/avideo/1056502003.html
正規表現
m#<dt>(\d+)<a.+?></a> :<font.+?>(?:<a.+?mailto:(.+?)">)?<b>(.*?)</b>(?:</a>)?</font>:(.+?)<dd>(.+?)<br><br></dd>#mik
- 240 :ソー ◆ROCKET7pV2 :09/03/21 11:16:19 ID:2BUtxFKr
- >>238
bbs2chreader0.4.19でUTF-8の外部板を読ませてみたら文字化けしました。
開発版の更新履歴をざっと見てもUTF-8に関する記述は見付けられなかったので
現状では無理っぽいですね。
- 241 :名無しさん@停滞中 ★:09/03/23 01:14:21 ID:???
- 余裕がないのです
自分の能力の低さに悶絶しておる最中でして
うう
>>240
そうでしたか。まあ当然なのだろうな。。
- 242 :名無しさん@停滞中 ★:09/03/28 22:53:44 ID:???
- メモ
だるまのエクセルVBA
http://members3.jcom.home.ne.jp/daruma_kyo/index.html
- 243 :名無しさん@停滞中 ★:09/04/04 10:48:10 ID:???
- http://qb5.2ch.net/test/read.cgi/operate/1237458856/980-993n
・・・。
- 244 :名無しさん@停滞中 ★:09/04/18 18:54:47 ID:???
- さて
リハビリがてらIPから国を識別するスクリプトをやってみたです
ipaddr2cctld
http://mirrorhenkan.hp.infoseek.co.jp/tld/
上のフォームに
http://www.cybersyndrome.net/plr5.html
にあるようなIPをいろいろ突っ込んでみたですが
何とかなってるみたい。
参考にさせて頂いたサイトおよびスクリプトは
http://yy14.kakiko.com/test/read.cgi/mirror/1014655362/869
で出した下記
不正アクセスの発信地の国別統計をとろう!
http://www.nminoru.jp/~nminoru/memo/ip-address/what_country_from.html
ただ、ここで出されていたIPと国の対応リストを試しにやってみたら
自分自身のIPが未対応だったもんで大いに躓いたです
下記
http://www.nminoru.jp/cgi-bin/ipaddr2cctld/index.cgi
で、仕方がないので
お出しになられているperlスクリプトを使って最新版を作ろうとしたら
チンプンカンプンで全然わからない。
PCにperlを入れてそこから実行するタイプみたいだけど
自分のマシンにperlを入れても多分全く使わないと思うのでそれはやめて
スクリプト本文を理解するのに努めたです
ビットシフトとかその辺り結構難しかったー。
で、何とか各NICから提供されている4/8版のリストから作ったファイルがこちら
Nakamuraさんのファイルだと670kbくらいでしたが
何だか2.6メガくらいになったです
http://mirrorhenkan.hp.infoseek.co.jp/tld/cgi-bin/ipaddr_to_cctld.txt
ちなみに何をやりたいかというと
ドメイン逆引き出来ないIPやcom/org/net/info等のホストがあったら
それらを国表示させてみたいなと。
パッケージ化出来たのであとは0ch本体に組み込むだけです
ってその前にやる事が色々あるですが
それらはおいおいと。
- 245 :名無しさん@停滞中 ★:09/04/18 19:34:25 ID:???
- ちなみに
日本でのcom/net/org/info表示されるhostって
どこかに一覧が無いのかな。
2chcacheさんの所のnotice.htmlで以前見たですけど
今は?がらないですし。
せめてその件だけでも教えて頂けたら
この上なく嬉しいのですが(私が)
- 246 :名無しさん@勉強中:09/04/22 16:06:49 ID:E+Y3iKCU
- その39管理人です。
メールにnotice.htmを添付して送りました。ご一覧の程を
- 247 :名無しさん@停滞中 ★:09/04/22 20:38:07 ID:???
- うおっ
こここここれはっ
>>246
どうもお久しぶりです。メール受け取りました。色々参考になります。
いやー・・・
色々ありますよね。
ちなみにDinoSwiftさんのほうはというと
普通にお元気みたいです(ってmixiでしかわからないですが)。
あとルクダルさんとかも。
# 共に全体公開設定されておられるのでこれくらいはいいかなと
という訳で(?)
今後共宜しくお願い致します。
- 248 :名無しさん@停滞中 ★:09/04/25 20:15:39 ID:???
- あと讃岐さんもお元気みたい
前スレ300の件はmixi内の讃岐さんの文章がソースだったんですが
まあそれはそれとして
http://mirrorhenkan.hp.infoseek.co.jp/senji/cgi-bin/test/read.cgi/senji/1218847084/4-5n
しょうがないのでjcode.plを使って
日本語の文字列が無い場合は撥ねるようにしてみますか
require("./jcode.pl");
if (&chkZenkaku($in{'value'}) ne 'sjis') { &error("エラー","内容文に日本語コードが検知できませんでした。","半角文字のみの投稿は規制されています。"); }
- 249 :名無しさん@停滞中 ★:09/04/27 19:08:38 ID:???
- メモ
良い子は見ちゃダメだよ!
「エロドーガの塔」
http://www.jpmobi.net/
アダルトDVD探検隊
http://avideo.s13.dxbeat.com/
保管されているスレッドのdat化用正規表現は・・・どうしようか(^^;
- 250 :名無しさん@停滞中 ★:09/04/28 19:38:05 ID:???
- うーむ
うまくいかぬ
URL例
http://www.jpmobi.net/thre.php?pg=1
正規表現(長過ぎるので適宜改行してます)
m#<a name="\d+"></a><div class="header"><span class="no"><a href="menu:\d+">([0-9]+)</a></sp
an><span class="name_label"> 名前: </span><a class="name_mail" href="mailto:(.+?)"><b>(.+?)</b></a><sp
an class="mail"> \[.*?\]</span><span class="date_label"> 投稿日:</span><span class="date">(.+?)</sp
an></div><div class="mes">(.+?)</div>
#mik
なぜマッチしないのだろう
文章が長すぎるのだろうか
私の頭が悪過ぎるのだろうか(←多分正解)
どの辺りがまずいのか 何方か教えて頂けたら嬉しいです(私が)
- 251 :名無しさん@停滞中 ★:09/04/28 19:43:33 ID:???
- ああそうか
メール欄無いケースを忘れてた
でもレス1はマッチしても良さそうなんだけどな
何かあらゆる方面で自信がなくなりつつあるです
もともとないのだけども
- 252 :名無しさん@停滞中 ★:09/05/01 17:17:34 ID:???
- メモ
JavaScript Samples
http://javascript.eweb-design.com/index.html
- 253 :名無しさん@停滞中 ★:09/05/01 17:29:09 ID:???
- ところで
http://es.bbs.nicovideo.jp/test/read.cgi/user/1216436132/19
「mexdf」というTLD(とは言わないだろうけど)・・・どこなのだろう?
ググってもよう判らぬ
メキシコなのかな。
- 254 :名無しさん@停滞中 ★:09/05/02 09:19:00 ID:???
- メモ
過去ログ補完所
http://kumasan.ddo.jp/kakolog/
- 255 :名無しさん@停滞中 ★:09/05/02 12:53:03 ID:???
- メモ
2ch.sagac.info(http://2ch.sagac.info/)のdat化について
URL例
http://2ch.sagac.info/2ch/takeshima.2ch.net/test/read.cgi/news4vip/1241170949/
http://mirror.sarashi.com/htmltodat/1241170949.html
正規表現
m#<a.+?></a><dt>([0-9]+) :(?:<a href="mailto:(.+?)">|<font color=green>)<b>(.+?)</b>(?:</font>|</a>):(.+?)<dd>(.+?)<br><br>#mik
前処理
s#(<title>.+?)画像>\d+枚 YouTube動画>\d+本 (</title>)#$1$2#ik
s#</?(?:object|embed|param).+?>##igk
s#<a rel="nofollow" href="/h2ch\.php\?url=(.+?\.youtube\.com/watch\?v=.+?)" target="_blank">#http://$1#igk
s#\n<br>.+?(?=\n)##igk
s#<img src=(https?://.+?\.(?:jpe?g|gif)) alt="" border=no />#$1#igk
s#(<a href="mailto:)<a href=.+?(https?://.+?">)</a>#$1$2#igk
- 256 :名無しさん@停滞中 ★:09/05/03 16:51:26 ID:???
- >>255追記
前処理に下記を追加
s#<img src=h?ttp://(img\.2ch\.net/ico/.+?\.gif).+?/>#sssp://$1#igk
ニュース速報板等のbeアイコンのタグをsssp://〜形式に戻す処理ですが
2ch.sagac.infoさんの場合 画像参照タグにonerrorでJavascriptを付加しているので
上の前処理を付けないと
htmltodatでdat変換する際にプレビュー等でエラーが出る場合があるです
具体例を出すと下2例とか
プレビューで1の名前しか出ない(dat変換は出来ている)
http://2ch.sagac.info/2ch/tsushima.2ch.net/test/read.cgi/news/1241315243/
スクリプトエラーのポップアップが頻繁に出る
http://2ch.sagac.info/2ch/tsushima.2ch.net/test/read.cgi/news/1241187467/
- 257 :名無しさん@停滞中 ★:09/05/04 10:38:52 ID:???
- メモ
unkar.jpドメインが止められました - へぼいいいわけ -
http://d.hatena.ne.jp/heiwaboke/20090430/1241063245
unkar.jpドメインは止められましたが、Googleガジェットは動いています - へぼいいいわけ -
http://d.hatena.ne.jp/heiwaboke/20090501/1241149663
お察しします
> 「http://unkar.jp/」を「http://219.94.194.196/」にすれば今でもアクセスできます。
情報ありがとうございます
- 258 :名無しさん@停滞中 ★:09/05/06 18:05:45 ID:???
- メモ
VIP DAT Uploader
http://dat.vip2ch.com/
- 259 :名無しさん@停滞中 ★:09/05/06 18:30:32 ID:???
- ついでにメモ
VIP DAT Uploader(http://dat.vip2ch.com/)のdat化
URL例
http://dat.vip2ch.com/read.php?dat=01276
正規表現
m#<dt id=".+">([0-9]+) :<font color=green><b>(.+?)</b></font><span class="info">(?:\[(.*?)\])?:(.+?)</span></dt><dd> (.+?)(?:<br><br>|</dd>)#mik
前処理
s#(<title>.+?\n)#$1</title>#ik
変換結果式
メール欄逆転
datファイルの格納場所がよくわかんなかったのでとりあえず。
titleタグが途中で改行されてるんで前処理を少し変則的にやってみたです
というか泥縄式といったほうが
- 260 :名無しさん@停滞中 ★:09/05/09 13:49:50 ID:???
- メモ
OURS-2ch過去ログ倉庫(http://lib.ac.la/2ch/read.php/*)のdat化
URL例
http://2ch.ac.la/?url=http://pc11.2ch.net/test/read.cgi/linux/1230708044/
http://lib.ac.la/2ch/read.php/linux/1230708044/
正規表現(一行では長過ぎるので改行しています)
m#<font color="\#0000FF">([0-9]+)</font>&?nbsp;<font color="\#007700"><b>(.+?)</b></font>&?nb
sp;(?:\[(.*?)\]&?nbsp;)?投稿日:(.+?)<div class="plain"> ?(.+?) *</div>#mik
前処理
s#(<title.*?)@OURS-2ch過去ログ倉庫(</title>)#$1$2#ik
s#\n<(?:meta|link|script|\!|br).*?(?=\n)##igk
s#\n</?(?:div|td|script|noscript|\/).*?(?=\n)##igk
s#\n(?:google|rakuten| +src).*?(?=\n)##igk
s#<img.+?>##igk
変換結果式
メール欄逆転
- 261 :名無しさん@停滞中 ★:09/05/10 09:57:37 ID:???
- 上
前処理を少し間違えたです
s#\n</?(?:div|td|script|noscript|\/).*?(?=\n)##igk
s#\n(?:google|rakuten| +src).*?(?=\n)##igk
↓
s#\n</?(?:div|td|script|noscript).*?(?=\n)##igk
s#\n(?:google|rakuten| +src|\/).*?(?=\n)##igk
まあ変換結果に支障は無いのでいいかな。
単にガラガラ削除の為の奴だったので。
- 262 :名無しさん@停滞中 ★:09/05/10 10:54:51 ID:???
- メモ
エロゲー板スレッドリンク
http://kagura.s18.coreserver.jp/
更新履歴を見ると2008/6/23で
> エロゲー板のほぼ全スレッドに対応しました
とありますので
かなり充実しているみたい。
で、此方のhtmlのdat化はというと
http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/538
で良さそう。
多少バツが悪く思いつつコピペさせていただくと
URL例
http://kagura.s18.coreserver.jp/kako5/1189841526.html
正規表現
m#<DT><A.+?>([0-9]+).+?<b>(.*)</b></FONT>\[(.*?)\].*?:(.*?)<DD> (.*)(:? <BR><BR>|<font)#mik
変換結果式
メール欄逆転
- 263 :名無しさん@停滞中 ★:09/05/12 17:35:40 ID:???
- メモ
http://web.archive.org/web/20050311171021/http://www.ragcans.com/kako/1061890165.html
正規表現
m#<DT.*?><A.+?>([0-9]+).+?<b>(.*)</b></u>(.*?)<span>:(.*?)</span></dt><DD>(.*)</dd>#mik
変換結果式
メール欄逆転
- 264 :名無しさん@停滞中 ★:09/05/14 20:06:16 ID:???
- http://anison.midgard.in/data/14.html
正規表現
m#<dt.*?>([0-9]+).+?(?:"mailto:(.+?)">)?<b>(.+?)</b>(?:</font>|</a>) ?:(.*?)(?:</dt>)?<dd> ?(.*?)<br><br>(</dd>|<dt.*?>|</dl>)#mik
- 265 :名無しさん@停滞中 ★:09/05/14 20:26:49 ID:???
- ところでRubyを入れてみたんですが
大元のバイナリを入れただけでは駄目なのかな。
あちこちにある講座やサンプルスクリプトを試行しようとすると
zlib.dllやらmechanizeやらgetopts等々が無いので出来ませんとか出るんですが。
その都度入れなきゃいけないとなると何だか尻込みしてしまうです。
pythonではそんな事全然無いですし入れたそのままで結構使えてるんだけどなー。
あとバージョンが1.9.1という最新版を入れてみたんですが
これよりも1.8.7とかのバージョンのほうが良いとあちこちにあるのを入れた後で見たですが
そうしたほうがいいのかな。
いずれにせよ
サンプルスクリプトそのままだと動かないってのはリンダ困っちゃうです
MoonWolfさんのdat2html.rbとかも動かないよー
- 266 :YhqivzTYErnXDGfnXN:09/05/16 05:35:00 ID:VX6zkNXB
- Good site, admin.
- 267 :名無しさん@停滞中 ★:09/05/16 18:11:36 ID:???
- ほう252人接続ですか
ってリロードしたら200人くらいになっちゃったけど
そんなに重いですかね?
そういう人用に「上が邪魔ならここをクリック」ボタンをいくつかつけてあるですけど。
というか普通に使う分には無問題だと思うですけど
win98無印のIE6で見ても別におもたかないような
ちなみにwin95のIE5だと何故かエラーが出るですけど何故なのだろうか
直せるものなら直しときたいものです
あとあれだ
ぽっぷちゃっとに
「このサイトに来ると何だか懐かしい」
という方が二人くらい居たですけど(てかこの2日ほど書き込み多いな)
考えてみれば4年くらいやってる訳で
もしかしたら本当に心底そう思っている人が出てきても
全然不思議ではないかもしれないなと。
まあ見方を変えれば
「何だまだやってたのか」でしょうけど。
女子中学生が女子大生になっててもおかしくない年月ではある
って計算合ってるのだろうか
ノストラダムスや2000年問題がほんのついこの前だったのになと
ワープロ打ちながら「わープロー」と叫んだり
ヨーヨーやりながら「よーよーよー」と絡んでみたり
コーヒー飲みながら「だばだーだーだーだばだーだばだー」と唱えてみたり
- 268 :名無しさん@停滞中 ★:09/05/16 19:36:51 ID:???
- メモ
tsu44 - Wassr
http://wassr.jp/user/tsu44/statuses/0vGgtVicJJ
screw it!
http://d.hatena.ne.jp/tsuyoshikawa/
本当は教えたくない。最強の携帯絵文字入力支援ソフト!なぜかみんな知らない。
http://1to3.mobi/blog/2008/09/mobile-pict-freesoft.html
- 269 :名無しさん@停滞中 ★:09/05/17 10:44:16 ID:???
- Windows に Ruby on Rails 2.2 + MySQL 5.x 環境を構築する手順とハマり所 - まさにっき(コードで世界を変えたい人の記録)
http://d.hatena.ne.jp/seiunsky/20081228/1230485404
Yet Another Decent Diary
http://d.hatena.ne.jp/wasisan/
ruby 1.9 を日常的に使うぼくが 1.9 の新機能を寸評する - まめめも
http://d.hatena.ne.jp/ku-ma-me/20090126/p1
とりあえず
すがまさおさんの記事の通りにやってみようかな
- 270 :名無しさん@停滞中 ★:09/05/17 15:59:00 ID:???
- メモ
リア友VIP(仮)
http://jbbs.livedoor.jp/game/40539/
VIP
http://popchat.nu/users/kinnniku318/
急に書き込みが増えたのはそういう事だったのかと
うーむ
- 271 :名無しさん@停滞中 ★:09/05/17 19:34:42 ID:???
- http://tsushima.2ch.net/test/read.cgi/news/1242541194/30
さてどうしたものか。
今のところは罹っていないのですが
- 272 :xCAMKiwsO:09/05/18 01:13:57 ID:R3HEuBiq
- Good site, admin.
- 273 :名無しさん@停滞中 ★:09/05/19 20:24:00 ID:???
- GENOウイルスチェッカー Ver.1.1
http://geno.2ch.tc/index.php?url=http://www.geocities.jp/mirrorhenkan/
--------------------------------------------------------
危険度928%
超絶危険なURLです。<s>友人のPCを壊すのに利用しましょう!</s>
絶対に踏んではいけません。
--------------------------------------------------------
という事でトップに注意書きを書いたですが
今見たら
--------------------------------------------------------
危険度50%
安全なURLです。踏んでも大丈夫でしょう。
--------------------------------------------------------
管理人さん
リファラでも見て直して下さったんでしょうか。
まあ次の更新まで
このままにしときますか。
cf.
◆XcxlmnqGqU さんのユーザープロフィール
http://be.2ch.net/test/p.php?i=1132280238&u=d:http://qb5.2ch.net/test/read.cgi/operate/1241361889/221
- 274 :名無しさん@停滞中 ★:09/05/21 18:30:09 ID:???
- にしてもウイルスチェッカーのような微妙なものの結果表示で
「<s>友人のPCを壊すのに利用しましょう!</s>」
のような文章をつけるなんていうのは
何というか 想像を絶する行為ですね。
http://tsushima.2ch.net/test/read.cgi/news/1242541194/30のように
コピペしたら「<s>」タグなんて取れてしまいますし。
今でもその一文を付けておられるかどうかは判りませんが
ココは遊ぶところではないと思うです
まあ思うだけなんですけど。
「2ch関連なんてそんなもん」なのかもですが
他の箇所も色褪せて見えるです
自分とこが
「超絶危険なURLです 絶対に踏んではいけません」
と判定されたというバイアスがあるんでしょうけど
けどけど
ちょっと何だかなあと思ったので書いちゃった。
まあそれだけ。
技術的には どういう箇所が引っ掛かったのかな。
是非とも知りたいものであります
- 275 :名無しさん@停滞中 ★:09/05/21 18:41:10 ID:???
- メモ
2ch保存庫(http://cm.umu.cc/ http://19.dee.cc/~cm/ http://18.pro.tok2.com/~biz/2ch/)
のdat化について
URL例
http://18.pro.tok2.com/~biz/2ch/read.php?1242863448
http://19.pro.tok2.com/~cm/read.php?1227934600
正規表現
m#<dt.*?>([0-9]+).+?(?:"mailto:(.+?)">)?<b>(.+?)</b>(?:</font>|</a>) ?:(.*?)<dd> ?(.*?)<br><br>(<script|<dt.*?>|</dl>)#mik
- 276 :名無しさん@停滞中 ★:09/05/21 18:41:54 ID:???
- メモ
色々スレッド検索(http://pc.z49.org/)のdat化について
URL例
http://pc.z49.org/logs/ml115_main/1236737389.html.gz
正規表現
m#<DT><A.+?>([0-9]+).+?<b>(.*)</b></FONT>\[(.*?)\].*?:(.*?)<DD> (.*)(:? <BR><BR>|<font)#mik
変換結果式
メール欄逆転
- 277 :名無しさん@停滞中 ★:09/05/21 18:43:08 ID:???
- メモ
e-wind.no-ip.org(http://e-wind.no-ip.org)のdat化について
URL例
http://e-wind.no-ip.org/2ch/%EF%BC%B0%EF%BC%A3%E7%AD%89/%E3%83%8F%E3%83%BC%E3%83%89%E3%82%A6%E3%82%A7%E3%82%A2/1226631405.html
http://e-wind.no-ip.org/2ch/PC等/ハードウェア/1226631405.html
http://74.125.153.132/search?q=cache:gwU2K3ynQysJ:e-wind.no-ip.org/2ch/%EF%BC%B0%EF%BC%A3%E7%AD%89/%E3%83%8F%E3%83%BC%E3%83%89%E3%82%A6%E3%82%A7%E3%82%A2/1226631405.html
http://mirror.sarashi.com/htmltodat/1226631405.html
正規表現
m#<DT><A.+?>([0-9]+).+?<span class="fgr"><span class="fbd">(.*)</span></span>\[(.*?)\].*?:(.*?)</dt><DD.*?> (.*)</dd>#mik
変換結果式
メール欄逆転
- 278 :名無しさん@停滞中 ★:09/05/21 18:45:20 ID:???
- メモ
2c.okawari.net(http://2c.okawari.net/)のdat化について
URL例
http://2c.okawari.net/thread/venus.bbspink.com/ascii/1216982609.html
http://2c.okawari.net/thread/live23.2ch.net/liventv/1242858893.html
正規表現
m#<a name="\d+"><dt>(.+?) :()<font color=green><b>(.+?)</b></font> :(.*?)<br/><dd>(.*?)<br><br></dd></dt>#mik
前処理
s#(<title>.+?) +- \[2c\](</title>)#$1$2#ik
幾つかhtmlを見て、メール欄が元から省略されているように思ったですが
もしかしたら違っているかも
- 279 :名無しさん@停滞中 ★:09/05/21 18:50:01 ID:???
- そして
今のところ 正規表現がお手上げなのが下記
オラオラ検索(http://oraken.net/2ch/)のdat化
URL例
http://oraken.net/2ch/cache/?index=1&thread_id=256099&all_sentence=1
正規表現
お手上げ
前処理
s#(<title>)オラ検: (.+?) \(\d+\)(</title>)#$1$2$3#ik
名前・メール欄・be・本文中のURLが省略されてるっぽいですが
それはそれとして
とりあえずココのをdat化出来るような正規表現があればなーと。
今の自分のスキルでは相当難しいですこれ
誰か教えて下さい
- 280 :名無しさん@停滞中 ★:09/05/22 08:18:41 ID:???
- メモ
http://be.2ch.net/test/p.php?i=168707434&u=d:http://qb5.2ch.net/test/read.cgi/operate/1241361889/l50
戦時板物資保管壕
http://senji.xrea.jp/
平仮名ヲ片仮名ニシ、アラビヤ数字ヲ漢数字ニスルダケノ道具
http://senji.xrea.jp/henkan.php
ではhttp://senji.xrea.jp/senji/も戦時統制化すればいいのになと
もしくはひらがな投稿をカタカナに直すように鏡の国スクリプトに手を加えるとか
- 281 :名無しさん@停滞中 ★:09/05/23 16:48:02 ID:???
- パソコン蛾ぶっ壊れた^^^^^^ - どこかの誰かの戯言集
http://d.hatena.ne.jp/yatterannetsu/20090520/p1
いや怖いです
鵜呑みにしてはいけない
ちなみに
「受け」の存在概念について本気出して考えてみた 〜6on6でのパーティの組み方+蜻蛉帰り〜 - どこかの誰かの戯言集
http://d.hatena.ne.jp/yatterannetsu/20081220/p2
ドキドキしちゃったじゃないか
- 282 :名無しさん@停滞中 ★:09/05/26 19:07:30 ID:???
- ミラー4つ追加
・・・もういいって?
- 283 :名無しさん@停滞中 ★:09/05/27 20:07:03 ID:???
- TODOメモ(カッケー!)
・クラシックメニューのdat化(>>56)
本文空欄の場合があるみたいなので
正規表現を下記に
m#<hr>(?:<form.+?>)?([0-9]+):(.+?) ((?:\d{2,4}|\d\d/\d\d).+?) +(?:\[(.+?)\] )?<br>(.*?) +(<hr>)#mik
・その53dat化ちょっと無理そう
・その56リンク先変更
http://2c.okawari.net/thread/pc12.2ch.net/win/1218238709.html
↓
http://2ch.logsoku.com/thread/pc12.2ch.net/win/1218238709.html
・その57変換書式変更
ところで、現在滞在中のページで使用しているクッキーの取得方法って何かないですかね。
ブックマークレットとかでもいいので。
- 284 :名無しさん@停滞中 ★:09/05/27 20:14:47 ID:???
- うむ
これでいちおう良いのかなと
javascript:alert(document.cookie);vaid();
これを応用して
document.cookieを値取得して
改行その他整形して
document.writeでブラウザ表示させれば良さそう
- 285 :名無しさん@停滞中 ★:09/05/29 18:26:55 ID:???
- # ちょっと長いです
メモ
2ch.sagac.info(http://2ch.sagac.info/)のdat化について
URL例1
http://2ch.sagac.info/-fv-/2ch/academy6.2ch.net/test/read.cgi/art/979488293/
http://2ch.sagac.info/-fv-/2ch/mamono.2ch.net/test/read.cgi/geinoj/1209569704/
http://2ch.sagac.info/-fv-/2ch/venus.bbspink.com/test/read.cgi/ascii/1169237398/
正規表現
m#<dt.*?>([0-9]+) :<span><b>(.*?)</b></span>\[(.*?)\]:(.+?)</dt><dd.+?>(.+?)</dd>#mik
受信オプション→HTTPヘッダ
※後述
前処理
s#(<title>.+?)画像>\d+枚 YouTube動画>\d+本 ?(?:Yourfilehost動画>4本)?(</title>)#$1$2#ik
s#</?(?:object|embed|param).+?>##igk
s#<a rel="nofollow" href="/h2ch\.php\?url=(.+?\.youtube\.com/watch\?v=.+?)" target="_blank">#http://$1#igk
s#\n<br>.+?(?=\n)##igk
s#<img src=(https?://.+?\.(?:jpe?g|gif)) alt=".*?" border=no />#$1#igk
s#(<a href="mailto:)<a href=.+?(https?://.+?">)</a>#$1$2#igk
s#<img src=ht?tp://(img\.2ch\.net/ico/.+?\.gif).+?/>#sssp://$1#igk
変換結果式
メール欄逆転
URL例を開いただけだと本文が表示されてないかも。
上部メニューの「画像のみ」「普通版」「 詳細版」を行ったり来たりすると表示されるかもです。
表示されたら、下記のブックマークレットをURL欄にコピーしてエンターキーを。
javascript:document.write("太字をコピペ<br><b>User-Agent: "+window.navigator.userAgent+"<br>Cookie: "+document.cookie+"</b>");
ブラウザにUser-AgentとCookieの文字列が表示されると思いますので
htmltodatの「受信オプション→HTTPヘッダ」の箇所にコピー&ペーストしてURLを呼び出して下さい。
(この作業をしないとhtmltodatで本文表示されたhtmlファイルを呼び出せないので)
これは「 1 :名無しさん@お腹いっぱい。[sage]:(後略)」の場合のものですが
そうでないケースもあるみたいなので次レスにて
- 286 :名無しさん@停滞中 ★:09/05/29 18:52:11 ID:???
- URL例2
http://2ch.sagac.info/-fv-/2ch/venus.bbspink.com/test/read.cgi/ascii/1238757853/
http://2ch.sagac.info/2ch/takeshima.2ch.net/test/read.cgi/news4vip/1241170949/
http://mirror.sarashi.com/htmltodat/1241170949.html
正規表現
m#<a.+?></a><dt>([0-9]+) :(?:<a href="mailto:(.+?)">|<font color=green>)<b>(.+?)</b>(?:</font>|</a>):(.+?)<dd>(.+?)<br><br>#mik
受信オプション→HTTPヘッダ
※後述
前処理
s#(<title>.+?)画像>\d+枚 YouTube動画>\d+本 (</title>)#$1$2#ik
s#</?(?:object|embed|param).+?>##igk
s#<a rel="nofollow" href="/h2ch\.php\?url=(.+?\.youtube\.com/watch\?v=.+?)" target="_blank">#http://$1#igk
s#\n<br>.+?(?=\n)##igk
s#<img src=(https?://.+?\.(?:jpe?g|gif)) alt="" border=no />#$1#igk
s#(<a href="mailto:)<a href=.+?(https?://.+?">)</a>#$1$2#igk
s#<img src=ht?tp://(img\.2ch\.net/ico/.+?\.gif).+?/>#sssp://$1#igk
htmlソースが
「<a name="#1"></a><dt>1 :<a href="mailto:sage"><b>名無しさん@お腹いっぱい。</b></a>:(後略)」
のタイプのものは此方にて。
URL例を開いただけだと本文が表示されてないかも。
上部メニューの「画像のみ」「普通版」「 詳細版」を行ったり来たりすると表示されるかもです。
表示されたら、下記のブックマークレットをURL欄にコピーしてエンターキーを。
javascript:document.write("太字をコピペ<br><b>User-Agent: "+window.navigator.userAgent+"<br>Cookie: "+document.cookie+"</b>");
ブラウザにUser-AgentとCookieの文字列が表示されると思いますので
htmltodatの「受信オプション→HTTPヘッダ」の箇所にコピー&ペーストしてURLを呼び出して下さい。
(この作業をしないとhtmltodatで本文表示されたhtmlファイルを呼び出せないので)
(ここは>>285のコピペです)
ここは現状、データ取得にはCookie送信が必要な所なのですが
以前のmakimo.toさんやremix2chさんの所のようにCookie内容が決め打ち出来ず
アクセス毎に個別に異なっている可変的なものみたいなので
個々にブックマークレット等で取得してhtmltodatに追加するしかなさそうに思ったです
自分の環境ではこのブックマークレットはIE/FireFox/Chromeのどれでも動きました。
やってみるとそんなに大層な事でもないんですが、どうでしょうか。
- 287 :名無しさん@停滞中 ★:09/05/29 19:13:38 ID:???
- >>285-286
上下とも前処理がミスってますね
s#(<title>.+?)画像>\d+枚 YouTube動画>\d+本 ?(?:Yourfilehost動画>4本)?(</title>)#$1$2#ik
s#(<title>.+?)画像>\d+枚 YouTube動画>\d+本 (</title>)#$1$2#ik
↓
s#(<title>.+?)画像>\d+枚 YouTube動画>\d+本 ?(?:Yourfilehost動画>\d+本)?(</title>)#$1$2#ik
まだ他にもあるかな
- 288 :名無しさん@停滞中 ★:09/05/29 19:35:01 ID:???
- 前処理変更箇所もう一つ
s#<img src=(https?://.+?\.(?:jpe?g|gif)) alt=".*?" border=no />#$1#igk
↓
s#<img src=(https?://.+?\.(?:jpe?g|gif|png|mng)) alt=".*?" border=no />#$1#igk
- 289 :名無しさん@停滞中 ★:09/05/29 20:10:08 ID:???
- これをやるのにCookieについて少し見てみたんですが
クッキー何それ食えるのおいしいの状態からそうすぐには抜け出せないなと。
でも、あちこちでよく見かけるクッキーでのスタイルシート選択とかそんな感じのものが
スタイルシート使わずとも出来るかも。
色んな固まりをgetElementByIdで取れるようにして
Cookieで表示非表示を取捨選択できるように とか。
って面倒なのでやらなそうですが。
- 290 :名無しさん@停滞中 ★:09/05/31 11:41:45 ID:???
- 前処理さらに追加
//be関係
s#<a rel="nofollow" href="/h2ch\.php\?url=be\.2ch\.net/test/p\.php\?i=(\d+)" target="_blank">\?(.+?)</a>#BE:$1-$2#igk
考えてみればhtmltodatでコメント行使えるんだから
コメントを多用したほうがいいかもですね。
自分 上述のブックマークレットとか前処理の最初にコメントとしてつけてあるですし
- 291 :名無しさん@停滞中 ★:09/05/31 19:35:04 ID:???
- >>279をやっているがうまくいかぬ
煮詰まったのでメモ
http://mirror.sarashi.com/htmltodat/oraken/test.html
http://mirror.sarashi.com/htmltodat/oraken/test1.html
http://mirror.sarashi.com/htmltodat/oraken/test2.html
http://mirror.sarashi.com/htmltodat/oraken/test3.html
http://mirror.sarashi.com/htmltodat/oraken/test4.html
正規表現(長過ぎるので3行に)
m#<p class="date"><a .+?>†</a> ([0-9]+)</p><div class="info box"><p><span><strong>.+?</str
ong></span>()()<span>\[(.+?)\]</span>(?:<strong><span>(>>\d+<br>)</span></strong>\t +)?</p><!-- Go
ogle Adsense --></div><ul> (.+?)</ul></div><div class="article">#mik
前処理
s#(<title>)オラ検: (.+?)\(\d+\)(</title>)#$1$2$3#igk
/s#(?:\r|\r\n|\n)##igk
/s#\n +##igk
/s#\n *?<ul>.*?(?=\n)##igk
s#\n +<li>##igk
s#</li>#<br>#igk
s#<a href="\.\./chain.+?>( ゜ヮ゜)</a>##igk
s#\n(<strong><span>)(>>\d+)(</span></strong>)#$1$2<br>$3#igk
変換結果式
$3<>$2<>$4<>$5$6<>
上のURLは試行錯誤しつつ wコマンドで保存した奴なんですが
現状では
http://mirror.sarashi.com/htmltodat/oraken/test2.html
のdat化であちこちダメな行があるのがどうにもよくわからんです
- 292 :名無しさん@停滞中 ★:09/06/03 21:49:32 ID:???
- メモ
オラオラ検索(http://oraken.net/2ch/)のdat化
URL例
http://oraken.net/2ch/cache/?index=1&thread_id=157791&all_sentence=1
正規表現(長いので3行に分割表示)
m#<p class="date"><a href=".+?" name=".+?">†</a> (\d+)</p><div class="info box">()()<p><span><str
ong>【\#\d+】</strong></span><span>\[(.+?)\]</span>(?:<strong><span>(>>\d+)</span></stro
ng> ?\t +)?</p><!-- Google Adsense --></div><ul>(.+?)<br>(?:</ul>)?</div><div class=".+?">#mik
前処理
s#(<title>)オラ検: (.+?)\(\d+\)(</title>)#$1$2$3#igk
s#\n +##igk
s#<li>#$1#igk
s#</li>#<br>#igk
s#<a href="\.\./chain.+?>( ゜ヮ゜)</a>##igk
変換結果式
通常の名無しさんの3倍<>$2<>$4<>$5$6<>
名前・メールが省略されているので
変換したいスレッドのあった板のデフォルト名無しを変換結果式に直書きしして下さい。
ソースを見ると、とにかく半角スペース含みの空行と本文の改行前後にも半角スペースがやたらあって
それを取り除く為の正規表現をつけたのですが
とにかくこれが時間がかかる時間がかかる。
上のだと7レスなのでまあいいんですが
1001レスあるhtmlだと10分強はかかっちゃうです。
こういう場合(連続半角スペース)の取り除き方って一体どうやるのがいいんでしょうか。
- 293 :名無しさん@停滞中 ★:09/06/09 19:37:23 ID:???
- >>265>>269で入れたまま放置していたruby1.91をごっそり削除して
Ruby 1.86 One-click Installer を入れてみたら
何だか あちこちのrubyスクリプトが動く動く
http://rubyinstaller.rubyforge.org/wiki/wiki.pl
MoonWolfさんのdat2html.rbもダブルクリックでhtml生成出来てしまうし
今までの悩みは何だったんだと。
と twitterかwassrに書こうかと思ったけど
こんな超初心的な事書いても流石に何かアレだものでココにメモ
- 294 :名無しさん@停滞中 ★:09/06/15 19:15:31 ID:???
- 【ダウソ民の】KeyJaneその7【2chブラウザ】
http://hideyoshi.2ch.net/test/read.cgi/download/1221523896/428
-----------------------------------------------------------------------------
428 名前:[名無し]さん(bin+cue).rar[sage] 投稿日:2009/05/04(月) 01:05:21 ID:vT63zZI30
[153] PZSf :mokume◆Q35xnK/I9LhhTw :2009/05/04 00:36:51 [レ] [引] [無] [あ] []
KJ_b053_rc1
■b052からの変更点
●激しく未完成
●まちBBSとか。
●過去ログ取得機能の汎用化
●html2dat機能をちょっと内蔵
●本バージョンはBREGEXP.DLLがJane2ch.exeと同じフォルダに無いと起動しないので注意!!
●本バージョンに同梱されているLogServers.iniをKEYフォルダにいれないと過去ログ取得機能は使えないので注意!!
謝辞
●本バージョンよりTatsuo Baba氏のBREGEXP.DLLとOsamu Takeuchi氏のBRegExp.pasを使用させていただいております。
●本バージョンの作成にあたって、mukiyu氏のhtmltodatを参考にさせて頂きました。
●スナップショット2chのdat化にあたってhttp://yy14.kakiko.com/test/read.cgi/mirror/1186175383/497の名無し氏の書き込みをパクらせていただきました。
以上の方々ありがとうございました。
------------------------------------------------------------------------------
ちょいとのけぞりつつ
KJ_01122_b053_rc1.rarをDLして
Readme(というかKeyJane.txt)を見てみると
------------------------------------------------------------------------------
■Special Thanx
(中略)
http://yy14.kakiko.com/test/read.cgi/mirror/1186175383/497の名無し氏(snapshotのdat化について)
------------------------------------------------------------------------------
いやーのけぞった。にしても「名無し氏」て。
ココの名前欄をトリップ付きのハンドル名とかにしておいたらそんな事も無かったろうなと
で、html2dat機能なんですが
どうもsnapshotのミラーについてだけの固定的なものみたいですね。
正規表現もKeyJanePlugin.dllあたりに内臓されてるみたい。
ミラーURLや正規表現その他を柔軟に個別指定出来るようになっていたら
どんなにか素晴らしい事でしょうか。
- 295 :名無しさん@停滞中 ★:09/06/15 19:27:31 ID:???
- > ミラーURLや正規表現その他を柔軟に個別指定出来るようになっていたら
> どんなにか素晴らしい事でしょうか。
と書いてから同梱のLogServers.iniを開いてみたら
どうやら自分でミラー先とか増やしたり出来るじゃないですか。
クッキー送信の項目も用意してありますし。
変換結果式や後処理が無いのが残念ですが。
でもすごい
この機能がJaneNidaに付加されたら嬉しいのですが
どうかな。
要望するのは図々しいかな
- 296 :名無しさん@停滞中 ★:09/06/15 19:43:20 ID:???
- あと別にいいですけど
LogServers.ini内のsnapshot用正規表現のうち
step7=s#(<><>)(.*?)( :)#<>$2<>#ig
↑これ不要です
どれもこれもやっつけで作った正規表現だもんで
まだあるかもしれないけど
まあいいや
- 297 :名無しさん@停滞中 ★:09/06/15 19:52:36 ID:???
- 改めてhttp://yy14.kakiko.com/test/read.cgi/mirror/1186175383/497を見てみると
直したほうが良さそうな件が2点
s#\n(?:\t| +).+?\n##ig
s#\n<div.+?\n##ig
↓
s#\n(?:\t| +).+?(?=\n)##ig
s#\n<div.+?(?=\n)##ig
この2行 ガラガラ削除の為の正規表現なんですが
肯定先読みにしないと1行づつ残っちゃうです。
まあ現状 dat化出来てるので別にいいんですが。
- 298 :名無しさん@停滞中 ★:09/06/21 01:50:36 ID:???
- やっとfaviconの表示方法判った
URLがサブドメインじゃない場合こうするのね
ちぃ覚えた でもちょびっツよくわかんない
- 299 :名無しさん@停滞中 ★:09/06/26 20:32:12 ID:???
- 新型トリップについてなんですが
http://qb5.2ch.net/test/read.cgi/operate/1244993904/309
をコピペして見てみると
---------------------------------------------------
if (length $handle_pass >= 12)
{
my $mark = substr($handle_pass, 0, 1);
if ($mark eq '#' || $mark eq '$')
{
if ($handle_pass =~ m|^#([[:xdigit:]]{16})([./0-9A-Za-z]{0,2})$|)
{
$GB->{TRIPSTRING} = substr(crypt(pack('H*', $1), "$2.."), -10);
}
else
{
# 将来の拡張用
$GB->{TRIPSTRING} = '???';
}
}
else
{
use Digest::SHA1 qw(sha1_base64);
$GB->{TRIPSTRING} = substr(sha1_base64($handle_pass), 0, 12);
$GB->{TRIPSTRING} =~ tr/+/./;
}
}
else
{
# 従来形式
}
・ 従来はトリップキーも含め <> や NG ワード等の置換処理が行われていたが,それをスルーするようにした.
・ キーの長さが 1024 桁を超えるとエラー.
---------------------------------------------------
苦手なperlでよくわかんないんですが
use Digest::SHA1 qw(sha1_base64;
と宣言してからsha1_base64で変換してるみたいで。
JavaScriptでsha1を計算するものを調べたら一応あったです
sha1.js mitsunari@cybozu labs
http://labs.cybozu.co.jp/blog/mitsunari/2007/07/sha1_1.html
あとJavascriptでBase64エンコードも
http://user1.matsumoto.ne.jp/~goma/js/base64.html
http://www.onicos.com/staff/iz/amuse/javascript/expert/
http://www.onicos.com/staff/iz/amuse/javascript/expert/base64.html
最初のperlコードを理解してからsha1/base64それぞれのjsを応用して組み込めば
http://www.geocities.jp/mirrorhenkan/others/trip/trip.html
の更新も
ひょっとしたrら出来るかもですね(そんな余裕も時間もないですが)
- 300 :名無しさん@停滞中 ★:09/06/27 08:12:03 ID:???
- 2chtrip - プロジェクト・ナニ屋 Wiki
http://sourceforge.jp/projects/naniya/wiki/2chtrip
鳥屋さんだとしたら
下のサイトでものすごくお世話になりました
そうかcryptってそういうものだったのかと
http://user64.psychedance.com/2004/11/spec_2ch_trip.html
http://user64.psychedance.com/2004/11/sample_des_cryp.html
500KB
続きを読む
掲示板に戻る 全部 前100 次100 最新50