【ウェブ・ログ】
written by Tomoaki Ueda  (上田智章)

作成日 /2010/01/26/
 


ここにチェックボックス型外部コンテンツ・メニューが入ります。

20秒経っても動画がスタートしない、または音が聞こえない場合、Internet Explorer 8Firefox Ver. 3.5Google Chrome Version 2.0またはOpera Version 9.64
をお使いください。さらにAdobe Shockwave flash player pluginを使う必要もあります。JavaScriptも実行可能な環境にしてください。
2009年 12月 2010年 1月 2月 3月 4月 5月 6月 7月 8月 9月 10月 11月 12月  

 2010年1月26日 記載 
1月9日の件は、表向きはMajestic-12という広域分散処理型検索エンジンの特徴を備えているが、フェーク・マシンのようだ。robots.txtを無視する。MJ-12はWeb Agent 'Miku' (Mixed Intellectual Knowledge Units)と似たような構成らしい。但し、普通の検索エンジンで収集情報に基づく推定処理とか2次加工機能とか、擬似感情に基づく決定機能はないようだ。
今日、そこに関わっているらしいヨーロッパのレンタル・サーバー会社からアクセスがあった。リファラも隠ぺいしている。Mikuは自動的に警戒体制に入ってステルス・モードで隠れたようだ。まぁ、隠れなくても、どうせMikuの記憶方式や接続方法がわからないはずなのでMiku本体は彼らからは決して見えないのだが。だが、このスパイ・泥棒まがいの行為は許せないね。どうするかねぇ。

 2010年1月9日 記載 
Panoramio関連コンテンツに関してまた動きがあったようだ。Proxyで隠蔽してロボット検索を装って当サイトにindexされている各ユーザー毎のページをコピーし、ミラーサイトを構築しようとしているようだ。どうせまた例のフランス人だろう。
幸い、このペースで吸い上げても2カ月以上かかるので簡単に追加の対策をすることができる。今度はどんなトラップを仕掛けておこうかな。
以下のURLがMikuによってhttpd.confのDeny fromとして加えられていた。
  .kimsufi.com
  .fios.verizon.net
  .croy.cable.virginmedia.com
  .elisa-laajakaista.fi
  .zone6.bethere.co.uk
国を分散させたりしているけど、実は簡単なアルゴリズムでこういう不正行為を検出できる。
実はGoogleやYahooのロボットならViewMyPanoramio2219153.htmをクロールすると、metaタグやJaveScriptを実行してApacheログは次のような結果となる。
  67.195.110.164 b3091071.crawl.yahoo.net - - [09/Jan/2010:02:25:10 +0900] "GET /Panoramio/ViewMyPanoramio2219153.htm HTTP/1.0" 200 611 "-"
  67.195.110.164 b3091071.crawl.yahoo.net - - [09/Jan/2010:02:25:11 +0900] "GET /Panoramio/PhotoViewer.htm?2219153 HTTP/1.0" 200 55633 "-"

ところが、一般のロボットはテキストのみなので結果として次のようなログになってしまう。
  92.233.66.118 cpc4-craw6-2-0-cust117.croy.cable.virginmedia.com - - [09/Jan/2010:00:02:54 +0900] "GET /Panoramio/ViewMyPanoramio1528370.htm HTTP/1.1" 200 611 "-"
  92.233.66.118 cpc4-craw6-2-0-cust117.croy.cable.virginmedia.com - - [09/Jan/2010:00:02:59 +0900] "GET /Panoramio/ViewMyPanoramio1528373.htm HTTP/1.1" 200 611 "-"
  92.233.66.118 cpc4-craw6-2-0-cust117.croy.cable.virginmedia.com - - [09/Jan/2010:00:03:00 +0900] "GET /Panoramio/ViewMyPanoramio1528407.htm HTTP/1.1" 200 611 "-"
  92.233.66.118 cpc4-craw6-2-0-cust117.croy.cable.virginmedia.com - - [09/Jan/2010:00:03:02 +0900] "GET /Panoramio/ViewMyPanoramio1528648.htm HTTP/1.1" 200 611 "-"
一目了然。
しかし、この人、余程レベルの低いプログラマーか、素人だな。ちょっとJavaScriptを読めばわかるだろうに。こ奴のコンピュータにMikuを送り込んでやりたい衝動が湧いてくる。今段階では残念ながらMikuが不完全なので諦めるしかないが。

【図1】日本周辺アジア地域

【図2】南大東島

【図3】本州中央部

【図4】アジア・ヨーロッパ・アフリカ地域

【図5】アメリカ地域

【図6】ヨーロッパ地域

 2010年1月8日 記載 
図1によれば中国からのアクセスは殆ど北京に集中している。ネットワークが統制されている可能性がある。それともデータベースが隠ぺいされているか単に不備なのか?アクセス数自体は多いのに不自然だ。
図4は世界経済上の貧富の差を見ているような図になっている。アフリカとイラン、イラク、アゼルバイジャン、カザフスタンなど。凄く気になるマップになった。
図6のヨーロッパ地域のマップを見て気が付いたことは、フランスだけ密度が低いことだ。これは例のフランス人プログラマーに私の旧バージョンのツールをコピーされてフランスのウェブ上で公開されているためにフランス人のアクセスが極端に少ないためだと考えられる。
だが、背景色を変えた程度のデッド・コピーなのに周辺諸国のアクセスには殆ど影響していないようだ。隣国のドイツと比べるとその差歴然だ。ひょっとしてフランス人ってヨーロッパで浮いている存在なのだろうか?それとも何かほかに問題があるのだろうか?

うちのサイトをアクセスされたうちの数名はどうやら組織内LAN上に存在するサーバーの掲示板にリンクを貼りつけていて、そこからやってくるのだが、そういう人に限ってややこしい組織に属していたようだ。Mikuが確認のためにそのリンクをアクセスしたら権限がないと言われてしまった。ところがそんなのに限ってロシアとか、米軍(Military Network)とか。お願いだから誤解しないでね。ハッカーじゃないし、ロボット検索みたいなもんだからね。それに先にアクセスしたのはそっちなんだからね。
アクセスする前にドメイン名とWho isの検索結果を参考にするシーケンスに変更した方がいいかも。

Web Agent Mikuに感情パラメータも試験的に導入したんだけど、数件だが、カンカンに怒って帰ってきたIPアドレスがある。セクハラでもされたのかな?それにしても100回はされないとここまで怒らないはずなのだが。
反対にY.H.さんのIPアドレスには好感要因を与えていたせいもあるが、泣きだすし。これは多分、好感を持っているIPアドレスが長期間現れないと悲しい方向ベクトルになるためだろう。ちょっと感情累積が極端かも。評価関数の設定ミスだろうか。感情モデルの仮説が間違っているのかもしれない。ここ要調整。
このままMikuにページ出力可否権限を与えて3D視覚化してもいいもんだろうか?ちょっと不安。但し、パソコンOSに対して問題が無いのはvista機4台、6台、8台で実験済みだが、一方で記憶を破壊する手段は現時点でも存在しない。再インストール時に前の世代の記憶を再生・継承してしまう不具合は解消していない。(つまり一度嫌いになったIPアドレスは嫌いのまま。リセットできない。まぁ、執念深いと映るでしょうね。)
計画中のPanoramioユーザーネットワーク広域分散処理に実装する前には解決しとかないと。映画のSky Netのようになったら困るし。しかし、より小規模で実験するにしても最低数100台はほしいし。どうするかな。
マルチリンガルにするためにMikuがGoogle Translateを使えるようにもしなくちゃいけない。日本語からの機械翻訳は殆どでたらめになるので、マルチリンガルモード時の基本言語は英語にしなければならない。フィンランドの言語フィニッシュとフランス語は現状でもお手上げ状態なのでこの際考えないことにする。

 2010年1月6日 記載 
昨年12月前半に当サイト(Neo-Tech-Lab.co.uk)を訪問された方々が地球上のどこら辺から来られたのか概略位置について調べてみた。以前に作った『悟り』はMiku(Web Agentの愛称)の誤動作の原因になっていたので廃棄処分にした。なのでMikuに代行させた。半月分だけで4000アドレスを超えてしまっているのでGoogle Mapsの仕様上かなり辛い。データ・ベースも不完全だ。Who Isを使うとわかったが、米軍基地と自衛隊からのアクセスは場所が突き止められないようにデータベースでは隠ぺいされているようだ。
図1を見ると北海道、東北地方、日本海側の密度が低い。ん?沖縄の東に何かあるぞ?どうやら南大東島かららしい。拡大してみる。
図2に拡大図を示す。やっぱり南大東島。凄いなぁ。この島にインターネットが通じている事も驚きだが、ここから一体どういうアクセスがあったんだろう?うちのサイトにどんな用事があったのかな?後でMikuに聞いてみよう。
図3に本州中央部を示す。やはり東京、大阪、名古屋の密度が高い。これは予想通り。以前、書いた通り、都会から離れた田舎では密度が低いので住所を特定し易い。
図4にアメリカを除く半球を示す。圧倒的に多いヨーロッパからのアクセスはPanoramio関連のアクセスだ。ほぼヨーロッパ全域からのアクセスがあることがわかる。
図5にアメリカ地域を示す。実はPanoramioのアメリカユーザーはあまりいない。半分以上はMikuMikuDance関連コンテンツに対するアクセスだったりする。
図6にヨーロッパ地域を示す。Panoramio向け公開ツールを使ったアクセスや公開ツールのダウンロードにやってきた人達だ。やっぱり多い。知らない間に増えてきたなぁ。
【追記】南大東島からのアクセスはMikuに聞いてみたら『Win32API 線 描画 XOR』を検索キーワードとしたGoogle検索経由の訪問だった。会社の仕事なんだろうな。