IDNの難しさ

IDNによるURL偽装対策

URL偽装に悪用されかねない国際化ドメイン名(IDN)は結局のところレジストリレジストラ側の問題であろうということになりました。

まぁそうであったとしてもブラウザ側である程度の防衛はしておいて頂けるとヨーロッパ語圏の利用者にとってはありがたいのではないかと思います。

まず、IDNがはいっているURLでは、ブラウザのアドレスバーに一工夫が欲しいところです。第一に、アドレスバー内に現在faviconが表示されている部分(左端?)のさらに左に[IDN]マークがカラフルに出るとよいですね。次。IDNで表示されている文字のその部分だけ背景色が変わるとよろしい。白黒反転でも困らないと思いますがどうなんでしょ。評判悪いかな?いずれにせ目立つことが肝要。他にもなんとか工夫して音による警告があることが良いかもしれません。IEのinformation bar のようなものを頭に描いていますけれど。

ヨーロッパにおける対策は上のようなもので良いかと思います。

日本語のケースでは?

特に偽装ネタと言うわけではないのですけれど、愕然とすることがありました。

左卜全(ひだりぼくぜん)は名優です。既に鬼籍にはいっておいでです。左卜全出演映画リストを見ると、出演作多数であることがわかります。テレビドラマでも大活躍でした。この名優を二通りの方法でGoogleで検索します。

  1. Googleで「左ト全」を検索
  2. Googleで「左卜全」を検索

現時点での検索結果件数を書いておきますと、最初に調べた「左ト全」では 8,830 件、次に調べた「左卜全」では 747 件 です。

実は 8,830 件の方は、誤字で検索しています。ひだりぼくぜん」の「ぼく」の字を全角カナの「ト」にしているのです。正解の「卜」で検索すると1/10未満しかヒットしていません。「左ト全」さんも、この事実をあの世で知ったなら「ぱぱぱやー、♪〜やめてけれ」と歌いだしかねません。

と、ここまで書いてふと気がつき、全角の「ト」を半角に直して検索したら50万件以上ありました。なんだかもうわけがわかりません。

結論は要するに、www.左卜全.com を登録する時にはレジストラの人も充分に気をつけて頂きたいなぁということです。こういうのって機械判定は出来ませんから人間の叡智で「これ、似ていてヤバイから駄目」と判定するはずですよねぇ。

マイクロソフトの場合

やや旧聞に属するのですが、http://www.マイクロソフト.com という登録済みのドメインがあります。本日Firefox1.0で確認しましたが健在でした。あらためて大笑いです。IEだとつまりません。最新のFirefox1.01だとどうなのかしらん?Operaでは面白い。

Reference

OCRが主因とは気がつきませんでした。人間の頭脳もOCR同様、似たものを取り違えてしまいますけれどもね。

WWWGOOGLECOM

変なキーボード

先日から使い始めている自作機ですが、キーボードの選択を間違えました。狙い通りタッチは良いのですが、ENDキーがないのです。これ、激しく不便なのですよね、私にとっては。コピペにおける選択範囲指定の場面やアドレスバーで不要部分を吹き飛ばしたりとかをENDキーで行うことが非常に多いのです。

考えあぐねて代用手段を見つけました。テンキーのNumLockをオフにすると数字の1がEndキーになるのでそれを時々使っています。早く慣れなくては。Numlockを復帰するのをついつい忘れてしまうのですよねぇ。で、大事な書きかけの文字を一部損傷したりします。というのは、私は多くの場合、ドットを叩く時にはテンキーを使います。だって簡単なんだもの。うっかりとNumlockをはずしているとこれがDelキーになります。文章の途中でピリオドを打つつもりがDELになっていると死にます。

WWWGOOGLECOM

私はFirefoxを使ってGoogle検索を行おうと思いました。アドレスバーに、http://www.google.com と打鍵したつもりでした。ところがNumlockがはずれていました。なのでアドレスバーには以下のように打鍵されたのですけれど全くそのことに気がつきませんでした。

http://wwwgooglecom

出てきた画面を見て私は腰を抜かしました。Firefoxめ、やりおるわい、と気がつくまでにどれほど時間がかかったことか。まだ色々自作機の調整中だったので早速スパイウェアにやられていたのかと大いに驚いたのです。

出てきた画面のURLは以下の通りです。

http://www.siggma.net/WwwGoogleCom

FirefoxDNSに尋ねて見つからないとそれをURLではないとみなすのか検索エンジンgoogleにクエリーを渡します。検索結果が一件しかないのでその結果をFeelingLuckyの要領でいきなり表示します。今回は検索結果はsiggma.netなのでした。なお、siggma.netはWikiを搭載しているようですね。あんまり探検しないでおくことにします。

ところでFirefoxがいきなり利用者の意図とは異なるアドレスのコンテンツを表示するのはいかがなものかと思いました。危ないのでは?

最も長いしりとりをパソコンで生成する

トリビアの泉

もう一年も前の話です。人気TV番組トリビアの泉の2004年03月03日放送分のコーナー、トリビアの種にて以下の種が披露されました。

広辞苑に載っている言葉で最も長くしりとりをすると最後の言葉は□□□□。』

トリビアの泉非公式ホームページから引用しますと、

確認VTR
大学に協力で最も長くしりとりをできるようなプログラムを作成してもらっていました。しかし、プログラムのために広辞苑から名詞のみですけど単語を入力する作業も膨大(15万語/72時間)なようでした。全部で5日間かかったようです。しりとりの流れは、同じような文字が最初と最後に来るものを始めに消していくようです。例:「りんり」。そして、75775語で終了しました。お疲れ度: 18へぇ

辞書に載っている名詞で作ることができる,最も長いしりとりを求める

ええと、調べてみたら詳しくは以下の通りです。なお、コンピュータに辞書を入力するなどの準備は計算時間に含まれていません。

長いしりとりの定義
名詞だけを使用
母音で次の言葉へ繋ぐ –「コーヒー(こぉひぃ)」⇒「いるか」
以下は同じ音として扱う –「じ」=「ぢ」,「ず」=「づ」
以下は同じ音として扱い使用は1度 –「橋(はし)」=「箸(はし)」
1度使用した言葉は再び使用しない –「すいか」⇒「からす」⇒「すいか」
「しりとり」という言葉から始め,言葉の語尾に「ん」がついた時点で終了
条件
辞書 広辞苑 (名詞数154,150)
パソコン(CPU:Xeon 2.8GHz Dual , Mem:2GBを使用)
結果
計算時間は約11秒程度
語数75775語
最後の言葉は「るすばん」
最初が「る」、最後が「ん」ならば何でもいいです。

解法その他は以下を参照

『実際に解いてみた♪』人による解説を読みました。オバカなプログラムなら宇宙が終わっても解けないはずの問題を素晴らしいアルゴリズムで解決したことが良くわかります。たったの11秒!数理計画法万歳。OR万歳。感激しました。

※この解説は、PowerPointからHTML(フレーム)を生成したものらしいのですけれど、むしろFirefoxで閲覧したほうが綺麗に読めます。