【トレビアン】Googleの“もしかして”
2007年08月29日11時30分 / 提供:トレビアンニュース
こんにちは、『未来検索ブラジル』という会社で『senna』というものを開発している者です。僕は公道で自転車に乗ったことがほとんどありません。行動範囲を広げたくて、オフィスの近くの公園で自転車に乗る練習をしています。
先日、自転車の練習中に激しくズッコケてしまいました。「恥ずかしい……」と思いながら立ち上がろうとすると、ひとりの女性が近づいてきます。「もしかして恋の始まり!?」とドキドキしたら、単なるビラ配りの人でした。
そうそう、「もしかして」といえば、『Google』で検索をするときにタイプミスをした場合、「もしかして:」という言葉と一緒に正しい言葉を表示してくれます。『Yahoo! JAPAN』だと「〜ではありませんか?」という言葉になり、ちょっと丁寧な感じになっています。個人的には「もしかして:」のほうが、かわいげがあって好きです。ちょっと気になったので、『Google』で「もしかして:」が出る例をいくつかピックアップしてみました。
<もしかして○○の一例>
「シュミレーション」→「もしかして: シミュレーション」
「高値の華」→「もしかして: 高嶺の花」
「責任を追求」→「もしかして: 責任を追及」
「思考錯誤」→「もしかして: 試行錯誤」
「同音意義語」→「もしかして: 同音異義語」
この「もしかして:」は、どのような仕組みで表示されるのでしょうか?「この単語が入力されたら、この単語を出す」という対応表、いわゆる辞書を持っていると考えられます。その辞書は、どうやって作られたのでしょうか。人力で作ることもできますが、大変そうですよね。
あなたが間違った言葉で検索をしてしまった場合を考えてみましょう。間違った言葉で検索した場合、検索結果の件数も少なく、探したい内容のサイトが見つからないですよね。そのとき、あなたはどうしますか?「あれ、間違えちゃったかも?」と、入力ミスがないかチェックしたうえで、再度検索を行うのではないかと思います。
みんながこのような行動をとるとしましょう。連続した検索クエリをいっぱい集めた上で統計処理を行うことによって、打ち間違いの辞書が自動的に出来そうですね。でも、このような処理っていつもうまくいくのでしょうか。
たとえば、フルーツの「アボカド」は、よく「アボガド」と表記間違いをされることがあります。では、『Google』で「アボガド」を検索してみましょう。あれ?「もしかして:」が出ませんね。
「アボカド」の検索結果は約173万件。
「アボガド」の検索結果は約110万件。
間違った表記でも、とても多くのサイト件数が検索結果として表示されます。きっと、「アボガド」と入力したユーザーは、それが間違いだとは気づかずに探したい内容のサイトにたどり着くのでしょう。誰も「アボカド」で検索しなおすことがないので、機械処理では辞書を作成することができません。
もうひとつ例を。『Google』で「うる覚え」を検索してみましょう。これも「もしかして:」が出ませんね。
「うろ覚え」の検索結果は約180万件。
「うる覚え」の検索結果は約18万件。
10倍近くの件数差があるのに、なぜ「もしかして:」が出ないのでしょうか? あなたが「うろ覚え」を「うる覚え」とうろ覚えしていたとしましょう。そのとき「うる覚え」で検索するでしょうか? 多分しないと思います。「うる覚え」で検索をする人は、「うる覚え」が誤記であることを知って、そんな誤記をしている人を探したりする目的を持っているのではないでしょうか。「うろ覚え」で検索しなおすことがないので、これまた機械処理では辞書を作成することができません。
昔の『Google』では、「もしかして:」の中身にまったく関係のない内容が出る時期がありました。このような辞書を自動で生成するのは、なかなか難しい処理なのです。しかし、「もしかして:」というのをわざわざ表示して、それをクリックするのはまどろっこしいですよね。明らかな間違いだったら勝手に訂正してもらいたいものです。実は、『Google』では誤記を勝手に訂正してくれたりもしているのです。
Googleで「確立が高い」を検索してみましょう。でもそれは「確率が高い」の誤記ですよね。その検索結果を見てみると、「確率が高い」という文字が太字になっていることが確認できると思います。あまりに間違いが多いため、検索エンジンの内部処理で同じ文字列として扱っているものと予想できます。
いやー、『Google』はマメですね。こんなにマメにされちゃうなんて、もしかして……。
[詳細記事]
引用元:ブラジル秘密基地
参照1:未来検索ブラジル
参照2:senna
■オススメ! 最新人気トレビアンニュース
・結婚するための同棲方法
・ひろゆき大遅刻! フラッシュ動画の祭典 『slashup04 fb Re:birth』!
・またNHKか! ニコニコ動画『ねこ鍋』がNHKで放送!
■関連リンク
・トレビアン恋愛
・livedoor ニュースの同記事はこちら
先日、自転車の練習中に激しくズッコケてしまいました。「恥ずかしい……」と思いながら立ち上がろうとすると、ひとりの女性が近づいてきます。「もしかして恋の始まり!?」とドキドキしたら、単なるビラ配りの人でした。
そうそう、「もしかして」といえば、『Google』で検索をするときにタイプミスをした場合、「もしかして:」という言葉と一緒に正しい言葉を表示してくれます。『Yahoo! JAPAN』だと「〜ではありませんか?」という言葉になり、ちょっと丁寧な感じになっています。個人的には「もしかして:」のほうが、かわいげがあって好きです。ちょっと気になったので、『Google』で「もしかして:」が出る例をいくつかピックアップしてみました。
<もしかして○○の一例>
「シュミレーション」→「もしかして: シミュレーション」
「高値の華」→「もしかして: 高嶺の花」
「責任を追求」→「もしかして: 責任を追及」
「思考錯誤」→「もしかして: 試行錯誤」
「同音意義語」→「もしかして: 同音異義語」
この「もしかして:」は、どのような仕組みで表示されるのでしょうか?「この単語が入力されたら、この単語を出す」という対応表、いわゆる辞書を持っていると考えられます。その辞書は、どうやって作られたのでしょうか。人力で作ることもできますが、大変そうですよね。
あなたが間違った言葉で検索をしてしまった場合を考えてみましょう。間違った言葉で検索した場合、検索結果の件数も少なく、探したい内容のサイトが見つからないですよね。そのとき、あなたはどうしますか?「あれ、間違えちゃったかも?」と、入力ミスがないかチェックしたうえで、再度検索を行うのではないかと思います。
みんながこのような行動をとるとしましょう。連続した検索クエリをいっぱい集めた上で統計処理を行うことによって、打ち間違いの辞書が自動的に出来そうですね。でも、このような処理っていつもうまくいくのでしょうか。
たとえば、フルーツの「アボカド」は、よく「アボガド」と表記間違いをされることがあります。では、『Google』で「アボガド」を検索してみましょう。あれ?「もしかして:」が出ませんね。
「アボカド」の検索結果は約173万件。
「アボガド」の検索結果は約110万件。
間違った表記でも、とても多くのサイト件数が検索結果として表示されます。きっと、「アボガド」と入力したユーザーは、それが間違いだとは気づかずに探したい内容のサイトにたどり着くのでしょう。誰も「アボカド」で検索しなおすことがないので、機械処理では辞書を作成することができません。
もうひとつ例を。『Google』で「うる覚え」を検索してみましょう。これも「もしかして:」が出ませんね。
「うろ覚え」の検索結果は約180万件。
「うる覚え」の検索結果は約18万件。
10倍近くの件数差があるのに、なぜ「もしかして:」が出ないのでしょうか? あなたが「うろ覚え」を「うる覚え」とうろ覚えしていたとしましょう。そのとき「うる覚え」で検索するでしょうか? 多分しないと思います。「うる覚え」で検索をする人は、「うる覚え」が誤記であることを知って、そんな誤記をしている人を探したりする目的を持っているのではないでしょうか。「うろ覚え」で検索しなおすことがないので、これまた機械処理では辞書を作成することができません。
昔の『Google』では、「もしかして:」の中身にまったく関係のない内容が出る時期がありました。このような辞書を自動で生成するのは、なかなか難しい処理なのです。しかし、「もしかして:」というのをわざわざ表示して、それをクリックするのはまどろっこしいですよね。明らかな間違いだったら勝手に訂正してもらいたいものです。実は、『Google』では誤記を勝手に訂正してくれたりもしているのです。
Googleで「確立が高い」を検索してみましょう。でもそれは「確率が高い」の誤記ですよね。その検索結果を見てみると、「確率が高い」という文字が太字になっていることが確認できると思います。あまりに間違いが多いため、検索エンジンの内部処理で同じ文字列として扱っているものと予想できます。
いやー、『Google』はマメですね。こんなにマメにされちゃうなんて、もしかして……。
[詳細記事]
引用元:ブラジル秘密基地
参照1:未来検索ブラジル
参照2:senna
■オススメ! 最新人気トレビアンニュース
・結婚するための同棲方法
・ひろゆき大遅刻! フラッシュ動画の祭典 『slashup04 fb Re:birth』!
・またNHKか! ニコニコ動画『ねこ鍋』がNHKで放送!
■関連リンク
・トレビアン恋愛
・livedoor ニュースの同記事はこちら
Ads by Google
コメントするにはログインが必要です
関連ニュース:グーグル
- <NTTドコモ>アンドロイド搭載の携帯電話 発売を開始毎日新聞 10日21時44分
- googleケータイは歴史の変換点となるか?--「HT-03A」発売に向けブロガーイベント開催CNET Japan 10日21時03分
- TKO木本 「これはすごい確率での発見ですよ」J-CASTニュース 10日15時40分
- ◎米グーグル、新OS搭載のネットブック概要を年内発表へ=無償化は広告収入に貢献時事通信社 10日13時56分
- グーグル、月面着陸40周年の日に「Google Earth」の新機能を発表すると予告CNET Japan 10日13時06分
- << マイクロソフトがテレ東、…
- IT一覧
- 世界一ウエストが細い&quo… >>
|
49,651円
まんてん屋
|
42,700円
まんてん屋
|
14,990円
エコ・ドライブ
|
3,591円
楽天ブックス
|
ITアクセスランキング
- 『DRAGON QUEST IX』の仲間キャラに自我がない件についてロケットニュース24 11日10時28分(17)
- 【トレビアン動画】お台場のガンダムセレモニー! 一般公開前夜の模様をお届け
トレビアンニュース 11日12時00分(2) - ドラクエも三人乗りも解禁!煩悩も爆走! ガンバレおかあさん【4コマでわかる時事ニュース】
ITライフハック 11日09時00分 - どっちがアップル純正のイヤホンの模造品かGIZMODO 11日14時00分(3)
- 違法、合法どっちなの? 遂に逮捕者もでた「マジコン」【気になるトレンド用語】ITライフハック 16日09時00分(13)
- DS版『ドラクエ5』を違法入手した者に待ち受ける罠INTER News 06日12時30分
- なんのためにブログを書くか 男性は社会指向 女性は自分指向 ネットエイジアがリサーチTechinsight Japan 11日00時10分(5)
- ついに『ドラクエIX』の本物ゲームデータが流出! マジコン対策は導入部分でのフリーズ
ガジェット通信 10日01時23分(14) - リラックマノートパソコン発売GIZMODO 11日16時00分(1)
- 中国の「ブートキャンプ」式インターネット依存症治療スラッシュドット・ジャパン 11日12時00分(1)
注目の情報
部長号泣!俺の英語が通じたぞ!とうとう夢が叶ったんです。英語の会議で通訳なしで成功したんです!
英会話習得の秘訣ですか?テキスト眺めたらダメ!ツライものは続かな
い、やり方変えたんですよ。
やっと見つけた英会話法はコチラ














行きの電車、帰りの電車で