January 6, 2012
世の中の写真の2%はFacebookにあり。世界最大の画像検索の登場はいつ?


Triposo Labs | A year long snapshots around the world

この無数の光の明滅を見ているとき、「世の中には何枚の写真が存在するんだろう」とふと思った。

この動画※1は、実際に人々が撮影した写真を光のドットとして、世界地図上に1日ごとにプロットしたものである。

検索してまわると、Quora1000MemoriesのJonathan Goodが回答してくれていた。


Q. How many photos are taken each year?
A. We did the calculations for this and estimate that 375 billion photos will be taken in 2011.
(Q. 毎年何枚の写真が撮影されている?→A. 僕らの計算では、2011年には3,750億枚の写真が撮影されるだろう)

さらに、引用されていたブログには、1826年のカメラ誕生以来の世の中に存在する写真の数は3.5兆と概算されていた(in total we have now taken over 3.5 trillion photos.)。

3.5兆! すごいですね。

また、写真の保存場所としてはFacebookがぶっちぎりのトップだった(70 billion)。



ほかにもFlickr(6 billion)とInstagram(150 million)の写真枚数も引用されていたけれど、たぶん不十分なので、Imageshack(20 billion ※2)、Photobucket(9 billion ※3)、そして日本に限ればmixi(810 million ※4)、フォト蔵(110 million ※5)も付け加えたほうがいいだろう(他に著名なサイトがあったら教えてください)。


表にするとこんな感じ。


2012年1月現在

つまりFacebookは世の中の2%もの写真を預かってることになる。スゲー。

こうなると欲しくなるのは当然、画像検索だろう。写真が増えれば増えるほど昔のものが探しにくくなる。自分のはまだしも、ほかのユーザーの特定の投稿写真を見つけるなど今でも不可能に近い。

Facebook内の写真はプライベートな写真が多そうではあるが、もしかするとGoogleがインデクスしている写真数よりも多いかもしれず、オープンな情報としても有益なウェブリソースになりうる。Facebookに画像検索が実装されたら世界最大の画像検索になることは間違いないだろう。実装はいつだろうか(Bingががんばってるかもしれないし、3rdパーティのそういうスタートアップが現れてもおかしくないかもね)。


#ちなみに、画像共有サイトで検索機能を提供しているところはFlickrくらい(だと思う)。Yahoo!Incエライ! YSTやFast Search & Transferの検索技術はこういうところで生きているかもしれない。

Footnote/注釈
1. この動画は、自動生成旅行ガイドアプリを提供するTripso によるもの(※6)。Triposoがウェブクロールして集めた写真のExifデータから撮影日・撮影場所を抽出して地図にプロットしている。動画は単に光が明滅するだけなので、見ても「ふーん」で終わってしまいそうだけれど、Triposo Labsのページには、時期によってとりわけ強い光の理由が解説されているので参照いただきたい。

2. Imageshackの写真枚数は、Techcrunchの2009年4月の記事から。2年前の数字なので今はもっと多いだろう。
3. Photobucketはトップページに写真(とビデオ)の投稿数を掲載している。それに、Twitterの公式写真共有のバックエンドはPhotobucketが担っているのでますます増えるだろう。
4. mixiは、mixiフォトのサービス開始1日で150万枚の投稿があったという記事から私が概算した。2010年6月から2011年12月までの18カ月×30日×150万枚で単純計算すると、少なくとも8億1千万枚となる。もしかすると日本で一番大きいかも!? 
5. フォト蔵はトップページに写真数を掲載している。
6. Triposoはウェブリソースをうまくマイニングして有益データを作っている。Factualや、Next Big Soundのアプローチに近い。英語圏ではマイニング系、Data系が流行り始めているけれど、日本語もリソースは多いほう。2012年はData系がくるっていうけれど、日本からData系スタートアップって出ないのかな。 

December 27, 2011
2011年の振り返り:地震/故郷編

仕事編に続いて、今年を振り返るとしたら、被災した故郷岩手のことに触れないわけにはいかない。と思って、地震で起きたこと、見たこと、感じたことをいったん書いてみました。でも、どうしてもこちら側っぽく(非被災地側っぽく)なる気がして、消しました。

代わりに、地元の友人が携わっているプロジェクトを。

「復興の狼煙(のろし)」ポスタープロジェクト

被災地じゃねえ、正念場だ

とか。すげえいい言葉ばかりです。

こちら側とあちら側という区別が消失する地点で活動していくこと。それが僕がもらったヒントです。

(番外編に続く)

December 25, 2011
2011年の振り返り:仕事編

年の始めにバイドゥを辞め、トシさん、ヒロと3人で準備、2月にユニバーサルナレッジができた。

おかげさまで無事年を越せる。

振り返ってみて思うのは、「弱い紐帯の強さ」理論は本当だった!ということ。

会社のスタート以来、たくさんの方が心配してくれたり応援してくれた。元同僚に何度も助けられた。出会いも、仕事も、知り合いや、その知り合いからの紹介だった。それに先日入社した勝又さんも含め、ユニナレの仲間は全員元上司と同僚。

みな、2 hopくらいしか離れていない人同士で物事が回っている、といえる。人は皆つながっているスモールワールド現象ともいえるけれど、ユニナレの場合それができたのは、トシさんをはじめとして「信頼できる仲間ネットワーク」を作ってからの起業だったからだろう。 

ユニナレのホームページには「分かち合い」を大切にします、と書いている。

「分かち合い」には「共有」という概念だけでなく、一緒に作っていく「コラボレーション」の概念も含んでいると思う。僕はこの「分かち合い」という言葉が好きで、「共同体験」を通じてこそ「信頼ネットワーク」は作られていくと思っているからだ。

2011年に出会った人に感謝、ユニナレとお仕事をご一緒してくださった人、私たちのプロダクトを導入いただいたお客様に感謝したい。

たぶん、「弱い紐帯の強さ(The strength of weak ties)」っていうネーミングよりも、「弱い紐帯のありがたさ(Thanks for weak ties)」っていう名前のほうがぴったりなんじゃないかな。

2012年もいい「絆」「ネットワーク」が生まれ、広がっていきますように。

(続く)

November 29, 2011
パーソナライズとは情報の海から意味を取り戻すこと



ふたつの記事に触発されたので検索のパーソナライズについての雑記を。

「Claude Shannon, father of information theory, separated information from meaning. His central dogma, “meaning is irrelevant” declared that information could be handled as a mathematical abstraction independent of meaning. … The immense size of modern databases gives us a feeling of meaninglessness.  It is our task as humans to bring meaning back into this wasteland. As finite creatures who think and feel, we can create islands of meaning in the sea of information.」

検索サービスも「情報」から「意味」を取り除いて生まれた。「意味」を把握することなく、数学的に情報を扱うことによって大規模な処理が可能になったためである。

その「検索」が「意味」を取り戻す行為、それがパーソナライズといえる。

ウェブ検索企業はずうっと前からパーソナライズに取り組んできた。下の一文は、これまでのパーソナライズへの取り組みの歴史が集約されている。 
「Context is so foundational in search today that without it, search results would be almost meaningless.  Personalization is a narrow class of context. It’s the context of you, the searcher, including your interests and your network of contacts.」

はじめは、「Your interest」の把握から始まった。

2005年、YahooのMyWebや検索履歴サービスを皮切りに、Googleも同時期に個々人の検索履歴を蓄積を開始。さらに、ウェブ検索をしている時間はウェブブラウズのほんの一部でしかないので、Googleはツールバーを用いて、検索結果以外のウェブ閲覧履歴も取得。これらは検索結果でクリックした、ブックマークした、閲覧したページのようなウェブ閲覧傾向から、利用者の興味を把握し、その傾向に応じて検索結果をパーソナライズするアプローチである。

そして、近年は、BingとFacebookとの連携のように、ソーシャルグラフやインタレストグラフの情報をフレーバーとして検索に反映するアプローチも出てきた(the context of your network of contacts)。人は社会的な生き物で、かつウェブはリアルタイムなのだから、社会的なつながりのなかで「今」シェアされたものを上位に表示することが自ずと文脈形成につながるという方法である。

では、「履歴・興味解析」と「プロフィール・ネットワーク解析」だけでパーソナライズが実現されるのだろうか。そうは思えない。

やはりコンテンツの「意味」を把握することが必要だろうと私は思う。「情報」の海から「意味」を取り戻すこと、それが検索が本当の意味でパーソナルなものになる。
ウェブ検索のパーソナライズは時間がかかるだろうが、バーティカル検索のパーソナライズはもう近々登場するだろうと思っている。

商品検索、ローカルサーチ、不動産検索、動画検索などのバーティカル検索は、意図が明確なうえ、コンテンツも構造化されている。ウェブ検索では得られない視聴時間、購買履歴、平均支払金額、資料請求情報などのユーザビヘイビアー情報も利用できる。モバイルデバイスによって位置情報の割り出しから、支払い情報までも把握できる。
 
ユニナレでもがんばりたいです。

June 27, 2011
導入率調査結果。日本の検索窓にサジェストを

言うまでもなく、情報が多いサイトにとって、キーワード検索は重要なナビゲーション手段。検索がなければユーザは求める情報に辿り受けないし、キーワードサジェストはその入り口であり、小さな検索結果でもあるため、ユーザとのコンタクトの最前線といえる。

キーワードサジェストの良さは、うろ覚えのキーワードを自動補完してくれたり、思いつかなかった最適なキーワードを提示してくれることだろう。長いキーワードの入力の手間を省くこともできる。サジェストがあるとないとでは、ユーザビリティにぐんと差がでる。

検索サービスによってもサジェストの内容やUIは異なる。ウェブ検索であれば、あらゆるキーワードがサジェスト候補として出てくるが、路線検索のサジェストは駅名やPOIだけが提示されるようになっている。書籍検索であれば書名や著者名、自動車検索であれば車種やメーカー、動画検索であれば動画タイトルや有名人名が提示される。それぞれの検索タイプに応じたサジェストが提示されることでよりユーザは明確にキーワードを選択することができる。

では、日本でいまどれくらいのサイトがサジェストを導入しているだろうか。

トラフィックが多く、検索が主なナビゲーションになっているサイトを150選び、サジェスト導入有無を調査した。また、サイトの検索タイプも分類し、どの分野で導入が進んでいるかも調査した。

(なお、ウェブ検索のサジェストをブログ検索など他の検索サービスに代替利用している場合は便宜上「サジェスト無」とした。例:Naverまとめは、Naverウェブ検索のサジェストを使っているので「サジェスト無」にマーク)

調査結果は以下のとおり(2011年6月26日時点)。

■表:日本の主要検索サイトのうち3割がサジェストを導入。7割が未導入

結果、150サイトのうち、サジェスト導入サイトは43サイトで、サジェスト未導入サイトは107と判明。日本のサイトのサジェスト浸透率は約3割といえる。

■グラフ:ウェブ検索が8割、商品検索は3割、知識・ニュース・レシピ・飲食店検索はゼロ

検索タイプ別にみると、2サイトしかリストしていない百科事典検索は100%だが、次いでウェブ検索が約80%、動画、画像、自動車、書籍、路線検索が50%と続く。先日から弊社ユニバーサルナレッジが提供を開始したサジェストはECサイト向けであるが、商品検索系のサジェスト浸透率は3割にとどまっている。

#ちなみに、調査中に関心したのが楽天の取り組み。楽天のほぼ主要サイトにはサジェストが導入されていた。

知識検索、ニュース、レシピ、飲食店、映画、(ソフトウェアやデジタルコンテンツの)コンテンツ検索の分野では、まったくサジェストが導入されていないこともわかった。検索結果とにらめっこをしながらキーワードを自分であれこれ変更しているユーザの姿が目に浮かんでしまう。

はたして、日本のあらゆる検索窓にキーワードサジェストが導入される日はくるだろうか。

インターネットをより便利に、より良くしたいと考えている弊社ユニバーサルナレッジは、キーワードサジェストの開発・導入を承っておりますので、ご興味・関心のある方はぜひご相談ください。日本の検索サービスがサジェストを導入する一助となりたいと思っています。(会社のホームページは鋭意制作中ですので、)こちらの連絡先からお問合わせください

なお、本調査のオリジナルリストは、Google Docsで公開しています。調査・更新を手伝いたいという特殊な(?)方がいたらご連絡ください。

- - -

最後に、最新事例的な、サジェストのおもしろい利用の仕方や、新しいUIをご紹介しておわりにします。

Quora

急成長しているアメリカのQ&A/知識検索サイト。かつて招待制だったことや、(Facebookログインによる)実名利用が前提で、実名であるがゆえに回答の信頼度が高い。Quoraのサジェストの特徴は、キーワード候補を提示するだけではなく、Q&Aの「Q」、つまり「質問文」をサジェストしてくれること。類似の質問(と回答)を提示してくれるので、求める情報にたどり着きやすい(また、同じような質問が何度も投稿されるのを防ぎ、知識がひとつのQに集約されていくのも助けている)。日本の知識検索系サイトでもぜひ導入していただきたい機能。


Naver人物検索

有名人のプロフィールや作品情報を検索できるサイト。Naver人物検索のサジェストの特徴は、有名人名キーワードとともに有名人画像も併せてサジェストしてくれること。画像があることによってわかりやすくなっている。なお、FacebookFlickrのサジェストも、同じように人名画像を表示してくれてわかりやすい。Quoraも画像付き人名サジェストを表示する場合あり。人物名のサジェストは画像といっしょに表示したほうがいいとみんな思ってるってことだね。

GMarket

eBayとジオシスのジョイントベンチャーECサイト。日本とシンガポールで事業展開。キーワード候補の選択に応じてサジェスト右側にその検索結果を動的に表示する。検索結果に遷移しなくてもサジェスト内で結果を得られる、ある意味サジェストを超えたサジェスト。若干動作が重いが、商品検索のサジェストUIとして参考になる。

- - -

日本の検索窓にサジェストを!