by Read/Write Web
●Query Pre-processing
user's intent-ユーザの意図を反映
1. Natural Language Processing
Hakiaや Powersetに代表。ユーザのクエリーの背景にあるsemanticsやmeaningを理解しようとする。
Google等との大きな違いは"stopwords" で、 by, for, about, of, in を重視する(Googleは無視する)
2. Personal relevance (aka personalization)
Googleはログインしていれば可能だが、John
Battelleはじめ「それってこわいよね」という意見もある。
Matt Cutts@Googleはそんなことないと反論しているが。anonymousでもパーソナライズできる仕組みや
複数のサイトで使えるパーソナライゼーション等に期待。
Collarity
3. Canned, specialized searches
SimplyHired仕事のvertical search engine( "employers friendly to mature workers", "dog-friendly
employers" 等)
●Information Sources
情報源にフォーカスし、情報源を制限して検索結果の信頼性をあげる。
4. New content types
今の若者達は携帯で写真や動画をやりとりする。ウェブでは画像、音声、映像、テレビ等の
rich media contentやsemantic informationが急増し、検索エンジンもそれらに対応。
- Rich media search: Audio (odeo, podzinger), Video (Youtube, truveo), TV (Blinkx ), Images (Picsearch, Netvue)
- Specialized content search: Blogs (Technorati), News (Topix), Classifieds (oodle)
もちろんGoogleも Google Blogsearch (blogs), Searchmash
(images), Google Video, Google News等がある。
一つの検索で複数のメディアを出す Searchmash や Retrevo 。
5. Restricted Data Sources
spamやSEOによって検索結果が荒れるので、検索する情報源を限定。A9.com Google Co-op Yahoo! Search Builder Rollyo
6. Domain-specific search (Vertical Search)
Alex Iskold's article on the Read/WriteWebもしくは this overview on Software Abstractions blog 参照。
Sramana Mitra's overview of online travel services も
●Algorithm Improvement
7. Parametric search
テキスト検索というよりDatabase query(や問題解決)。
Shopping.com indeed(zip codeで仕事探し)GlobalSpec (Engineering components)
8. Social Input
Yahoo!のBradley Horowitzは social input が検索テクノロジーの差別化要因になると考えている (Microsoft も). wisdom of crowdsってやつだ。
del.icio.us comparison among the different findability solutions StumbleUpon, Squidoo
GoogleのPageRankもcollective intelligence.
9. Human Input
ChaChaは人間のオペレータが検索クエリーに対応。Yahoo! Answers
(うわー検索したらchat live with a guideって出て来た!)
10. Semantic Search
Semantic Webの可能性。
Monitor110 Spock(plans to have a 100 million profiles) Riya
11. Discovery support
searchとRSSなど。
Bloglines "Recommended Feeds" Aggregate Knowledge
●Results Visualization and Post-processing
12. Classification, tag clouds and clustering
Quintura Clusty
13. Results visualization
Visual Thesaurus Inxight Software HeatMaps (Trulia HousingMaps
14. Results refinement and Filters
Healia demographic filtersを使って検索結果をtweakできる医療検索エンジン。
医療だと特に性別年代人種により症状や服薬に影響を与えるので重要。
Google OneBox widget と Plusbox feature
15. Results platforms
TiVoが映画を検索できたりやNintendoがオンラインゲームやレシピを検索できるように?
Plazoo Quintura
API Alexa Web Search platform oodle, zillow trulia
16. Related Services
the web's too bigという検索エンジンはイギリスのPR会社のサイトにある情報だけを探せる検索エンジン。
複数のPR会社への問い合わせを一気に出来る機能も搭載 不動産のZestimate Home Q&A機能
17. Search agent
Copernic
Connotate Technologies
search engineについて詳しく書いているRead/WriteWebの記事 にて紹介→ Allth.at Swamii Searchbots.net
●References
Josh Kopelman/Redeye VC: Google - The next vertical search engine?
O'Reilly Rader (via Sarah Milstein): Thoughts on the State of Search
Don Dodge: What's new in search technology? Is Google it?
Rich Skrenta: How to beat Google, part 1
Information Arbitrage: Domain Expertise: The Key to Next Generation Search
David Berkowitz: The Hunt for Search Engine Innovation, Part 1
Richard MacManus/RWW: Interview with Google's Matt Cutts about Next-Generation Search
Phil Butler on Hakia and Powerset
Bob Stumpel: SEARCH 2.0 - consolidated
Google Operating System: What Has Google Done in Search Lately?