*[社会]いかにして“大海から針を探す”か?――MSの社会学的アプローチ

http://www.zdnet.co.jp/news/0308/21/ne00_smith.html
ニュース・メールの内容からいい情報を抜き出すというのは昔からあったような・・・だって、Webページ(HTML)よりシンプルなデータ構造だし、データがきれいだと効果がわかりやすいし。。。
最近思うんだけど、Webページは視覚効果があるから、検索エンジンはそれを考慮すべきなんだよなぁ。1つのページの中にすべての文字を同様に扱うのは変じゃない?
今の検索エンジンは単語の登場回数とか自然言語処理を行った上での検索はやってるんだけど、ページの視覚効果を考慮した(たとえば、文字が大きくして強調されてるとか)の検索エンジンって実用的じゃないよねぇ。っていうかまだ見たことないよねぇ。
おぉ。これってまだ誰も手をつけていない分野???