1986 To Present
msgbartop
Google 我生活的每一天…
msgbarbottom

29 Apr 09 Google 社会化努力和改进搜索质量的关系

最近隐约感觉到 Google 在社会化方面似乎正在渐渐布局,但又看不出什么。刚才看到 Google 也许会发布针对个人偏好定制的新闻搜索,突然想到社会化可能是为了获取用户数据,从而针对不同用户给出不同的搜索结果和广告。简单整理了一下文字。可能有点“小题大作”或者“老生常谈”了,欢迎参与讨论发表你的看法。

据传,在六个月后,Google 将会发布新的新闻搜索,到时候你根本不用进行主动的搜索就可以看到 - 而且是只看到 - 你感兴趣的新闻。

但是 Google 是怎么样知道你对哪些新闻感兴趣的呢?通对对用户偏好数据的分析。而最能体现用户偏好的地方就是社会化网站。这似乎也可以解释为什么 Google 加快了自己的社会化步伐,并且开始重视 Google Profile。尤其是前几天被发现的 iGoogle 小工具“What’s Popular”更是将新闻和社会化结合到了一起。通过用户对新闻的评分情况来判断用户对哪些新闻感兴趣。

Photobucket

如果说“What’s Popular”这个小工具还不足以说明问题的话,去年推出并且曾一度饱受争议的 SearchWiki 也有让用户评分的功能。用户进行搜索本来就带有一定的目的性,只有对某个东西感兴趣了才会去搜,然后根据自己的感兴趣程度对搜索结果条目评分(不感兴趣的删除,感兴趣的上移)。而且这也是搜索结果个性化的最初体现 - 用户手动修改。

现在看来 Google 推出 SearchWiki 的主要目的可能并不是希望直接通过用户评分来改进搜索结果(当然不排除也有这个原因)而是获得用户对搜索结果感兴趣程度的数据。毕竟要准确的给向用户提供个性化的新闻服务需要对用户有足够的了解。

目前 Google 的推荐服务有很多,比如自动完成搜索关键词、YouTube 的相关视频、以及谷歌音乐中的“相似歌曲”功能等,但这些都是分析内容的相似性而没有考虑到用户的偏好 - 虽然 Google 表示如果你登录了自己的帐号你的搜索结果显示会考虑到你之前的搜索等因素,但是现在这些对搜索结果的影响几乎可以忽略不计。如果用户有特定的偏好就必须使用高级搜索进行限定。

我能想到的比较明显的根据用户的偏好的推荐就是 Google Reader 中的“Top Recommendations”。你也许会说,这不也是对用户订阅的内容进行分析后得出的吗?但是别忘了,这里用户订阅的内容已经很多,可以综合用户的所有订阅条目做出推荐,而上面提到的其他则是根据用户的一个“关键词/视频/歌曲”等得出其他大量的推荐,仅通过单个信息很难得出用户的偏好。但是现在 Google Reader 中的 “Top Recommendations” 做的也不好:

Photobucket
我不知道为什么给我推荐NBA的东西,我177个订阅里才两个和NBA相关,而 China Hearsay 就更无厘头了。

当然,对 Google Reader 做出如此不靠谱的推荐并不意外,因为他了解我的还不够多。

李开复曾在不同场合都举过一个“给妈妈送一束花”的例子:N年后,母亲节,你想送妈妈一束花。于是你搜索“买花”或者“母亲节”等关键词的时候,Google 就会给出相关提示。接下来,Google 会帮你挑好你妈妈喜欢的花,在你常去的花店购买,并且选择你信任的快递公司送给你妈妈 - Google 也知道你妈妈住在哪里。整个过程可能只需要你在付款时输入密码。

这是一个极端的例子,但是如果 Google 对你有足够多的了解,加上互联网的发展,这是完全有可能做到的。甚至,你一时冲动买了一件完全不符合自己常规品味的衣服,Google 都能根据你的日常习惯、最近工作状态、天气好坏等进行数据分析得出你买这件衣服是“历时的必然”。

如果考虑到用户隐私的话,这样会很可怕,但作为搜索引擎公司,这是 Google 必须考虑的。在做谷歌音乐报道的时候,产品经理洪锋也说,最好的音乐搜索是会自然的播放出适合你当时心情,当时环境的音乐,不用手动去挑选你喜欢的“泡泡”,甚至也不用烦劳大脑去思考想听什么 - 在什么都不适合听的时候谷歌音乐不会打扰你。

扯了那么多,我想说明的就是根据用户偏好可以做很多事情,尤其可以做的更有针对性(针对性对广告来说是最重要的因素),所以 Google 需要大量用户使用数据。显然 Google 也意识到了仅仅通过搜索来获得用户感兴趣的话题无法满足自己让搜索引擎更“人性化/个性化”的需求,而 Facebook 的爆发激化了 Google 的这一矛盾,使 Google 必须应对社会化网站带来的挑战,同时也通过社会化来改进搜索质量。

首先,Facebook 是封闭的,用户在 Facebook 里可以完成几乎所有在网上能做的事情,Google 就无法获得用户在 Facebook 里活动的数据,而且人们停留在 Facebook 里也看不到 Google 的广告。因此 Google 的社会化的第一步就是要打破 Facebook 的封闭,让互联网更开放,让用户不要一直呆在 Facebook 里,让他们出来进行搜索,并点击广告。

然后 Google 发现通过社会化可以得到很多用户使用偏好的数据,远比仅仅通过搜索获得的丰富。通过对搜索关键词的分析,Google 能更好的提供相匹配的广告,而通过对用户行为的分析,Google 能更好的改进搜索结果。虽然广告是 Google 盈利的主要途径,但是吸引用户来看广告的是精确的搜索结果。

最后,对于广告来说,针对性也是非常重要的。如果 Google 能对一个用户的喜好非常了解,在向该用户投放广告的时候也会更加有效。比如这个用户搜索“乔丹”,Google 就会知道他并不是想找那个打篮球的人,而是那个艳星,但是他搜索的目的并不是看艳照,而是想知道她老公开什么车追到她的。于是,Google 就会显示恋爱技巧的文章,而不是篮球、不是成人网站、也不是汽车。相比后三个,显然第一个广告对用户更有吸引力。

如果从这个方面来看的话,Google 的很多社会化努力都和改进搜索结果有关,可谓“项庄舞剑,意在沛公”。改进搜索结果就需要使得搜索结果更加个性化,要是搜索结果更加个性化就需要获得足够多的用户数据,要获得足够多的用户数据的最好方法就是通过社会化网站。

但即便 Facebook 把全部的用户数据都开放给 Google 的话,对整体搜索质量的提高肯定会有帮助,但是对个性化搜索结果却并无太多益处,因为 Google 帐号和 Facebook 帐号之间没有任何联系。所以在收购 Facebook 几乎为不可能的时候,Google 必须自己做社会化努力。

Tags: , , ,



Reader's Comments

  1. |

    就我的经验而言,google reader的订阅推荐对最近的订阅的权重很大…譬如我最近订阅的关于新闻的一个英文feed,那么就会被推荐类似于图里面china hearsay之类的feed;如果最近订阅的blog里面讲篮球的比较多,那么,nba出现在list之上就几乎是毫无疑问的了…总体来说,对我,google reader的推荐还是比较靠谱的…

  2. |

    @uty:
    那我完全不是这样的。关于NBA的是我很久很久以前,可以说刚开始用 Google Reader 的时候就订的,但是我基本不去看,最多看个标题,然后直接全部 Mark as read。而且我最近订阅的都是关于互联网的中文博客。
    不过推荐的确会变,有时候从标题来看的确会有我感兴趣的,但是里面的内容为仍然不是我需要的,我也从来没有订阅过推荐的东西。
    我觉得推荐应该看一个 Feed 的更新量和用户的阅读比例(一个是阅读量和更新量的比例,一个是阅读该 Feed 的条目和全部阅读数的比例)这样比较靠谱。

  3. |

    IPV6的来临似乎在这方面有帮助!

  4. |

    @download: 我对 IPV6 不是很了解,这似乎是一个互联网协议,请问这对个性化搜索有何帮助?愿闻其祥。谢谢!

  5. |

    http://www.seog.org.cn/2009/03/14/ipv6_seo/

    这篇文章讲得比较详细

  6. |

    @download:
    恩,非常感谢!就是这个意思。Zac 也有类似文章:
    http://www.chinamyhosting.com/seoblog/2009/02/26/keyword-ranking-dying/

  7. |

    关键是,机器只能根据我以前做过的事情判断我的喜好,如果我想做一些以前做过的事情范围之外的事情,怎么办

  8. |

    @Betty:
    判断了你的喜好就能判断你喜欢做什么不喜欢做什么啊,并不是具体的事情。
    再说,你做的任何一件事情都是基于以前做过的事情而做的,虽然有时候你觉得是无意识的,但之前的行为对你现在和今后的行为都会有影响,如果能很好的分析你之前做过的事,就能预测你之后可能会做什么。
    打个比方,你和电脑走象棋,你每走一步都和之前的每一步棋都相关的,电脑数据库够大,对你之前的棋路进行分析,就能对你下一步可能走哪里(可能有多种走法)做出预判。现在的情况是,你可能一步都没走,电脑对你的了解是基于对大量人的了解所得出的,具有普遍性但不具有针对性,比如虽然电脑没和你下过棋,但能预判你第一步最有可能走当头炮。而你和电脑走多了,它可能就知道你第一步其实最喜欢拱卒。

  9. |

    @adamzhu1986:
    不,你立论的基础是人是可以预测的,而我认为(至少某些)人是不可预测的,至少在可预见的将来技术上难以实现。
    比如我就是喜好与众不同,或者我平常就是更爱看篮球,但我今天却想看汽车,结果它列出的全是篮球的东西,岂不是让我很不爽?(事实上此类事情现在就经常发生……)

  10. |

    @Betty:
    我认为大部分人的大部分行为是可以预测的,比如佛洛伊德的一些关于人的童年对他未来的影响的确成立。
    一个人平常爱看篮球,一天突然想看汽车,一般都是有原因的,或者他今天在外面看到了车,或者很早之前的一次和车的经历因为现在某个原因触动了他。但是人们自己并不会觉得这和其他一些事有联系,不是有一句话么:“偶然中的必然”。
    当然,要搜索引擎做到这些必须让他“侵入”到你生活的方方面面,包括一个人的表面和内心。必须是搜索新闻和搜索A片都让搜索引擎知道这是同一个人,而不能让搜索引擎仅了解一个人冠冕堂皇的一面或者只是阴暗的一面。我认为“一切事情都有其发生的原因”,只是有的明显有的不明显。比如说,1-9选一个数字,我认为一个人选某个数字肯定是有其背后的原因的,就算选的人自己根本不知道,当然,他可能每次都选不一样的。原因可能是个人喜好,经历,甚至是当时的场景,让他选的人,甚至那天吃的早饭。
    话说回来,这些的确是很难准确的被预测的,但是缩小到一定的范围,比如只是网上行为,仅限于篮球,再小到火箭队,如果你搜索次数够多,搜索引擎是可以知道你输入特定的关键词是想要什么。比如你输入“得分”,他会知道你是想知道姚明的场均得分,而不是上一场比赛的得分,也不是巴蒂尔的得分 - 当然,有时可能你就是想知道巴蒂尔上一场比赛的得分,但是大多数时候,搜索引擎的判断是正确的。而这个“大多数”是可以无限向100%接近的。
    PS,至于此类事情现在经常发生这很正常,我们讨论的是未来的搜索引擎,拥有足够多的数据。现在的搜索引擎笨的很,连我有时候输入英文是想知道这个单词的中文意思都不明白,还给我列10个链接。

  11. |

    “今天在外面看到了车”之类的事情是在现实中做的,不是在网络上做的,Google无法知道,也就无从预测。
    现在说Google扩展也只是扩展到网络的方方面面,而不是现实生活的方方面面。
    真到了“选某个数字的背后原因”都被搜索引擎知道,那就不是展望,而是科幻了,显然在“可预见的将来”难以实现 :)

  12. |

    @Betty: 搜索引擎本来就只需知道你上网的习惯即可,我举1-9的数字只是举例人的行为是可以被预测。 Google 只要知道你输入得分是想知道姚明赛季平均得分,或者能做到李开复举的“送妈妈一束花”的例子,就是足够聪明了。



Leave a Comment

:| 8O :) :? 8) :D :oops: :P :roll: ;) :cry: :o :lol: :x :( :?: more »

:| 8O :) :? 8) :D :oops: :P :roll: ;) :cry: :o :lol: :x :( :?: more »