搜索技术进化的新方向:内容引擎,社区内容的加工流水线;新技术背后的人 - CPU 路线图 - DonewsBlog

来源:百度文库 编辑:神马文学网 时间:2024/06/06 10:23:53
搜索技术进化的新方向:内容引擎,社区内容的加工流水线;新技术背后的人
下一代的搜索技术(附文《姜奇平,深远地思考互联网经济:搜索与用户体验》)是怎样的?很多人已经在研究,并在实践着(搜索“下一代的搜索技术”可见)。本文长话短说,少提理论,着眼于应用。
有必要提到麦田说的“社会化搜索=社区≠社区搜索”,我的理解,对后者(不等式)的表达没有疑义,但前者(等式),很容易会让人一下子迷糊起来;如果多加上一个字,改为“社会化搜索=大社区”,理解起来就会容易很多。
这里说的“大社区”, 是指一种参与式的信息交流空间,它与“强关系”形成的社区概念有所不同。在大社区中,人们之间会有各种若即若离的信息流关系。是的,未来的网络世界就是大社区,未来的搜索将是大社区中的信息流通道,这些通道将会促进各个信息结点之间的互动(背后还是人)。
大家知道,在互联网上,写与读是基本手段。新的搜索技术会面向阅读,方便人们阅读、学习、找资料甚至是找朋友。在这个基础上,它会成为人们进行网络交际活动的中间语言层。从阅读的角度来看,它将有机地融合“推与拉”(pull and poll)两种传播方式的优势(对用户体验言),同时覆盖“大众”(某一社群的共同兴趣或观点看法)与“小众”信息(某些人要的精确资料)两个层面。
除了内容整合之外,其神奇之处在于,它还可以有机地整合起种种的功能型应用,促进互联网上的信息通讯。我相信,在未来的不久,我们在互联网上的交流效率将比现在的效率提高一个数量级。
更有意思的是,其实现的复杂度,比起现有的搜索技术,同样会高出一个数量级,有很多原因,下面列举三点:
一、在功能上,它不仅要能精确搜索,还要能促进参与式的互动。要注意,互动的个体不再是网站,而是人,基数变大了10倍多(有数据表明,06年5月份,全球网民突破10亿;06年4月份,全球网站数量超过8000万,按这些数字计算,之间的比率是12~13倍。当然,很多人不爱交流,但是,网站方面同样也有很多静默状态的站点)。就这一点来说,复杂度是原来的2的10次方;再加上个人信息行为的变化度,互动频度的提高,那复杂度就更大了(考虑到个人的内容量会少于网站的内容量,这点会稍微降低复杂度,但不会低太多);
二、互联网信息的写入速度在不断加快,信息的“熵”值在不断提高。在海浪中的高速度,比较起在真空中的高速度,前者明显要难得多;
三、它要有一个更好的降噪技术 —— 这是很多人都忽略了的地方;可是,请千万不要看小这一点。如果没有好的降噪手段,系统的运行质量会大打折扣,用户体验自然就不会好;只有做好了反SPAM的工作,信息噪音降低下来,新系统才会行之有效。
正因为其难度高,大家都在探索阶段;也正因为难度高,大家都有机会。现在的实际情况是,很多团队都同在一条起跑线上。只不过,有些团队的腿长,跑步会更快,象Google、Yahoo,就这样而矣。
细推个中的关键,就是要通过模糊技术,去达成更准确判断的目的,也就是说,要有更高的AI 。毫无疑问,这种搜索系统如果能实现,那它将会成为互联网信息的自动化工场,社区内容的加工流水线。
回归主题,不管进步得再好,归根到底,搜索技术还是要服务于人,让用户能更快更低成本地获取资讯,人际交往更便利。最终,这将会在世界范围内,促进信息生产力整体的提高。
本文的发端始于《社会化搜索:一个关键的等式》,《东拉西扯:当搜索遭遇社会》。象之前提过“会花更多的时间去研究”的那样,自国庆前开始,我一直在考虑着这方面的事情。在这期间,找房子搬家费了一个星期的时间(用了酷讯,有些用,但最后,还是通过熟人才找到合适的房子),11号那天装好宽带,不巧又碰上DONEWS BLOG大修。刚好,现在也琢磨透了,先发篇短文,接下来再写透(内容引擎的发展轨迹,着重在未来的竞争形态)。后面的笔头,可真不容易动,因为那涉及到了很多的“对象”,还好,谋篇已现,内容正在精炼之中。敬请暂待下文,有兴趣的朋友,不妨多交流。