以词搜词

来源:百度文库 编辑:神马文学网 时间:2024/05/29 03:53:05
以词搜词(Search words with words)
What is “以词搜词”?
以词搜词(cisoci)是通过熟悉的词找到不熟悉的词的一个过程,比如通过“王菲”找到“李亚鹏”, 通过“馒头”找到“胡戈”等。
Why CiSoCi?
在现在搜索引擎(如Google、Baidu)的关键词框架下,用户要得到正确的文档,必须输入正确的关键词,词选对了,相应的文档就能搜索出来,搜索引擎就像一个“从词到文档”的API,只要输入正确,输出就正确。
然后保证正确的输入却不是一件容易的事,事实上,很多用户都需要经过一个反复的过程来找到那个合适的“搜索词”, 如下图所示:
用户开始想到一个词,可能不是最合适的搜索词,一般用户会用这个词去搜索文档,然后从文档中去找更好的搜索词,如此反复,直至找到那个最合适的“搜索词”。
在人际关系网中有个“六度空间理论”,其认为任意两个人之间,最多六次转接就可以连线;如果把文档中的“词”也看成关系网中的“人”的话,同样存在着“词际关系网”,每个“词”同样也有其认识的其他“词”,并在不同时期还可能有不同的权重,比如“王菲”这个词,历史上先后就与“窦唯、谢霆峰、李亚鹏”关系比较近,同样,词与词之间也可以通过不同转接进行相连。
例解
如用户输入“王菲”,结果页面的左边是“词搜索”的结果,右边是“文档搜索”的结果。从“词搜索”结果可以看出,与“王菲”相关的其他名人有“李亚鹏”等, 而网络对“王菲”的评价用词常用“冷艳、忧郁”等, 而网络对“章子怡”的评价用语则多用“性感”等词汇。