laolu: 移动搜索行为的一些数据资料

来源:百度文库 编辑:神马文学网 时间:2024/06/03 14:32:32
移动搜索行为的一些数据资料

除了专利之外,Google的工程师们也发表了不少研究论文,主题广泛。其中有篇《A Large Scale Study of Wireless Search Behavior: Google Mobile Search》(PDF文档),对移动搜索行为做了统计分析。
在XHTML(手机)查询中:平均每个查询输入的单词数量为2.3个(中位2,最大30,标准差1.6),平均每个查询输入的字符数为15.5个(中位14,最大502,标准差9.18)。在PDA查询中:平均每个查询输入的单词数量为2.7个(中位3,最大65,标准差1.5),平均每个查询输入的字符数为17.5个(中位16,最大396,标准差9.1)。这与以往桌面查询的数据(一为2.35[注1],一为2.6[注2])很接近。
XHTML和PDA搜索的主题范畴见下:
手机XHTML查询的主题范畴分类统计
主题范畴
占查询的%
平均每个查询的字符数
平均每个查询的单词数
Total 100 15.5 2.3
Adult > 20 12.5 2.2
Entertainment > 10 17.1 2.9
Internet & Telecom > 5 15.1 2.4
Local Services > 5 18.8 3.0
Games > 2 17.5 3.0
Computers &Technology > 2 14.7 2.4
Lifestyle & Communities > 2 17.5 2.9
Sports > 2 15.7 2.6
Health & Beauty > 2 18.6 2.9
Travel & Recreation > 2 16.1 2.5
Society > 2 19.2 2.9
Automotive < 2 15.7 2.6
Shopping & Consumer Services < 2 15.2 2.4
Arts & Literature < 2 18.3 2.9
Food & Drink < 2 17.0 2.7
Hobbies < 2 14.8 2.5
News & Current Events < 2 16.8 2.7
Finance & Insurance < 2 16.0 2.5
Science < 2 16.5 2.8
Industries < 2 15.9 2.5
Home & Garden < 2 16.3 2.6
Real Estate < 2 20.0 3.1
Business < 2 17.2 2.7
Unclassified > 15 14.4 1.1
Total 100 17.5 2.7
PDA查询的主题范畴分类统计
主题范畴
占查询的%
平均每个查询的字符数
平均每个查询的单词数
Total 100 17.5 2.7
Local Services > 15 19.9 3.1
Entertainment > 5 17.7 3.0
Computers & Technology > 5 17.0 2.9
Travel & Recreation > 5 18.4 2.9
Internet & Telecom > 5 15.4 2.5
Adult > 5 15.0 2.5
Sports > 5 17.1 2.8
Food & Drink > 2 18.4 2.8
Health & Beauty > 2 17.9 2.7
Society > 2 20.2 3.0
Automotive > 2 16.9 2.8
Shopping & Consumer Services > 2 17.3 2.7
Lifestyle & Communities > 2 18.1 2.8
Games > 2 16.8 2.8
News & Current Events > 2 15.3 2.5
Finance & Insurance > 2 16.8 2.5
Arts & Literature > 2 19.1 3.1
Hobbies < 2 16.8 2.7
Industries < 2 16.9 2.6
Home & Garden < 2 19.4 2.9
Science < 2 18.2 2.9
Real Estate < 2 21.5 3.2
Business < 2 19.5 2.9
Unclassified > 5 13.3 1.5
数据来源:A Large Scale Study of Wireless Search Behavior: Google Mobile Search
据以往发表的有线搜索主题([注3]),前三个是“Commerce, travel, employment or economy”、“People, places and things”和“Computer or Internet”,色情查询只占10%不到。对照上面的数据,虽然XHTML和PDA的查询主题有些不同,但它们与有线查询的差异更大。
//原以为移动设备上输入比较麻烦,用户的查询可能更简短,结果好像不是;原以为手机绑定到个人,色情查询会更少,结果好像也不是。手机和PDA用户在查询上的不同,可能与用户群有关。如果在中国,PDA用户搜索的第一需求就是哪儿吃饭?
[注1]:
数据来自两篇参考文献:
1)Jansen, B. J., Spink, A., Bateman, J., Saracevic, T. 1998. Real life information retrieval: A study of user queries on the web. SIGIR Forum, Vol. 32 No. 1 pp. 5 -17.(这里有PDF原文下载,但需要帐户或收费);
2)Silverstein, C., Henzinger, M., Marais, H., Moricz, M. 1999. Analysis of a Very Large Web Search Engine Query Log SIGIR Forum, Vol. 33 No. 1 pp. 6 -12.(这里有免费的PDF原文下载)。
[注2][注3]:
数据和引用来自:Spink, A., Jansen, B., Wolfram, D., Saracevic, T. 2002. From E-Sex to E-Commerce: Web search changes. IEEE Computer Vol. 35 No.3 pp. 107-10.(这里有免费的PDF原文下载)。
另外还找到两篇相关搜索查询统计分析的文章:
1)Steven M. Beitzel, Eric C. Jensen, Abdur Chowdhury, David Grossman, Ophir Frieder. Hourly Analysis of a Very Large Topically Categorized Web Query Log.(这里有免费的PDF原文下载)。
2)Analysis of a very large web search engine query log(PPT文档)