东拉西扯:超链分析和PageRank的专利问题 - 对牛乱弹琴 | Playin‘ with IT

来源:百度文库 编辑:神马文学网 时间:2024/05/23 20:08:30
东拉西扯:超链分析和PageRank的专利问题

之所以想起这个话题,是因为看到xiao以内行身份在月光博客的留言:

作者说百度抄袭google链接分析专利的说法是可笑的,李彦宏的确拥有超链分析专利,而且这个专利的日期要早于google的专利,这在美国专利局网站上都是可以查到的。

我立刻在美国专利和商标局网站查了一下,发现Lawrence Page(即Larry Page)共有两项专利被批准,其中于1998年1月9日提交的PageRank的专利申请(PDF文件下载),于2001年9月4日被批准,美国专利号6,285,999。

根据百度页面上的提示,Robin Li(李彦宏)于1996年即在美国提交了超链分析的相关专利申请(filed a patent on the hyperlink analysis in the United States。不过,百度中文页面上则说是李彦宏获得了美国专利,但没提超链分析)。我以发明人姓名“Robin Li”为关键字(IN/li-robin),在USPTO网站查询,已获批的专利查询结果为“0”,专利申请查询结果为“1”。不过,后面这个申请是去年10月份提交的,跟搜索引擎无关,作为发明人之一的Robin Li,应该不是李彦宏。

百度自己的网站上,能找到一些有关超链分析的说法,并称李彦宏是这一专利的惟一持有人的,但关于该专利申请和获得的详情几乎没有。只是在这篇《程序员》杂志2003年的采访中,闫辉问起有关该专利的情况时,李彦宏回答道:“在美国,有专业的专利律师。但当时这个专利是我的职务发明,所以发明人是我,拥有者属于我任职的公司,而公司又不懂这个东西的重要性,也不愿意去冒风险打官司。”有没有知情者可以告诉我这个专利的专利号?

以前我曾在很多地方看到,李彦宏说上世纪90年代中期,他在澳大利亚讲超链分析,有两个斯坦福的学生坐在台下,后来这两个学生做出了Google。不过我一直没太搞清楚这事儿的先后次序,到底是李彦宏的启蒙在前,还是Page和Brin的实践在前。终于梁冬的书中找到了答案,这个会议的时间是1998年4月,地点是澳大利亚的布里斯班。如果没有搞错,这应该就是第七届国际WWW大会。不过这时候,Google的前身BackRub已经在斯坦福大学的网络上运行了两年多。

我在这次大会的网站上,找到了一些更有趣的信息。Larry Page和Sergey Brin著名的论文,《一种大规模超文本Web搜索引擎的分析》就是在这次大会上提交的,作为对PageRank技术最早的公开阐述,这个论文后来被大量引用。

不过,在这个网站上,我没能找到有关Robin Li的任何信息,包含Page和Brin的网页,倒是可以找到一些。

本文只有疑问,没有结论。

百度首席产品设计师俞军过去很欣赏这样一句话:“我们若能更妥善地搜寻资料,实在已经改变世界。”我也很欣赏,但我同时认为,这种改变是有限的,总有太多的真相,存在于搜索引擎之外。搜索引擎的确可以帮助我们获得很多不为人知或被历史尘封的信息,但我们所能掌握的有价值的信息,还是太少,常常不足以支持一个准确的结论。

另外,请大家有话好好说,不要互相攻击。

Update: 在有关朋友的提示之下,重新以“Li Yanhong”这个名字搜索,找到了相关专利,美国专利号:5,920,859。专利提交日期为1997年2月5日,批准日期为1999年7月6日。这项专利是关于超文本文档检索系统和方法(Hypertext document retrieval system and method)。相关专家可以来分析两个专利的相似性。



Trackback: http://tb.donews.net/TrackBack.aspx?PostId=860109


[点击此处收藏本文]   发表于 2006年05月08日 9:53 AM



 Jonson Yuen 发表于2006-05-08 10:02 AM  IP: 202.105.42.*搜索时代!基本上社会属性的人一言一行都会搜个片甲不留!
 广告小蝎 发表于2006-05-08 10:16 AM  IP: 61.159.4.*唉,要忽悠是越来越难了
 DemonFox 发表于2006-05-08 10:21 AM  IP: 128.12.173.*呵呵,好,我喜欢这样的考证。
 小发 发表于2006-05-08 10:24 AM  IP: 222.197.4.*确实是大人物。说个谎话脸不红,心不跳。
 billy.gao 发表于2006-05-08 10:27 AM  IP: 210.21.123.*忽悠不行还有大棒,历史都可以被当成婊子,个人的言行就更不足轻重了。百年后谁还记得谁?
 19楼 发表于2006-05-08 10:44 AM  IP: 218.108.8.*中国人就喜欢这样,不脚踏实地做事,支持Google.
 19楼 发表于2006-05-08 10:45 AM  IP: 218.108.8.*中国人就喜欢这样,不脚踏实地做事,支持Google.
 nings 发表于2006-05-08 10:49 AM  IP: 222.138.161.*如今这个时代,靠忽悠已经不行了。
 掠夺者 发表于2006-05-08 10:52 AM  IP: 222.223.189.*专利不专利是不重要的,关键的是谁的算法更好!!!
 公关 发表于2006-05-08 11:05 AM  IP: 210.22.131.*谁先谁后应该没什么关系吧,
 chenmi 发表于2006-05-08 11:22 AM  IP: 60.176.95.*随着网络或者说国人对法律意识越来越重视的情况下,专利以及版权这样的概念慢慢的成为了流行的名词。对于这个已经使用了多年的技术,现在去翻历史查证是到底哪里处了错?这样做只能用来……,呵呵,省略中间的一段议论。

对于超链分析和PR的专利问题,其实我们并不在意,谁在用这个技术也不重要;对用户来说,这个技术最终的实现结果才是最重要的,无论怎么说Google对这个技术的应用让我们了解了这个技术,百度的表现却不明显。
 kk 发表于2006-05-08 11:37 AM  IP: 222.93.45.*李彦宏玩搜索确实比较早...

KESO怎么老针对他...
 u 发表于2006-05-08 11:50 AM  IP: 203.211.94.*keso我经常看你的blog,从个人角度上来将,我不是很喜欢你,因为从你的文字中,总是能察觉到你贬低自己国家的痕迹,但是无论如何,这个没关系,下面我说说你发这个文章这个事情。

我看了你这个文章后花了30分钟,在网上找了资料,大致是这样:

首先:根据Wayback Machine,在1998年2月7日,这个连接:(http://web.archive.org/web/19980207005953/http://backrub.stanford.edu/)中,BackRub中没有提及任何PageRank的资料,实际上我看到的,从文字上可以感觉到BackRub自己认为自己是一个Web Crawler。

然后:到了1998年10月,请注意,这个时间是在1998年4月之后,BackRub正式使用了Google的域名:(http://web.archive.org/web/19981206025554/http://backrub.stanford.edu/),从此BackRub就没有再更新过。

为了继续调查,我看了Google.com的历史纪录,在这里(http://web.archive.org/web/*/http://www.google.com),可以看到第一个纪录是1998年10月,这个(http://web.archive.org/web/19981202230410/http://www.google.com/),其中首次出现了PageRank这个字眼,在这个页面(http://web.archive.org/web/20000301130432/www.google.com/adv_features.html)。


总结一下,大致是这样:

1997年2月 Li Hongyan 提交了类似PageRank的专利申请,1998年4月Li Hongyan 于澳大利亚演讲,其中在座听讲的有Larry Page和Sergey Brin,同时他们已经有了类似PageRank的论文(但是这个时候已经距Li Hongyan提交专利申请1年了),1998年10月Google上线,正式使用PageRank这个字眼,但是Patent Pending,1999年7月Li Hongyan的专利获得批准,2001年9月Google专利获得批准。

以上文字如果有错误,也很正常,因为我才花了30分钟的时间。

美国专利和商标局,毕竟是美国人的机构,2001年时偏袒一下当时已经很厉害的Google,这个无话可说。

我从来不用Baidu,但是,作为技术认为,我知道要维护一个Baidu这样的搜索引擎绝对不是一件容易的事情,虽然Baidu严格上来说是一个美国的上市公司,但是这个毕竟是我们华人开发出来的产品,哎,你们这群人啊,嘿嘿,嘿嘿。
 dowei 发表于2006-05-08 12:12 PM  IP: 61.177.9.*如果抛开什么华人的身份,百度做了什么?注册地又不是中国,顶多就是为中国提供了很多服务。

但是这种服务并非最好的,也不是没有百度不可的,甚至百度影响了我们更好的获得此类服务。比如中国移动,虽然给你了手机业务,但相信在更多的地方,没有移动的充分竞争会让我们拥有更好的移动通讯服务。除了李颜红跟我们一样是中国人外,对中国人还有什么好处?所以也没必要老拿什么华人来说事吧,好就是好,坏就是坏。
 u 发表于2006-05-08 12:14 PM  IP: 203.211.94.*我又花了点时间看了看两个Patent的内容,因为不是这方面的专家,所以很难做出什么评论,不过从一些句子上来看:

Li Yanhong的Patent的概述摘要:
A search engine for retrieving documents pertinent to a query indexes documents in accordance with hyperlinks pointing to those documents. The indexer traverses the hypertext database and finds hypertext information including the address of the document the hyperlinks point to and the anchor text of each hyperlink.

Page的Patent的概述摘要:
A method assigns importance ranks to nodes in a linked database, such as any database of documents containing citations, the world wide web or any other hypermedia database. The rank assigned to a document is calculated from the ranks of documents citing it.

我还是认为,Li Yanhong是这个主意的创始人,Page只是将这个主意Refine而已。
 u 发表于2006-05-08 12:17 PM  IP: 203.211.94.*dowei老兄,请举例一个移动花费比中国移动便宜的国家,香港除外(特别行政区),无论你是否PPI因素,都可以。
 Chinese 发表于2006-05-08 12:17 PM  IP: 203.109.157.*I always think Keso is a rubbish, and poison in China IT industry. Why a small amount of Chinese bloggers always look down at your own country, your local firms? e.g. Wang Jianshuo

Shame for you guys, we oversea chinese love China more than you do.
 xpilot 发表于2006-05-08 12:18 PM  IP: 220.165.164.*有什么样的人就做什么样的事,别的不敢说,2002年那次封Google事件,我倒是全程经历了,做网站做到这种程度,就不是什么专利,什么技术问题了,完全就是人品道德问题。

本来说,抄袭也不是什么见不得人的事,抄就抄了,要认账,别抄了还反咬一口,这是我无法理解和绝对做不到的。

百度创始人如此,百度也如此,前途极其有限...
 兰斯 发表于2006-05-08 12:36 PM  IP: 61.135.146.*哈哈,居然用robin li去查,笑死了
 明心见性 发表于2006-05-08 12:50 PM  IP: 220.207.72.*u的评论很客观,我补充一点。对于百度是否是中国公司这个问题,最近不少人讨论,有人经过分析百度股权结构,认为外资所拥有股份超过百度总股份的50%,因此百度不是中国公司。
这个观点是完全错误的。
判断一个公司是哪里的公司,要看该公司的决策权掌握在哪些人手里。中国现在有不少在美国上市的公司,但只要其决策权掌握在中国人手中,就是中国公司。
百度在上市的时候,推出了一个“牛卡”计划,“这一股权设计计划称作“不同表决权股份结构”(DualClassStructure)。其方法为,将上市后的百度股份分为A类(Class A)、B类(Class B)股票。将在美国股市新发行股票称作A类股票,在表决权中,每股为1票,而创始人股份为B类股票,其表决权为每1股为10票。而在赴美上市的中国公司中,采用这一股权设置计划的,百度是第一家,也是目前唯一的一家。”
因此,尽管外资所占股份总额超过50%,但并不代表其拥有超过半数的表决权,也就意味着并不拥有对百度的决策权。
那百度创始人股份又主要集中在谁手里?通过分析百度股权结构我们可以看到,主要是集中在李彦宏、徐勇、其他百度其他高管以及部分百度员工手里,一些早期的风险投资也拥有部分创始人股份,但在百度上市后,逐渐卖出获利,而这些股份卖出后,即变成每股1票的A类股票。
因此,百度的决策权牢牢掌控在中国人手中,他是一家在美国上市的中国公司。
顺便说一句,曾有人对李彦宏的身份提出质疑,说其是美国人,纯粹是胡说八道。李彦宏是地地道道的中国人。不仅如此,为了做好百度,他不愿长时间离开中国,前几年把早年在美国获得的长期居住证(绿卡)都已注销。
 nasi 发表于2006-05-08 1:21 PM  IP: 61.135.146.*keso, 贬低中国对你有什么好处呢?

是不是黑眼睛黄皮肤让你感到羞耻?
 IT静夜思 发表于2006-05-08 1:37 PM  IP: 211.100.33.*TrackBack来自《“超链分析”和“PageRank”专利的分析比较》:

keso在他的blog里面提到了baidu和google的专利问题。刚才我把两个专利的文档都打开看了,并且比较分析了一下。下面我从专业的角度来讨论一下这个问题:
1. 网上争论的焦点是“超链分析”和...
 非常可笑 发表于2006-05-08 1:38 PM  IP: 219.144.192.*又在间接玩百狗追黑狗的游戏。
Keso搬石头砸自己的脚,可悲。
写这种文章前应该做好充要的调查。
搜索引擎实用适用就好,
管他妈的谷歌还是百度。
Google有Gmail等很多优秀的产品,
百度也有百度知道等牛气之作,
就像搞编程的整天讨论C++或Java那种语言好,
忘了编程是干什么的人,
不耻。
在这里缅怀一下Beyond的《光辉岁月》——缤纷色彩闪出的美丽,是因它没有分开每种色彩。

 http://daatou.bloggoing.com/ 发表于2006-05-08 1:39 PM  IP: 211.99.184.*还有多少谎言?
还有多少故事?
百度,百度,
百毒在身,流毒世界。
哈哈
 malefactor 发表于2006-05-08 1:48 PM  IP: 159.226.5.*大致比较了一下两个方法,其实ROBIN LI的方法和PAGERANK是完全不同的算法,ROBIN LI的方法是所谓的"虚拟文档"的方法,就是把所有指向某个页面的链接"锚文字"来代替网页的内容,并以此计算和查询的相似性,说实话,在当时来说,这个也是比较有新意的算法,但是和PAGERANK思路是完全不同的,PAGERANK并非计算查询和页面的相似性的,而是计算页面重要性的算法;
 e频 发表于2006-05-08 1:53 PM  IP: 61.168.90.*to xpilot:
2002年封Google事件,应该更全面的看这个问题。

如今被封网站越来越多,个中原因我们都能明白一些。

可以想想为什么联合早报相对其它国外新闻网站封的次数少些,原因很简单,联合早报的内容不是很敏感。你认为ZF能让当时能搜出那么敏感内容的google活下去么?

我不替baidu说话。只是我们在这里,就只能接受这样的安排。我不相信baidu有那么大能量。我只相信我们的ZF。
 youarefool 发表于2006-05-08 2:02 PM  IP: 202.109.75.*我觉得kose纯属脑子进水型,不知道百度是否挡住了你迈向美国自由世界的脚步?犯得着这样跟百度死磕?还来试图揭人家百度创始人的老底,呵呵,太幼稚了,拿Robin Li来查,您对美国和互联网技术的了解也真是肤浅的可笑吧.首先,您先去进修一下外语,然后再进个大学补一下关于互联网和搜索引擎方面的课,再跳出来献丑可以吗?

google不知道给了你多少钱,你这么免费做爪牙有被李开复欣赏吗?还是准备骂了李彦宏然后,占山为王等招安?就看您的表现呢,估计老李开个差不多的价钱你就屁颠屁颠地过去了,大概你就等的这一天吧,不然真很难解释你的动机呢.

说实话,你再跳脚再激动,没有用处,百度不是靠你这样的人物就可以做到今天的地步的.是靠自身的实力,如果怀疑百度曾经干了什么事情,你可以拿出证据来.退一万步说,我觉得就是干了,又怎么样?中海油不是被美国政府以国家安全的名义狙击了吗?中国为什么不能阻止google进入?

似乎现在骂党骂国已经成了时尚.百度可怜,因为貌似与此有关,就成了IT届被攻击的对象.QQ可怜,因为本土,因为"下等网民"用得多,就成了"精英人士"鄙弃的对象.联想可怜,因为生在中国,即使收购了IBM也被讥笑为画虎不成反类犬.只要你是个中国人,只要你在中国做了点胆敢跟跨国公司挑战的事情,你就绝对成了笑柄和被辱骂的对象?为什么?因为你技术差!因为你在中国的统治下,因为你是黄颜色!

但是骂人的这位keso,你既然这么讨厌自己出生在这个国家,为什么不学杰克逊一样去漂白,去整容?或者投奔自由世界?为什么只会在这里口吐怨言,自己整自己?中国真的不缺你这样的人,缺的是有自尊的中国人.技术粗糙,有时间可以跟上,心没有方向,那才是最大的悲哀.国内这帮技术人员,你们为什么不自己创造一个百度或者QQ,跟跨国企业竞争?那时候,你再来说鄙弃别人的话可以吗?

说实话,百度是什么,外资还是中资,发明技术在前还是在后,一点不重要.重要的是,百度之所以成为百度,不管有没有原罪,不管如何,它正在努力成为一个最好的公司.而且,我觉得百度,完全可以不必要理会一帮各怀鬼胎的宵小们的言语,木秀于林大风催,呵呵.但不是你几句话就能吹倒的,越磨练越成器.百度,QQ,联想,都是如此.
 小飞 发表于2006-05-08 2:02 PM  IP: 61.135.146.*to malefactor:
你应该仔细读一读Robin Li的专利描述,你所说的“ROBIN LI的方法是所谓的"虚拟文档"的方法,就是把所有指向某个页面的链接"锚文字"来代替网页的内容,并以此计算和查询的相似性”,完全是误读!

 seovista 发表于2006-05-08 2:03 PM  IP: 60.166.3.*百度李老板如果真认为GG的人窃取了他的专利,应该去告,如果说原先供职的公司没有告的话,真是这家公司不懂炒作(同样也是不坚持原则),告GG应该是件出名的事啊。

如果李老板真的向媒体公开说过谁谁窃取了他的东西,那第三方进行查实、分析都是应该被允许的。
 yaryar 发表于2006-05-08 2:13 PM  IP: 220.184.104.*百度可怜,因为貌似与此有关,就成了IT届被攻击的对象.QQ可怜,因为本土,因为"下等网民"用得多,就成了"精英人士"鄙弃的对象.联想可怜,因为生在中国,即使收购了IBM也被讥笑为画虎不成反类犬.只要你是个中国人,只要你在中国做了点胆敢跟跨国公司挑战的事情,你就绝对成了笑柄和被辱骂的对象?为什么?因为你技术差!因为你在中国的统治下,因为你是黄颜色!
-------------------------------------------
youarefool的这段话不错,,
 malefactor 发表于2006-05-08 2:22 PM  IP: 159.226.5.*to 小飞:
我仔细看了ROBIN LI的专利了,再次确认就是"虚拟文档"的思路,不知你说我哪里误读了?麻烦拿出些证据,我没看出哪里误读.还请你指教;
 Tony Bai 发表于2006-05-08 2:42 PM  IP: 61.189.35.*我觉得baidu应该不会抄袭google的,直觉:)
 小飞 发表于2006-05-08 2:57 PM  IP: 61.135.146.*to malefactor:
我觉得你没理解超链分析的本质,超链分析最重要的思想,不是“把所有指向某个页面的链接"锚文字"来代替网页的内容”,而是“根据页面被其他页面链接的次数和链接中的内容,来计算页面与关键词的相关度”

pagerank的核心思想,和超链分析的区别并不大。

 ffish 发表于2006-05-08 3:00 PM  IP: 222.90.144.*百度的屁股摸不得,这个说法再次得到了证实。

既然百度官方页面上http://www.baidu.com/about/en/management.html明白的写出了Robin Li (CEO)和Robin Li (Co-founder and Chief Executive Officer)字样,并且没有Li Yanhong字样,不知道keso用Robin Li来查专利有什么可笑的。

国内有些公司的所作所为,真的仅因为是“中国制造”,就要被大家不分青红皂白的爱和捧吗?作为google的fans,看不惯baidu的很多做法,是多正常的事情,还用列举些例子来说明为什么有人不喜欢baidu吗?

动不动上升到汉奸的高度,也太夸张了吧。那个写英语的家伙,你在国外倒是可以眼不见心不烦。keso力捧过国产“豆瓣”,你不妨给些证据显示你的爱国心。
 ffish 发表于2006-05-08 3:01 PM  IP: 222.90.144.*百度的屁股摸不得,这个说法再次得到了证实。

既然百度官方页面上http://www.baidu.com/about/en/management.html明白的写出了Robin Li (CEO)和Robin Li (Co-founder and Chief Executive Officer)字样,并且没有Li Yanhong字样,不知道keso用Robin Li来查专利有什么可笑的。

国内有些公司的所作所为,真的仅因为是“中国制造”,就要被大家不分青红皂白的爱和捧吗?作为google的fans,看不惯baidu的很多做法,是多正常的事情,还用列举些例子来说明为什么有人不喜欢baidu吗?

动不动上升到汉奸的高度,也太夸张了吧。那个写英语的家伙,你在国外倒是可以眼不见心不烦。keso力捧过国产“豆瓣”,你不妨给些证据显示你的爱国心。
 Adrian 发表于2006-05-08 3:03 PM  IP: 210.89.157.*我不知道Keso的文章里那一句话贬低中国了?整篇文章一直都在摆事实讲道理,麻烦这位nasi也讲讲道理。keso所评论的百度是一个在美国上市,创始人是华裔,且50%以上由美方控股的美国公司。
 吃冰 发表于2006-05-08 3:12 PM  IP: 61.51.68.*李彦宏、丁磊这些人低调躲开国内媒体是有道理的。
IT江湖险恶,远小人近君子,省得被人背后捅了都不知道是为了啥。
 vincent wu 发表于2006-05-08 3:17 PM  IP: 158.182.8.*我有心把“超链”比作月亮,因为它照亮了搜索界发展的进程;但现在看来它却是搜索界的潘多拉魔盒,keso被传染也中了招,一打开就惹来争论不断,而他自己给《一种大规模超文本Web搜索引擎的分析》加的“超链”也错了----最好更正一下---免得大家误以为这篇横空之作是子虚乌有。

至于这场百度谷歌专利的争论,在我看来,其实不关先后、仅仅是天资和功力的区别。

我先将李彦宏的专利摘要大致翻译一下:

Hypertext document retrieval system and method
超文本文档提取系统和方法

A search engine for retrieving documents pertinent to a query indexes documents in accordance with hyperlinks pointing to those documents. The indexer traverses the hypertext database and finds hypertext information including the address of the document the hyperlinks point to and
the anchor text of each hyperlink. The information is stored in an inverted index file, which may also be used to calculate document link vectors for each hyperlink pointing to a particular document. When a query is entered, the search engine finds all document vectors for documents having the query terms in their anchor text. A query vector is also calculated, and the dot product of the query vector and each document link vector is calculated. The dot products relating to a particular document are summed to determine the relevance ranking for each document.
一个用于提取与查询项相关文档的搜索引擎。该搜索引擎根据指向文档的超链,对这些文档进行索引。该索引编制器(indexer)扫描超文本数据库,寻找包括超链所指文档的地址、超链的锚文字等超文本信息。将这些信息存储在反向(inverted)的索引文件里,该文件还可用于计算文档连接向量(document link vector),以针对每一指向某文档的超链。当用户输入一个查询项,该搜索引擎找到的所有文档向量,其“锚”文字包含该查询项。并计算一个查询向量(query vector), 然后计算该查询向量和每一文档连接向量之间的内积。将与某文档相关的内积进行累加,以决定该文档的相关度排序。

----------
而keso所找到的sergy和page专利里的《简介和总结》部分我也大致翻译如下:

当查询项与非常多的文档匹配时,目前的网络搜索引擎产生非常差的(排序)结果。但是用户常常送出这样的简单查询项。针对这样的查询,描述在此的系统能产生令人惊奇的结果提升,关键在于使用来自存储网络连接(web link)的大数据库内可用的附加信息。该网络引用(web citation)数据库用于决定每一网页的引用重要程度,据此再对查询结果排序。该系统业已实现,并能产生杰出的结果,哪怕是相对来讲只包含400万网页的小数据库。该系统不仅产生更佳的结果,更显著地减少计算代价,而计算代价却是网络搜索引擎最大的开销。要展示改善的结果,只需挑一个简单的查询项,比如“天气”,然后将我们系统的结果和传统网络搜索引擎的结果(像altavista)比较。

-------------------

根据我所了解的page-rank模型,和刚刚所看到的李的专利所述模型,两相比较,我只能说李能想到并妥善利用超链,表现的功力已远非平常人。因为那个时候做信息提取研究的研究者,恐怕都已经意识到要利用到诸如超链和锚文字等附加信息,而问题关键是谁能有功力利用得漂亮。可是在这个层面,裴吉(page)的page-rank模型,凭借极其深厚的理论支撑和显著的优势,让google鹤立鸡群,而李的方法,只能说是未蜕变成鹤、丑过page-rank的丑小鸭。

李的想法是否启蒙后人,是否也启发过page,可能是件无头悬案。但先后之争,在我看来没什么意义,以他们作为研究者的身份,谁知道他们受了哪些前人的影响呢?而
“今人不见古时月,今月曾经照古人”,“超链”这东西,也如同月亮,罩过不少人,但谁也不必太过信誓旦旦说成是属于自己。关键是谁在月光的眷顾下,练就了最强的神功。







 yourarefool 发表于2006-05-08 3:28 PM  IP: 202.109.75.*那是因为,豆瓣还没有强大到和google一拼的能耐,Keso完全可以不用理会.一旦哪天豆瓣不幸崛起,而且也正好是goole或者flickr光荣当机的时候,豆瓣估计也惨了.

什么叫百度的屁股摸不得,google的屁股一样也摸不得.有人敢说一句google的不好看看,早被蛰成马蜂窝了.现在百度和google之争,完全上升到了政治和意识形态之争.我觉得为百度不值.不过一个有志气的中国人想干点事情,却背负了太多的附加价值.而喜欢攻击百度的人,大多数是"技术精英"(姑且算是精英吧,简称技精),大多数是不满而无处发泄的中下层人员,躁动不安又无可安置自己无前途的心,于是,恨铁不成钢地自卑,骂骂百度,立个名头,显示自我.也实在是让人不齿的心态.

说实话,Keso挑这个事情也挺无聊挺下作,都多少年前的事情了,议论来议论去,好象你的论据也站不住脚,不是有造谣的嫌疑吗?
 malefactor 发表于2006-05-08 3:28 PM  IP: 159.226.5.*to 小飞:
呵呵,我觉得你应该仔细看看PAGERANK的思路,两者是完全不同的.
首先,PAGERANK是跟查询完全没有关系的,它并不是用来计算查询和页面的相关度的,假设一个搜索引擎完全采用PAGERANK来评分的话,不论用户的查询是什么,搜索结果排名是完全一样的,而ROBIN LI的虚拟文档方法是根据指向一个网页的链接文字是否包含查询词汇来计算查询和页面的相似性的,所以首先两者要解决的问题就不一样,出发点是不同的.
另外,ROBIN Li的方法并不能向PAGERANK那样体现"如果指向一个页面的链接数目越多,那么页面权值越大",假设一个用户搜索"JAVA",假设一个页面A有100个链接指向A,如果只有3个链接的锚文字包含JAVA,那么其它97个链接的贡献是0,而PAGERANK是不考虑这种情况的,所有100个链接都对页面A有贡献;
第三,PAGERANK的核心思想是根据页面链接关系通过叠代计算来将页面本身重要性得分进行传播,而ROBIN Lii的方法完全是不能体现这个思路的,只是锚文字是否包含查询对于页面是否相关有作用.
虚拟文档现在已经是一个比较常用的技术了(当然PAGERANK在研究领域应用更广泛),它和PAGERANK无论是出发点,基本思路,计算方法都是有本质区别的.
 zhiliwu 发表于2006-05-08 3:33 PM  IP: 210.176.196.*TrackBack来自《》:

今人不见古时月,今月曾经照古人
 nasi 发表于2006-05-08 3:37 PM  IP: 61.135.146.*to Adrian
好好读读,在美国上市就是美国公司么?
------------------------------------------
明心见性 发表于2006-05-08 12:50 PM IP: 220.207.72.*
u的评论很客观,我补充一点。对于百度是否是中国公司这个问题,最近不少人讨论,有人经过分析百度股权结构,认为外资所拥有股份超过百度总股份的50%,因此百度不是中国公司。
这个观点是完全错误的。
判断一个公司是哪里的公司,要看该公司的决策权掌握在哪些人手里。中国现在有不少在美国上市的公司,但只要其决策权掌握在中国人手中,就是中国公司。
百度在上市的时候,推出了一个“牛卡”计划,“这一股权设计计划称作“不同表决权股份结构”(DualClassStructure)。其方法为,将上市后的百度股份分为A类(Class A)、B类(Class B)股票。将在美国股市新发行股票称作A类股票,在表决权中,每股为1票,而创始人股份为B类股票,其表决权为每1股为10票。而在赴美上市的中国公司中,采用这一股权设置计划的,百度是第一家,也是目前唯一的一家。”
因此,尽管外资所占股份总额超过50%,但并不代表其拥有超过半数的表决权,也就意味着并不拥有对百度的决策权。
那百度创始人股份又主要集中在谁手里?通过分析百度股权结构我们可以看到,主要是集中在李彦宏、徐勇、其他百度其他高管以及部分百度员工手里,一些早期的风险投资也拥有部分创始人股份,但在百度上市后,逐渐卖出获利,而这些股份卖出后,即变成每股1票的A类股票。
因此,百度的决策权牢牢掌控在中国人手中,他是一家在美国上市的中国公司。
顺便说一句,曾有人对李彦宏的身份提出质疑,说其是美国人,纯粹是胡说八道。李彦宏是地地道道的中国人。不仅如此,为了做好百度,他不愿长时间离开中国,前几年把早年在美国获得的长期居住证(绿卡)都已注销。

 ffish 发表于2006-05-08 3:37 PM  IP: 222.90.144.*yourarefool,从你的nick到你的匿名,到你帖子中充斥的臆断和帽子,你出色的再一次给baidu做了很有效果的公关。
 嗯嗯 发表于2006-05-08 3:58 PM  IP: 222.217.120.*你最好不要再写百度和GOOGLE.
对这个问题,你不客观,
即使你认为你客观,你挑的问题也只是对GOOGLE献媚,对百度讽刺的份
你从来不曾鼓励过百度
FUCK!
 yourarefool 发表于2006-05-08 3:58 PM  IP: 202.109.75.*太抱歉了,我跟百度一点关系没有.也不需要给百度免费公关,更不需要为了百度去辱骂其对手,发掘一下Larry Page和Sergey Brin的私秘史,你一定很失望吧,呵呵.

"这种改变是有限的,总有太多的真相,存在于搜索引擎之外。"

是的,你可以无限的接近真相,但请你不要妄下结论,或者,试图将一个类似谣言的帽子和臆断建立在你自己不懂的论据上:)




 十口 发表于2006-05-08 3:58 PM  IP: 221.224.35.*说说163吧
为了他的免费发短信,才用的泡泡.好不容易积攒了20多w金币.可惜一下子把100金币发一条短信提高到了1000金币.
还有升级为1g的163 mail,好像是2w还是20w金币?
刚升级了没十日,163就提供免费升级到1g mail了.

说说联想吧.收了ibm的pc确实让人兴奋,可是前些日子的think本本主板飞线是怎么回事?真的是主板没缺陷??

qq也可以说说.为了保6位qq号,申请了会员,捆绑了手机.但是除了每个月8快会员费,其他什么我都没消费过,包括没买过任何一个q币.
于是去年9月,平均一天半一条短信,内容都是:xxx功能推出,会员回复xx即可以xx折扣获得.
前后一个多月,我打客服电话过去询问可否关闭,结果客服mm的回答是:
不可能不收到.
如果我不想收呢.
那你就取消手机捆绑吧.
那我就不是会员了啊
那就没办法了,就不做会员吧.

baidu么,实话,目前我还没中过招,所以还谈不上厌恶.因为被3721装过x次后我禁止了很多东西.

很多时候,不去抱怨别人BS.
有句话叫做 自作孽,不可活.
 政治局常委 发表于2006-05-08 4:00 PM  IP: 10.0.2.*谨防IT娱乐化。
 sirding 发表于2006-05-08 4:18 PM  IP: 219.142.192.*不管怎么样,讨论是有益处的;keso是否崇洋,大家各有各的见地。
baidu是否值得鄙视,应该让用户来说——大部分的用户(60%)喜欢用百度,尽管Google比较客观——说明google对中国用户的关注还没有从技术上升到实用的层面。技术人员看baidu垃圾,但是普通用户感到baidu比google亲切、实用,这说明什么?

不过,keso对这些批评的容忍还是体现了自己的大度的。
 inspire 发表于2006-05-08 4:54 PM  IP: 221.224.34.*我发现中国粪青真多
而且这批粪青的水平还不杂样。离愤青还差远了


 jicknan 发表于2006-05-08 5:06 PM  IP: 222.92.90.*1.百度 != 中国
2. Keso 很爱国
3. 有些人太无聊
4. 同意 sirding,keso 很大度, 也可能是觉得有些人不值得去计较
5. 只有无聊的人才会参与类似的讨论,我也是
 Platinum 发表于2006-05-08 5:25 PM  IP: 219.142.219.*这篇文章可以贴 xys.org 上去了……风格完全一致……
 vazi 发表于2006-05-08 5:41 PM  IP: 210.21.123.*哈哈,这篇是Keso最失败的Google公关稿啦。。。疑问数十行,结论四行。而且Update的结论还是推翻自己之前的质疑的。

我觉得Keso越来越进入一种迷途,Google变得神圣纯洁,于是其他公司和对手就变得邪恶而且歹毒。Keso对Google的迷信进入了一种无法自拔的状态,也就看不到Google的阴暗面。

对于Google,Keso已经失去了客观的角度与中立的立场去分析了,在这一点上,Keso已不是一个优秀IT评论家了。

向微软的Robert Scoble学习一下吧,虽然受雇于微软,但依然可以客观公正冷静理性的分析市场和产品。正是由于他的客观分析,微软的人才得到更多的启发和创意。

要成为一个热门舆论的人物很容易,只需要狠狠的批,乖乖的拍,但要做一个启迪思维和受人尊敬的客观公正互联网英雄并不是那么容易的!


 草根博客 发表于2006-05-08 5:49 PM  IP: 61.183.11.*TrackBack来自《百度七宗罪》:

百度,这个自称是全球最大的中文搜索引擎,经过这几年来的发...
 路过~~ 发表于2006-05-08 5:51 PM  IP: 221.216.169.*人家说了不人身攻击了,咋这么多人还不听话呢~~~
 Boler Guo 发表于2006-05-08 6:01 PM  IP: 218.4.73.*keso 知错就改还是值得鼓励的,但是u能找到那里专利,而keso找不到那个专利却值得深思呀~
 幻影小飞侠 发表于2006-05-08 6:04 PM  IP: 3.242.255.*《一种大规模超文本Web搜索引擎的分析》链接错误
应该是http://www7.scu.edu.au/1921/com1921.htm
作者大名似乎也写错了
 www 发表于2006-05-08 6:45 PM  IP: 221.219.5.*对牛弹琴的blog很红,之前觉得虽然没有什么建设性的意见,但至少不讨厌blog的作者。
可今天看了这篇文章,发现这个作者真的很无知,而且不懂装懂。
 E.Y. 发表于2006-05-08 7:24 PM  IP: 59.61.2.*“我们若能更妥善地搜寻资料,实在已经改变世界。”其实也是GOOGLE创始人说的.俞军最早是个大G FANS,把这句话到处引用,以致现在中文一查,出处都是他.李彦宏有一段时间也老用这句话,公关稿,演讲稿...,当然都是不屑注明出处的了.疑惑,这句话就那么好嘛,他们就非想不出自己的CATCH LINE?但是最早他们是很自觉地把自己摆在G的位置下面的,对G是仰视的,所以处处引用G的话大概是觉得光荣的吧.

KESO提出的这个问题,正是我觉得李彦宏最无耻的一个说法.当时记得他们的提法是G的两创始人在澳洲聆听李的演讲,会后李还解答了他们的问题等等.G当时根本没把中国市场看在眼里,所以李彦宏敢这么黑白讲.现在看他还敢不敢这样讲了.当然,他当时混淆视听的目的也已经达到大半了.

至于KESO在这篇文章中所用的口气,我认为是十分公正的.KESO是IT圈中少有的正直的人之一,所以才对G的脾气.李彦宏最早的时候,为了发展,使用过一些卑鄙手段,说过些卑劣的话,但是也不一定就是小人,小人有更小人的手段,李只能说是个普通人.如果李一早摆出正人君子有所为有所不为的架势,那么百度肯定不会有今天了.牺牲一个君子的虚名,成全了一个百度,才是商人气概.

G呢,是天生的正人君子.可是在中国是会水土不服的.
 都来骂 发表于2006-05-08 7:28 PM  IP: 221.221.5.*百度就是一狗屎吹牛公司,垃圾卑鄙下流公司,不要脸的公司。呵呵!见一次骂一次,不求能够让它倒闭,只求骂得百度狗门心里不爽。
 百度把KESO封啦!! 发表于2006-05-08 7:55 PM  IP: 219.150.248.*请看这里!
http://blog.donews.com/allogo/archive/2006/05/08/860799.aspx
 没有必要这样…… 发表于2006-05-08 7:55 PM  IP: 222.248.33.*没有必要这样……

首先我认为,存在就有他的合理性。
其次我认为,任何事物也都有两面性。

但从你的一系列文章中,都可以看出你的一个观点:google好,百度不好!
——我不信,百度就没有一点好?

但对于读者来说,可能会感觉到你的偏见吧——难道你不觉得这样的不公证行为会影响你在你的fans心中的光辉形象?
当然,你有言论的自由,你可以讲你愿意说的话。

作为blog的名人,作为有影响力的blog作者,你,没有必要这样……

个人观点……

 gg 发表于2006-05-08 8:41 PM  IP: 219.134.76.*我发现百度的员工都很团结,一发现异己就群起而攻。而且还会变换马甲地发言,真是应验了百度的风格-“为达目的不惜手段”。
 Ninstein 发表于2006-05-08 8:43 PM  IP: 58.20.164.*其实谁先谁后又如何呢
毛爷爷说过 白猫黑猫 能抓老鼠的就是好猫
你做搜索引擎拥有最多的专利 最早拥有什么技术 那又如何呢
用户的体验结果完全可以否认掉一切所谓的专利

所以,给用户带来的多少利益才是权衡标准
 断峰狼 发表于2006-05-08 8:49 PM  IP: 218.94.133.*youarefool 发表于2006-05-08 2:02 PM IP: 202.109.75.*
我觉得kose纯属脑子进水型,不知道百度是否挡住了你迈向美国自由世界的脚步?犯得着这样跟百度死磕?还来试图揭人家百度创始人的老底,呵呵,太幼稚了,拿Robin Li来查,您对美国和互联网技术的了解也真是肤浅的可笑吧.首先,您先去进修一下外语,然后再进个大学补一下关于互联网和搜索引擎方面的课,再跳出来献丑可以吗?

google不知道给了你多少钱,你这么免费做爪牙有被李开复欣赏吗?还是准备骂了李彦宏然后,占山为王等招安?就看您的表现呢,估计老李开个差不多的价钱你就屁颠屁颠地过去了,大概你就等的这一天吧,不然真很难解释你的动机呢.

说实话,你再跳脚再激动,没有用处,百度不是靠你这样的人物就可以做到今天的地步的.是靠自身的实力,如果怀疑百度曾经干了什么事情,你可以拿出证据来.退一万步说,我觉得就是干了,又怎么样?中海油不是被美国政府以国家安全的名义狙击了吗?中国为什么不能阻止google进入?

似乎现在骂党骂国已经成了时尚.百度可怜,因为貌似与此有关,就成了IT届被攻击的对象.QQ可怜,因为本土,因为"下等网民"用得多,就成了"精英人士"鄙弃的对象.联想可怜,因为生在中国,即使收购了IBM也被讥笑为画虎不成反类犬.只要你是个中国人,只要你在中国做了点胆敢跟跨国公司挑战的事情,你就绝对成了笑柄和被辱骂的对象?为什么?因为你技术差!因为你在中国的统治下,因为你是黄颜色!

但是骂人的这位keso,你既然这么讨厌自己出生在这个国家,为什么不学杰克逊一样去漂白,去整容?或者投奔自由世界?为什么只会在这里口吐怨言,自己整自己?中国真的不缺你这样的人,缺的是有自尊的中国人.技术粗糙,有时间可以跟上,心没有方向,那才是最大的悲哀.国内这帮技术人员,你们为什么不自己创造一个百度或者QQ,跟跨国企业竞争?那时候,你再来说鄙弃别人的话可以吗?

说实话,百度是什么,外资还是中资,发明技术在前还是在后,一点不重要.重要的是,百度之所以成为百度,不管有没有原罪,不管如何,它正在努力成为一个最好的公司.而且,我觉得百度,完全可以不必要理会一帮各怀鬼胎的宵小们的言语,木秀于林大风催,呵呵.但不是你几句话就能吹倒的,越磨练越成器.百度,QQ,联想,都是如此.




喜欢这句话
欣赏
 moonsafari 发表于2006-05-08 8:52 PM  IP: 138.243.201.*从商业或者个人道德上来说,百度确实不敢恭维,可以再想想那个恶心的百度工具条...事实上大多国内企业都不敢让人恭维,所以骂国内企业也是正常的,没必要上升到政治层面。
 R 发表于2006-05-08 9:41 PM  IP: 221.201.174.*居然还有人以为百度是中国公司?
那个什么断峰狼,我不得不说你是SB
 一一 发表于2006-05-08 10:03 PM  IP: 220.205.0.*实际上,深层次和潜意识内,这是个文化和意识形态之争。

在中国的市场条件下,可能拿不出一家干净的公司,这个无法苛求。美国花几百年时间造就的市场环境和竞争条件,中国猝急间不可能达到,恐怕还要数十年的漫长。
如果你生在资本主义原始积累期的美国,大概你就会觉得中国公司所谓“不正当竞争”手段的软弱和苍白,所谓无耻只能是小巫见大巫。

只是觉得国内技术界的短视和浮躁。拼命指责甚至挑拨辱骂,解决不了问题。百度有胸怀,可以从竞争和对手指责中改善成长,也算不了什么。但请批评者保持,善意和宽容。极端民族主义的确让人烦,但没有这点民族自尊心的话,也许未来没有一家公司是中国制造,更别谈中国创造了,呵呵。

也许创新是技术发展的灵魂,但皮之不存,毛将焉附?世界上本来就有多种发展途径,有google那样的cool brand,超前地进行用户体验,让人觉得酷而新奇,永远让人惊喜。也有百度这样的,以最大多数用户体验为基础的缓慢的养成和培育。创新不是横空出世,而是在旧有的体验上进行改造,综合与优化是最好的创新,从这个意义上来说,百度贴吧、知道等都是非常好的创新产品。

至于抄袭,本来都是搞同质竞争,如此相同的行业,想要苛求完全不同的产品,大概也是做梦。本来是两个公司之间的口水战,关键还是核心技术,这个是抄袭不来的。

至于技术,百度擅长的是中文搜索,从来也没有说要在英文搜索上跟google比较。说实话,百度的英文搜索和google的中文搜索一样烂。各有所长,百度又没有非要进军英语市场,google可是把手脚伸向中国,这可是田忌赛马了,高下立判。请各取所好,你想查阅英文或技术资料,请google,你想查阅中文信息和娱乐信息,请百度一下,没有人非要让舍此而取他呀?

说到个人品德什么的,这个扯太远了,没有证据的事情请都不要瞎猜。说百度阴google,觉得百度可能是吃了个哑巴亏。这种事情,绝对是,解释也是屎,不解释也是屎,以Robin Li的口才,说上三天还不如马云出来说半个小时。呵呵。谁又知道这是不是对手嫁祸百度的阴招?谷歌这次闹这么个大笑话,也没见百度落井下石,讥笑不已吧?保持对对手的尊重,是有度量的公司的起码条件,这一点似乎被有些人忘却了。

google是个让人喜欢的对手,这并不意味着,所有的GFANS也都如此。百度一直被妖魔化,让人纳闷。很多搞技术的骂起来简直不分青红皂白,坚持仇恨百度,似乎百度是什么的代名词,这真的是有些可怕了。不知道是仇富还是恨铁不成钢还是别的?理性地对待这两个公司的竞争,多点善意,多点宽容,也许是鸡饭和肚丝们最好的态度了,也真的该让人,清净清净了。
 Q 发表于2006-05-08 10:09 PM  IP: 61.48.9.*楼上的,前面评论里对百度是不是中国公司这个问题说得那么清楚了,你居然还以为百度不是中国公司?

我不得不说你才是sb
 作作 发表于2006-05-08 10:24 PM  IP: 60.163.106.*以前天天来看keso的blog, 后来变成了3-4天一看,现在是一周一看,以后估计很少再来了。真是可惜!
 断峰狼 发表于2006-05-08 10:55 PM  IP: 218.94.133.*to R

不知你是跟百度有仇还是跟我有仇
首先,我还没有确定百度是不是中国的,但楼上的已经解释的很清楚了。现在国内企业大部分都以引进外资为荣为本事,所以有外资的股份也实属见怪不怪的事,你还偏偏强调或者肯定百度就不是中国的。
其次,我只是赞成其话。关于这个我也没有好争的,你自己看看有好多网友都看不惯KESO了,更别说百度。
最后,建议你以后说话拿出个理由,不要没事乱咬!
 nu 发表于2006-05-08 11:32 PM  IP: 61.242.126.*路过,从第一楼慢慢地看到最后,发现里面火药味十足,咱先不管它什么专利问题,外国企业与中国企业问题,还是上升到什么政治问题,客观的看一下keso的文章,里面提到了:本文只有疑问,没有结论。下面的一些人也申明找到了原文及一些证实方式,咱先不说这些,文章最后也声明了:另外,请大家有话好好说,不要互相攻击。可以看出keso是用很公正的态度来写完这遍文章.
只是希望大家心平气和的谈论自己的观点,只针对事不要搞人身攻击.

 只言片语的碎片 发表于2006-05-08 11:35 PM  IP: 211.100.33.*TrackBack来自《碎片:百度专利vs屏蔽Google》:

近日,百度、Google两阵营又起纷争。Gfans暂时先声夺人。古人说道理越辩越明,不知道此次旧话重提有无新意结果出现。
详见:
百度七宗罪
Google和百度的中国式困惑
东拉西扯:超链分析和Pag...
 湿毒清 发表于2006-05-08 11:43 PM  IP: 218.66.62.*给用户带来的多少利益才是权衡标准?
身为十大流氓软件的百度插件,倒是强奸了不少网民。
 一一 发表于2006-05-08 11:51 PM  IP: 220.205.0.*是这样,你可以心平气和地说你一个平时你深恶痛绝的对手的谣言,这个谣言是你拿不准的,所以,只有慢条斯理,让人不要互相攻击。可惜keso同学抛出这个话题的用意已经很明确了:

“我知道这是个谣言,我拿不准,但我宁可相信它是事实。”

而且还有那么一大段含沙射影的话,联系到keso一贯的言论,如果他真的搞懂这个问题的话,口气恐怕就不是这么软弱和故作公允了。

立场是错的,一切都是错的。keso同学,应该爱惜你自己的羽毛。
 Mike 发表于2006-05-09 12:11 AM  IP: 128.173.49.*Y. Li, “Beyond Relevance Ranking: Hyperlink Vector Voting,”
RIAO 97: Computer-Assisted Information Searching on
Internet, 1997, McGill University, Montreal, Canada, pp.
648–650.
Beyond Relevance Ranking: Hyperlink Vector Voting
Yanhong Li, Larry Rafsky
GARI Software/IDD Information Services,
1997,
TOWARD A QUALITATIVE SEARCHENGINE
YANHONG LI
GARI Software/IDD Information Services,
JULY • AUGUST 1998, Internet Computing.

我觉得李彦宏没抄google,但是也很难说google从李彦宏那里听去了idea,可能双方印证了一下,英雄所见略同吧, 这个idea也不是很难想到,文献检索中的引用(citation)几十年前就有了,关键是谁实现的好.
 Mike 发表于2006-05-09 12:35 AM  IP: 128.173.49.*"这个会议的时间是1998年4月,地点是澳大利亚的布里斯班。如果没有搞错,这应该就是第七届国际WWW大会。" 那个workshop应该是比这个更早的会议,双方都没有成名的一个小workshop,我想是梁冬搞错了。keso直接问李彦宏吧。
 andy 发表于2006-05-09 12:55 AM  IP: 222.240.156.*1.那些骂KESO是垃圾的可以走远些,他真是垃圾你们在这里费什么劲?到底谁会跟垃圾费劲?
2.自我感觉KESO对百度的态度没那么阴暗,虽然他曾经被邀去GOOGLE总部访问。对自己不那么争气的孩子,中国人也老喜欢拿别人的孩子刺激他。但那毕竟是自己的孩子啊。
3.KESO写这个不知道花了多少时间,至少估计他没有预料到这文会引起这么大的动劲。以后如果还要发这样敏感的言论(你当然会发,不然你就不是KESO了,哈哈)建议多花些时间准备资料。毕竟事后的UPDATE不能完全弥补原文中的漏洞带来的影响
 jacksl 发表于2006-05-09 1:30 AM  IP: 60.179.0.*只是路过~
 最佳阅读网 发表于2006-05-09 2:14 AM  IP: 221.222.175.*
这个。谁能说的清啊。公说公,婆说婆







最佳阅读网
http://www.bestread.cn
 海棠依旧 发表于2006-05-09 3:45 AM  IP: 82.224.37.*观点太中立,就不会有观众。
 搜索引擎优化排名SEO每天一贴 发表于2006-05-09 4:44 AM  IP: 203.175.160.*TrackBack来自《Google PageRank专利和李彦宏超链分析专利的区别》:

今天在洪波的博客中看到一篇文章:超链分析和PageRank的专利问题,才第一次知道百度总裁李彦宏曾经申请并获得对于超链接分析的专利,我们姑且称之为超链分析专利。而这个专利申请是在G...
 JasonIT 发表于2006-05-09 6:05 AM  IP: 60.228.16.*百度也该和你学学“脚踏实地”的道理啊~~
 oneandhalf 发表于2006-05-09 6:10 AM  IP: 84.9.47.*路过, 觉得这是一个商业操作, 科学技术是不会随着争论这些而进步的!?
 freesurfing 发表于2006-05-09 8:36 AM  IP: 218.28.15.*google翻译,简体中文翻成英文,输入百度,看看翻译结果。

我跟google写过信反映过,没有回应。平时比较喜欢用google,觉得google应该不屑用这种方法对竞争对手的,或许是个玩笑,但玩笑开的太大了吧。Don‘t be evil,至少这个不是。
 jfish 发表于2006-05-09 8:53 AM  IP: 219.145.162.*两个专利性质完全不同,说抄袭有些可笑。Keso很客观的分析,并没有发表自己的立场,而有些人却开始人身攻击,对人不对事,实在没有风度。
我们不喜欢百度,是因为太多低级的做法,而且本身搜索技术就比Google差,搜出来结果多,排在最前面的却很少是有用的,如果真的Google抄袭了Baidu,怎会抄袭的如此出神入化呢?
象前面那位老兄说的,不管谁的专利,最后谁实现的最好,谁就是老大,就这么简单。李彦宏说别人抄他的,未免炒作的味道比较重,如果Google做的很烂,他会搬出来说Google抄他的吗?
 E-space 发表于2006-05-09 8:58 AM  IP: 81.169.170.*TrackBack来自《对于baidu,我们无可奈何!》:

Keso写的东拉西扯:超链分析和PageRank的专利问题,还真捅了马蜂窝,一大堆人在回复中说什么的都有,还上升到了爱国的高度,至于嘛??
我觉得作为一个中国人,一个炎黄子孙,应该没有...
 KID 发表于2006-05-09 9:03 AM  IP: 202.115.112.*就算Keso再可耻,咱们还是会来看他的
Baidu和Google都是这个理儿
 十口 发表于2006-05-09 9:40 AM  IP: 221.224.35.*难道是国内没有米国那么几百年的自由商业竞争,所以才导致‘谁的屁股都不干净’?

明明是自己可以不做的事情,何必要把理由加给客观呢。

好比现在的家长厌恶网吧和十年前家长厌恶游戏厅一样,难道自己的孩子一点错没有,都是网吧和游戏厅的错?




看到前些日子那个飞线主板的lenovo本本的消息,本来还对国货有点好感,现在全无了。lenovo的所有东西,今后都彻底被我打入冷宫了。

口碑不是一日两日能立的。还是那句:自作孽,不可活。

忘记说了,yahoo现在在我心目中的地位如同3721。
 vazi 发表于2006-05-09 10:21 AM  IP: 210.21.123.*只有疑问,没有结论:
百度为什么收购Hao123?

只有疑问,没有结论:
Google为什么被控传播网络色情?

只有疑问,没有结论:
百度的插件为什么被人指为流氓软件?

只有疑问,没有结论:
Google为什么想以9千万美元了结点击欺诈官司?

只有疑问,没有结论:
为什么Keso只质疑百度而没有质疑Google?
 cxna 发表于2006-05-09 10:48 AM  IP: 60.166.246.*yahoo把邮箱卖给zf那档子事足以证明yahoo是如何缺乏道义
 A Pseudo SE Expert 发表于2006-05-09 1:28 PM  IP: 162.105.81.*关于两个专利的关系:因为我很早就比较过这两个专利,所以冒昧指点一下迷津:

一句话,Y Li 专利的目的是解决"anchor text indexing" 问题, 而 L Page 提出的是一个与文本内容无关、完全基于超链接关系的 global doc ranking technique.

有一个问题关键在于:在1997年的时候,"anchor text indexing" 已经不是一个全新的idea, 早在1994年就已经有人使用并且在 WWW‘94 会议上发表(used by the WWWW Worm)。因此 Y Li 专利的新颖性是存疑的。

无论如何,这两个技术都是当前任何一个 Web search engine 都必须使用的基础性技术。由于难以获得“专利侵权判据”,没有人会担心因为使用这些技术而被告侵权,只是他们不会说自己使用了它们。例如,没有人敢说自己使用了 PageRank (除了Google, of course),但是可以说是用了某种 link analysis technique...


 Jan‘uary 发表于2006-05-09 2:03 PM  IP: 61.129.251.*TrackBack来自《Keso?》:

Keso??½PageRank??????????Larry Page???£????ζKes......
 bidu 发表于2006-05-09 4:50 PM  IP: 买了一本关于百度的书度假,看了几章,怕脏了自己的眼,扔垃圾堆里了(对天发誓是实话)。
 LL 发表于2006-05-09 5:44 PM  IP: 192.168.46.153, 202.116.64.*看了gfans表现

我决定做一名百度粉
 zola 发表于2006-05-09 6:10 PM  IP: 220.168.9.*建议Donews的开发人员改一下这个BLOG程序:
把发表留言的人的名字的颜色改一下,有link的名字用蓝色,没有留下网址的留言者的名字用灰色,或者干脆用背景色。

这样的好处就是:我们可以基本上判断哪些人说话不负责。
 caoz 发表于2006-05-09 6:41 PM  IP: 61.135.146.*caoz行不更名坐不改性,
多说无益,也不想嚼这个舌头
只说一句话

Google在中国遭封杀和百度没关系。

 gsx 发表于2006-05-09 7:18 PM  IP: 221.218.19.*“Google在中国遭封杀和百度没关系。”这不符合“精英们”的期望,多说无益。但我坚信,CNN以前在中国遭封杀跟SINA没关系。
 zola 发表于2006-05-09 7:23 PM  IP: 220.168.9.*只不过百度成为最大受益者,因而顺理成章地也就成了最大嫌疑人而已。
 asialion 发表于2006-05-09 8:19 PM  IP: 221.216.153.*google的fans的确看起来素养较差,丢人哪!
 asialion 发表于2006-05-09 8:21 PM  IP: 221.216.153.*google的fans的确看起来素养较差,丢人哪!
 lesliewei 发表于2006-05-09 8:22 PM  IP: 222.76.101.*从 blogger 及传播的角度来说,能引起 N 多人群情激奋或参与的 post 就是好的 post,所以 keso 绝对是最好的 blogger 之一。

其它的,大家对 keso 的要求就不要那么高了吧。
 aaa 发表于2006-05-09 9:25 PM  IP: 61.149.250.*


支持百度!支持国货!


 jv 发表于2006-05-09 9:29 PM  IP: 221.232.229.*这哥们搞的象和百度有仇似的!
 卡卡鱼 发表于2006-05-09 9:35 PM  IP: 61.50.138.*本来就是纯粹的技术讨论,楼上的百度fans们不拿出有力的证据出来,却诉诸政治,甚至人身攻击,实在令人鄙视。
 hefa 发表于2006-05-09 10:18 PM  IP: 221.221.38.*唉~动不动就fans fans得
是时髦还是幼稚?


 hefa 发表于2006-05-09 10:23 PM  IP: 221.221.38.*先贤有曰:为人中庸
我承认google是个好东西,我整天用他的服务,首选邮箱gmail的
可我不是所谓的fans

我只崇拜一个人,那个人学识极高又淡薄商业

baidu是有很多问题,例如那个著名的“推广”
qq当年为了赢利还切断免费注册而用短信注册呢
都是为了赚钱,你不愿意用就不用呗,没有人拿枪逼你用

何必呢?何苦呢?
出名未必是好事
被人当作小丑,在传统观点看来不是什么值得庆幸的事情


 hefa 发表于2006-05-09 10:24 PM  IP: 221.221.38.*有时间把donews的问题解决解决
已经有很多人把blog从donews转移了

人心散了,不好带了—— 一个donews5年用户的看法

 小庸 发表于2006-05-09 10:29 PM  IP: 218.59.80.*似乎现在骂党骂国已经成了时尚.百度可怜,因为貌似与此有关,就成了IT届被攻击的对象.QQ可怜,因为本土,因为"下等网民"用得多,就成了"精英人士"鄙弃的对象.联想可怜,因为生在中国,即使收购了IBM也被讥笑为画虎不成反类犬.只要你是个中国人,只要你在中国做了点胆敢跟跨国公司挑战的事情,你就绝对成了笑柄和被辱骂的对象?为什么?因为你技术差!因为你在中国的统治下,因为你是黄颜色!


说的太好了,其实很多“精英”就是垃圾
 梦游客 发表于2006-05-09 11:27 PM  IP: 221.223.229.*我不留链接,所以我说话不负责

这篇挺强的,我留个座位

一边倒的撕杀没看头,经典的戏,一定要双方你来我往的打,最好还有不明真相跟着瞎掺和的

当然也有些事情我搞不懂,好多中国人的脑子都是单极的,容不下性质相同的两件事物共同存在,所以剧终都是正义战胜了邪恶。如果世界上只剩下正义,那么正义也就是邪恶了
 gao 发表于2006-05-10 1:30 AM  IP: 219.130.214.*俺们小站长不管什么专利,只希望百度能对我们这些小站长公平些,别让俺们做出个像样的网站就能封掉,郁闷死了,今天刚做好了网站,才来了几千IP就封掉了,这是什么世道,最重要是别J8启用那些封杀专员,那些专员都发财了,现在百度上高流量的站谁不是他们在背后控制的,靠,一旦程序涉及到人为因素,就肯定造成这程序的失败,严重希望百度在这方面要改善,如果没能力的话至少要让那些所谓的封杀专业不定期更换,建议采用现有的考车跑长途的考官的方法,这样对任何人都公平,而且在封杀人员的上面最好设置一个监管部门,这部门不涉及封杀工作,只负责检查!
我们小站长只需要公平,别花了好几个月的心思弄个好站,流量来了,二天就能封掉,郁闷死了
 hot1.cn 发表于2006-05-10 2:07 AM  IP: 222.69.170.*还是相信google些!

百度也不错,吵来吵去有点意思,这里有特务吗?!

听大家吵吵,或许也会有所启示,哈哈。。。
 gsx 发表于2006-05-10 9:03 AM  IP: 221.218.19.*to gao:

没百度你就做不了网站了?没百度就没互联网了?

“封”?你的网站不能正常访问了?

你的牢骚很搞笑。
 Ming 发表于2006-05-10 10:49 AM  IP: 219.137.122.*评论更精彩。嘿嘿。我是G粉。
 cvu 发表于2006-05-10 1:55 PM  IP: 172.30.20.209, 162.40.115.*为波兰的罪过感到羞耻的人,就是波兰人

  —— 波兰思想家米奇尼克,讲自己怎样成为一个爱国者和民族主义者
 zz 发表于2006-05-10 7:19 PM  IP: 202.38.245.*Keso最近发了一篇文章叫做《东拉西扯:超链分析和PageRank的专利问题》,通篇在论证百度老大李彦宏是不是抄袭Larry Page的专利。本来老夫看了标题饶有兴致,可是看下去越来越不是滋味。Keso号称自己只是摆数据,不评论,可笑的是文字中透露的那股鄙视百度的味。什么叫不评论?各位可以去看看Solidot的报道,再比较比较Keso的文字;不评论的文字也有两种,一种有感情色彩,一种没有感情色彩,不评论的文字同样可以影响读者的判断,玩这种文字游戏,是不是有点下流,还不如干干脆脆摆明了自己是baidu黑呢。

最最可笑的是做论证的时候去查李彦宏申请的专利号,居然拿Robin Li这个名字去查?查出来结果为0于是“几乎”得出结论说Robin Li是骗人的。哈哈,申请专利会用这种名字么?稍微有点脑子就知道专利申请人的名字应该和有效证件上的名字一样吧,中国人在美国的有效证件,八成是护照了。护照上是不会有Robin Li这种名字的。贻笑大方。
 osek 发表于2006-05-10 9:37 PM  IP: 220.192.14.*keso肯定不是垃圾,从环保角度来看,垃圾是放错位置的能源。keso是服食了一枚叫做“谷哥”的迷幻药,产生了迫害妄想患者的某些症状,整体错位,所以所以看起来像垃圾。

实际上,我保证,keso正常情况下,是个爱国爱自己的好人:)


 月光博客 发表于2006-05-11 12:30 AM  IP: 61.151.239.*TrackBack来自《再谈百度和Google的问题》:

  首先,KESO发现了百度的创始人的确于1997年在美国申请过一项专利-超文本文档检索系统和方法(Hypertext document retrieval system and method),而后一年Google申请了PageRank专利,不过,这两项专利基本上是不太相关的,因此对于搜索引擎底层的PageRank技术,应该就没有谁抄袭谁的说法。

  其次,百度的支持者(或员工)透露百度股权“提供双重级别的普通股”,提供反恶意收购计划,即使绝大部分股权
 摆事实讲道理 发表于2006-05-11 2:16 AM  IP: 72.197.234.*一个专利是否重要,从引用率可以看出来。
Yanhong Li的US Patent(5,920,859, Hypertext document retrieval system and method), 申请时间是1997/2/5,批准时间为1999/7/6;到现在,已经被71个后来的搜索相关的US Patents引用。

Lawrence Page在Stanford的两项Patents(6,285,999, Method for node ranking in a linked database; 6,799,176, Method for scoring documents in a linked database); 申请时间分别为1998/1/9和2001/7/6,批准时间分别为2001/9/4和2004/9/28;到现在为止,被其它专利的引用次数分别是29和5。

另外,Lawrence Page的第二项专利中也引用了Yanhong Li的专利。

东拉西扯:超链分析和PageRank的专利问题 - 对牛乱弹琴 | Playin‘ with IT 东拉西扯:超链分析和PageRank的专利问题 东拉西扯:默多克困境 - 对牛乱弹琴 | Playin' with IT 东拉西扯:RSS什么时候消失? - 对牛乱弹琴 | Playin‘ with IT 东拉西扯:互联网创业者 - 对牛乱弹琴 | Playin‘ with IT 东拉西扯:隐私问题与明知故犯 - 对牛乱弹琴 | playin‘ with it 东拉西扯:百度和它的对手们(4)腾讯篇 - 对牛乱弹琴 | Playin‘ with IT... 东拉西扯:百度的框 - 对牛乱弹琴 | Playin' with IT - 洪波的偏见 |... 东拉西扯:炎热的8月对牛乱弹琴 | playin‘ with it 东拉西扯:Google的70-20-10产品框架 - 对牛乱弹琴 | Playin‘ with IT 东拉西扯:永远的测试版 - 对牛乱弹琴 | playin‘ with it 东拉西扯:阿北的豆瓣 - 对牛乱弹琴 | Playin‘ with IT 东拉西扯:365key的tag - 对牛乱弹琴 | playin‘ with it 对牛乱弹琴 | playin‘ with it 对牛乱弹琴 | Playin‘ with IT 对牛乱弹琴 | Playin' with IT 东拉西扯:从一起网说开去 - 对牛乱弹琴 | Playin' with IT - DonewsBlog 东拉西扯:你是一个凡人 - 对牛乱弹琴 | playin‘ with it 东拉西扯:Facebook为什么不卖? - 对牛乱弹琴 | Playin‘ with IT... 东拉西扯:报纸不会再有春天 - 对牛乱弹琴 | Playin‘ with IT 东拉西扯:我希望在2006年看到的新应用 - 对牛乱弹琴 | Playin‘ with I... Google退出中国 - 对牛乱弹琴 | Playin' with IT - D... Web创业的10条戒律 - 对牛乱弹琴 | Playin‘ with IT - Donew... 说说我的Firefox Extensions - 对牛乱弹琴 | Playin‘ with IT - DonewsBlog