编辑“︁
PageRank
”︁(章节)
跳转到导航
跳转到搜索
警告:
您没有登录。如果您进行任何编辑,您的IP地址会公开展示。如果您
登录
或
创建账号
,您的编辑会以您的用户名署名,此外还有其他益处。
反垃圾检查。
不要
加入这个!
== 概述 == [[File:PageRank-hi-res.png|thumb|250px|PageRank的卡通概念图,图中笑脸的大小与指向该笑脸的其他笑脸的数目成正比.]] PageRank是一种链接分析算法,它通过对超链接集合中的元素用数字进行权重赋值,实现“衡量集合范围内某一元素的相关重要性”的目的。该算法可以应用于任何'''含有元素之间相互引用的情况'''的集合实体。我们将其中任意元素E的权重数值称为“E的PageRank”(The PageRank of E),用符号表示为 <math>PR(E)</math>。其他的因素,类似“作者排名(Author Rank)”同样可以影响到该元素的权重值。 PageRank的结果来源于一种基于图论的数学算法。它将万维网上所有的网页视作节点(node),而将超链接视作边(edge),并且考虑到了一些权威的网站,类似CNN。每个节点的权重值表示对应的页面的重要度。通向该网页的超链接称做“对该网页的投票(a vote of support)”。每个网页的权重值大小被递归地定义,依托于所有链接该页面的页面的权重值。例如,一个被很多页面的链接的页面将会拥有较高的权重值(high PageRank)。 大量关于PageRank的学术论文在Page和Brin的原版论文前就已有之。<ref name="originalpaper">{{Cite journal | last1 = Brin | first1 = S. | authorlink1 = Sergey Brin | last2 = Page | first2 = L. | authorlink2 = Larry Page | doi = 10.1016/S0169-7552(98)00110-X | title = The anatomy of a large-scale hypertextual Web search engine | journal = Computer Networks and ISDN Systems | volume = 30 | pages = 107–117 | year = 1998 | url = http://infolab.stanford.edu/pub/papers/google.pdf | issn = 0169-7552 | pmid = | pmc = | deadurl = no | archiveurl = https://web.archive.org/web/20150927004511/http://infolab.stanford.edu/pub/papers/google.pdf | archivedate = 2015-09-27 | df = | access-date = 2018-12-10 }}</ref>在实际情况中,PageRank很容易被利用。相关的研究往往会关注那些因受到影响而出现错误的PageRank结果,以找到一种有效地避免其被错误地影响的方法(如忽略部分错误的链接)。<ref>{{citation |last1 = Gyöngyi |first1 = Zoltán |last2 = Berkhin |first2 = Pavel |last3 = Garcia-Molina |first3 = Hector |last4 = Pedersen |first4 = Jan |contribution = Link spam detection based on mass estimation |pages = 439–450 |title = Proceedings of the 32nd International Conference on Very Large Data Bases (VLDB '06, Seoul, Korea) |url = http://ilpubs.stanford.edu:8090/697/1/2005-33.pdf |year = 2006 |deadurl = no |archiveurl = https://web.archive.org/web/20141203194914/http://ilpubs.stanford.edu:8090/697/1/2005-33.pdf |archivedate = 2014-12-03 |df = |accessdate = 2018-12-10 }}.</ref> 2005年初,谷歌公司为网页链接推出一项新属性[[nofollow]],使得网站管理员和博客作者可以创建一些不計票的链接,也就是說这些链接不算作「投票」,从而实现抵制垃圾投票的目的。 Google工具条上的PageRank指標从0到10。它似乎是一个对数标度算法,细节未知。雖然'''PageRank'''是谷歌的商标,其技术亦已经申请专利,但是專利權屬於[[斯坦福大學]],而非谷歌公司。 PageRank算法中的点击算法是由[[乔恩·克莱因伯格]](Jon Kleinberg)提出的。而其他的基于链接的网页排名算法,则包括[[乔恩·克莱因伯格]]发明的HITS算法,IBM CLEVER Project,TrustRank算法以及hummingbird算法等等。
摘要:
请注意,所有对Local Chinese Wikipedia的贡献均可能会被其他贡献者编辑、修改或删除。如果您不希望您的文字作品被随意编辑,请不要在此提交。
您同时也向我们承诺,您提交的内容为您自己所创作,或是复制自公共领域或类似自由来源(详情请见
Project:著作权
)。
未经许可,请勿提交受著作权保护的作品!
取消
编辑帮助
(在新窗口中打开)
导航菜单
个人工具
未登录
讨论
贡献
创建账号
登录
命名空间
页面
讨论
大陆简体
不转换
简体
繁體
大陆简体
香港繁體
澳門繁體
大马简体
新加坡简体
臺灣正體
查看
阅读
编辑
查看历史
更多
搜索
导航
首页
最近更改
随机页面
MediaWiki帮助
工具
链入页面
相关更改
特殊页面
页面信息