万维网

来自Local Chinese Wikipedia
(重定向自Web
跳转到导航 跳转到搜索

Template:NoteTA Template:Distinguish Template:Redirect2

脚本错误:没有“Infobox”这个模块。Template:Template other脚本错误:没有“Check for unknown parameters”这个模块。

File:Chrome on Linux.png
Google Chrome中显示维基百科网页

万维网Template:Langx)亦作脚本错误:没有“Lang”这个模块。脚本错误:没有“Lang”这个模块。全球广域网[1][2],是一个公共的互连资讯系统,使内容得以透过互联网共享[3]。其根据超文本传输协议(HTTP)的特定规则,提供对文件及其他网络资源的存取[4]

万维网是由英国电脑科学家提姆·柏内兹-李于1989年在欧洲核子研究组织(CERN)任职时发明,并于1993年对公众开放。它被构想为一个“通用连结资讯系统”[5][6][7]。文件和其他媒体内容透过网页服务器提供给网络,并可由网页浏览器等程式进行存取。万维网上的服务器与资源是透过称为统一资源定位符(URL)的字串来识别与定位[8]

最初且至今仍非常常见的文件类型是以超文件标示语言(HTML)格式化的网页。这种标示语言支援纯文字图像影片音讯内容,以及实作复杂使用者互动的脚本[9]。HTML语言也支援超链接,可立即存取其他网络资源,使用者透过点选超链接在多个网站之间切换浏览。网络应用程序则是具备应用软件功能的网页。万维网上的资讯是使用HTTP在互联网上传输[10]。具有共同主题且通常具有共同域名的多个网络资源构成了一个网站。单一网页服务器可以提供多个网站,而某些网站可能由多个服务器提供。网站内容由无数的公司、组织、政府机构和个人使用者提供,并包含大量的教育、娱乐、商业与政府资讯。

万维网已成为全球占主导地位的资讯系统平台[11][12][13]。它是全球数十亿人使用互联网的主要工具[4]

历史[编辑]

File:First Web Server.jpg
这台由提姆·柏内兹-李欧洲核子研究组织(CERN)使用的NeXT电脑成为了世界上第一台网页服务器
File:WWW logo by Robert Cailliau.svg
罗伯特·卡里奥设计的万维网标志。目前万维网并没有广泛被采纳的通用标志。

万维网是由英国电脑科学家提姆·柏内兹-李欧洲核子研究组织(CERN)工作时发明[14][15]。他的动机是为了解决在该大型且不断变化的组织中储存、更新及寻找文件的问题,并将其分发给CERN以外的合作者。在设计中,柏内兹-李扬弃了当时常见的树状结构以及依赖关键词标记档案的方法。相反地,他采纳了他在CERN建立的私人ENQUIRE系统中所实践的概念。当他得知泰德·尼尔森超文字模型时,该模型中文件可以透过与文字中嵌入的超链接,以不受限制的方式进行连结,这进一步确认了其构想的可行性[16][17]

该模型后来由苹果公司HyperCard系统推广。与HyperCard不同的是,柏内兹-李的新系统从一开始就旨在支援独立电脑上多个数据库之间的连结,并允许互联网上任何电脑的多个使用者同时存取。他还规定该系统最终应处理除文字以外的其他媒体,例如图形、语音与影片。连结可以指向可变的资料档案,甚至可以在其服务器电脑上启动程式。他还构思了“闸道”,使新系统能够存取以其他方式组织的文件。此外,他坚持系统应该是去中心化的,对于连结的建立没有任何中央控制或协调机制[6][18][14][15]

柏内兹-李于1989年5月向CERN提交了一份提案,当时并未给该系统命名[6]。他在1990年底前实作了一个可运行的系统,包括一个名为WorldWideWeb的浏览器,以及一个在CERN执行的HTTP服务器。作为开发的一部分,他定义了第一版HTTP协定、基本的URL语法,并将HTML作为主要文件格式[19]。该技术于1991年1月开始发布给CERN以外的其他研究机构,随后于1991年8月23日发布至互联网。万维网在CERN获得了成功,并开始传播到其他科学与学术机构[20][21]

CERN于1993年4月30日免费开放万维网协定与程式码,使其得以广泛使用[22][23][24]。在NCSA于同年稍晚发布Mosaic网页浏览器后,万维网的普及率迅速增长,不到一年内就涌现了数千个网站[25][26]。Mosaic是一款图形化浏览器,可以显示文字内图像并提交由HTTPd服务器处理的表单[27][28]马克·安德森吉姆·克拉克于次年创立了Netscape并发布了Navigator浏览器,将JavaJavaScript引入万维网,迅速成为主导浏览器。网景于1995年成为上市公司,带动了万维网热潮并引发互联网泡沫[29]微软随后开发了自己的浏览器Internet Explorer,开启了浏览器大战。透过与Windows捆绑销售,成为占主导地位的浏览器长达14年[30]

柏内兹-李创立了万维网协会(W3C),该协会在1996年建立了XML,并建议以更严谨的XHTML取代HTML[31]。与此同时,开发者开始利用名为XMLHttpRequest的IE功能来制作Ajax应用程序,并掀起了Web 2.0革命。MozillaOpera苹果公司拒绝了XHTML,并创立了开发HTML5WHATWG[32]。2009年,W3C做出让步并放弃了XHTML[33]。2019年,W3C将HTML规范的控制权移交给WHATWG[34]

命名[编辑]

提姆·柏内兹-李指出,万维网的正式拼法为三个独立的单字World Wide Web,每个单字的首字母均须大写,且中间不加连字号[35]。随着网络应用程序希望为其域名建立品牌形象并更易于发音,强调www字首的情况已逐渐减少。伴随移动互联网的普及,诸如Gmail.com、Outlook.com与Facebook.com等服务,通常在称呼中不再加上“www.”[36],甚至连“.com”也一并省略[37]

在英语中,www通常读作double-u double-u double-u[38] 。部分使用者特别是在新西兰会将其发音为dub-dub-dub[39]史蒂芬·佛莱在其“Podgrams”系列播客中则将其读作wuh wuh wuh[40]。英国作家道格拉斯·亚当斯曾于1999年的《周日独立报》讽刺道:“World Wide Web是我所知唯一一个缩写念起来比原名还要长三倍的事物”[41]

1994年6月,在北美留学的一名中国地理学家李小文中国新闻电脑网络(CND)的电子出版物《华夏文摘》上首次将“World Wide Web”称为“万维天罗地网”,简称“万维网”,这样其中文名称汉语拼音也是以WWW开始,自此“万维网”这一名称在中国开始被广泛采用[42]

原理[编辑]

“互联网”与“万维网”这两个名词经常被混用而未加区别,然而两者并不相同。互联网是一个透过电信与光学网络相互连结的全球电脑网络系统。相比之下,万维网则是档案及其他资源的全球集合,并透过超链接与URI相互连结。网页资源是透过HTTPHTTPS进行存取,这些是使用互联网传输协定的应用层协定[4]。在万维网上浏览网页,通常是从在网页浏览器中输入URL,或是点选指向该网页或资源的超链接。随后网页浏览器会启动一系列背景通讯讯息,以获取并显示请求的页面。

连结[编辑]

File:WorldWideWebAroundWikipedia.png
万维网的一小部分的图形,呈现超链接的结构

大多数网页包含指向其他相关页面、可下载档案、原始文件、定义以及其他网络资源的超链接。在底层的HTML中,超链接的编码如下:<a href="http://example.org/home.html">Example.org Homepage</a>.

这种透过超文字连结相互连结的实用相关资源集合被称为资讯网。提姆·柏内兹-李于1990年11月首次称之为WorldWideWeb(最初使用驼峰式大小写,随后被废弃)的系统[43]

万维网的超链接结构由如右图描述,节点代表网页或网址,节点之间的有向边则代表超链接。随着时间推移,许多超链接指向的网络资源会消失、搬迁或被不同的内容取代。这使得超链接渐渐失效,这种现象被称为失效连结。万维网的易逝性质促使许多人致力于对网站进行存档。自1996年开始运作的互联网档案馆,是此类计划中最为知名的机构[44]

网页[编辑]

网页是一种适用于万维网与网页浏览器的文件。网页浏览器会将网页显示在萤幕或移动设备上。

网页通常指代视觉上可见的内容,但也可能指代电脑档案本身,该档案通常是包含以HTML或类似标记语言编写的超文字档案。典型的网页提供超文字,以便透过超链接浏览至其他网页。网页浏览器在呈现每个网页时,经常需要存取多个网络资源元素,例如读取样式表指令码及图像。

在网络上,网页浏览器可以从远端网页服务器撷取网页。网页服务器可能会限制仅限私有网络存取。网页浏览器使用HTTP向网页服务器发送此类请求。

静态网页的传输内容与其在网页服务器档案系统中的储存方式完全相同。相比之下,动态网页则是由网络应用程序产生,通常由服务器端软件驱动。当每位使用者可能需要完全不同的资讯时,便会使用动态网页,例如银行网站、网络邮件等。

浏览器[编辑]

File:Internet Key Layers.png
万维网作为一种应用层协定运作,使其功能更加完备。Mosaic网页浏览器的出现大幅提升了网页的实用性,包括对图像与动态图像GIF的显示

脚本错误:没有“main”这个模块。 网页浏览器是存取万维网资讯的使用者代理软件。使用者需要拥有网页浏览器,才能连接网页服务器并显示其页面。使用者透过执行此程式,在电脑上进行网页的下载、排版及显示。除了让使用者搜寻、显示及在网页间切换之外,网页浏览器通常还具备书签管理、历史纪录、Cookie管理、设定首页等功能,并可能提供储存网站登入密码的机制。

服务器[编辑]

脚本错误:没有“main”这个模块。

网页服务器是指服务器软件,或是专门执行该软件的硬件,能够满足万维网用户端的请求。一般而言,一个网页服务器可以包含一个或多个网站。网页服务器透过HTTP及其他数个相关协定处理传入的网络请求。

网页服务器的主要功能是储存、处理并将网页传送给用户端[45]。用户端与服务器之间的通讯采用HTTP。传送的页面最常为HTML文件,除了文字内容外,还可能包含影像、样式表及脚本。

使用者代理通常是网页浏览器网络爬虫,透过HTTP对特定资源发出请求并通讯,而服务器则回传该资源的内容,若无法执行则回传错误讯息。该资源通常是服务器次级储存装置上的实际档案,但并非必然如此,这取决于网页服务器的实作方式。

虽然主要功能是提供内容,但HTTP的完整实作也包括从用户端接收内容的方法,功能包括提交网页表单上传档案。

许多通用型网页服务器也支援使用ASPPHP或其他脚本语言进行脚本编写。这意味着网页服务器的行为可以在独立的档案中编写脚本,而实际的服务器软件保持不变。通常,此功能用于动态产生HTML文件,而非回传静态文件。前者主要用于从数据库中检索或修改资讯。后者通常速度快得多且更容易快取,但无法提供动态内容。

网页服务器也经常被发现嵌入在打印机路由器网络摄影机等装置中,且仅服务于局域网络。网页服务器随后可作为监视或管理该装置系统的一部分。这通常意味着用户端电脑只需要使用网页浏览器,而不需要安装额外的软件,且目前大多数操作系统皆已内建网页浏览器。

国际化[编辑]

File:World Map of Web Index 2014.svg
2014年,全球各国网络索引地图

W3C国际化活动确保万维网技术能应用于所有语言、文字及文化[46] 。自2004年或2005年起,Unicode开始取得优势,最终在2007年12月超越ASCII与西欧语言字元集,成为万维网上最常使用的字元映射表[47]。最初Template:IETF RFC仅允许以US-ASCII子集构成的URI来识别资源。而Template:IETF RFC则允许通用字元集中的任何字元,现在资源可透过任何语言的IRI进行识别[48]

参阅[编辑]

脚本错误:没有“Portal”这个模块。

参考文献[编辑]

Template:Reflist

外部链接[编辑]

Template:Sister project

Template:- Template:电信 Template:FOSS Template:Authority control