互聯網檔案館

出自Local Chinese Wikipedia
(重新導向自Internet Archive
跳至導覽 跳至搜尋

Template:Hatnote Template:Selfref Template:NoteTA 腳本錯誤:沒有「Infobox」這個模塊。腳本錯誤:沒有「Check for unknown parameters」這個模塊。腳本錯誤:沒有「check for clobbered parameters」這個模塊。

File:Internet Archive headquarters exterior February 2008.jpg
舊「互聯網檔案館」總部(1996年 - 2009年11月)
File:Christian science church122908 02.jpg
新「互聯網檔案館」總部(2009年11月 - )

互聯網檔案館Template:Langx)是美國的一個非營利性的、提供互聯網多媒體資料檔案閱覽服務數位圖書館。互聯網檔案館由Alexa創始人布魯斯特·卡利於1996年創辦,總部位於加利福尼亞州三藩市的列治文區,其使命是「普及所有知識」(腳本錯誤:沒有「Lang」這個模塊。[1][2]。該網站提供的數字資料有如網站、網頁、圖形材料音樂、視頻、音頻、軟件、動態圖像和數百萬書籍等的永久性免費儲存及獲取的副本。

迄至2021年2月,該網站儲存了7280 億個網頁、3800萬本書和文本、1400 萬個錄音(包括 240,000 場現場音樂會)、700 萬個視頻(包括 200 萬個電視新聞節目)、400 萬張圖片、790,000 個軟件程序。[3]除此之外,互聯網檔案館也是網絡開放與自由化的倡議者之一,但其亦遭遇出版商與著作權持有人訴訟,令許多網絡的歷史紀錄被移除。[4]

歷史[編輯]

1996年,卡利(Brewster Kahle)在創立盈利性的Alexa Internet的同時也創立了互聯網檔案館;同年10月開始收集儲存資料[5][6]。而檔案館亦曾於1996年5月10日下午2:42保存了已知最早的頁面。[7][8][9][10]不過,直到2001年開發了「時光機」前,這些資料都無法存取。1999年末擴展收集範圍[11]

2012年8月,互聯網檔案館宣佈[12]將在其現存的130萬檔案的下載選項中加入BitTorrent[13][14]。因為透過兩個檔案資料中心協調,這成為從該檔案館下載資料的最快方法[13][15]

2013年11月6日,檔案館在里奇蒙德區的總部失火,損壞了許多設備和一些附近的公寓[16][17],預計損失達到60萬美元[18]。 2014年11月,互聯網發佈測試版,2016年3月,移除舊佈局。[19][20]

2016年11月,卡利宣佈互聯網檔案館正在建立加拿大分站,總部將設在加拿大,但具體地點沒有公佈。[21][22][23] 媒體報道中,卡利表示 :

11月9日,在美國,我們突然意識到一個承諾進行徹底變革的新政府的出現。這強有力地提醒我們,像我們這樣有長期計劃的機構,也需要為適應變化而設計。對我們來說,這意味着我們要保持我們的文化材料的安全、私密和永遠可訪問。這意味着要為一個可能面臨更大限制的網絡做準備。這意味着在一個政府監視不會消失的世界裏為用戶服務;事實上,政府監視看起來還可能會再增加。縱觀歷史,圖書館一直在與嚴重的侵犯私隱的行為作鬥爭——人們僅僅因為他們閱讀的內容便遭到逮捕。而互聯網檔案館正在努力保護我們的讀者在數字世界的私隱。[21]

從2017年開始,聯機計算機圖書館中心(OCLC)和互聯網檔案館通過合作,使該檔案館的數碼化圖書記錄可在WorldCat上訪問。[24]

2018年以來,互聯網檔案館推出視覺藝術入駐項目,將藝術家與檔案館超過48pb的[25]數碼化材料聯繫起來。在為期一年的項目中,視覺藝術家創作了大量作品,頂峰時期還舉行了展覽。其期望是將數字歷史與藝術聯繫起來並為後代創造一些能在線上或線下欣賞的東西。[26]

2019年,互聯網檔案館位於三藩市的總部收到炸彈威脅,迫使該大樓暫時被騰空。[27]

2024年5月27日開始,互聯網檔案館受到分佈式拒絕服務攻擊,[28]攻擊持續三天後仍未停止。[29]

2024年9月中旬,谷歌在搜索結果中加入互聯網檔案館的連結。[30]

腳本錯誤:沒有「Gallery」這個模塊。

2024年9月30日,互聯網檔案館被盜取約3100萬位用戶的Email、密碼、用戶名。[31][32]2024年10月10日,互聯網檔案館受到DDoS攻擊。攻擊者疑似是親巴勒斯坦黑客。[33]截至10月23日,archive.org、Wayback Machine、Archive-It和開放圖書館服務全部恢復,但登錄等部分功能仍然不可用。[34]

運作[編輯]

互聯網檔案館是一家在美國運營的501(c)(3)非營利組織,其年度預算約為1000萬美元,來源則是其網頁爬蟲服務、合作關係、贊助以及卡利-奧斯丁基金會[35]。該檔案館的總部位於加利福尼亞州三藩市。從1996年到2009年,其總部設在三藩市要塞,那裏曾是美國的一個軍事基地。自2009年以來,其總部一直設在三藩市芬斯頓大道300號,這裏以前是一個基督教科學教堂。公司大部分員工曾一度在其圖書掃描中心工作;截至2019年,全球有100家付費運營商進行了掃描。[36]互聯網檔案館的大房間收藏了100多個代表互聯網檔案館員工的陶瓷人像,其中第100尊是亞倫·斯沃茨的雕像。該系列人像的靈感來自中國秦始皇兵馬俑,由布魯斯特·卡利委託,Template:維基數據鏈接雕刻。[37]

互聯網檔案館也在加州的三個城市設有資料中心,分別為三藩市、紅木城列治文。為減少數據丟失的風險,該檔案館在包括埃及新亞歷山大圖書館[38][39]阿姆斯特丹[40]等更遙遠的地方儲存了一些存檔副本。

互聯網檔案館的大部分材料來自捐贈,[41]例如2017年波士頓公共圖書館提供的大量78轉/分鐘的光盤,[42]2018年特倫特大學捐贈的25萬本圖書,[43]以及馬里格魯夫學院圖書館在2020年關閉後的全部藏品。[44]其後所有材料經過數碼化後進行數字存儲,而數字副本返回原始持有者以及在互聯網檔案進行複製,如果不是公共領域中的內容,可在遵循首次銷售原則的受控數字借閱(CDL)理論的前提下,每次借給世界各地的一個顧客。[45]

互聯網檔案館參與了腳本錯誤:沒有「ilh」這個模塊。[46]並於2007年被加利福尼亞州政府選為官方指定圖書館。[47][48]

互聯網檔案館宕機或資料庫出錯時,可於新亞歷山大圖書館鏡像網站查詢1996至2007年的備份資料[49]

網頁[編輯]

時光機[編輯]

腳本錯誤:沒有「main」這個模塊。 網站時光機是互聯網檔案館最重要的服務之一,其名稱取自一部名為腳本錯誤:沒有「ilh」這個模塊。的美國卡通片。時光機允許人們去搜索和訪問其網頁存檔。[50]該檔案館的資料由自帶的網絡爬蟲自動搜集,截至2011年,已抓取了超過1500億的網頁[51][52]。在一些國家和地區,時光機這個術語的使用已經非常普遍,「時光機」和「互聯網檔案館」甚至開始被當做同義詞使用。

大量網站及其相關數據(圖像、原始碼、文檔等)都被保存在一個數據庫中。該服務可以用來查看以前版本的網站過去的樣子,從可能不再可直接訪問的網站中獲取原始原始碼,甚至訪問已經不存在的網站。因為許多網站所有者選擇防止用戶訪問他們的網站,故並非所有網站都可使用該服務。如同所有以來自網絡爬蟲的數據為基礎的網站一樣,互聯網檔案館由於各種其他原因確實網絡的大片領域。2004年的一篇論文指出,互聯網檔案館的信息覆蓋範圍存在國際偏好,但亦指出這「並非有意」。[53]

一個名爲「Save Page Now」(即刻保存頁面)的功能於2013年10月推出,該功能可從網站時光機主頁的右下角訪問,[54]輸入目標網站的URL並點擊保存,該網頁就會成為時光機的一部分。[55] 2016年10月,互聯網檔案館宣佈將改變網頁的計數方式,使所顯示的存檔頁面數量減少。嵌入對象如圖片、視頻、樣式表JavaScript將不再被視為「網頁」,而HTML、PDF和純文本文檔則仍被視為網頁。[56]

File:Incoming additional storage at Internet Archive.jpg
互聯網檔案館增量採購的存儲盤
年份 存檔頁面的數量(億)
2005 40[57]
2006 85[58]
2007 85[59]
2008 85[60]
2009 150[61]
2010 150[62]
2011 150[63]
2012 150[64]
2013 373[65]
2014 430[66]
2015 479[67]
2016 510頁面Template:Citation/styles.css沒有內容。[A][68]

273頁面Template:Citation/styles.css沒有內容。[B][69]

2017 286[70]
2018 344[71]
頁面Template:Citation/styles.css沒有內容。A 使用了2016年10月以前的舊版計數系統
頁面Template:Citation/styles.css沒有內容。B 使用了2016年10月以後的新版計數系統

2020年9月,互聯網檔案館宣佈與Cloudflare合作,自動索引通過其「Always Online」服務提供服務的網站。[72]

Archive-It[編輯]

File:Internet-archive-brewster-kahle-2013-0329.webm
創始人布魯斯特·卡利正在談論Archive-It

Archive-it是一款幫助機構和個人建立存檔的工具。Archive-It允許用戶自定義輸入或排除他們因為文化遺產的原因而保存的網絡內容。通過一個web應用程式,Archive-It合作夥伴可以收集、編目、管理、瀏覽、搜索和查看自己的已存檔內容。 [73]

在可訪問性方面,存檔的網站全文可在捕獲後7天內搜索到。[74]通過Archive-It收集的內容被捕獲並存儲為一個WARC文件,並有一個主副本和備份副本被存儲在互聯網檔案館的數據中心。WARC文件的副本可以提供給訂閱合作夥伴機構,以最大地達到其地理冗餘存儲的目的[75]通過Archive-It捕獲的數據會被定期索引到互聯網檔案館的一般檔案中。

Archive-It的合作夥伴有大學和學院的圖書館、州檔案館、聯邦機構、博物館、法律圖書館和文化組織,包括電子文獻組織、北卡羅萊納州州檔案館和圖書館、史丹福大學哥倫比亞大學開羅美國大學、喬治敦法律圖書館和許多其他大學。截至2014年3月 (2014-03)Archive-it在美國的46個州和其他16個國家共有超過275個機構是其合作夥伴,共有超過74億個網頁的在線存檔。

互聯網檔案館學術[編輯]

2020年9月,互聯網檔案館宣佈了一項新的計劃,即存檔和保存可開放獲取的學術期刊,並稱之為互聯網檔案館學術。[76][77][78]其全文搜索索引包括超過2500萬篇研究性文章和保存在互聯網檔案館中的其他學術文件。收藏範圍包括從18世紀期刊的數碼化副本到最新的可開放獲取會議論文和從萬維網上爬行抓取的預印本。

總索引[編輯]

2021年,互聯網檔案館發佈了《總索引》(腳本錯誤:沒有「Lang」這個模塊。)的最初版本,包含1.07億篇學術期刊文章。[79][80]

圖書[編輯]

收集文本[編輯]

File:Scribe Machine Acquisition 3.jpg
互聯網檔案館的「抄寫員」圖書掃描工作站

互聯網檔案館收集了世界各地的數碼化圖書以及各大圖書館和文化遺產機構的特殊藏品。互聯網檔案館在5個國家經營着33個圖書掃描中心,其活動受圖書館和基金會的財政支持。[56][81]截至2013年7月 (2013-07),檔案館共收集了440萬本書,每月的下載量超過1500萬次。[56]截至2008年11月 (2008-11),檔案館共有100萬個網絡文本,總大小高達0.5PB,涵蓋了原始照相圖像、裁剪和歪斜的圖像、PDF文件和原始OCR數據。[82]

大約在2006年到2008年之間,微軟通過其實時搜索圖書項目與互聯網檔案文本建立特殊的關係,掃描了超過30萬本捐贈的圖書,微軟並提供財政支持和掃描設備。2008年5月23日,微軟宣佈將結束在線圖書搜索項目,不再掃描圖書。[83]微軟在不受合同限制的情況下公開了掃描書籍,並將其掃描設備捐贈給了其前合作夥伴。[83]

2007年10月,檔案館用戶開始上傳來自Google圖書公有領域的書籍。[84]截至2013年11月,該檔案館收藏的圖書有90多萬本來自Google的數碼化圖書;[85]這些圖書除沒有Google的水印,並且可以不受限制地使用和下載外,與Google上的圖書完全相同。[86]布魯斯特·卡利在2013年透露,這項工作由亞倫·斯沃茨協調完成,斯沃茨和「一些朋友」在遵守Google的限制條件的情況下從Google下載公共領域的書籍。這樣做是為了確保公眾能夠進入公共領域。檔案館亦確保這些內容被歸屬並連結到Google,谷歌也沒有提出異議,而圖書館則發出了「抱怨」。根據卡利的說法,這個例子證明了斯沃茨的「天才」,他致力於為數百萬人提供最大的公共利益。[87]腳本錯誤:沒有「anchor」這個模塊。除圖書外,檔案館還提供免費和匿名的公眾訪問渠道使公眾可以訪問超過400萬份法庭意見、法律摘要或美國聯邦司法機構上傳的展品。這些文件一直保存在聯邦法院的收費牆後。到2013年,已有超過600萬人通過互聯網檔案館訪問這些文件。[87]

互聯網檔案館中的圖書閱讀器網絡應用程式[88]內置於其網站中,具有單頁、雙頁和縮略圖模式;全屏模式;保持圖像高解像度的頁面快速移動和翻頁動畫等功能。 [88][89]

+ 各語言文本數
1 語言 英語 法語 德語 西班牙語 漢語 阿拉伯語
文本數(2015年11月27日) 6,553,945[90] 358,721[91] 344,810[92] 134,170[93] 84,147[94] 66,786[95]
2 語言 荷蘭語 葡萄牙語 俄語 烏爾都語 日語 合計(2016年10月30日)
文本數(2015年11月27日) 30,237[96] 25,938[97] 22,731[98] 14,978[99] 14,795[100] 10,612,003[101]
+ 各年代文本數
1 年代 1800年代 1810年代 1820年代 1830年代 1840年代 1850年代
文本數

(2015年11月27日)

39,842[102] 51,151[103] 79,476[104] 105,021[105] 127,649[106] 180,950[107]
2 年代 1860年代 1870年代 1880年代 1890年代 1900年代 1910年代
文本數

(2015年11月27日)

210,574[108] 214,505[109] 285,984[110] 370,726[111] 504,000[112] 455,539[113]
3 年代 1920年代 1930年代 1940年代 1950年代 1960年代 1970年代
文本數

(2015年11月27日)

185,876[114] 70,190[115] 85,062[116] 81,192[117] 125,977[118] 206,870[119]
4 年代 1980年代 1990年代 2000年代 2010年代
文本數

(2015年11月27日)

181,129[120] 272,848[121] 579,905[122] 855,253[123]

Open Library[編輯]

腳本錯誤:沒有「main」這個模塊。 開放圖書館是互聯網檔案館的另一個項目。該項目旨在為出版的每一本書提供一個網頁,擁有2500萬冊版本目錄記錄。該項目還致力於成為一個可在線訪問的公共圖書館,從500多萬份所收集文本中全文收錄大約160萬本公共領域以及印刷中和擁有版權的書籍,[124]其中許多可任意閱讀與下載[125][126]以及全文檢索;[127]該項目與來自6個國家的1000多家圖書館建立了合作關係,為非公共領域的647,784本圖書提供為期兩周的電子書借閱服務 [128][129]惟需先在網站上免費註冊。開放圖書館是一個自由及開放原始碼軟件,其原始碼可以在GitHub上免費獲得。

開放圖書館也面臨一些作者和作家協會的反對,他們認為該項目是在未經授權地分發圖書,因此違反了版權法,[130]2020年6月,四家主要出版商對互聯網檔案館提起版權侵權訴訟,旨在停止開放圖書館項目。[131]

圖書數碼化贊助商[編輯]

許多大型機構贊助商已經為互聯網檔案館提供了數百萬份掃描出版物(文本項目)。[132]一些已經將大量文本數碼化的贊助商,包括多倫多大學的羅柏斯圖書館、阿爾伯塔大學圖書館、渥太華大學圖書館、國會圖書館、波士頓圖書館聯盟成員圖書館、波士頓公共圖書館、普林斯頓神學院圖書館和許多其他圖書館。[133]

2017年,麻省理工學院出版社授權互聯網檔案將圖書數碼化,並可從該出版社的存書目錄中借用圖書,[134]由阿卡迪亞基金提供財政支持。[135][136]次年,互聯網檔案館進一步從阿卡迪亞基金獲得資金,邀請其他一些大學出版社與互聯網檔案館合作,將圖書數碼化,並將該項目命名為「解鎖大學出版社圖書(Unlocking University Press Books)」。 [137][138]

國會圖書館創建了許多處理系統標識符,指向互聯網檔案中的免費數碼化書籍。[139]互聯網檔案館和開放圖書館也被國會圖書館網站列為電子書來源。[140]

多媒體[編輯]

File:IMG 5020 - Flickr - Jason "Textfiles" Scott.jpg
讀卡器
File:Unrelated Microfilm.jpg
互聯網檔案館的縮微膠片
File:Videocassettes and VCRs at Internet Archive.jpg
互聯網檔案館的錄影帶

除了上述內容之外,互聯網檔案庫還收集了大量的數字媒體,這些數字媒體均符合美國公共領域CC授權協議。這些媒體文件均會根據媒體類型(moving images、audio、text、etc.)被組織成集合,並根據各項標準被分入子集合。例如大都會藝術博物館提供的相關資料就會被分入一個子集,目前該集合相關資料的數量已經超過了140,000個[141]。每個主集合都含有一個「社區」子集合(以前被稱為「開源」)用於存儲公眾的貢獻。

音頻收藏[編輯]

音頻檔案包括音樂、有聲讀物、新聞廣播、舊時廣播的節目和各種其他音頻文件。該系列中有超過200,000個免費數字錄音。子集包括有聲讀物和詩歌、播客、[142]非英語音頻等。[143]

Live Music Archive子集包括來自獨立音樂家的超過170,000個音樂會錄音,以及更為成熟的藝術家和音樂合奏,以及關於錄製他們的音樂會的寬鬆規則,例如感恩至死,以及最近的碎南瓜。此外,Template:維基數據鏈接還允許互聯網檔案館收藏他父親Template:維基數據鏈接的音樂會錄音。澤馮系列從1976年至2001年不等,包含126場音樂會,包括1,137首歌曲。[144]

布魯克林博物館[編輯]

此系列包含大約3,000件布魯克林博物館的物品。[145]

其他服務與目標[編輯]

物理媒體[編輯]

卡利對書籍被扔掉的現象表現出強烈反應,以及受斯瓦爾巴全球種子庫的啟發,正在設想每出版的一本書便收集一本。除了這些書,卡利還計劃存儲互聯網檔案館的在2010年被替換的舊伺服器。[146]

軟件[編輯]

互聯網檔案擁有「世界上最大的在線歷史軟件集合」,跨越50年計算機歷史,包含數以萬億計字節的計算機雜誌和期刊、書籍、共享軟件光盤、FTP網站、視頻遊戲等。互聯網檔案館創建了一個它檔案庫以保存它們。[147]該項目主張獲得美國數字千年版權法的豁免權,以允許他們繞過美國著作權局於2003年批准的為期三年的複製保護[148]檔案館不提供軟件以供下載,因為豁免僅僅是為了保存或複製圖書館或檔案館出版的數字作品。[149]國會圖書館於2006年延長豁免,又於2009年無限期延長,等待進一步的規則制定。 [150]圖書館重申,豁免是「最終規則」,而2010年豁免尚未到期。 [151]

2013年,互聯網檔案館開始提供可以MESS方式遊玩的老軟件視頻遊戲,例如雅達利2600的遊戲E.T.外星人[152]自2014年12月23日起,互聯網檔案館通過基於瀏覽器的DOSBox模擬,推出數千款DOS/PC遊戲[153][154][155][156]且僅用於學術和研究目的。[157][158][159]截止2015年年初,互聯網檔案館共收錄了2400款MS-DOS遊戲[160]

2020年11月,檔案館為Adobe Flash導入了一種新的模擬器Ruffle,並開始致力於在2020年12月31日Flash插件的壽命結束前存檔Flash動畫和遊戲。[161]

台式抄寫系統[編輯]

互聯網開發了一種實現內容數碼化的組合軟硬件系統,稱為台式抄寫系統(Table Top Scribe System)。[162][163]

儲蓄互助社[編輯]

從2012年到2015年11月,互聯網檔案館運營着一個儲蓄互助社,總部設在新澤西州新不倫瑞克,目標是為中低收入人群提供訪問服務。在其短暫的存在時期內,互助社與國家信貸管理局經歷了一系列重大衝突,嚴重限制了互助社的貸款資產組合和為其對比特幣公司提供服務帶來擔憂。互助社解散時,有395名成員,市值250萬美元。[164][165]

藝術家入駐活動[編輯]

由Amir Saber Esfahani組織的互聯網檔案館視覺藝術家入駐活動[166]旨在將新興和在職藝術家與檔案館的數百萬藏品聯繫起來,並展示當開放信息獲取與藝術發生交叉時可能發生的事情。在為期一年的入駐活動期間,選定的藝術家創作了一批作品,以響應檔案館的藏品並在自己的實踐中加以利用。[167]

去中心化[編輯]

2019年開始,[168]互聯網檔案館組織了一個名為去中心化網絡營地(Decentralized Web Camp)的組織。該組織一年組織一次活動,在自然環境中匯集全球各地不同的貢獻者社區,旨在解決網絡世界面臨的現實世界挑戰,並為發展中的互聯網共同創造一個去中心化技術,促進合作、學習和樂趣,同時促進形成信任、人為代理、相互尊重和生態認識的準則。[169]

爭議[編輯]

下架感恩至死樂隊音樂會表演[編輯]

2005年11月,「感恩至死」樂隊音樂會在互聯網檔案館可免費下載。紐約時報報道,約翰·佩里·巴洛認為鮑勃·威爾、米奇·哈特和比爾·克魯茲曼是這一變化的發起者。[170]菲爾·萊什在其個人網站上對此事發表評論稱注意到所有「感恩至死」樂隊的表演都在感恩節前從archive.org刪除,他沒有參與這個決策過程,也沒有被告知這些節目將被取消。而他本人覺得音樂是「感恩至死」樂隊的遺產,希望以各種方式將其音樂提供給想要的人。[171]

布魯斯特·卡利在11月30日的一篇論壇帖中概括了樂隊成員之間可能達成的妥協。觀眾的錄音可以被下載或流動傳播,但調音台版本則只能流動傳播,而音樂會後來又被重新同意下載。[172]

拒絕國家安全信函的要求[編輯]

腳本錯誤:沒有「anchor」這個模塊。 腳本錯誤:沒有「Multiple image」這個模塊。

2008年5月8日,有消息稱,互聯網檔案館成功拒絕了聯邦調查局的一封國家安全信函中提供一個未公開用戶的日誌的要求。[173][174]

2016年11月28日,又有消息指美國聯邦調查局的第二封國家安全信函的要求也被成功拒絕,該信函要求獲取另一名未公開用戶的日誌。[175]

反對《禁止網絡盜版法案》與《保護知識產權法案》[編輯]

2012年1月18日,互聯網檔案館停止運行12小時,以示對禁止網絡盜版法案保護知識產權法案的抗議,認為兩項法案將「對網絡出版的生態產生負面影響,導致互聯網檔案的出現」。與此同時,英文維基百科以及其他許多網站其他也進行了類似的抗議活動。[176]

反對Google圖書協議[編輯]

互聯網檔案館是Template:維基數據鏈接的成員,該聯盟一直是Google圖書和解協議最激烈的批評者之一。檔案館提倡應該開發另一種數字圖書館項目。[177]

《任天堂力量》雜誌存檔[編輯]

2016年2月,有互聯網檔案用戶開始存檔任天堂官方雜誌《任天堂力量》從1988年到2012年的數字副本。2016年8月8日,任天堂刪除了其檔案,在此之前,前140期已被收集。任天堂告向遊戲網站Polygon回應其刪檔舉動時稱,任天堂必須保護自己的角色、商標和其他內容。任天堂知識產權若未經批准即被使用,其保護知識產權的能力將被削弱,其知識產權也可能被用於其他項目。[178]

土耳其及印度的封鎖[編輯]

2016年10月9日,互聯網檔案館以及其他文件託管服務在土耳其被黑客用來存儲政府泄露的電子郵件(共17GB)後,被短暫屏蔽。[179][180]

2017年8月,根據Template:維基數據鏈接發佈的兩項法院命令,印度政府的Template:綠鏈封鎖了互聯網檔案館和其他文件共享網站,[181]理由是兩部波里活電影的複製品據稱通過該服務被分享,而這可能帶來對盜版問題的擔憂。[182]但只有HTTP版本被阻止,使用HTTPS協議仍然可以訪問。[181]

被恐怖分子用於宣傳[編輯]

2018年5月,網絡安全公司Flashpoint發佈的一份報告稱,伊斯蘭國正在利用互聯網檔案館來分享其宣傳內容。[183]來自互聯網檔案館的克里斯·巴特勒回應,他們會定期與美國和歐盟政府就分享恐怖主義信息問題進行交談。[183]

2019年4月,歐洲刑警組織轉述法國警方的要求,要求互聯網檔案館關閉550個「恐怖主義宣傳」站點。[184]互聯網檔案館拒絕了這一要求,稱這些報告對他們所指出的內容的指控是錯誤的,或者內容過於寬泛,該網站無法同意這一要求。[184]

2022年1月,一位前加利福尼亞大學洛杉磯分校的講師上傳了一份800頁的宣言,其中包含種族主義的想法和對加州大學洛杉磯分校工作人員的威脅。[185]一周後,互聯網檔案館進行了關於檔案管理員是否應該保存這些文件的討論,最終將該宣言移除。[185]

與出版商的法律糾紛[編輯]

腳本錯誤:沒有「main」這個模塊。2019冠狀病毒病疫情期間,許多學校、大學和圖書館被關閉,互聯網檔案館於2020年3月24日宣佈,其正在創建國家緊急圖書館,具體方法為取消開放圖書館對140萬本數碼化圖書的借閱貸款限制,改為限制用戶可以借閱的圖書數量和強制歸還;通常情況下,該網站只允許他們擁有的每本書的實體副本使用一個加密文件進行一次數字借閱,該文件在借閱期結束後將無法使用。項目將至少持續到2020年6月30日,或者直到美國國家緊急狀態結束,以較晚者為準。[186]該項目啟動時,互聯網檔案館允許作者和版權所有者提交退出申請,讓他們的作品從國家應急圖書館中刪除。[187][188][189]

互聯網檔案館表示,在世界各地的實體圖書館被關閉的形勢下,國家應急圖書館解決了「前所未有的全球對獲取閱讀和研究材料的迫切需求」。[190]並多方面舉證以證明此舉的正確性。聲稱在法律方面,他們正在促進獲得那些無法獲得的資源,並不違背合理使用原則。檔案館繼續實施他們在國家應急圖書館項目開始之前的受控數字借閱政策,這意味着他們仍然對借出的圖書進行加密,用戶並不能比以前更容易地創建新的圖書副本。只有法院才能最終決定國家應急圖書館是否是在合理使用。在道德上,互聯網檔案館和其他圖書館一樣是一個註冊圖書館,他們要麼自己購買圖書,要麼接受捐贈,通過圖書館借閱的時間早於版權限制。[187][191]

但檔案館之前的借閱方式已經受到作者和出版商的批評,在國家應急圖書館宣佈啟動後,作者、出版商和代表雙方的團體進一步提出質疑,將此舉等同於版權侵犯和數字盜版,並將新冠肺炎疫情作為推動版權邊界的理由。[192][193][194][195]在其中一些作者的作品遭到嘲笑後,互聯網檔案館的傑森·斯科特要求國家應急圖書館的支持者不要詆毀任何人的書,表示意識到其中有很大爭論和分歧,但書能賦予生命和改變生命,而「這些書正是由這些作家創作」。[196]

國家應急圖書館的運作是四大圖書出版商阿歇特哈珀·柯林斯約翰·威利父子企鵝蘭登書屋於2020年6月對互聯網檔案館提起的訴訟的一部分,該訴訟質疑受控數字借閱計劃的版權有效性。[131][197]作為對訴訟的回應,互聯網檔案館於2020年6月16日提前關閉了國家應急圖書館項目。 [198][199]在版權聯盟的支持下[200],原告在訴訟中聲稱,互聯網檔案館的行為構成了「故意的大規模版權侵權」。 [201]2020年8月,該訴訟的審判暫定於2021年11月開始。[202]到2022年6月,該案雙方都要求對該案作出簡易判決,各自支持各自的一方,法官Template:維基數據鏈接批准在2022年晚些時候舉行簡易判決聽證會。[203]最終沒有發佈簡易判決,而是在2023年3月20日舉行了第一次聽證會。[204]聽證會舉行期間,約翰·科爾特爾被指對IA的合理使用主張無動於衷,也不相信出版商的圖書館電子書市場沒有受到他們做法的影響。[205]

參議院司法委員會知識產權小組委員會主席、北卡羅來納州參議員湯姆·蒂利斯在給互聯網檔案館的一封信中表示,他「擔心互聯網檔案館認為決定版權法範圍的是其本身而不是國會」。[201]

作為對出版商訴訟的部分回應,2020年末,檔案館發起了一項名為「授權圖書館」的運動(標籤#Empowering Libraries),稱這起訴訟為對所有圖書館的威脅。[206]

在2021年的一篇預印本文章中,作者Argyri Panezi認為,該案「提出了兩個重要但獨立的問題,這兩個問題都與圖書館作品的電子訪問有關;第一,它提出了關於數字借閱的法律實踐的問題,第二,它提出了緊急使用受版權保護的材料是否是合理使用的問題」,並認為圖書館在公共服務中的作用是「確保子孫後代有平等的訪問渠道或機會的一系列原始來源」。[207]

2020年12月,出版者周刊將這起訴訟列為「2020年十大最受關注的圖書館故事」之一。[208]

科爾特爾法官於2023年3月24日裁定互聯網檔案館在該案中敗訴,稱國家應急圖書館的理念沒有遵循合理使用原則,因此檔案館在沒有候補名單限制的情況下借出書籍侵犯了出版商的版權。互聯網檔案館事後表示,將對這一裁決提起上訴,但除此之外,將繼續提供此前已被判例法批准的其他數字圖書服務,例如為閱讀障礙用戶提供的圖書服務。[209][210]

Wayforward Machine[編輯]

2021年9月30日,作為其25周年慶典的一部分,互聯網檔案館推出了「Wayforward Machine」,這是一個諷刺性的小說網站,網站內有詢問個人信息的彈出窗口。該網站描繪了一個虛構的反烏托邦時間線,講述促使這樣一個未來的形成的現實世界中的事件,例如2022年廢除美國法典第230條和2041年引入廣告植入。[211][212]

下架BBC莫迪紀錄片[編輯]

2023年,互聯網檔案館成為印度人觀看BBC紀錄片《印度:莫迪問題》第一集的熱門網站。[213]據報道,該視頻於1月23日被檔案館下架。[213]互聯網檔案館隨後於1月27日表示,他們是根據英國廣播公司根據數字千年版權法的要求才下架該視頻。[214]

參見[編輯]

腳本錯誤:沒有「Portal」這個模塊。

  • 腳本錯誤:沒有「ilh」這個模塊。
  • 腳本錯誤:沒有「ilh」這個模塊。
  • 腳本錯誤:沒有「ilh」這個模塊。
  • 數位圖書館

頁面Template:Col-begin/styles.css沒有內容。

參考文獻[編輯]

  1. Template:Cite web
  2. Template:Cite web
  3. Template:Cite web
  4. Template:Cite web
  5. Template:Cite news
  6. Template:Cite web
  7. Template:Cite web
  8. Template:Cite web
  9. Template:Cite web
  10. Template:Cite web
  11. "Daisy Books for the Print Disabled"頁面存檔備份,存於互聯網檔案館), February 25, 2013. Internet Archive.
  12. Kahle, Brewster (August 7, 2012). "Over 1,000,000 Torrents of Downloadable Books, Music, and Movies"頁面存檔備份,存於互聯網檔案館). Internet Archive Blogs.
  13. 13.0 13.1 Template:Cite web
  14. "Hot List for bt1.us.archive.org (Updated August 7 2012, 7:31 pm PDT)"頁面存檔備份,存於互聯網檔案館). US Cluster. Internet Archive.
  15. "Welcome to Archive torrents"頁面存檔備份,存於互聯網檔案館). Internet Archive.
  16. Template:Cite web
  17. Template:Cite web
  18. Template:Cite web
  19. Template:Cite web
  20. Template:Cite web
  21. 21.0 21.1 Template:Cite web
  22. Template:Cite web
  23. Template:Cite web
  24. Template:Cite web
  25. Template:Cite web
  26. Template:Cite web
  27. Template:Cite web
  28. Template:Cite web
  29. Template:Cite web
  30. Template:Cite web
  31. Template:Cite web
  32. Template:Cite web
  33. Template:Cite web
  34. Template:Cite tweet
  35. 腳本錯誤:沒有「Citation/CS1」這個模塊。
  36. Template:Cite web
  37. Template:Cite news
  38. Template:Cite web
  39. Template:Cite web
  40. Template:Cite web
  41. Template:Cite web See also: Template:Cite web
  42. Template:Cite web
  43. Template:Cite web
  44. Template:Cite web
  45. Template:Cite web
  46. Template:Cite web International Internet Preservation Consortium. Netpreserve.org
  47. Template:Cite web
  48. Template:Cite web
  49. Template:Cite web
  50. Template:Cite news
  51. Template:Cite web
  52. Grotke, A. (2011). Web Archiving at the Library of Congress. Computers In Libraries, 31 no. 10 (December 2011), p. 15-19.
  53. Template:Cite journal
  54. Template:Cite web
  55. Template:Cite web
  56. 56.0 56.1 56.2 Template:Cite web
  57. Template:Cite web
  58. Template:Cite web
  59. Template:Cite web
  60. Template:Cite web
  61. Template:Cite web
  62. Template:Cite web
  63. Template:Cite web
  64. Template:Cite web
  65. Template:Cite web
  66. Template:Cite web
  67. Template:Cite web
  68. Template:Cite web
  69. Template:Cite web
  70. Template:Cite web
  71. Template:Cite web
  72. Template:Cite web
  73. Template:Cite book
  74. Template:Cite web
  75. Template:Cite web
  76. Template:Cite web
  77. Template:Cite web
  78. Template:Cite web
  79. Template:Cite journal
  80. Template:Cite web
  81. Kahle, Brewster (May 23, 2008). "Books Scanning to be Publicly Funded"頁面存檔備份,存於互聯網檔案館). Internet Archive Forums.
  82. "Bulk Access to OCR for 1 Million Books"頁面存檔備份,存於互聯網檔案館). Open Library Blog. November 24, 2008.
  83. 83.0 83.1 Template:Cite web
  84. Template:Cite web
  85. Template:Cite web
  86. Books imported from Google have a metadata tag of scanner:google for searching purposes. The archive provides a link to Google for PDF copies, but also maintains a local PDF copy, which is viewable under the "All Files: HTTPS" link. As all the other books in the collection, they also provide OCR text and images in open formats, particularly DjVu, which Google Books does not offer.
  87. 87.0 87.1 Brewster Kahle, "Aaron Swartz memorial at the Internet Archive Template:Webarchive", 2013-01-24, via The well-prepared mind Template:Webarchive, via S.I.Lex Template:Webarchive.
  88. 88.0 88.1 Template:Cite web
  89. Template:Cite web
  90. Template:Cite web
  91. Template:Cite web
  92. Template:Cite web
  93. Template:Cite web
  94. Template:Cite web
  95. Template:Cite web
  96. Template:Cite web
  97. Template:Cite web
  98. Template:Cite web
  99. Template:Cite web
  100. Template:Cite web
  101. Template:Cite web
  102. Template:Cite web
  103. Template:Cite web
  104. Template:Cite web
  105. Template:Cite web
  106. Template:Cite web
  107. Template:Cite web
  108. Template:Cite web
  109. Template:Cite web
  110. Template:Cite web
  111. Template:Cite web
  112. Template:Cite web
  113. Template:Cite web
  114. Template:Cite web
  115. Template:Cite web
  116. Template:Cite web
  117. Template:Cite web
  118. Template:Cite web
  119. Template:Cite web
  120. Template:Cite web
  121. Template:Cite web
  122. Template:Cite web
  123. Template:Cite web
  124. Template:Cite web
  125. 腳本錯誤:沒有「Citation/CS1」這個模塊。
  126. Template:Cite news
  127. Template:Cite web
  128. Template:Cite web
  129. Template:Cite web
  130. Template:Cite news
  131. 131.0 131.1 Template:Cite web
  132. For example, the Princeton Theological Seminary Library has described how it and other academic libraries are digitization partners with the Internet Archive: Template:Cite web
  133. Template:Cite web
  134. Template:Cite web
  135. Template:Cite web
  136. Template:Cite web
  137. Template:Cite web
  138. Template:Cite web
  139. For example: Template:Cite web; Template:Cite web; Template:Cite web; Template:Cite web; Template:Cite web.
  140. Template:Cite web And: Template:Cite web
  141. Template:Cite web
  142. Template:Cite web
  143. Template:Cite web
  144. Template:Cite web
  145. Template:Cite web
  146. Template:Cite web
  147. Template:Cite web
  148. Template:Cite web
  149. Template:Cite journal
  150. Template:Cite journal
  151. Template:Cite journal
  152. Template:Cite web
  153. Template:Cite news
  154. Template:Cite web
  155. Template:Cite web
  156. Template:Cite web
  157. Template:Cite web
  158. Template:Cite news
  159. Template:Cite news
  160. Template:Cite web
  161. Template:Cite web
  162. Template:Cite web
  163. Template:Cite web
  164. Template:Cite news
  165. Template:Cite web
  166. Template:Cite web
  167. Template:Cite web
  168. Template:Cite web
  169. Template:Cite web
  170. Template:Cite news
  171. Template:Cite web
  172. Template:Cite web Authors and date indicate the first posting in the forum thread.
  173. Template:Cite news
  174. Template:Cite news
  175. Template:Cite news
  176. Template:Cite web
  177. Template:Cite web
  178. Template:Cite web
  179. Template:Cite web
  180. Template:Cite web
  181. 181.0 181.1 Template:Cite web
  182. Template:Cite web
  183. 183.0 183.1 Template:Cite web
  184. 184.0 184.1 Template:Cite web
  185. 185.0 185.1 Template:Cite news
  186. Template:Cite web
  187. 187.0 187.1 Template:Cite web
  188. 腳本錯誤:沒有「Citation/CS1」這個模塊。
  189. Template:Cite web
  190. Template:Cite web
  191. Template:Cite web
  192. Template:Cite web
  193. Template:Cite web
  194. Template:Cite web
  195. Template:Cite web
  196. Template:Cite news
  197. Template:Cite news
  198. Template:Cite web
  199. Template:Cite news
  200. Template:Cite web
  201. 201.0 201.1 Template:Cite news
  202. Template:Cite web
  203. Template:Cite web
  204. Template:Cite news
  205. Template:Cite web
  206. 腳本錯誤:沒有「Citation/CS1」這個模塊。
  207. Template:Cite journal Article reportedly forthcoming.
  208. Template:Cite web
  209. Template:Cite web
  210. Template:Cite news
  211. Template:Cite news
  212. Template:Cite web
  213. 213.0 213.1 Template:Cite news
  214. Template:Cite web

延伸閱讀[編輯]

頁面Template:ReflistH/styles.css沒有內容。

外部連結[編輯]

腳本錯誤:沒有「Side box」這個模塊。

  1. REDIRECT Template:Official_website

腳本錯誤:沒有「Navbox」這個模塊。 Template:Tor onion services 腳本錯誤:沒有「Authority control」這個模塊。腳本錯誤:沒有「Check for unknown parameters」這個模塊。