中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

GitHub 啟動代碼永久保存計劃,至少一千年

2019-11-18    來源:raincent

容器云強勢上線!快速搭建集群,上萬Linux鏡像隨意使用

近日,GitHub 年度開發(fā)者大會 GitHub Universe 2019 正式拉開帷幕。GitHub 在峰會現(xiàn)場宣布了一項永久保存代碼計劃——GitHub Archive Program,通過不間斷的跨各種數(shù)據(jù)格式和位置存儲多個副本的方式來保護(hù)開源軟件代碼,至少保存 1000 年。

 

作者: 趙鈺瑩  來源:InfoQ

代碼永久保存計劃

開源軟件的出現(xiàn)為科技發(fā)展提供了動力,這也是全人類的共同遺產(chǎn)。 GitHub Archive Program 的任務(wù)就是最大可能為后代保留這些開源軟件。為了完成這項計劃,GitHub 與 Long Now Foundation、the Internet Archive、the Software Heritage Foundation, Arctic World Archive、Microsoft Research、the Bodleian Library 和 Stanford Libraries 合作,通過不間斷地跨各種數(shù)據(jù)格式和位置存儲多個副本來保護(hù)代碼,維持至少 1000 年的長期存檔。

GitHub 表示,盡管發(fā)生全球性災(zāi)難的可能性很小,但所有存儲在現(xiàn)代設(shè)備平臺上的內(nèi)容都可能會在幾代后消失,跨多個組織和存儲形式的歸檔軟件將有助于確保其長期保存:在線歸檔員將其稱為“ LOCKSS”,因為大量副本可以確保安全。

目前,大量的知識存儲在臨時媒體設(shè)備上:硬盤、SSD、CD 可以使用數(shù)十年,備份磁帶名義上只有 30 年的壽命,還得嚴(yán)格控制熱量和濕度。即便未來這些硬件還在,但運行在上面的軟件可能早已被淘汰, GitHub Archive Program 計劃有更長遠(yuǎn)的打算,以解決數(shù)據(jù)在未來丟失的風(fēng)險。

與此同時,這一計劃也為受到訪問限制的開發(fā)者提供了選擇,如果 GitHub 在某些地方不可用,受影響的開發(fā)人員可以使用 Internet Archive 和 Software Heritage Foundation 訪問其項目的公共代碼。

存哪?怎么存?

在 Long Now 創(chuàng)始人 Steward Brand 的啟發(fā)下, GitHub 采用“分層”策略來歸檔代碼。通過提供從實時到長期存儲的一系列解決方案,該方法旨在最大程度地提高靈活性和耐用性。存檔程序分為三類:熱門,一般和冷門。

熱門:接近實時更新

一般:每月或每年更新一次

冷門:每 5 年以上更新一次

GitHub(以下各存儲方案按熱度排列,GitHub 為熱門項目首選)

每次訪問 GitHub,GitHub 都會將 Git 數(shù)據(jù)復(fù)制到世界各地的多個數(shù)據(jù)中心。此外,在 Git 的多個位置存儲數(shù)據(jù)、問題、拉取請求以及數(shù)據(jù)備份,所有這些都可通過 GitHub API 實時獲得。

GHTorrent

GHTorrent 監(jiān)視 GitHub 公共項目的時間線,并進(jìn)行歸檔,遞歸爬取歸檔內(nèi)容和依賴性。這些存檔每天或每月可供下載。

GH Archive

GH Archive 監(jiān)視 GitHub 公共事件時間軸,將這些事件歸檔,并使用 BigQuery 使它們可查詢。開發(fā)者可以按小時、天或月下載快照。

Wayback Machine

互聯(lián)網(wǎng)檔案館 Wayback Machine 將檢索 GitHub 的公共資料庫(包括新的資料庫、問題、拉取請求、Wiki 等),并將副本存儲在舊金山和其他位置的硬盤上,這些檔案將通過 git 和 https 公開提供。

Software Heritage Foundation

Software Heritage Foundation(軟件遺產(chǎn)基金會)將定期抓取 GitHub,并將其公共存儲庫添加到存檔中,并向其提供公共 API 訪問權(quán)限。

Bodleian 圖書館

牛津大學(xué)的 Bodleian 圖書館將 GitHub 的 10,000 個最受關(guān)注和最依賴的存儲庫保留為 Piql 膠片格式,從而為 Arctic Code Vault 提供冗余。

GitHub Arctic Code Vault(北極)

2020 年 2 月 2 日,GitHub 會對每個活躍的公共存儲庫進(jìn)行快照捕獲,并保存在 GitHub Arctic Code Vault 中。存儲所使用的膠片卷軸長達(dá) 3500 英尺,由專門負(fù)責(zé)研發(fā)超長期數(shù)據(jù)保存技術(shù)的挪威 Piql 公司提供并編碼,其中的薄膜使用鹵化銀聚酯技術(shù)。根據(jù) ISO 標(biāo)準(zhǔn),這種介質(zhì)的使用壽命長達(dá) 500 年;同時,老化模擬測試表明,其使用時長也能達(dá)到原來的兩倍。

這是位于北極世界檔案館(AWA)中的數(shù)據(jù)存儲庫,位于北極山永久凍土區(qū)深 250 米。該檔案館位于斯瓦爾巴群島的一個廢棄煤礦中,比北極圈更靠近北極。 GitHub 將在 2020 年 2 月 2 日捕獲每個活動公共存儲庫的快照,并將這些數(shù)據(jù)保存在 Arctic Code Vault 中。

斯瓦爾巴群島受國際《斯瓦爾巴群島條約》的管制,屬于非軍事區(qū),是世界上最北端的城鎮(zhèn)所在地,地球上最偏遠(yuǎn)和地緣政治最穩(wěn)定的人類居住地之一。AWA 是挪威國有采礦公司 Store Norske Spitsbergen Kulkompani(SNSK)與長期數(shù)字存儲提供商 Piql AS 的一項聯(lián)合計劃。 AWA 致力于永久保存檔案,膠片卷軸將被存儲在位于斯瓦爾巴群島偏遠(yuǎn)群島一座廢棄煤礦密封室內(nèi)的鋼壁容器中。

盡管斯瓦爾巴群島受到氣候變化的影響,但在可預(yù)見的將來,可能只會影響到最外面幾米的永久凍土,預(yù)計變暖不會威脅穩(wěn)定性。礦山靠近著名的 Global Seed Vault(僅一英里之遙),這增強了斯瓦爾巴群島作為人類集體知識的穩(wěn)定且長期的檔案館地位。

存檔在 GitHub Arctic Code Vault 中的 02/02/2020 快照將包括所有活動的公共 GitHub 存儲庫,此外還包括由星號、依賴項和咨詢小組確定的大量休眠存儲庫?煺諏⒂擅總存儲庫的默認(rèn)分支的 HEAD 減去任何大于 100KB 的二進(jìn)制文件組成,每個存儲庫將打包為一個 TAR 文件。

為了提高數(shù)據(jù)密度和完整性,大多數(shù)據(jù)將以 QR 編碼存儲。易于閱讀的索引和指南將逐項列出每個存儲庫的位置,并說明如何恢復(fù)數(shù)據(jù)。

微軟研究院的 SILICA 項目

GitHub 存檔計劃與 Microsoft 的 Silica 項目合作,通過使用飛秒激光(目前科技條件下所能獲得的最短脈沖激光)將所有活動的公共存儲庫寫入石英玻璃片中,最終將其保存超過 10,000 年。

未來如何獲取這些代碼?

GitHub 正在召集 GitHub Archive Program 咨詢小組,其中包括人類學(xué)、考古學(xué)、歷史學(xué)、語言學(xué)、檔案科學(xué)、未來主義等方面的專家,就應(yīng)該在歸檔中包含哪些內(nèi)容以及如何與繼承者進(jìn)行最佳溝通提出建議。

存檔的簡介將包括 QR 解碼、文件格式、字符編碼和其他關(guān)鍵元數(shù)據(jù)的技術(shù)指南,以便可以將原始數(shù)據(jù)轉(zhuǎn)換回源代碼,以供將來其他人使用。該歸檔文件還將包括技術(shù)樹 - 路線圖和 Rosetta Stone,以供將來好奇的人繼承該歸檔文件的數(shù)據(jù)。

關(guān)于存檔及其使用方式的概述,“技術(shù)樹”將作為軟件開發(fā)和計算的快速入門手冊,并與該存檔的用戶指南捆綁在一起。它將描述如何從原始數(shù)據(jù)向后處理到源代碼,以及如何提取項目的目錄、文件和數(shù)據(jù)格式。

據(jù)報道,該檔案還將包括應(yīng)用開源的信息和指南,以及當(dāng)下開發(fā)者使用開源的情況,以防將來讀者需要從頭開始重建技術(shù)。在人類擁有可以運行的現(xiàn)代計算機但沒有可在其上運行的軟件的范圍內(nèi),檔案及其技術(shù)樹可能會非常有價值。但是,該價值很有可能是歷史性的。

一千年是很長的時間,一千多年前尚未建成吳哥窟等古代遺址。但是,GitHub 認(rèn)為可以考慮并計劃在未來 1000 年內(nèi)實現(xiàn)各種可能性,主要任務(wù)是為后代開發(fā)者保留開源軟件,并打算將 GitHub Archive Program 作為開源社區(qū)重要性的證明。希望這項計劃現(xiàn)在和將來可以進(jìn)一步宣傳全球開源運動,促進(jìn)在全球范圍內(nèi)廣泛采用開源和開放數(shù)據(jù)政策并鼓勵長期思考。

標(biāo)簽: GitHub

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:大數(shù)據(jù)和人工智能如何協(xié)同工作

下一篇:你需要了解的智慧城市中的大數(shù)據(jù)存儲