歡迎光臨
每天分享高質量文章

資料儲存的未來,磁帶是贏家?!

大資料分析和人工智慧領域近年來的研究進展,為企業收集有關其業務每一個可衡量方面的資訊創造了強大的動機,這應該不足為奇。而且,現在金融監管條例要求各單位保留相關記錄的時間也比過去要長得多。所以公司和機構儲存的資訊都越來越多

 

研究顯示,被記錄下來的資料在容量上正在以每年30%40%的速度增長[1]。與此同時,用於儲存資料的現代硬碟的容量增長速度還不到這一速度的一半。幸運的是,大部分資訊不需要即時訪問。對於這類資訊,磁帶是完美的解決方案。

真的嗎?磁帶?這個想法可能會喚起對出現在像電腦風雲Desk Set或《奇愛博士》Dr. Strangelove這樣的老電影裡那種在大型主機旁斷斷續續地轉動盤式磁帶的回憶。那麼,讓我們來做個快速的事實核查吧:磁帶從未消失!

的確世界上大部分資料仍然保留在帶上,包括基礎科學如粒子物理學和射電天文學)、文化遺產和國家檔案電影、銀行、保險石油勘探及其他很多方面的資料等。甚至還有一群人(包括我在內,接受過材料科學工程或物理方面的專業訓練),他們的工作就是不斷改進磁帶儲存。

是的,磁帶已存在很長時間了,但該技術尚未成為歷史,而是恰恰相反像硬碟和電晶體一樣,磁帶在過去幾十年中取得了巨大進步

第一個商用數字磁帶儲存系統IBM推出的Model 726,它可以在一捲磁帶上儲存大約1.1兆位元組資料。今天,一盒時新的磁帶可容納15TB資料。一個機械磁帶庫可容納多達278PB的資料,如果是將這麼多資料儲存在光碟上,那麼將需要3.97張光碟(能將它們一張壓一張地疊放起來的話,會形成一座高度超過476千米高塔)

確實,磁帶不能提供硬碟或半導體儲存器那樣快速的訪問速度。不過,磁帶的優勢還是很多。首先,磁帶儲存更節能:一旦所有資料被記錄了下來,磁帶盒就會安靜地獃在機械磁帶庫的插槽中,根本不消耗任何電量。磁帶也非常可靠,錯誤率比硬碟低四到五個數量級。磁帶還是非常安全,具有內建的動態加密以及由介質本身的性質所提供的額外安全性。畢竟,如果磁帶沒有安裝在驅動器中,則無法訪問或修改其上儲存的資料。鑒於透過網路攻擊導致的資料竊取不斷增長,這種“air gap”網閘尤其具有吸引力。

磁帶的離線特性還為有缺陷的軟體提供了額外的防線。例如,在2011年,Google的一次軟體更新中,程式碼裡的一個缺陷導致Google意外刪除了大約40,000Gmail帳戶的電子郵件。儘管在多個資料中心的硬碟上儲存了多個資料副本,但資料仍有所丟失。幸運的是,資料也記錄在磁帶上,Google最終從磁帶備份中恢復所有丟失的資料。

2011年的Gmail事件是最早披露的雲服務提供商使用磁帶進行運營的案例之一。更近一些時候,微軟宣佈其Azure Archive  Storage使用了IBM的磁帶儲存裝置。

1951年:最早被用在計算機(Univac)上記錄資料的磁帶照片來源:Bettmann / Getty Images

1952年:推出商用計算機磁帶儲存系統IBM 726)。照片來源:IBM

1964年:推出軌磁帶照片來源:IBM

1968年:推出自動穿帶磁帶機(IBM 2420)。照片來源:IBM

1974年:最早的自動(機械)磁帶庫(IBM 3850)。照片來源:IBM

1974年:最早的自動(機械)磁帶庫(IBM 3850)。照片來源:IBM

1984年:推出薄膜磁頭技術(IBM 3480)和4×5英寸磁帶。照片來源:IBM

1989年:推出數字資料儲存磁帶(螺旋掃描磁帶)。照片來源:Kadin2048 /Wikipedia

1993年:推出數字線性磁帶。照片來源:Christian Taube /Wikipedia

2009年:IBM推出線性磁帶檔案系統照片來源:IBM

2009年: IBM推出線性磁帶檔案系統圖片來源:Hewlett Packard Enterprise / IBM / Quantum。 

2017年:最新一代LTOLTO-8釋出照片來源:IBM

儘管磁帶有以上優點,公司使用磁帶的主要原因通常出於經濟上的考慮磁帶儲存的成本是將相同數量的資料儲存在磁碟上所需成本的六分之一,這就是為什麼幾乎可以在任何儲存大量資料的地方找到磁帶系統的原因。但由於磁帶現在已經完全從消費級產品中消失,大多數人都不知道它的存在,也就更不知道磁帶記錄技術近年來取得的巨大進步以及在可預見的將來會繼續取得的進步了。

所有這一切都是磁帶已經陪伴我們幾十年,並在未來幾十年繼續存在。我怎麼能這麼肯定?繼續讀下去,你就知道原因了

磁帶之所以能存活這麼久,有一個根本原因它很便宜而且,它正在變得越來越便宜。但情況會一直如此嗎?

可能會認為,如果將更多資料塞進硬碟的能力正在減弱,那麼對於使用相同基本技術但更老的磁帶來說也是如此。令人驚訝的現實是,對於磁帶而言,這種容量的擴大並沒有顯示出放緩的跡象。事實上,其儲存容量應該以每年約33%的歷史增長速度繼續增長多年,這意味著大約每兩到三年磁帶的儲存容量就會翻一番這可以看作是磁帶的摩爾定律。

對於那些不得不在儲存預算不高的情況下應對資料爆炸式增長問題的人來說,這是個好訊息。要理解為什麼磁帶仍然具有硬碟的潛力,可以思考下磁帶和硬碟的進化方式。

兩者依賴於相同的基本物理機制來儲存數字化的資料。它們以磁性材料薄膜中的窄軌道來實現儲存在薄膜中磁性在兩種極性狀態之間切換。資訊被編碼為一系列位元,由沿軌道分佈的特定點處存在或不存在磁極轉換來表示。自20世紀50年代推出磁帶和硬碟以來,兩者的製造商一直被“更密集更快更便宜口號所驅策發展結果是兩者的成本(以每千兆位元組容量所需美元計)都已經降低了多個數量級

磁性基板每平方毫米上可記錄資訊密度指數長,這導致了硬碟和磁帶成本降低。面密度(areal density)是沿資料軌道的記錄密度和垂直方向上軌道密度的乘積。

早期階段,磁帶和硬碟的面密度相似。但是,更大的市場規模和來自硬碟銷售收入為更大規模的研發工作提供了資金,這使得硬碟的製造商能夠更積極地提高硬碟的面密度結果是容量硬碟目前的面密度大最新磁帶的100

儘管如此,由於磁帶具有更大的可用於記錄的錶面積,最先進的磁帶系統裡的一盒本機磁帶可容納高達15TB的資料——超過了市場上容量最大的硬碟的容量儘管兩種裝置佔用的空間差不多,但事實的確如此

照片來源:Victor Prado

內部和外部一種時新的使用線性磁帶開放技術LTO的盒式磁帶,它只包含一個卷軸,將它插入磁帶系統後,磁帶自動捲到傳動裝置內建的卷軸

當然除容量外,磁帶和硬碟的效能特徵是非常不同的。盒式磁帶中帶子長度通常為數百米導致平均資料訪問時間為5060秒,而硬碟的平均資料訪問時間僅為510毫秒。但是,令人驚訝的是,將資料寫入磁帶的速率是寫入磁碟速度的兩倍多。

在過去幾年中,硬碟上資料的面密度增速已從其歷史平均值每年約40放緩到10%至15之間。原因與一些基本物理事實有關:要在給定面積中記錄更多資料,需要為每個位元分配一個更小的區域。這反過來會減弱讀取這個位元時可以得到的訊號的強度。如果訊號在強度上降低過多,它消失在硬碟上塗有磁性顆粒因其顆粒特性而產生的噪音之中

透過使這些顆粒變小,可以減少背景噪音。但是很難將磁性顆粒縮小到一定的尺寸而不會損害它們以穩定的方式保持磁性狀態的能力。在這個行業中,用於磁記錄的最小可行尺寸被稱為超順磁極限。而硬碟製造商已經抵達了這個極限尺寸

直到最近,這種容量增速的放緩對消費者來說都並不明顯,因為硬碟製造商能夠透過每個硬碟中新增更多的磁頭和碟片來進行補償,從而在相同尺寸的包裝中實現更高的儲存容量。但現在,可用空間和增加更多磁頭和碟片的成本限制了硬碟製造商所能獲得的收益。增速放緩開始變得明顯。

一些正在研發的技術可以使硬碟突破現今的超順磁極限的限制。這些技術包括熱輔助磁記錄技術HAMR)和微波輔助磁記錄技術MAMR),它們允許使用更小的顆粒,從而使磁碟的更小區域被磁化成為可能。但這些方法增加了成本並帶來棘手的工程挑戰。根據製造商的說法,即使這些技術研發成功,它們提供的容量增長可能也是有限。例如,最近宣佈將在2019年開始出貨MAMR硬碟西部資料公司預計說,MAMR技術只能使硬碟的面密度每年增加約15%。

相比之下,磁帶儲存裝置目前使用的面密度還超順磁極限之下。因此,磁帶的摩爾定律可以持續十年或更長時間,而不會遇到這些基礎物理層面的障礙。

然而,磁帶是一種棘手的技術。它的可拆卸性使用薄的聚合物基板而不是剛性基片以及同時多達32平行軌道上記錄,為設計人員帶來了很大障礙。這就是我在IBM蘇黎世研究實驗室的研究團隊一直努力尋找能使磁帶容量持續擴充套件的方法(要麼適應性採用磁碟技術,要麼發明全新的方法)的原因。

2015年,我們和富士膠片株式會社的合作伙伴一起展示了透過使用垂直於帶的超小鋇鐵氧體顆粒,可以使磁帶的資料記錄密度達到目前的商用技術可實現的密度的12倍以上。最近,我們與索尼儲存介質解決方案公司合作展示了以大約20倍於目前最先進磁帶的面密度來記錄資料是可能的。如果能將這項技術商業化,那麼現在可能需要一打盒式磁帶來存檔其所有數字材料的一部大製作電視節目,將來只用一盒磁帶就能存得下來。

照片來源:David Parker/Science Source; 版權所有: IBM。

資料洪流現代磁帶庫可容納數百PB,而1952年推出的IBM 726圖)僅能儲存幾兆位元組

我們技術上取得了很多進步,才實現了這樣規模的儲存容量。首先,我們提高了讀寫磁頭沿著磁帶上細長磁軌移動的能力在我們最新的演示中,磁軌寬度只有100奈米左右。

我們還不得不減小資料讀取器——用於讀取記錄資料的磁軌的磁阻感測器——的寬度,使從其當前的微米尺寸縮小小於50奈米的程度。結果,我們用這麼小的讀取獲取到的訊號非常嘈雜。我們透過提高介質本身的信噪比(它是磁性顆粒的尺寸和方向以及它們的成分、磁帶錶面的平滑度和光滑度的函式來補償。為了進一步解決這個問題,我們改進了裝置所採用的訊號處理和糾錯方案。

為了確保我們的新原型介質能夠資料儲存數十年,我們改變了記錄層中磁性顆粒的性質使其更加穩定。但是改變使得記錄資料變得更加困難,以至於普通的磁帶感測器無法可靠地將資料寫入新介質為此,我們使用了一種產生比傳統磁頭強得多的磁場的特殊磁頭

結合使用這些技術,我們能夠在我們的實驗室系統中以每英寸818,000位元的線性密度讀資料(由於歷史原因,世界各地的磁帶工程師以英寸為單位衡量資料密度)。結合使用新技術可以處理的每英寸246,200磁軌,我們的原型裝置達到了每平方英寸201千兆位元的面密度。假設一個磁帶盒可以容納1,140磁帶(鑒於我們所使用的新磁帶介質厚度小於以前的,這是一個合理的假設這一面密度對應於高達330 TB單盒磁帶容量。這意味著一盒磁帶可以記錄的資料與裝滿一輛手推車的硬碟所能容納的一樣多

在2015年,資訊儲存產業聯盟(一個由惠普、IBM、甲骨文、昆騰及若干學術研究團體共同成立的組織)釋出了國際磁帶儲存路線圖》(International Magnetic Tape Storage文中預測說,2025年,磁帶儲存的面密度將達到每平方英寸91 Gb。根據這一趨勢推斷,到2028年,磁帶儲存的面密度將超過每平方英寸200 Gb

該路線圖的作者都對磁帶儲存的未來感興趣。你不必擔心他們過於樂觀。我和我的同事最近進行的實驗室實驗表明,每平方英寸200 Gb的面密度完全有可能實現。因此,在我看來,在未來至少十年內,磁帶完全有把握保持過去的容量增速。

實際上,磁帶可能屬於最後一批仍然遵循摩爾定律的資訊科技——至少在未來十年內,它仍能遵循這一定律而這反過來只會增加磁帶相對於硬碟和其他儲存技術的成本優勢。因此,即使你可能很少在黑白電影之外看到它,磁帶在未來數年裡依然會發揮重要作用

  • 本文刊登在20189印刷版IEEE SPECTRUM上,標題為Tape Storage Mounts a Comeback
  • 本文轉自“IEEE電氣電子工程師學會”
  • 本文作者Mark Lantz是IBM蘇黎世研究實驗室先進磁帶技術經理。

參考文獻

John GantzDavid Reinsel. The Digital Unviserse in 2020: Big Data, Bigger Digital Shadows, and Biggest Growth in the Far East – United States. Februry 2013. Available at 

https://www.emc.com/collateral/analyst-reports/idc-digital-universe-united-states.pdf 

贊(0)

分享創造快樂