Jarkko Virtanen

Varmuuskopiointi nauhoille

Johdanto

Nauhat ovat toimineen jo vuosia varmistuksen perustana nopean kirjoittamisen ja halvan hinnan takia suhteessa datamäärään. Nauhojen käytössä on kuitenkin muutamia ongelmia, joihin pyritään vaikuttamaan erilaisilla varmistustekniikoilla ja säilytystekniikoilla. Pyrin valottamaan tekniikoita ja niiden hyötyjä ja haittoja.

Nauhavarmistuksen ongelmia

Ensimmäinen suurista ongelmia on nauhojen kestävyys. Nauhat kuluvat ja venyvät helposti, jolloin niillä olevan datan palauttamisesta tulee vaikeaa tai jopa mahdotonta. Nauha voi tuhoutua jo kirjoituksen yhteydessä tai huolimattoman käsittelyn seurauksena.

Toisena suurena ongelmana voidaan pitää säilytystä. Säilytyksessä pitää pyrkiä ottamaan huomioon nauhoille sopivat olosuhteet nauhojen säilymisen takia. Säilytys ei ole halpaa, joten parasta olisi, jos säilytystarve pystytään minimoimaan mahdollisimman tehokkaasti.

Kolmantena ongelmana on nauhoilta lukeminen. Data kirjoitetaan nauhoille samalla tavalla, mitä se on jo esimerkiksi kiintolevyillä. Data saattaa olla voimakkaasti pirstaloitunutta, jolloin palautettavan datan osia voi olla sekaisin nauhan alussa, keskellä ja lopussa. Lukiessa esimerkiksi 600 tb nauhaa edestakaisin, aikaa menee varmasti ja nauha kuluu.

Varmistus

Varmistukset tehdään yleensä tasaisin väliajoin, kuten joka yö. Olemassa on myös tekniikoita, jotka aloittavat varmistuksen havaitessaan datan muuttuneen tarpeeksi edellisestä varmistuskerrasta. Nauhoille varmistuksessa on pääsääntöisesti käytössä kolme erilaista tekniikkaa. Perustekniikkana on täysivarmistus, missä varmuuskopioitava data kopioidaan täydellisesti nauhalle. Muutkin tekniikat vaativat täydenvarmistuksen tasaisin väliajoin, jotta voidaan palauttaa jotain konkreettista. Muista tekniikoista yleisimmin käytössä on inkrementaalinen varmistus, missä varmistetaan uudet tiedostot nauhalle. Kolmantena on differentiaalinen varmistus, mikä toimii inkrementaalisen tavoin, mutta varmistaa myös muuttuneet tiedostot nauhalle. [1.]

Täysivarmistus

Täydessä varmistuksessa kaikki varmistettava varmistetaan kerralla nauhalle, eikä tarvitse miettiä mitään muuta. Etuina täydessä varmistuksessa on tietenkin vaadittavan varmistustekniikan yksinkertaisuus. Voidaan laittaa säännöllisin väliajoin nauha koneeseen ja ottaa pois ja viedä varastoon. Palauttaessa vain haetaan nauha ja voidaan helposti palauttaa kaikki nauhalle tallennettu tieto. Ei tarvita insinööriä hoitamaan varmistusta tai palautusta. Yleensä pitkällä tähtäimellä varmistettavaan dataan nähden tulee hyvin vähän muutoksia, mistä seuraa saman datan turha varmentaminen moneen otteeseen. [3.] Tarvitaan paljon kalliita nauhoja ja niille tarvitaan säilytys tilaa. Nauhojen tarve riippuu tietenkin valitusta varmistustiheydestä ja säilytyskestosta.

Tekniikkana toimii hyvin paikoissa, missä tarvitaan jatkuvaa varmistusta, vaikka syntyvän datan määrä on pieni. Täysivarmistus toimii pohjana kaikille muillekin varmistustavoille, koska aina varmistaessa tarvitaan täydellinen kopio, mihin sitten voidaan sisällyttää muutokset. Täydellisesti varmistetun nauhan tuhoutuminen on aina kohtalokasta, koska silloin ei nauhalta voida enää palauttaa tietoja. [2.]

Inkrementaalinen

Käytetyin nauhavarmistuksen tapa, missä luodaan ensin täysvarmistus. Täyden varmistuksen jälkeen jatketaan varmistusta, varmistamalla vain muuttuneet tiedostot. Teoreettisesti optimaalisessa tilanteessa, missä nauhat kestäisivät ja palautuksen tarve olisi epätodennäköistä, voitaisiin inkrementaalisella minimoida nauhojen tarve. Varmistamiseen riittäisi vain edellisen varmistuskerran jälkeen tulleiden muutosten tallentaminen. Todellisuudessa tapa on ongelmallinen palautettaessa tietoja nauhoilta, koska palauttaessa tarvitsee lukea kaikkien edellisten osanauhojen tiedot ensin sisään. Tietojen luvun jälkeen voidaan vasta päätellä uusin palautettava tieto. Jonkun nauhan vioittuessa tullaan todennäköisesti menettämään haluttuja tietoja, koska ei voida enää mennä sitä pidemmälle, vaikka varmistusnauhoja vielä olisikin. Sopiva varmistustapa täysvarmistuskertojen väliseen aikaan, milloin kaivataan lyhytaikaista varmistusta. Pidempiaikainen säilömistarve voidaan toteuttaa vain täysvarmistetuilla nauhoille. [3.]

Differentiaalinen varmistus

Differentiaalinen varmistus toimii inkrementaalisen tavoin, mutta siinä tallennetaan aina kaikki muutokset edellisestä täysvarmistuksesta lähtien. Nyt suurin pullonkaula on täysvarmistusnauha, koska sen rikkoutumisen jälkeen ei pystytä palauttamaan yhtään sen perään tehtyä differentiaalista nauhaa. Osittaisvarmistuksia voidaan kuitenkin tehdä inkrementaalista enemmän palauttaessa pienemmän nauhojen sisään lukemisen takia. Todennäköisyys menettää varmistettuja tietoja yhden nauhan rikkoutuessa myös pienenee, koska ollaan riippuvaisia vain kahdesta eri nauhasta. Differentiaalinen nauhavarmistus tarvitsee inkrementaalista enemmän nauhoja ja siten säilytystilaa, mutta sitä voidaan käyttää pidempiaikaiseen säilytykseen. [3.]

Nauhojen kierto

Nauhojen kiertoon käytetään yleisimmin kahta erilaista tekniikkaa. Yleisimmät ovat ”Grandfather-father-son” ja “Hanoin torni”.

Grandfather-father-son

Nauhojen kiertoon yleisimmin käytetty kierto systeemi on ”lapselta isälle ja isältä isoisälle” kierto. Kierrossa päivittäin otetaan lapsivarmuuskopio päivän muutoksista nauhalle. Yleisimmin kerran viikossa siirretään täysivarmistus pysyvämpään yleensä kuukaudenajan ylläpidettävään säilytykseen isänauhaksi. Viimeisenä vaiheena on siirtää kuukausisäilytyksestä nauha noin kerran kuukaudessa pysyväissäilytykseen. [4.]

Hanoin torni

Hanoin tornissa käytetään 3:sta ylöspäin olevia nauhasettejä tietojen varmistamiseen. Tekniikassa varmistetaan jokaisena päivänä. Varmistus hoidetaan Hanoin torni pelistä tutulla tavalla. Riippumatta nauhojen määrästä ensimmäisen kahden nauhan varmistus hoidetaan aina samalla tavalla. Ensimmäiselle nauhalle A tallennetaan joka toinen päivä. Toiselle nauhalle B tallennetaan joka toisella A välipäivänä. Kolmannesta nauhasta lähtien tekniikka muuttuu hiukan riippuen nauhojen määrästä. Kolmen nauhan setissä täydennetään vain puuttuvat päivät nauhalla C. Useampaan nauhaan mentäessä C väliä kasvatetaan mahdollistaen D nauhan ja taas viidenteen nauhaan mentäessä jätetään D väliin aukko nauhalle E. [4.]

Nauhoille tallennustapoja

Nauhoille tallennetaan dataa kolmella eri tekniikalla ja valmistajakohtaisesti niiden yhdistelmillä. Tavat ovat linear, linear serpentine ja helical.

Linear

Lineaarinen on tavoista yksinkertaisin. Siinä lukupää kirjoittaa nauhalle nauhan suuntaisesti alusta loppuun saakka. Tekniikan tallennustiheys on käytettävistä huonoin, mutta samalla se on nopea ja vähiten virhealtis nauhan tai luku/kirjoituspään sijaintivirheille. [5.]

Linear serpentine

Tekniikka toimii lineaarisen tavoin nauhan loppuun saakka. Nauhan lopussa lukupäät liikkuvat hieman ja lähtevät kirjoittamaan toiseen suuntaan. Näin saavutetaan tuplasti suurempi tallennustiheys verrattuna lineaariseen. Riskinä on mahdollinen nauhan liukuminen ja siten tietojen päällekkäin kirjoitus. Toinen ongelma voi aiheutua vaihdettaessa toiseen asemaan palauttaessa, jolloin lukupäiden sijainnit eivät välttämättä ole identtiset ja palautuksesta tulee vaikeaa tai mahdotonta. [5.]

Helical

Tapa eroaa kahdesta edellisestä kirjoittamalla viistosti rivi kerrallaan. Näin toimien pystytään saavuttamaan edellisiä nopeampia kirjoitus ja lukunopeuksia. Ongelmiksi tulee luku ja kirjoituspään tarkka sijainti nauhan suhteen, jolloin kaiken voi sotkea esim. nauhan venyminen. [7.]

Yhteenveto

Yksinkertaisen tekniikan valinta sekä nauhajärjestelmässä, että valitussa säilytystekniikassa tekee varmistuksesta yksinkertaista ja siten helppoa. Yksinkertainen tekniikka on kuitenkin hidasta ja vaatii paljon säilytystilaa. Isossa yrityksessä oikea tapa on huolehtia riittävästä varmistusmäärästä, jolloin voidaan käyttää nopeita ja vähän riskialtiimpia tekniikoita ja taas pienessä yksinkertaisempi riittää todennäköisesti hyvin.

Lähteet

[1] Näin varmistat oikein. [viitattu 3.11.2011]

Saatavissa: http://www.tietokone.fi/lehti/tietokone_4_1996/varmistus_ja_arkistointivalineet_varmista_oikein_7086.

[2] lisäyskopiointi; lisäysvarmistus. [viitattu 5.11.2011]

Saatavissa: http://www.tsk.fi/tsk/termitalkoot/hakemistot-267.html?page=get_id&id=ID216&vocabulary_code=TSKTT

[3] Kemppainen Ossi. Backup – Varmuuskopiointi. [viitattu 5.11.2011]

Saatavissa: http://www2.it.lut.fi/kurssit/06-07/Ti5316800/Linux-tyot/Backup-Varmuuskopiointi_Ossi_Kemppainen_Linux-tyo.pdf

[4] Wikipedia. Backup rotation scheme. [viitattu 30.11.2011]

Saatavissa: http://en.wikipedia.org/wiki/Backup_rotation_scheme

[5] Wikipedia. Magnetic tape data storage. [viitattu 30.11.2011]

Saatavissa: http://en.wikipedia.org/wiki/Magnetic_tape_data_storage

[6] Wikipedia. Tape Drive. [viitattu 30.11.2011]

Saatavissa: http://en.wikipedia.org/wiki/Tape_drive

[7] Wikipedia. Helical scan. [viitattu 30.11.2011]

Saatavissa: http://en.wikipedia.org/wiki/Helical_scan

SivuTiedotLaajennettu edit

Vaativuus Jatko
Valmius Valmis
Tyyppi Ydin
Luokitus Atk
Mitä Eheys
Miltä Muu
Missä Laite
Kuka Titu-ammattilainen
Milloin Ennakolta
Miksi Hyvä tapa
Print version |  PDF  | History: r5 < r4 < r3 < r2 | 
Topic revision: r5 - 01 Dec 2011 - 19:56:15 - JarkkoVirtanen?
 

TUTWiki

Copyright © by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding TUTWiki? Send feedback