Palvelinten varmistusjärjestelmät
Määttä, Tuomas (2015)
Määttä, Tuomas
2015
Tietotekniikan koulutusohjelma
Tieto- ja sähkötekniikan tiedekunta - Faculty of Computing and Electrical Engineering
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2015-01-14
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tty-201412191628
https://urn.fi/URN:NBN:fi:tty-201412191628
Tiivistelmä
Diplomityön tavoitteena oli kuvata yleisellä tasolla niitä seikkoja, jotka vaikuttavat keskikokoisen yrityksen tarpeeseen päivittää oman konesalin palvelinten varmistusjärjestelmä, sekä mitä järjestelmän uusinnassa tulisi ottaa huomioon. Näiden yhteydessä työssä pureudutaan myös jonkin verran itse konesalitekniikkaan, varsinkin niiden teknologioiden osalta, jotka eivät kuulu tavallisen toimiston it-infrastruktuuriin.
Diplomityössä käsitellään ensisijaisesti varmistusjärjestelmän käyttöä omassa konesaliympäristössä. Kun it-infrastruktuuri ja varmistusjärjestelmä ovat kokonaan omassa ylläpidossa, on myös sen määrittelyihin helpompi vaikuttaa. Pilvipalvelun hyödyntäminen osana palautumissuunnitelmaa saattaa olla organisaatiolle kustannustehokas ratkaisu, mutta sen käyttö tulisi ehdottomasti testata huolellisesti.
Työssä on pyritty korostamaan myös varmistuksiin liittyvää hallinnollista puolta, sillä tarve datan varmistamiselle, eli datan saavutettavuuden turvaamiselle, tulisi olla määritetty organisaation tietoturvastrategiassa.
Päivittäisten varmistusten ottaminen deduplikoivalle levypohjaiselle järjestelmälle ja viikoittaisten ottaminen nauhoille osoittautui toimivaksi järjestelyksi suurimmalle osalle varmistustöistä. Tällöin tuotannon kannalta kriittisimmistä palvelimista on varmistukset hajautettu kahdelle eri medialle ja levypohjaiselta järjestelmältä yksittäisten tiedostojen palauttaminen on monissa tapauksissa nopeampaa kuin nauhakirjastosta. Tällöin myös mahdollinen deduplikointikannan korruptoituminen ei aiheuta kohtuuttoman suurta datan häviämisen riskiä.
Diplomityön lopussa selvitettiin myös uuden järjestelmän suorituskykyä ja sen resurssien riittävyyttä. Deduplikointikannan levytilan, varmistuspalvelimen prosessorin ja muistin kapasiteetti riittäisi vielä merkittävästi suuremman datamäärän käsittelyyn. Sen sijaan varmistettavan datan siirtämiseen käytetty verkkoyhteys vaikuttaisi olevan järjestelmän pullonkaula, eli varmistustöiden kesto näyttäisi riippuvan pitkälti verkkoyhteyden nopeudesta. The objective of this Master’s thesis is to describe broadly those factors that affect medium sized enterprises’ needs to update their backup systems in their data center and also some details one should take into account. On the other hand this theses delves a bit into technology used in the data centers, especially those that are not part of conventional office IT infrastructure.
This thesis focuses on backup systems that are used to backup data from a selfmaintained data center. It is easier to control backups when IT infrastructure and backup systems are not outsourced. Cloud based disaster recovery site as a part of disaster recovery plan may be very cost-effective but it must be tested extensively.
Administrative role of backups is also highlighted in this thesis. The need of taking backups, in other words, maintaining data availability, should be defined in the organization’s information security strategy.
Daily backups to deduplicated disk based storage and weekly backups to tape library turned out to be practical solution for most of the servers that need to be backed up. In this way servers that have the most critical data have backups distributed into two different type of media. In the unlikely event of corrupted deduplication database there is still data to be restored from an alternative source. In addition, restoring files from disk based backup storage is in many cases much faster than from a tape library.
Performance analysis and resource evaluation of the new backup system has been carried out at the end of this thesis. The size of the disk based storage for the deduplication database, processor performance and memory capacity was found to be sufficient for even larger amount of data to be processed. Instead, network connection seems to be the bottle neck for the backup system. This means that backup job durations depend highly on the bandwidth of the network connection.
Diplomityössä käsitellään ensisijaisesti varmistusjärjestelmän käyttöä omassa konesaliympäristössä. Kun it-infrastruktuuri ja varmistusjärjestelmä ovat kokonaan omassa ylläpidossa, on myös sen määrittelyihin helpompi vaikuttaa. Pilvipalvelun hyödyntäminen osana palautumissuunnitelmaa saattaa olla organisaatiolle kustannustehokas ratkaisu, mutta sen käyttö tulisi ehdottomasti testata huolellisesti.
Työssä on pyritty korostamaan myös varmistuksiin liittyvää hallinnollista puolta, sillä tarve datan varmistamiselle, eli datan saavutettavuuden turvaamiselle, tulisi olla määritetty organisaation tietoturvastrategiassa.
Päivittäisten varmistusten ottaminen deduplikoivalle levypohjaiselle järjestelmälle ja viikoittaisten ottaminen nauhoille osoittautui toimivaksi järjestelyksi suurimmalle osalle varmistustöistä. Tällöin tuotannon kannalta kriittisimmistä palvelimista on varmistukset hajautettu kahdelle eri medialle ja levypohjaiselta järjestelmältä yksittäisten tiedostojen palauttaminen on monissa tapauksissa nopeampaa kuin nauhakirjastosta. Tällöin myös mahdollinen deduplikointikannan korruptoituminen ei aiheuta kohtuuttoman suurta datan häviämisen riskiä.
Diplomityön lopussa selvitettiin myös uuden järjestelmän suorituskykyä ja sen resurssien riittävyyttä. Deduplikointikannan levytilan, varmistuspalvelimen prosessorin ja muistin kapasiteetti riittäisi vielä merkittävästi suuremman datamäärän käsittelyyn. Sen sijaan varmistettavan datan siirtämiseen käytetty verkkoyhteys vaikuttaisi olevan järjestelmän pullonkaula, eli varmistustöiden kesto näyttäisi riippuvan pitkälti verkkoyhteyden nopeudesta.
This thesis focuses on backup systems that are used to backup data from a selfmaintained data center. It is easier to control backups when IT infrastructure and backup systems are not outsourced. Cloud based disaster recovery site as a part of disaster recovery plan may be very cost-effective but it must be tested extensively.
Administrative role of backups is also highlighted in this thesis. The need of taking backups, in other words, maintaining data availability, should be defined in the organization’s information security strategy.
Daily backups to deduplicated disk based storage and weekly backups to tape library turned out to be practical solution for most of the servers that need to be backed up. In this way servers that have the most critical data have backups distributed into two different type of media. In the unlikely event of corrupted deduplication database there is still data to be restored from an alternative source. In addition, restoring files from disk based backup storage is in many cases much faster than from a tape library.
Performance analysis and resource evaluation of the new backup system has been carried out at the end of this thesis. The size of the disk based storage for the deduplication database, processor performance and memory capacity was found to be sufficient for even larger amount of data to be processed. Instead, network connection seems to be the bottle neck for the backup system. This means that backup job durations depend highly on the bandwidth of the network connection.