Redactie - 24 februari 2016

Mijn data in puin: Opslag systemen staan vaak vol (onnodige) data

Waarschijnlijk kent u het TV programma “Mijn leven in puin”? Het programma gaat over mensen die zoveel spullen bewaren dat ze zowat “verdrinken” in hun spullen en niet meer weten wat te bewaren of weg kan.

Een vergelijk met bovenstaande is wat betreft de opslag van data bij veel organisaties te trekken. Als gevolg van de verregaande digitalisering en de sociale media slaan we steeds meer data op. Uit onderzoeken van Gartner blijkt dat de meeste datagroei, 60% of meer, ongestructureerde data is. Deze data is niet van belang voor de organisatie maar brengt wel extra kosten met zich mee.

Samen met belangrijke- en ongestructureerde-data blijven we steeds meer opslaan. Omdat we niet weten wat al onze users opslaan groeit de dataopslag in onze filers gestaag. Met als resultaat dat we het overzicht volledig kwijt raken. Zeker in het geval wanneer we veel users hebben.

Om aan de opslagcapaciteit te voldoen gaan we ruimte maken en kopen we een grotere filer en/of we gaan archiveren. De “Cloud” is een andere mogelijkheid, want zoals de aanbieders van Cloud oplossingen beweren is het goedkoop en veilig. Maar cloud is niet zo goedkoop als men doet geloven zeker als je bedenkt dat gebruikers van clouddiensten een kopie van hun eigen data in bezit moeten hebben. Het archiveren en opslaan in de “Cloud” van ongestructureerde data kan je zo ongeveer vergelijken met de vliering van veel huizen, er staan veel spullen opgeslagen waar je niet meer naar omkijkt. Maar die opslag brengt wel veel kosten met zich mee!

De totale kosten van data per TB van filers (NetApp, EMC, Ision, etc.) komen tussen de 3000 en 5000 Euro per jaar. Daarnaast neemt het operationele risico verder toe. Back-up en restore duren gewoon langer dan nodig. Bij high availability oplossingen is het zelfs nog erger in geval van data mirroring, we hebben dan dubbele (ongestructureerde)data opslag.

Alleen extra storage toevoegen in welke vorm dan ook om aan groeiende vraag naar opslag te blijven voldoen is niet altijd de beste oplossing blijkt uit bovenstaande.

Een betere oplossing is de data te classificeren, op te schonen en pas daarna op te slaan voor later gebruik. Belangrijk is dat je dus de mogelijkheid hebt om duidelijke overzichten te krijgen van welke data er op de diverse plekken ligt opgeslagen en of deze data nog relevant is.

Verder is het zaak dat uw gebruikers hun “eigen straatje” schoonhouden met andere woorden, zorg dat ze niet te veel data opslaan, u legt ze een diskquota op en waarschuwt wanneer ze tegen hun opslaglimiet aan lopen. Uw users kunnen dan tijdig maatregelen nemen om zelf overtollige data op te ruimen. Met het quotabeheer zijn we dus proactief bezig de datagroei te beperken.

Als laatste is doorbelasting van de gebruikte storage aan de diverse afdelingen/users een goede manier om de datagroei aan banden te leggen met als voordeel dat de IT afdeling door middel van doorbelasting meer budget kan krijgen om hun infrastructuur zo goed mogelijk te laten functioneren.

Meer inzicht en controle is een absolute noodzaak voor organisaties om de tsunami van data die op ze afkomt het hoofd te bieden.

Omdat data blijft veranderen en zal groeien op uw IT systemen bent u er met een eenmalige schoonmaak actie niet klaar. Het is een continu proces.

Het proactief managen van userdata is gewoon harde noodzaak om ervoor te zorgen dat uw data in goede conditie blijft en de kosten voor opslag niet uit de hand lopen. Dataopslag is niet alleen een kostbare zaak maar de data zelf is een kostbare asset en van levensbelang van uw organisatie.

Jaap Nebbeling werkt bij Northern.net en is gespecialiseerd User Data Management