Redactie - 09 mei 2012

Storage: never a dull moment


Dat de hoeveelheid data die we met elkaar creëren, elk jaar weer groter is, weet iedereen intussen wel. Of de groei van data ooit eens zal gaan afvlakken lijkt onwaarschijnlijk. Niet alleen de hoeveelheid data neemt toe, ook de data die we actief en ‘realtime’ willen gebruiken, groeit.  We willen steeds grotere files creëren, verzenden, doorzoeken, verwerken etcetera. Dat vraagt niet alleen grotere, maar vooral snellere opslagmogelijkheden. De zogeheten I/O-capaciteit van storage, de snelheid waarmee data kan worden opgeslagen én gelezen, moet aanzienlijk omhoog als we willen voldoen aan de eisen van de markt.

Nog steeds wordt het merendeel van al onze gegevens wereldwijd opgeslagen op een magnetische drager, zoals tape en disks. En magnetisme kent zijn grenzen wat betreft dynamiek. Onze schijfjes worden nog wel groter, maar weinig sneller. Dus er zijn andere technieken nodig. Hier komt de elektronica ons te hulp. Met de zogeheten solid state geheugens, elektronische componenten die gegevens kunnen opslaan, kunnen we razendsnel schrijven en lezen. We noemen dit soort geheugen ook wel ‘Flash-drives’. Sinds de ontwikkeling van deze Flash-geheugens zijn deze geheugens steeds groter en sneller geworden. EMC bouwde als eerste in 2008 zogeheten Enterprise Flash Disks (EFD) in zijn opslagsystemen.  Hoewel Flash disks nog steeds aanzienlijk duurder zijn dan ‘ouderwetse’ draaiende magnetische disks, worden deze EFD’s toch steeds meer geleverd.  De reden: de groeiende behoefte aan zeer hoge I/O performance van applicaties.

Data dichtbij de server

Intussen proberen we ook met ander oplossingen de I/O performance voor de applicatie te verhogen. Een mogelijkheid is de storage ‘dichterbij’ de applicatie te brengen. De afgelopen 10 jaren hebben we uit efficiencyoverwegingen data steeds meer centraal opgeslagen. Ook beheer, veiligheid en het delen van data kan op die manier veel beter worden uitgevoerd. Echter, de data kwam wel verder van de server en de applicatie te staan. Via grote storage-netwerken werd de data van en naar de server gebracht. En juist daar zit op dit moment een potentieel voordeel. Als we in staat zijn de data – die een applicatie op een gegeven moment nodig heeft – alvast dichtbij de server op te slaan, dan kunnen we de vertraging van het netwerk opheffen. En als we dan ook nog snelle EFD’s gebruiken kan de I/O performance een stuk verbeteren. Dat is precies wat we op dit moment zien gebeuren.

Snelle storage
Eigenlijk weer een stukje terug in de tijd naar Direct Attached Storage (DAS), elke server zijn eigen opslag. Maar nu wel op een intelligentere manier. We brengen via het netwerk alleen díe gegevens naar de server die op dat moment nodig zijn. Verder blijft de data efficiënt centraal bewaard en beheerd. We zien diverse start-ups die zich op deze markt voor snelle storage hebben gestort. En met redelijk succes want iemand die echt snelle performance nodig heeft, kan op deze – weliswaar duurdere – wijze toch die snelheid halen. En die snelheid kan op vele manieren benut worden. Om bijvoorbeeld grotere files toch binnen redelijke tijd te verwerken. Maar ook om een oude applicatie sneller te maken in plaats van deze te herschrijven.

Een andere ontwikkeling zou kunnen zijn om de applicatie ‘midden’ in de storage te plaatsen. Nu storage-platforms allemaal gevirtualiseerd zijn en op gewone X86- standaardarchitecturen draaien, kan een gevirtualiseerde applicatie natuurlijk ook ‘in’ de storage pool draaien.  Dichter bij de data kun je niet zijn, bijna ondergedompeld in de opslag je data verwerken. We werken bij EMC met beide oplossingen. Echter essentieel is dat we met deze mooie oplossingen niet het kind met het badwater weggooien. We zijn juist ooit van aparte storage afgestapt, omdat verspreide en niet beheerde data duur, inefficiënt en onbeheersbaar was. Dus de data op die Flash drives, dichtbij de applicatie, moet onder beheer blijven van de centrale opslagsysteem. En gelukkig kan dat prima.

Beweging

Tegenwoordig is veel storage management geautomatiseerd.  Met technieken als Fully Automated Storage Tiering (FAST) kunnen we alle data prima managen wat betreft het op dát moment beste opslagmedium. Dat kan in de centrale storage, óf het verder weggeplaatste archief, óf ‘ergens’ bij een cloud-leverancier. Maar natuurlijk óók op een Flash disk dicht bij een applicatie. We brengen op die manier de gewenste data op de meest efficiënte en effectieve plaats. Het is duidelijk: de storage-branche is volop in beweging. Het is mooi te mogen werken in het centrum van deze dynamische informatiewereld.

Hans Timmerman, CTO bij EMC Nederland