De logistiek van industriële bedrijven wordt al decennia lang geoptimaliseerd. Het welslagen van dit proces kan bepalend zijn voor de toekomst van de hele onderneming. Datamanagement is niets anders, behalve dan dat het gaat om het beheren van bedrijfsinformatie.
Bijna alle bedrijven (98,5 %) zijn bezig met digitalisering, zo blijkt uit de IDG-studie “Enterprise Storage 2021”. IT-infrastructuur/architectuur/colocatie (46 %) en cloud (42 %) werden door de deelnemers als de belangrijkste onderwerpen genoemd, op de voet gevolgd door cyberbeveiliging (36 %) en data-analyse/big data (34 %). Daarna volgen Artificial Intelligence/Machine Learning, Internet of Things en Storage Strategies and Solutions, elk met meer dan 20 %.
Op basis van deze prioritering kunnen de toekomstige vereisten voor data en dus voor databeheer worden afgeleid.
1. Datamobiliteit
In de eerste twee onderwerpen, Infrastructuur en Cloud, wordt gesteld dat in de toekomst zowel hybride cloud-infrastructuren als traditionele IT-stacks binnen de sector zullen worden geëxploiteerd. Wegens diverse vereisten zal deze hybride vorm nog enige tijd bij ons zijn. Het gevolg hiervan is dat de gegevens de processen moeten volgen die ze verwerken. Een toepassing die vandaag in het lokale datacenter wordt geëxploiteerd, kan morgen al in de cloud staan of vice versa. Gegevensbeheer moet daarom functies bieden waarmee gegevens naar behoefte kunnen worden verplaatst, gerepliceerd of gesynchroniseerd.
De behoefte aan gegevensmobiliteit vloeit ook voort uit de trend naar edge computing. De informatie is verspreid over vele locaties en moet op dezelfde manier worden beheerd als op alle andere opslagplatforms. Er zijn zelfs mogelijkheden om data-intensieve workloads direct op de opslagsystemen te draaien, bijvoorbeeld als containers – wat een compleet nieuwe kans voor opslagklassen betekent.
Een neveneffect van datamobiliteit is het voorkomen van migratieprojecten die tegenwoordig gebruikelijk zijn. In het beste geval kunnen gegevens zonder onderbreking over de grenzen van leveranciers worden verplaatst.
2. Automatisering/Autonomie
Het bedrijfsmodel van de cloud behelst in wezen de automatisering van IT-processen. Hier moet het gegevensbeheer naadloos op aansluiten. Op basis van beschrijvende informatie (gegevenslabels) moet de bevoorrading automatisch plaatsvinden. Aanvullende functies zoals capaciteitsrapportage en -voorspelling, voorspellend onderhoud en systeemoptimalisatie zijn de weg naar autonoom gegevensbeheer.
3. Gegevensetikettering
Als eerste vereiste voor automatisering is beschrijvende informatie voor gegevens en gegevensgroepen nodig. Idealiter zou dit kunnen gebeuren via een besluitvormingssysteem (AI en/of op regels gebaseerd). Zolang dit niet het geval is, gebeurt dit via de betreffende applicatie (bijvoorbeeld manifestbestanden in het geval van containers) of via de applicatiebeheerder.
4. Hoge beschikbaarheid
Uit bovengenoemd onderzoek blijkt duidelijk dat honderd procent beschikbaarheid van opslag de nummer één eis is. Dit vereist niet alleen een hoge beschikbaarheid op één locatie, maar ook replicatiemechanismen naar andere locaties. Metroafstanden van tien tot 30 kilometer, die tegenwoordig in Duitsland gebruikelijk zijn, moeten worden heroverwogen met het oog op het verhoogde risico op rampen. Hier moet ten minste een derde locatie, grotere afstanden of spiegeling naar de cloud worden overwogen.
5. Gegevensbeveiliging en gegevensbescherming
Op de derde plaats, direct na infrastructuur en cloud, staat het onderwerp gegevensbeveiliging. Ondanks alle beschermende maatregelen in het datacentrum en in de cloud, moet worden aangenomen dat kwaadaardige routines zullen doordringen tot de opslag. Hier moeten mechanismen worden geïntegreerd die zowel de toegang tot gegevens beperken als reageren wanneer dit laatste bastion is overwonnen. Continue gegevensbescherming op opslagniveau kan hier de oplossing zijn. Voorwaarde is natuurlijk dat dit niet ten koste gaat van de prestaties en zorgt voor een zo kort mogelijke RPO en RTO.
Bedrijven gaan er tegenwoordig toe over gegenereerde gegevens niet langer te verwijderen. De waarde van deze informatie kan niet worden bepaald op het moment van de creatie. Informatie die vandaag nutteloos is, kan morgen de basis zijn voor een voordeel op de markt. Operationele en wettelijke kadervoorwaarden kunnen het tegenovergestelde vereisen en bewaar- en schrappingstermijnen bepalen. Deze worden op precies dezelfde wijze geregistreerd als de beveiligingsklassen bij het labelen van de gegevens. Overeenkomstige opslagklassen zorgen voor opslag en archivering of vernietiging volgens de wettelijke voorschriften.
6. Multiprotocol
Big Data, maar ook AI en IoT, vereisen verschillende toegangsmechanismen. Een ideaal gegevensbeheersysteem zou gegevens moeten opslaan voor deze gebruikssituaties, ongeacht het toegangsprotocol. Dit voorkomt onnodige replica’s, bespaart bandbreedte en voorkomt fouten die worden veroorzaakt door verouderde gegevensrecords. Naast de gebruikelijke protocollen zoals NFS en SMB zijn hier ook HDFS en S3 vereist. Een client voor high-performance computing maakt ook voor deze use-case tijdkritische toegang mogelijk.
7. Massa-gegevens
De toekomstige datavolumes in een bedrijf zijn op dit moment nauwelijks te voorzien. Nu bedrijven zich steeds meer op digitalisering richten, ontstaan er voortdurend nieuwe eisen die op korte termijn schaalopties in het petabyte-bereik vereisen. Speciale IoT-oplossingen waarvoor ook video- en geluidsopnamen nodig zijn, moeten hier slechts als voorbeeld worden genoemd.
Een andere eis is dat grote hoeveelheden gegevens toegankelijk moeten worden gehouden voor AI en Big Data. Offline media houden het gevaar in dat de informatie die erop is opgeslagen niet tijdig te gelde kan worden gemaakt.
8. Prestaties
Opslagprestaties worden in bedrijven altijd pas besproken als ze ondraaglijk zijn voor de gebruikers, afhankelijk van hun belastbaarheid. Juist snel reagerende bedrijfstoepassingen kunnen de aanvaarding door de klant positief beïnvloeden en de efficiëntie in het bedrijf aanzienlijk verhogen. Evenzo kunnen batchprocessen worden versneld of zelfs worden overgezet naar real-time systemen. Quality of Service moet daarom worden ondersteund bij gegevensbeheer.
9. Toegang tot opslag
Voor grotere gegevensvolumes zijn grotere bandbreedtes nodig. Bovendien wordt uit een oogpunt van prestaties een lagere latency verwacht. Vandaag wordt dit gerealiseerd via verschillende opslagnetwerken. Dit verhoogt de complexiteit van de provisioning en vereist extra gegevenskopieën. Het is niet voor niets dat all-IP oplossingen een actuele trend zijn in de opslagomgeving. Met Remote Direct Memory Access (RDMA) worden latenties teruggebracht tot het microsecondenbereik, en zijn overeenkomstige bandbreedtes naar behoefte beschikbaar via 25/100/400 Gb Ethernet.
10. Milieubescherming
Meer en meer bedrijven verankeren ambitieuze CO2-doelstellingen in hun strategie. De datacentra en dus ook het gegevensbeheer moeten hun bijdrage leveren. Bij steeds meer projecten wordt hiermee rekening gehouden. Voor gegevensbeheer betekent dit dat naast de kosten ook de CO2-voetafdruk moet worden vermeld. Vooral de overgang van mechanische harde schijven naar elektronische flashgeheugens biedt een groot besparingspotentieel.
De eisen voor een toekomstgericht gegevensbeheer zijn zeer divers en zijn gericht op de bedrijfs- en IT-strategie. Misschien wel het belangrijkste bezit van een bedrijf geniet tegenwoordig niet voor niets onze volledige aandacht.
Huawei biedt hier een end-to-end oplossing. De OceanStor Dorado, OceanStor Pacific en OceanProtect systemen vormen de fysieke basis. De gegevensbeheermachine (DME) is het brein dat de gegevensstromen orkestreert. Via AI-ondersteunde end-to-end processen wordt aan alle bovengenoemde eisen voldaan.
Het pad naar autonoom gegevensbeheer is dus geopend!
*De auteur: Op basis van een brede kennis van IT-infrastructuren, cloudoplossingen tot applicatiesystemen en uitgebreide ervaring met enterprise-klanten uit diverse branches, is Peter Kruth verantwoordelijk voor het ontwerp en de architectuur van efficiënte klantspecifieke datacenteroplossingen. De nadruk ligt op flexibele cloud- en AI-gebaseerde technologieën. In zijn vrije tijd houdt hij zich onder meer bezig met de ontwikkeling van Progressive Web Apps (PWA) in de IoT-omgeving.