Gegevensintegratie is het proces waarbij gegevens uit verschillende bronnen worden gecombineerd tot één uniforme weergave. Het is zowel een technisch als een bedrijfsproces en wordt gebruikt om gegevens efficiënt te beheren en beschikbaar te maken voor degenen die ze nodig hebben. Met een data-integratieoplossing kunnen datasilo’s worden geëlimineerd en kunnen data worden samengebracht die anders ongebruikt zouden blijven en de inzichten verloren zouden gaan. Door de integratie van data kunnen analytische tools praktische business intelligence-inzichten opleveren. Het maakt deel uit van het gegevensbeheerproces en wordt steeds vaker gebruikt naarmate de behoefte aan big data-integratie en het delen van gegevens toeneemt.
Data-integratie technieken
Een gegevensintegratiesysteem omvat een netwerk van gegevensbronnen, een masterserver en clients die toegang hebben tot gegevens van de masterserver. Een goede oplossing voor gegevensintegratie levert tijdig gegevens uit vertrouwde bronnen ter ondersteuning van analytische bedrijfsprocessen. De aangeleverde informatie is opgeschoond en omgezet in waardevolle informatie. Gegevensintegratie kan worden gedaan door middel van verschillende technieken:
- Extract, Transform, Load (ETL): Gegevens worden uit de bron gehaald, getransformeerd en in een datawarehouse geladen.
- Gegevensregistratie wijzigen: Gegevensveranderingen binnen een database worden in realtime geïdentificeerd en toegepast op een datawarehouse.
- Gegevensreplicatie: Gegevens in de ene database worden gerepliceerd naar een andere om de informatie gesynchroniseerd te houden.
- Integratie van streaminggegevens: Verschillende gegevensstromen worden continu geïntegreerd en ingevoerd in analysesystemen en gegevensopslag.
Voordelen en oplossingen voor data-integratie
Dit proces is handig voor twee bedrijven die systemen samenvoegen of voor het consolideren van applicaties binnen één bedrijf om een uniek beeld te krijgen van de gegevensactiva van het bedrijf. Het kan worden gebruikt om een datawarehouse te bouwen voor het uitvoeren van analyses op basis van de gegevens in het magazijn.
Gegevensintegratie vermindert fouten, aangezien het handmatig invoeren en bijwerken van gegevens niet langer nodig is. Hoewel het gebruik van een data-integratieoplossing vooraf tijd kost, is de tijd die wordt bespaard bij het voorbereiden en analyseren van gegevens de investering waard. Ook heeft iedereen veilig toegang tot deze gegevens via selfservice voor individuele of gedeelde projecten.
Populaire oplossingen voor data-integratie zijn onder meer:
- TIBCO Cloud-integratie
- Matillion
- SSIS van Microsoft
- Oracle GoldenGate
- Astera Centerprise