Virtualizzazione dei dati vs. data warehouse: 3 fatti chiave

Qual è la differenza tra la virtualizzazione dei dati e un data warehouse? In che modo entrambi i termini si riferiscono al data fabric? Scopri la differenza tra queste opzioni di architettura dei dati.

Perché mettere i dati al lavoro è una sfida per così tante aziende? Innanzitutto, le aziende dispongono di una mole di dati sempre maggiore. In genere, tutti questi dati risiedono in database o applicazioni a compartimenti stagni che non si connettono tra loro. I dati sono solitamente archiviati in diversi formati e alcuni di essi sono strutturati, mentre il resto è destrutturato. I dipendenti hanno accesso ad alcuni database, ma non ad altri. Il personale qualificato per gestire i database, necessario per gestire tutti questi dati, è limitato e costoso. Inoltre, i problemi di sicurezza e compliance normativa rendono complesso l’accesso ai dati e la loro governance.

Sono emersi diversi approcci tecnologici per aiutare le aziende a gestire questi e altri problemi di integrazione dei dati, tra cui data warehouse, data lake, data mesh, virtualizzazione dei dati e, più recentemente, data fabric. In questo articolo esamineremo due tecnologie opposte - il data warehouse e la virtualizzazione dei dati - e discuteremo quali sono le loro differenze significative per il modo in cui sarai in grado di gestire e sfruttare il valore dei dati.

[ Vuoi saperne di più su come risolvere i problemi sui tuoi dati a compartimenti stagni e accelerare l’innovazione? Richiedi l’eBook: The Data Fabric Advantage. ]

Cos’è la virtualizzazione dei dati?

Cosa significa virtualizzazione dei dati? Immagina i tuoi dati in tutti i diversi sistemi di origine dati in cui risiedono, in tutti i loro diversi formati. La virtualizzazione dei dati è un livello di architettura virtualizzata che si "appoggia" su queste fonti di dati e le collega. (Nota: questo concetto si distingue dalla "visualizzazione dei dati", che si riferisce a cose come grafici e diagrammi che aiutano a spiegare i dati).

Si può pensare a questo livello virtualizzato come a un livello di astrazione, il che significa che non è necessario tutto il lavoro di sviluppo che sarebbe tipicamente necessario per ottenere i dati (come call API, pipeline di dati, ecc.). Gli aggiornamenti in tempo reale garantiscono la correttezza dei dati sia nel sistema di origine che nel livello virtualizzato.

La virtualizzazione dei dati è un aspetto del data fabric, che è un livello di architettura e un set di strumenti per collegare set di dati eterogenei e creare una visione unificata. Grazie al livello di dati virtualizzati, non è necessario migrare i dati dal luogo in cui si trovano, ad esempio un database, un’applicazione ERP o CRM. I dati possono trovarsi sia on-premise che in un servizio cloud.

A volte i termini virtualizzazione dei dati e data fabric vengono usati in modo intercambiabile, ma il data fabric è un concetto un po’ più ampio (e più incentrato sull’utilizzo dei dati). I dati che si trovano nel livello virtualizzato devono essere messi in pratica in qualche modo e il data fabric fornisce gli strumenti per renderli possibili, in modo da poterli collegare, mettere in relazione ed estendere.

Un punto chiave da ricordare sull’approccio del data fabric o della virtualizzazione dei dati è il seguente: i dati non si spostano mai. Non ci sono tempi o costi di migrazione. Anche se i dati rimangono nella loro posizione di origine, puoi utilizzarli per l’analisi o per alimentare altre applicazioni. Si tratta di una differenza significativa rispetto all’approccio del data warehouse.

Che cos’è un data warehouse?

Mentre un data fabric collega i set di dati, un data warehouse si limita a raccoglierli. Un data warehouse è un archivio di dati strutturati. Con un data warehouse, estrai i dati dai sistemi di origine, li trasformi per ripulirli e duplicarli e li carichi nel data warehouse. Ciò significa un aumento dei costi operativi in termini di tempi di sviluppo, manutenzione, tempo, manutenzione e debito tecnico.

In realtà, per portare i dati dal punto A (o da molti punti A) al punto B del magazzino ci vuole molto tempo e impegno umano. L’approccio del data warehouse può anche causare problemi di integrità dei dati, in quanto si sposta l’insieme dei dati originali e si applica una complessa logica di trasformazione.

Infine, a differenza del data fabric, l’approccio del data warehouse comunemente rinuncia a fornire agli utenti dati in tempo reale (il lavoro di trasformazione sarebbe troppo difficile). Si tratta di uno svantaggio significativo.

Per maggiori dettagli su questo argomento, consulta il nostro articolo correlato: Data fabric vs. data mesh vs. data lake. (Un data lake è simile a un data warehouse ma per i dati non strutturati).

Virtualizzazione dei dati vs. data warehouse: differenze e somiglianze.

Questi due approcci ai dati sono opposti, ma hanno alcuni punti in comune.

Ecco cosa condividono i concetti di virtualizzazione dei dati e data warehouse:

Categoria. Entrambi sono modi di affrontare l’integrazione o l’architettura dei dati.
Scopo. Entrambi cercano di risolvere i problemi di integrazione dei big data e di rendere i dati accessibili agli utenti aziendali.

Bisogna notare queste importanti differenze:

Sede dei dati. È bene ribadire che con la virtualizzazione dei dati/data fabric i dati rimangono dove sono, mentre in un data warehouse i dati vengono migrati. La migrazione è sinonimo di tempo, ore di pianificazione e sviluppo e spese.
Rapidità. La virtualizzazione dei dati e il data fabric consentono di velocizzare l’azienda e il team IT, perché si salta la fase di migrazione.
Agilità. Un’architettura data fabric offre un nuovo modo di collegare i dati tra i silos dell’azienda. Un elemento di differenziazione fondamentale è che il data fabric copre sia i sistemi transazionali che quelli analitici. I dati transazionali sono dati vivi, quelli che cambiano costantemente per supportare applicazioni come il CRM. I dati analitici sono dati storici. Sono immutabili, non cambiano. I data warehouse supportano solo dati analitici.

Come la virtualizzazione dei dati e il data fabric accelerano il lavoro di sviluppo.

Hai appena letto che l’utilizzo di un livello di virtualizzazione dei dati può aumentare la velocità di sviluppo, ma di quanto? Secondo una ricerca di Gartner, "il Data Fabric riduce i tempi di progettazione dell’integrazione del 30%, di implementazione del 30% e di manutenzione del 70%". Poiché un livello di dati virtualizzato elimina la necessità di migrazione dei dati, puoi iniziare a usare i tuoi dati per sviluppare prodotti e applicazioni potenti immediatamente.

Inoltre, non dovrai creare integrazioni API, a meno che tu non voglia farlo, perché un data fabric costruito su un livello di virtualizzazione dei dati ha già una soluzione per ottenere i dati. Un’opzione correlata, la rete di dati, si occupa dello stesso problema del data fabric, ma lascia alle aziende un sacco di lavoro di integrazione API e altre attività di sviluppo che richiedono molto tempo. Il data mesh è una soluzione ad alto contenuto di codice più che il data fabric.

Puoi ottenere ancora più velocità e valore da un approccio data fabric se lo combini con una piattaforma che include la modellazione dei dati senza codice e la sicurezza a livello di record.

3 fatti di integrazione dei dati da ricordare.

Sei arrivato qui per sapere tre cose fondamentali sulla virtualizzazione dei dati e sui data warehouse. Quindi prendi spunto da queste informazioni:

La virtualizzazione dei dati collega i dati. Un data warehouse raccoglie solo dati.
La virtualizzazione dei dati crea un livello virtuale che permette agli utenti di fare le stesse cose che farebbero se i dati fossero tutti in un magazzino, ma più velocemente e senza alcun lavoro di migrazione.
Un data fabric utilizza un livello di virtualizzazione dei dati per consentire al business e all’IT di utilizzare i tuoi dati e risparmiare tempo per creare prodotti e servizi più innovativi.

[ Come si inserisce il data fabric in una moderna strategia di automazione? Ottieni il Rapporto Gartner® sulle tendenze dell’Hyperautomation nel 2022. ]

Appian è The Process Company. Forniamo una piattaforma software che aiuta le organizzazioni a gestire processi migliori per ridurre i costi, migliorare l’esperienza dei clienti e ottenere un vantaggio strategico. Con un forte impegno verso il successo dei nostri clienti, supportiamo molte delle più grandi aziende a livello globale in diversi settori.

Informazioni sulla Privacy

Trust Center

Informazioni su Appian

Appian Blog

Lavora con noi

Investitori