Lezione 2.5
OneLake
Modulo 02 · Lezione 2.5 · Livello Base

Connettersi a OneLake e ai Lakehouse Fabric

La nuova frontiera: dati in OneLake, organizzati in Lakehouse, letti in Direct Lake. Senza duplicazioni, senza ETL pesanti. Vediamo cos'è OneLake, come si crea un Lakehouse, come si carica una tabella, e come si collega Power BI.

  • ⏱ Tempo stimato: ~25 min + esercitazioni
  • 🎯 Prerequisiti: L1.3 (Fabric F-SKU), L2.2 (Direct Lake)
  • 🛠 Software: browser + accesso a un tenant Fabric (anche trial)
1

OneLake — il data lake unico del tenant

OneLake è il data lake unificato di Microsoft Fabric. È uno solo per tenant (non uno per area o per progetto): l'idea è eliminare i silos di dati tipici delle aziende ("noi del marketing abbiamo il nostro data lake, voi del finance avete un altro").

OneLake è basato su Azure Data Lake Storage Gen2, ma con tre superpoteri:

  • Built-in per tutti i workload Fabric: Lakehouse, Warehouse, Real-Time, Power BI scrivono e leggono qui senza dover configurare nulla.
  • Shortcuts (collegamenti virtuali): puoi "vedere" dati che vivono altrove (S3, GCS, Dataverse, ADLS Gen2 esterno) come se fossero in OneLake, senza copiarli.
  • Formato Delta standard: tutte le tabelle sono Delta/Parquet, leggibili da qualunque motore moderno.
OneLake catalog: vista ad albero del tenant con Workspaces, Lakehouse, tabelle e file. Le icone shortcut hanno una piccola freccia di link.
OneLake catalog: vista ad albero del tenant con Workspaces, Lakehouse, tabelle e file. Le icone shortcut hanno una piccola freccia di link.
2

Lakehouse — dove si organizzano i dati

Un Lakehouse è il contenitore dentro OneLake che unisce due cose:

  • Files — area filesystem dove metti CSV, Parquet, JSON, immagini, qualsiasi file.
  • Tables — area tabellare con tabelle Delta interrogabili in SQL e leggibili in Direct Lake.

Si crea in 4 click:

  1. Apri Microsoft Fabric (app.fabric.microsoft.com).
  2. Workspace su capacità F-SKU → + New → Lakehouse.
  3. Dai un nome (es. lh_Vendite).
  4. Si apre il Lakehouse: a sinistra "Tables" e "Files". Pronti.
Interfaccia Lakehouse in Fabric: pannello Tables/Files a sinistra, anteprima dati al centro, ribbon in alto per Get Data / SQL endpoint.
Interfaccia Lakehouse in Fabric: pannello Tables/Files a sinistra, anteprima dati al centro, ribbon in alto per Get Data / SQL endpoint.
3

Caricare dati in un Lakehouse — quattro modi

1) Upload manuale

Drag-and-drop di un CSV/Parquet/Excel nella sezione Files. Per trasformarlo in tabella Delta: right-click → "Load to Tables".

2) Dataflow Gen2

Editor Power Query nativo dentro Fabric. Apri una sorgente qualsiasi (cloud o on-prem via Gateway), trasforma con M/Power Query, scrivi il risultato come tabella Deltanel Lakehouse. Ideale per pipeline schedulate.

3) Data Factory pipeline

Per ingestion massive (TB) e orchestrazione complessa: Copy Activity, ForEach, lookup, ecc. Output: tabelle Delta nel Lakehouse.

4) Shortcut

Non sposti i dati: li "vedi". Tre tipi più comuni:

  • Shortcut a S3 / GCS: vedi un bucket esterno come tabella locale.
  • Shortcut a Dataverse: vedi le entità D365 senza duplicare.
  • Shortcut interno OneLake: vedi tabelle di un altro Lakehouse del tenant.
Shortcut = zero copia, zero refresh
È la feature killer di OneLake. Sui dati esistenti in S3/Dataverse smetti di fare ETL. Cambi al volo, vedi al volo.
4

Endpoint SQL del Lakehouse

Ogni Lakehouse ha automaticamente uno SQL Analytics Endpoint: un endpoint TDS (lo stesso protocollo di SQL Server) per interrogare le tabelle Delta con T-SQL. Puoi connetterti da:

  • SQL Server Management Studio / Azure Data Studio.
  • Power BI Desktop (Get Data → Microsoft Fabric → Lakehouse SQL endpoint).
  • Tool BI di terze parti (Tableau, Looker, ecc.).
Read-only
L'endpoint SQL del Lakehouse è solo lettura. Per scrivere usa Dataflow, Spark notebook, pipeline o un Warehouse.
5

Collegare Power BI a un Lakehouse — i modi

Modo A — Modello semantico Direct Lake (consigliato)

Dentro il Lakehouse, ribbon → "New semantic model". Selezioni le tabelle Delta da includere. Fabric crea un modello semantico in Direct Lakeautomaticamente. Da lì, "Create report" e parti col report.

Modo B — Power BI Desktop → Lakehouse (Import o DirectQuery)

Get Data → Microsoft Fabric → Lakehouse → seleziona il workspace + Lakehouse. Vedi le tabelle. Scegli Import (copia in .pbix) o DirectQuery (live via SQL endpoint).

Modo C — Get Data → OneLake catalog

Naviga l'intero catalogo OneLake del tenant. Vedi tutti i Lakehouse, Warehouse, modelli semantici esistenti. Utile quando non sai dove sta esattamente la tabella.

Quando usare quale
  • Direct Lake (Modo A) — produzione, performance, freschezza.
  • Import via Desktop (Modo B) — sviluppo locale, prototipi, dataset piccolo.
  • OneLake catalog (Modo C) — esplorazione, quando il consumatore non sa il path.
6

Glossario rapido del mondo OneLake/Fabric

Glossario veloce
OneLake
Il data lake unico del tenant Fabric. Storage condiviso per tutti i workload.
Lakehouse
Contenitore in OneLake con due aree: Files (filesystem) e Tables (Delta interrogabili).
Warehouse
Database SQL serverless in Fabric, alternativa al Lakehouse quando vuoi sintassi SQL pura (T-SQL DDL/DML).
Shortcut
Collegamento virtuale a dati esterni (S3, GCS, ADLS, altro Lakehouse). Niente copia, niente refresh.
Delta Lake
Formato di tabella basato su Parquet con transazioni ACID, time travel, schema evolution. È lo standard di OneLake.
SQL Analytics Endpoint
Endpoint T-SQL read-only sopra un Lakehouse, accessibile da SSMS, Power BI, tool terzi.
Direct Lake
Modalità Power BI che legge tabelle Delta da OneLake senza copiarle, con VertiPaq on-demand.
Capacity Unit (CU)
Unità di calcolo Fabric. F2 = 2 CU, F64 = 64 CU. Determina quanto carico contemporaneo gestisce il workspace.
Workspace Fabric
Cartella collaborativa che contiene Lakehouse, Warehouse, modelli, report, pipeline. Vive su una capacità.
Domain
Raggruppamento logico di workspace (es. "Finance", "Sales") per governance e branding tematico.
7

Errori comuni

'Cannot read Lakehouse' da Power BI Desktop
Probabilmente il tuo account utente non ha permessi sul workspace Fabric, oppure il workspace non è su capacità. Verifica: Service → workspace settings → users + capacity.
Tabella Delta non visibile come tabella, solo come file
Hai caricato un Parquet/CSV nella sezione Files ma non hai fatto "Load to Tables". Right-click → Load to Tables → conferma schema. Diventa tabella Delta interrogabile.
Shortcut a S3 senza permessi
Lo shortcut richiede credenziali (Access Key/Secret) o IAM role per leggere il bucket S3. Configurale al momento della creazione dello shortcut. Microsoft conserva la chiave cifrata.
8

Esercitazioni

Esercizio 1Base

Crea il tuo primo Lakehouse

Consegna

Vai su Microsoft Fabric. Se non hai un workspace su capacità, attiva una Fabric trial(60 giorni gratis). Crea un workspace, poi un Lakehouse "lh_Test". Apri il Lakehouse e identifica le due aree (Files / Tables).

Esercizio 2Base

Carica un CSV → tabella Delta

Consegna

Nel Lakehouse appena creato: sezione Files → Upload → carica un CSV qualsiasi. Right-click sul file → Load to Tables → conferma schema → la tabella appare nella sezione Tables.

Esercizio 3Base

Crea un modello semantico Direct Lake

Consegna

Dal Lakehouse → ribbon "New semantic model" → spunta la tabella appena caricata → "Confirm". Si apre il modello semantico in Direct Lake. Poi click "Create report" e disegna un visual a tua scelta.

Esercizio 4Intermedia

Connetti Power BI Desktop al Lakehouse

Consegna

Apri Power BI Desktop → Get Data → Microsoft Fabric → Lakehouse → seleziona workspace e Lakehouse. Importa la stessa tabella. Confronta il comportamento di Direct Lake (dal Service) vs Import (dal Desktop): cosa noti?

Esercizio 5Intermedia

Shortcut concettuale

Consegna

Spiega in 3 frasi cosa fa uno shortcut da OneLake a un bucket S3 dell'azienda. Cosa cambia rispetto a una copia ETL classica?

Esercizio 6Avanzata

Lakehouse vs Warehouse

Consegna

In Fabric esistono sia Lakehouse che Warehouse. Per ognuno di questi 3 casi indica quale scegli e perché:

  1. ETL su file CSV/Parquet con Spark notebook.
  2. Reportistica T-SQL ad hoc dal team finance (skilled in SQL Server).
  3. Ingestion via Data Factory + report Power BI Direct Lake.
9

Quick check finale

Quick check

Quante istanze di OneLake ha un tenant Fabric?

Quick check

Cosa fa 'Load to Tables' su un file Parquet in Files?

Hai finito il Modulo 2 ✓

Sai caricare dati da qualsiasi sorgente, scegliere la modalità (Import / DirectQuery / Direct Lake), gestire il Gateway, lavorare con OneLake e Lakehouse. Nel Modulo 3 entriamo in Power Query e impariamo a pulire prima di modellare.