Array CGH: Guida completa all’Array CGH e alle sue applicazioni moderne

L’Array CGH, o Comparative Genomic Hybridization su microarray, è una tecnologia di riferimento per la rilevazione di variazioni nel numero di copie del DNA (CNV) su scala genomica. Nel panorama delle tecniche genetiche, questo strumento ha trasformato la diagnosi di condizioni genetiche, i profili di tumori e le ricerche di base sul genoma umano. In questo articolo esploreremo cosa sia l’Array CGH, come funziona, quali sono i vantaggi e i limiti, come si interpreta un grafico di CNV e quali sono gli scenari clinici e di ricerca in cui questa tecnologia trova applicazione. All’interno troverai anche riferimenti al termine array cgh, utile per chi cerca contenuti SEO orientati a questo specifico termine.
Cos’è l’Array CGH e come funziona
L’Array CGH è una tecnica di genomica comparativa che confronta il DNA di un campione di paziente con un DNA di riferimento, su un supporto di microarray contenente sequenze di DNA note. L’idea chiave è misurare come si distribuiscono le quantità di DNA tra campione e riferimento: variazioni costanti nel rapporto indicano cambiamenti del numero di copie su regioni genomiche. Il principio di base può essere riassunto così: se una regione del genoma è duplicata nel paziente, la fluorescenza relativa sarà più alta sul lato paziente; se è delezionata, la fluorescenza relativa sarà inferiore. Il risultato è un profilo di log2 dei rapporti di intensità che, quando segmentato, rivela CNV a livello cromosomico.
Perché si chiama Array CGH
La sigla CGH sta per Comparative Genomic Hybridization, ma spesso si incontra l’espressione in italiano come Array CGH. Una variante meno comune è l’uso di array cgh, che riflette l’uso del termine in minuscolo in contesti SEO o descrittivi. In questa guida useremo entrambe le forme per favorire una comprensione completa e una migliore indicizzazione, tenendo presente che la formulazione più corretta dal punto di vista tecnico è Array CGH con CGH in maiuscolo.
Diagramma di funzionamento in breve
- Etichettatura del DNA del paziente e del DNA di riferimento con coloranti diversi (tipicamente rosso e verde).
- Hybridizzazione su un microarray contenente sonde di DNA mirate o a tappeto sul genoma.
- Scansione del chip per leggere l’intensità fluorescente in ciascuna sonda.
- Calcolo del rapporto paziente/reference e trasformazione in log2.
- Algoritmi di segmentazione per identificare regioni in cui i log2 differiscono in modo significativo dal baseline.
Esistono diverse tipologie di microarray utilizzate nell’Array CGH: array basati su BAC (Bacterial Artificial Chromosome), array oligonucleucleotidici (oligo) di alta risoluzione e, meno comunemente oggi, array SNP che forniscono anche informazione sull’allele. Oltre alla risoluzione, la scelta dipende dall’obiettivo: diagnosi di condizioni congenite, investigazioni di tumori o studi di varianti normali del genoma.
Componenti chiave dell’Array CGH
Per capire come si costruisce e come si interpreta un esperimento di Array CGH è utile conoscere i componenti principali:
- Chip o supporto microarray: è la superficie su cui risiedono le sonde di DNA. Nei BAC arrays le sonde sono grandi frammenti di DNA (centinaia di kilobasi), mentre negli oligo arrays sono short oligonucleotidi che coprono tutto il genoma ad alta densità, consentendo una risoluzione molto superiore.
- DNA di paziente e DNA di riferimento: entrambi sono etichettati con colori diversi per permettere il confronto diretto sullo stesso slide.
- Sistema di scansione: un lettore di fluorescenza che misurare l’intensità di ciascuna sonda. Le intensità dette out sono convertite in rapporti log2.
- Software di analisi: strumenti per normalizzare i dati, correggere bias (ad es. contenuto GC, mappabilità), segmentare il profilo e chiamare CNV (delezioni o duplicazioni).
È importante notare che la scelta tra Array CGH su array oligo, su array BAC o su array SNP influisce la risoluzione e la capacità di rilevare particolari tipi di variazioni. Per esempio, gli array oligo offrono una copertura molto più densa del genoma e permettono di rilevare CNV molto piccoli rispetto ai vecchi array BAC.
Vantaggi e limiti dell’Array CGH
Vantaggi principali
- Copertura genomica: permette una valutazione non mirata di tutto il genoma, identificando CNV in regioni inattese o non note.
- Risoluzione scalabile: a seconda del tipo di array, è possibile ottenere risoluzioni che vanno da centinaia di kilobasi a pochi kilobasi o meno.
- Approccio ibrido e robusto: è meno dipendente da interpretazioni soggettive rispetto ad approcci tradizionali come FISH per grandi delezioni o duplicazioni.
- Applicazioni cliniche e di ricerca: utile in diagnosi di ritardo dello sviluppo, sindromi genetiche complesse, autismo e studi di anomalie congenite, nonché nell’ambito oncologico per il profilo CNV dei tumori.
Limiti principali
- Non rileva tre tipi di alterazioni: gamma bilanciate (traslocazioni o inversioni senza perdita o guadagno di DNA), microstrutture molto piccole sotto la soglia di rilevamento e mosaicismi a basso livello.
- Dipendenza dal DNA di riferimento: la qualità e la provenienza del DNA di riferimento possono influenzare la sensibilità e la specificità del test.
- Risoluzione non uniforme: la qualità delle sonde e la mappabilità del genoma causano variazioni di sensibilità in regioni rimpicciolite o ripetitive.
- Falsi positivi e negativi: in regioni complesse, come quelle con ricche di ripetizioni, possono apparire CNV spurii che non hanno significato clinico.
Per mitigare questi limiti, è comune integrare l’analisi Array CGH con altre tecnologie (es. MLPA per conferme mirate, o NGS per esame più dettagliato dei breakpoint) e con validazioni cliniche
Protocolli e flussi di lavoro tipici
Un flusso di lavoro tipico per l’Array CGH comprende diverse fasi chiave, dalla preparazione del campione all’interpretazione finale. Ecco una panoramica semplificata:
- Preparazione dei campioni: estrazione di DNA ad alta qualità da tessuti o sangue del paziente e del riferimento. La purezza e la concentrazione influiscono sui passaggi successivi.
- Etichettatura e co-ibridazione: DNA del paziente e DNA di riferimento vengono etichettati con coloranti diversi e ibridati sullo stesso array.
- Lavaggio e scansione: rimozione delle sostanze non legate e acquisizione delle immagini fluorescenti per ogni sonda.
- Analisi dati: normalizzazione, correzioni di bias (per esempio GC-content), calcolo dei rapporti log2 e segmentazione per definire CNV.
- Interpretazione e report: assegnazione di una categoria clinica per ogni CNV (assente, di nessun effetto noto, di significato probabile o noto), con eventuali raccomandazioni per conferme o ulteriori test.
Le fasi di analisi sono cruciali: algoritmi come circular binary segmentation (CBS) o altre tecniche di segmentazione suddividono il genoma in regioni omogenee rispetto al log2 ratio, facilitando l’individuazione di delezioni e duplicazioni significative. Inoltre, l’interpretazione richiede banche dati di CNV note e una valutazione di consanguineità, mosaicismi, e contesto clinico del paziente.
Come interpretare i risultati: da log2 ratio a CNV
La chiave per tradurre i dati grezzi in informazione clinicamente utile è l’interpretazione del profilo log2. Ecco alcuni concetti utili:
- Baseline: in condizioni ideali, la maggior parte del genoma dovrebbe apparire come una linea di baseline vicino a zero nel log2 ratio, che rappresenta due copie presenti sia nel paziente che nel riferimento.
- Delezioni: una delezione si manifesta come una regione con log2 ratio negativo, tipicamente scendendo al di sotto di una soglia definita dal protocollo (ad es. tra -0,3 e -1,0 a seconda della dimensione della CNV e della qualità del dato).
- Duplicazioni: una duplicazione produce log2 ratio positivo, oltre la soglia di baseline. Maggiore è la regione interessata, maggiore sarà la confidenza della chiamata.
- Granularità vs affidabilità: regioni molto piccole potrebbero essere meno affidabili a causa di rumore di fondo. Le CNV confermate da tecniche indipendenti sono preferibili.
- Contesto clinico: la significatività di una CNV dipende dal gene coinvolto, dalla perdita o dall’aumento di contenuti patologici, e dall’associazione con fenotipi noti.
In alcuni casi, è utile distinguere tra CNV costituzionali (presenti in tutto l’organismo, ereditabili o de novo) e CNV somatiche (presenti in un tessuto, ad esempio in tumori). L’interpretazione clinica può variare notevolmente a seconda del contesto.
Array CGH e confronto con altre tecnologie
Nel panorama delle tecnologie genetiche, l’Array CGH si confronta spesso con altre metodiche per valutare quale strumento sia più adatto a una domanda clinica o di ricerca.
Array CGH vs NGS (Next-Generation Sequencing)
Entrambe le tecnologie permettono di rilevare CNV, ma hanno differenze chiave:
- Risoluzione: NGS offre una risoluzione potenzialmente a livello di singolo nucleotide, ma l’interpretazione delle CNV su grandi dataset di sequencing richiede pipeline complesse. L’Array CGH fornisce una mappa CNV forte e rapida a risoluzioni di kilobasi o superiore a seconda dell’array.
- Tipo di informazione: l’NGS permette anche di rilevare mutazioni puntiformi, mosaicismo a basso grado e variazioni nell’allele (informazioni sugli SNP). l’Array CGH si concentra principalmente sulle variazioni in copia e non distingue alleli specifici.
- Costi e tempi: a seconda della piattaforma, l’Array CGH può offrire test diagnostici più rapidi e a costi contenuti, specialmente per diagnostica standard di CNV, mentre l’NGS può essere più costoso e richiedere una pipeline analitica più complessa.
Array CGH vs MLPA e FISH
MLPA (Multiplex Ligation-dependent Probe Amplification) e FISH (Fluorescence In Situ Hybridization) sono tecniche mirate che hanno utilizzato per anni per confermare o indagare CNV specifici. Rispetto all’Array CGH:
- Copertura: MLPA è mirata a regioni specifiche, mentre l’Array CGH è array-wide. FISH può essere utile per validare una CNV candidata o per valutare la localizzazione cromosomica in cellule singole.
- Scala di dettaglio: l’Array CGH fornisce una vista globale; MLPA e FISH offrono conferme mirate con robuste risoluzioni per regioni di interesse.
Applicazioni cliniche e di laboratorio
Le applicazioni dell’Array CGH sono variegate e si estendono dalla genetica clinica alla ricerca di base:
- Diagnosi di disturbi dello sviluppo e aneuplie: molte condizioni neurodevelopive, ritardo dello sviluppo, disordini comportamentali, e anomalie congenite mostrano CNV che possono essere rivelate dall’Array CGH.
- Sindromi genetiche note: sindromi da duplicazioni o delezioni ricorrenti sono identificate con facilità dall’analisi di CNV su tutto il genoma.
- Esplorazione di varianti in popolazioni sane: lo studio di CNV di popolazioni sane aiuta a distinguere CNV di significato clinico da varianti innocue o di sindrome minima.
- Oncologia genomica: nei tumori, l’Array CGH fornisce un profilo CNV che aiuta a comprendere la catena di eventi genomici, identificando regioni di amplificazione oncogenica o delezioni di sopravvivenza genica.
Contesti pratici: esempi concreti di utilizzo
Immagina un paziente con ritardo dello sviluppo e anomalie congenite multiple. Un Array CGH può essere uno dei primi test diagnostici consigliati per rilevare CNV causali o contributive. Se una delezione o duplicazione nota è presente in geni legati a sindromi neurocomportamentali o sviluppo, si può procedere con conferme replicate (MLPA o FISH) e con una consulenza genetica mirata. In ambito oncologico, l’analisi di CNV su campioni tumorali può rivelare amplificazioni di geni oncogeni o delezioni di geni coinvolti in regolare la crescita cellulare, fornendo indicazioni per terapie mirate o per la classificazione prognostica del tumore.
Biologia dei dati: gestione di valori mancanti e affidabilità
Nel flusso di lavoro reale, non mancano i dati con vari livelli di affidabilità. Alcune regioni possono presentare rumore elevato o incongruenze a causa di sequenze ripetute o di differenze di mappatura. In questi casi si parla di dati con valori non determinabili o di CNV non confermabili, e saranno gestiti come incerti o esclusi dall’interpretazione finale. Le buone pratiche prevedono una conferma indipendente per CNV clinicamente rilevanti, soprattutto in contesti di diagnosi o decisioni terapeutiche.
Guida pratica ai termini chiave
Per chi lavora con l’Array CGH, ecco un piccolo glossario utile:
- CNV (Copy Number Variation): variazione nel numero di copie di una regione genica.
- Log2 ratio: parametro che rappresenta il logaritmo in base 2 del rapporto tra DNA paziente e DNA di riferimento.
- Segmentazione: processo di raggruppare regioni contigue del genoma che hanno lo stesso livello di log2 ratio.
- Array oligonucleucleotidico: tipo di Array CGH ad alta risoluzione basato su oligonucleotidi sintetizzati sul chip.
- Array BAC: tipo di Array CGH che usa grandi frammenti di DNA come sonda; tipicamente ha risoluzione inferiore rispetto agli array oligo.
- SNP array: variante di microarray che include sonde per SNP e permette, oltre alle CNV, l’analisi delle allelità e livelli di mosaicismo.
Futuro e tendenze: dall’Array CGH all’era integrata
Il panorama tecnologico continua a evolversi rapidamente. Le tendenze emergenti includono:
- Aggiornamenti di risoluzione: nuove famiglie di array oligo consentono una mappa CNV ancora più precisa, utile per individuare varianti di piccole dimensioni difficili da rilevare in passato.
- Integrazione con sequencing: pipeline ibride che integrano CNV rilevati dall’Array CGH con dati di sequencing per fornire un quadro completo del genoma e per migliorare la definizione dei breakpoint.
- Analisi di mosaicismo: strumenti di analisi sempre più sensibili permettono di distinguere CNV presenti in percentuali diverse di cellule, con importanza in oncologia e in patologie congenite.
- Approcci clinici personalizzati: la combinazione di CNV con mutazioni puntiformi e profili di espressione può guidare terapie mirate e decisioni terapeutiche più precise.
Conclusione
L’Array CGH resta una pietra miliare nella diagnostica genetica e nella genomica di ricerca. La capacità di mappare CNV a livello genomico completo, con una risoluzione modesta o elevata a seconda del tipo di array, offre un quadro robusto per identificare varianti che spiegano fenotipi complessi o guidano scelte cliniche. La chiave del successo è la combinazione di una buona progettazione sperimentale, una rigorosa analisi dei dati e una contestualizzazione clinica. Il termine array cgh, quando compare nel materiale di ricerca o marketing, si integra naturalmente con Array CGH in un ecosistema linguistico che privilegia sia la precisione tecnica sia l’accessibilità informativa per i lettori curiosi e per i professionisti della genetica.
In definitiva, che si tratti di diagnostica consultiva, di studio di sindromi complesse o di profili tumorali, l’Array CGH rappresenta uno strumento chiave per decifrare la complessità del genoma umano attraverso una lente di CNV ben definita, offrendo basi solide per diagnosi accurate, ricerca avanzata e terapie future sempre più mirate.