Alla scoperta dei vantaggi nascosti di questa funzionalità di Excel trascurata

Alla scoperta dei vantaggi nascosti di questa funzionalità di Excel trascurata

Per anni ho fatto affidamento su Excel per calcoli semplici e per creare tabelle di base. Pur utilizzando formule comuni ed eseguendo semplici manipolazioni di dati, non ho mai sentito il bisogno di addentrarmi nelle funzionalità più complesse di Excel, finché i miei progetti non sono diventati sempre più complessi.

La sfida che ha innescato la mia esplorazione

L’aumento dei costi dei componenti per PC nella mia zona – spesso superiori a quelli degli Stati Uniti a causa delle fluttuazioni del mercato e delle tasse di importazione – mi ha spinto a indagare sulla disparità di prezzo. Il mio obiettivo era determinare se fosse più conveniente acquistare direttamente da piattaforme come Amazon o Newegg invece che dai rivenditori locali. Per farlo, ho raccolto dati sui prezzi di diversi mesi su componenti essenziali per PC, tra cui CPU, GPU e RAM. Quello che inizialmente pensavo sarebbe stato un semplice progetto di monitoraggio si è rapidamente trasformato in un compito arduo.

I dati che ho accumulato erano caotici. I file di ogni rivenditore erano in un formato diverso, complicando qualsiasi tentativo di integrazione. Ad esempio, Amazon registrava le date nel formato MM/GG/AAAA, mentre Newegg usava AAAAMMGG e il mio negozio locale Shopee aderiva allo standard GG-MM-AAAA.

Dati disordinati del foglio di calcolo
Screenshot di Jayric Maning – Nessuna attribuzione richiesta

Le incongruenze nei dati non si limitavano ai formati delle date. I nomi delle colonne erano completamente diversi: Newegg contrassegnava i prezzi come “retail_price”, Amazon optava per “unit_price_usd” e Shopee li etichettava semplicemente come “price_php”.Inoltre, la formattazione dei prezzi variava, con alcune voci che mostravano simboli di valuta come “₱18.600”, mentre altre erano indicate come semplici numeri come “320”.Anche i nomi dei marchi erano incoerenti, apparendo in formati diversi come “gigabyte”, “GIGABYTE INC.” o “Gigabyte Tech”.

Pulire e consolidare manualmente questi dati si stava trasformando in un’impresa estenuante. Mi ritrovavo a passare innumerevoli ore a copiare dati tra i file, a sostituire valori incoerenti e a rimuovere meticolosamente le righe vuote. Inoltre, convertire i prezzi da PHP a USD richiedeva di fare costantemente riferimento ai tassi di cambio in tempo reale su un secondo monitor. Questo processo laborioso era tedioso e pieno di potenziali errori, tanto che quasi mi spinse ad abbandonare il progetto.

Fu allora che decisi di esplorare una funzionalità di cui gli appassionati di Excel vanno spesso fieri: Power Query. Sebbene Excel offra numerosi strumenti avanzati, scoprii che Power Query risolveva specificamente i miei problemi. Dopo aver guardato video didattici su YouTube, mi resi conto di quanto tempo avrei potuto risparmiare utilizzando l’editor di Power Query per riordinare i dati disorganizzati che avevo raccolto.

Il mio approccio passo passo all’utilizzo di Power Query

In poco tempo ho sviluppato una procedura semplice in Power Query Editor per ripulire quei file CSV disordinati e convertirli in un foglio di calcolo coerente e organizzato.

Ho iniziato importando i dati nell’editor di Power Query. Ho aperto una nuova cartella di lavoro di Excel, ho selezionato ” Dati” dalla barra multifunzione e ho scelto ” Da testo/CSV”. Dopo aver selezionato il file CSV, ho cliccato su “Trasforma dati” per accedere all’editor di Power Query.

Il primo passo è stato standardizzare la colonna Data. Dato che le due fonti avevano linee temporali distanti 12 ore, garantire una formattazione uniforme della data era essenziale. Questo processo si è rivelato incredibilmente semplice. Ho evidenziato la colonna Data, ho fatto clic con il pulsante destro del mouse e ho selezionato Modifica tipo > Usa impostazioni locali. Nel pop-up successivo, ho impostato il tipo su Data e ho scelto Inglese (Stati Uniti) per garantire una formattazione coerente. Power Query ha identificato abilmente vari formati (MM/GG/AAAA, AAAA/MM/GG, GG-MM-AAAA) e li ha standardizzati in un unico formato con facilità.

Cambia tipo utilizzando le impostazioni locali
Screenshot di Jayric Maning – Nessuna attribuzione richiesta

Una volta corretto il formato della data, ho proceduto alla pulizia della colonna. Poiché la maggior parte degli errori derivava dal mio strumento di scraping dei dati, ho utilizzato il filtro “Rimuovi errori” per eliminare le voci errate. Questo passaggio ha rimosso efficacemente i valori nulli e qualsiasi dato problematico residuo, garantendo una rappresentazione coerente delle date in tutti i file.

Colonna data fissa
Screenshot di Jayric Maning – Nessuna attribuzione richiesta

Successivamente, ho affrontato i nomi di marca caotici tramite la funzionalità ” Sostituisci valori”. Dopo aver selezionato la colonna pertinente, ho cliccato con il pulsante destro del mouse, ho aperto ” Sostituisci valori ” e ho inserito e standardizzato tutte le varianti dei nomi di marca, ad esempio trasformando “gigabyte” e “GIGABYTE INC.” in un’unica voce coerente: “GIGABYTE”.Lo stesso approccio è stato applicato ad AMD, semplificando di fatto la colonna “Marchio” in tutte le fonti dati.

  • Colonna di marca disordinata
    Screenshot di Jayric Maning – Nessuna attribuzione richiesta
  • Colonna di branding fissa
    Screenshot di Jayric Maning – Nessuna attribuzione richiesta

Infine, ho standardizzato la colonna Prezzo. Questo ha rappresentato una sfida, poiché molte voci erano semplici numeri privi di contesto riguardo alla valuta, complicando i processi di conversione. Fortunatamente, la colonna Negozio ha fornito un contesto immediato, consentendo una conversione semplice dei prezzi di Shopee PH in USD.

Per risolvere questo problema, ho prima utilizzato “Sostituisci valori” per eliminare tutti i simboli di valuta (ad esempio $, ₱, USD, PHP) dalla colonna “Prezzo”.Dopo aver convertito queste voci in formato decimale selezionando ” Tipo di modifica” > “Decimale”, ho creato una nuova colonna denominata “Prezzo USD” utilizzando ” Colonna personalizzata” nella scheda “Colonna “.Ho implementato la seguente formula:

if [Store] = "Shopee PH"then Number. Round([Price] / 55, 2) else Number. Round([Price], 2)

Facendo clic su OK, ho convertito tutti i prezzi da Shopee PH in USD per un confronto più chiaro.

Formula di conversione del prezzo
Screenshot di Jayric Maning – Nessuna attribuzione richiesta

La formula è realizzata nel linguaggio di scripting Power Query M. Questo linguaggio di scripting offre una sintassi semplice e relativamente facile da comprendere. Non è necessario padroneggiare l’intero linguaggio per utilizzarlo efficacemente; lo utilizzo solo quando necessario per costruire le mie formule.

Formato di prezzo uniforme
Screenshot di Jayric Maning – Nessuna attribuzione richiesta

Una volta rettificati i dati, ho semplicemente chiuso l’editor di Power Query e ho fatto clic su Mantieni per salvare tutte le modifiche apportate alla mia cartella di lavoro.

Risparmio di tempo con Power Query

Inizialmente, ho esitato ad adottare Power Query, temendo che avrebbe introdotto un’altra funzionalità complicata che mi avrebbe portato via troppo tempo. Contrariamente alle mie aspettative, l’ho trovato molto più semplice. Invece di eseguire infinite operazioni di ricerca e sostituzione, Power Query mi ha permesso di ripulire in modo efficiente i dati prodotti dai miei strumenti di scraping.

Ciò che mi ha stupito ulteriormente è stato il fatto che ogni modifica implementata fosse documentata, consentendomi di replicare il processo di pulizia senza sforzo. Questo funziona essenzialmente come uno script automatizzato per la pulizia dei dati, trasformando file CSV caotici in fogli di calcolo ben organizzati, ideale per situazioni che coinvolgono set di dati personalizzati generati tramite web scraping, dove la qualità dei dati è spesso incoerente.

Per chi gestisce frequentemente complesse attività di pulizia dei dati, formati incoerenti o più origini dati, Power Query semplifica questi processi in un flusso di lavoro gestibile e automatizzato. Invece di dedicare ore ogni settimana alla risoluzione manuale dei problemi, un semplice clic su Aggiorna consente di immergersi direttamente nell’analisi.È una funzionalità potente di Excel che avrei voluto adottare molto prima. Una volta sperimentata l’efficienza di un processo di pulizia automatizzato e facilmente ripetibile, non si torna più indietro.

Fonte e immagini

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *