
多年來,我一直依賴 Excel 進行簡單的計算和建立基本表格。雖然我使用常用公式並進行簡單的資料操作,但直到我的專案變得越來越複雜,我才覺得有必要深入研究 Excel 更複雜的功能。
引發我探索的挑戰
我所在地區的PC零件價格不斷上漲——由於市場波動和進口稅的影響,價格通常高於美國——這促使我開始調查價格差異。我的目標是確定直接從亞馬遜或新蛋網等平台購買是否比從當地零售商購買更經濟。為此,我收集了幾個月的PC關鍵零件價格數據,包括CPU、GPU和RAM。我原本以為這只是一個簡單的追蹤項目,但很快卻變成了一項艱鉅的任務。
我收集的數據非常混亂。每個零售商的文件格式都不一樣,這使得合併資料變得非常困難。例如,亞馬遜記錄日期的格式是 MM/DD/YYYY,而 Newegg 使用的是 YYYYMMDD,而我當地的 Shopee 商店則遵循 DD-MM-YYYY 的標準。

資料不一致的問題不僅限於日期格式。列名也完全不同:Newegg 將價格標記為“零售價”,Amazon 選擇了“單價美元”,而 Shopee 則簡單地將其標記為“價格php”。此外,價格格式也各不相同,有些條目顯示貨幣符號,例如“₱18, 600”,而另一些條目則以純數字表示,例如“320”。甚至品牌名稱也不一致,以各種格式出現,例如「gigabyte」、「GIGABYTE INC.」或「Gigabyte Tech」。
手動清理和整合這些數據變成了一項令人精疲力盡的工作。我發現自己花了無數的時間在文件之間複製、替換不一致的值,並一絲不苟地刪除空白行。此外,將價格從 PHP 轉換為 USD 需要不斷參考第二台顯示器上的即時匯率。這個勞力密集的過程既繁瑣又容易出錯,幾乎讓我放棄了這個專案。
就在那時,我決定探索 Excel 愛好者經常讚不絕口的一個功能——Power Query。雖然 Excel 中有很多高級工具,但我發現 Power Query 特別解決了我的問題。在觀看了 YouTube 上的教學影片後,我發現使用 Power Query 編輯器整理我收集的雜亂資料確實可以節省大量時間。
我使用 Power Query 的逐步方法
我很快就在 Power Query 編輯器中開發了一個簡單的程式來清理那些混亂的 CSV 檔案並將它們轉換為連貫、有條理的電子表格。
我首先將資料匯入 Power Query 編輯器。我開啟了一個新的 Excel 工作簿,從功能區中選擇「資料」 ,然後選擇「從文字/CSV」匯入。選擇 CSV 檔案後,我點擊「轉換資料」以進入 Power Query 編輯器。
第一步是標準化“日期”列。由於兩個資料來源的時間軸相差 12 小時,因此確保日期格式統一至關重要。這個過程非常簡單。我選中“日期”列,右鍵單擊,然後選擇“更改類型”>“使用區域設定”。在隨後彈出的視窗中,我將類型設為“日期”,並選擇“英語(美國)”以確保格式一致。 Power Query 能夠熟練地識別各種格式——MM/DD/YYYY、YYYY/MM/DD、DD-MM-YYYY——並輕鬆地將它們標準化為單一格式。

日期格式修正後,我開始清理該列。由於大多數錯誤源自於我的資料抓取工具,我使用了「刪除錯誤」過濾器來消除錯誤條目。此步驟有效地刪除了空值和任何剩餘的問題數據,確保所有文件的日期表示一致。

接下來,我透過「替換值」功能解決了品牌名稱混亂的問題。選中相關列後,我右鍵單擊,打開“替換值”,輸入並標準化所有品牌名稱的變體,例如將“gigabyte”和“GIGABYTE INC.”轉換為一個一致的條目:“GIGABYTE”。同樣的方法也應用於 AMD,有效簡化了所有資料來源中的「品牌」欄位。
-
截圖由 Jayric Maning 提供 – 無需署名 -
截圖由 Jayric Maning 提供 – 無需署名
最後,我標準化了價格列。這帶來了一個挑戰,因為許多條目只是數字,缺乏貨幣背景訊息,使得轉換工作變得複雜。幸運的是,“商店”列提供了即時背景信息,可以直接將Shopee PH價格轉換為美元。
為了解決這個問題,我首先使用「替換值」功能從「價格」欄位中刪除所有貨幣符號(例如 $、₱、USD、PHP)。然後,透過選擇「變更類型」>「小數」將這些條目轉換為十進位格式,並在「列」標籤下使用「自訂列」建立了一個名為「價格(美元)」的新欄位。我實施了以下公式:
if [Store] = "Shopee PH"then Number. Round([Price] / 55, 2) else Number. Round([Price], 2)
透過點擊「確定」,我將 Shopee PH 的所有價格轉換為美元,以便進行清晰的比較。

公式採用Power Query M 公式語言編寫。該腳本語言語法簡單,相對容易理解。無需掌握整個語言即可有效使用它;我僅在建立公式時才參考它。

一旦資料被修正,我只需關閉 Power Query 編輯器,點擊「保留」即可儲存對工作簿所做的所有變更。
Power Query 節省的時間
起初,我猶豫是否要使用 Power Query,擔心它會引入一個複雜的功能,佔用我太多時間。結果出乎意料,我發現它簡單得多。 Power Query 讓我能夠有效率地清理抓取工具產生的數據,而無需執行無休止的查找和替換操作。
更讓我驚訝的是,我實施的每項調整都記錄在案,讓我能夠毫不費力地複製清理過程。這本質上就像一個資料清理的自動化腳本,將混亂的 CSV 檔案轉換成井然有序的電子表格——非常適合透過網頁抓取產生的自訂資料集,因為這類資料集的資料品質通常參差不齊。
對於經常處理繁瑣的資料清理任務、不一致的格式或多個資料來源的用戶,Power Query 將這些流程簡化為易於管理的自動化工作流程。無需每週花費數小時手動修復問題,只需點擊「刷新」即可直接進行分析。這是 Excel 的強大功能,真希望自己早點用它。一旦體驗到自動化、易於重複的清理流程的高效性,就再也回不去了。
發佈留言