Excel 資料整理術:告別髒資料,提升數據品質

拿到一份原始資料後,首要任務不是寫公式,而是「整理」。雜亂無章、帶有重複項或格式不一的「髒資料」(Dirty Data) 會導致你的樞紐分析表出錯、公式失效。本篇將教你三個最實用的資料整理核武器:移除重複項資料分欄,以及讓電腦自動幫你工作的快速填入

移除重複項 (Remove Duplicates)

當資料來源是手動輸入或多份表格合併時,經常會出現重複列。

操作步驟:

  1. 點擊資料範圍中的任一儲存格。
  2. 切換到「資料」分頁。
  3. 點擊「移除重複項」按鈕。
  4. 在彈出的視窗中,勾選你要比對的欄位。
    • 全選:整列內容完全一樣時才刪除。
    • 僅勾選「手機號碼」:只要號碼相同,就算名字不同也會視為重複。

資料分欄 (Text to Columns)

有時候你匯入的資料會把所有內容擠在同一格(例如:台北市,100,姓名),中間用逗號隔開。這時我們需要「資料分欄」來將它們拆開。

操作步驟:

  1. 選取要拆分的整欄資料。
  2. 點擊「資料」分頁 -> 「資料分欄」。
  3. 選擇「分隔符號」,然後點擊下一步。
  4. 勾選分開它們的符號(如「逗號」、「空格」或「Tab」)。
  5. 點擊完成,資料就會自動散佈到右側的空白欄位。

懶人救星:快速填入 (Flash Fill)

這是 Excel 近年來最聰明的功能。它可以透過「模仿」你的操作習慣,自動幫你批次處理複雜的字串拆分或組合。

實戰應用:從完整姓名中提取「姓氏」

  1. 假設 A 2~A 10 是完整姓名清單。
  2. 在 B2 手動打下第一個人的姓氏(例如:王)。
  3. 選取 B2 並按下快捷鍵 Ctrl + E
  4. 奇蹟發生:Excel 會根據 B2 的邏輯,瞬門自動填滿 B3 到 B10 的所有姓氏。

更多應用場景:

  • 格式重組:將 A 欄的 0911-222-333 變成 B 欄的 (0911) 222333
  • 字串抽取:從身分證號碼中提取第 2 碼到第 5 碼。
  • 英文大小寫變換:把 mike lee 批次變成 Mike Lee

檢查與修復資料的 SOP

如果你發現公式結果怪怪的,請執行以下檢查:

  1. 資料型態檢查:數字被儲存為文字了嗎?最快的方法是全選該欄位,點擊出現的驚嘆號標籤,選擇「轉換成數字」。
  2. 肉眼難見的空格:使用上一章學過的 TRIM 函數清理。
  3. 空值的處理:利用「尋找與取代」(Ctrl + H) 將空白格統一填入 0N/A

為什麼整理資料這麼重要?

「垃圾進,垃圾出」(Garbage In, Garbage Out) 是數據科學的金科玉律。一份整潔、結構化的表格,能讓後續的樞紐分析、VLOOKUP 搜尋效率提升數倍。