Excel 資料整理術:告別髒資料,提升數據品質
拿到一份原始資料後,首要任務不是寫公式,而是「整理」。雜亂無章、帶有重複項或格式不一的「髒資料」(Dirty Data) 會導致你的樞紐分析表出錯、公式失效。本篇將教你三個最實用的資料整理核武器:移除重複項、資料分欄,以及讓電腦自動幫你工作的快速填入。
移除重複項 (Remove Duplicates)
當資料來源是手動輸入或多份表格合併時,經常會出現重複列。
操作步驟:
- 點擊資料範圍中的任一儲存格。
- 切換到「資料」分頁。
- 點擊「移除重複項」按鈕。
- 在彈出的視窗中,勾選你要比對的欄位。
- 全選:整列內容完全一樣時才刪除。
- 僅勾選「手機號碼」:只要號碼相同,就算名字不同也會視為重複。
資料分欄 (Text to Columns)
有時候你匯入的資料會把所有內容擠在同一格(例如:台北市,100,姓名),中間用逗號隔開。這時我們需要「資料分欄」來將它們拆開。
操作步驟:
- 選取要拆分的整欄資料。
- 點擊「資料」分頁 -> 「資料分欄」。
- 選擇「分隔符號」,然後點擊下一步。
- 勾選分開它們的符號(如「逗號」、「空格」或「Tab」)。
- 點擊完成,資料就會自動散佈到右側的空白欄位。
懶人救星:快速填入 (Flash Fill)
這是 Excel 近年來最聰明的功能。它可以透過「模仿」你的操作習慣,自動幫你批次處理複雜的字串拆分或組合。
實戰應用:從完整姓名中提取「姓氏」
- 假設 A 2~A 10 是完整姓名清單。
- 在 B2 手動打下第一個人的姓氏(例如:王)。
- 選取 B2 並按下快捷鍵
Ctrl+E。 - 奇蹟發生:Excel 會根據 B2 的邏輯,瞬門自動填滿 B3 到 B10 的所有姓氏。
更多應用場景:
- 格式重組:將 A 欄的
0911-222-333變成 B 欄的(0911) 222333。 - 字串抽取:從身分證號碼中提取第 2 碼到第 5 碼。
- 英文大小寫變換:把
mike lee批次變成Mike Lee。
檢查與修復資料的 SOP
如果你發現公式結果怪怪的,請執行以下檢查:
- 資料型態檢查:數字被儲存為文字了嗎?最快的方法是全選該欄位,點擊出現的驚嘆號標籤,選擇「轉換成數字」。
- 肉眼難見的空格:使用上一章學過的
TRIM函數清理。 - 空值的處理:利用「尋找與取代」(
Ctrl+H) 將空白格統一填入0或N/A。
為什麼整理資料這麼重要?
「垃圾進,垃圾出」(Garbage In, Garbage Out) 是數據科學的金科玉律。一份整潔、結構化的表格,能讓後續的樞紐分析、VLOOKUP 搜尋效率提升數倍。