表哥表妹們肯定都有一個(gè)共識(shí):BI 不怕需求難,最恨數(shù)據(jù)不規(guī)范!
一天收上來(lái)幾十份 Excel 數(shù)據(jù)表,一看數(shù)據(jù)格式,各種五花八門(mén)的問(wèn)題,直接炸了。這成千上萬(wàn)條數(shù)據(jù)要怎么清洗?
我曾經(jīng)教過(guò)大家用函數(shù)清洗數(shù)據(jù)的方法,具體可參見(jiàn) Excel 數(shù)據(jù)源清洗,用這兩個(gè)函數(shù)批量刪除空格和換行
用函數(shù)可以完成大部分?jǐn)?shù)據(jù)清洗,但是不能 100%,比如數(shù)字前面多了一個(gè)“0”,象 01234 這種,用文中兩個(gè)函數(shù)沒(méi)法讓它變成 1234。
而且用函數(shù)畢竟還是費(fèi)時(shí),我今天要教大家另外一個(gè)大殺器:只要將數(shù)據(jù)傳到 Power Query 跑一圈,什么都不用做,所有數(shù)據(jù)都清洗好了。
而且這方法一勞永逸,以后哪怕再有新增的不規(guī)范數(shù)據(jù),只要刷新一下就能自動(dòng)更新出一張干凈的數(shù)據(jù)表。
案例:
下圖中的學(xué)號(hào)本該是 6 位數(shù)字,可是現(xiàn)在每個(gè)單元格左上方都有個(gè)綠色小箭頭,說(shuō)明數(shù)字格式有問(wèn)題。
請(qǐng)用最快捷的方式清洗數(shù)據(jù),讓所有學(xué)號(hào)恢復(fù)成 6 位 的數(shù)字格式。
解決方案:
1. E 列的“學(xué)號(hào)”格式是規(guī)范的,但是由于 A 列數(shù)據(jù)源的不規(guī)范,在 F 列使用 vlookup 函數(shù)查找姓名時(shí),根本找不到。
2. 現(xiàn)在開(kāi)始清洗步驟:選中需要清洗的數(shù)據(jù)區(qū)域的任意單元格 --> 選擇菜單欄的“數(shù)據(jù)”-->“從表格”
3. 彈出的對(duì)話(huà)框中會(huì)自動(dòng)選中數(shù)據(jù)表區(qū)域,且勾選了“表包含標(biāo)題”--> 點(diǎn)擊“確定”
數(shù)據(jù)表就傳到 Power Query 編輯器中,并且已經(jīng)自動(dòng)清洗干凈了!
你看,我在 Power Query 中什么都沒(méi)有做,數(shù)據(jù)就自動(dòng)清!洗!干!凈!了!
4. 選中菜單欄的“主頁(yè)”-->“關(guān)閉并上載”-->“關(guān)閉并上載”
Excel 工作簿中會(huì)出現(xiàn)一個(gè)新的 Sheet2,其中存放的是 Power Query 洗過(guò)的數(shù)據(jù)。
5. 現(xiàn)在回到 Sheet1,將 F 列中 vlookup 公式的待檢索區(qū)域換成 Sheet2 的表格區(qū)域,就發(fā)現(xiàn)姓名都查找出來(lái)了,說(shuō)明“學(xué)號(hào)”列的數(shù)據(jù)都清洗干凈了。
6. 我們現(xiàn)在來(lái)試一下:如果新增不規(guī)范數(shù)據(jù),刷新以后是否會(huì)自動(dòng)清洗?
在 A15:B15 行新增數(shù)據(jù),A15 單元格的學(xué)號(hào)同樣是不規(guī)范數(shù)據(jù);在 F15 單元格用 Ctrl+D 復(fù)制樓上的公式。
因?yàn)?Sheet2 中還沒(méi)有這個(gè)新增的學(xué)號(hào),所以此時(shí)還查找不到對(duì)應(yīng)的姓名。
7. 切換到 Sheet2 --> 選中表格的任意區(qū)域 --> 右鍵單擊 --> 在彈出的菜單中選擇“刷新”。
新增的學(xué)號(hào)和姓名就出現(xiàn)在表格末尾,而且數(shù)據(jù)自動(dòng)清洗好了。
8. 再次回到 Sheet1,此時(shí)可以看到 F15 單元格成功查找到了“李四”。
聯(lián)系客服