Excel數(shù)據(jù)處理的完整流程包括:數(shù)據(jù)輸入→數(shù)據(jù)存儲(chǔ)→數(shù)據(jù)加工→報(bào)表輸出。
我們使用Excel進(jìn)行數(shù)據(jù)處理的目的主要有三個(gè):
I 事物性數(shù)據(jù)記錄;
II 制作報(bào)表、圖表;
III 利用Excel強(qiáng)大的數(shù)據(jù)分析功能,進(jìn)行數(shù)據(jù)分析。
參照上述數(shù)據(jù)處理的流程和目的,我們可以將Excel表格分為基礎(chǔ)數(shù)據(jù)表、事務(wù)性明細(xì)數(shù)據(jù)表、報(bào)表三大類。
I 基礎(chǔ)數(shù)據(jù)表(事務(wù)性明細(xì)數(shù)據(jù)記錄的數(shù)據(jù)源)
基礎(chǔ)數(shù)據(jù)表是對(duì)需要記錄的事物的基本特性的描述,如商品編號(hào)、名稱、規(guī)格、單位、單價(jià)、供應(yīng)商等數(shù)據(jù)?;A(chǔ)數(shù)據(jù)表也是確保統(tǒng)計(jì)對(duì)象唯一性的編碼與名稱+規(guī)格的對(duì)照表。
II 事務(wù)性明細(xì)數(shù)據(jù)表(數(shù)據(jù)分析的數(shù)據(jù)源)
可以理解為保存基礎(chǔ)、事務(wù)性數(shù)據(jù)的倉(cāng)庫,是記錄數(shù)據(jù)的清單,是一張由行和列組成的一維表格(首行為字段名、其它行為記錄)。表格中的一列數(shù)據(jù)記錄一類信息,一行數(shù)據(jù)記錄一個(gè)數(shù)據(jù)對(duì)象的多種信息,所以數(shù)據(jù)表也可以稱為“數(shù)據(jù)庫”。每列的第一行是字段名(變量名),其余列是字段值(變量值)。
“列”在數(shù)據(jù)庫中稱為“字段”,字段名稱在數(shù)據(jù)表中不能重復(fù),每個(gè)字段只記錄同一個(gè)含義、同一類型的數(shù)據(jù)。
“行”是除去首行(標(biāo)題行)外的一行數(shù)據(jù)被稱為“一條記錄”。
III 報(bào)表
報(bào)表是呈現(xiàn)數(shù)據(jù)結(jié)果的表格,是對(duì)事務(wù)性明細(xì)數(shù)據(jù)進(jìn)行加工后形成的表格。報(bào)表不僅需要具備直觀、易用和容易理解的特點(diǎn),還需具備美觀、得體的特點(diǎn)。
常見的數(shù)據(jù)分析方式有:排序、分列匯總、篩選、應(yīng)用公式和函數(shù)、插入數(shù)據(jù)透視表等。
基礎(chǔ)數(shù)據(jù)和事務(wù)性數(shù)據(jù)的規(guī)范是數(shù)據(jù)管理中最為關(guān)鍵的環(huán)節(jié),其在很大程序上決定著報(bào)表的質(zhì)量高低以及數(shù)據(jù)分析的準(zhǔn)確性。數(shù)據(jù)表的數(shù)據(jù)存儲(chǔ)只需要將“事務(wù)”完整地記錄下來,其在設(shè)計(jì)理念上也不同于報(bào)表。
基礎(chǔ)數(shù)據(jù)和事物性明細(xì)數(shù)據(jù)要確保數(shù)據(jù)記錄和分析的規(guī)范性,需要從以下方面進(jìn)行考慮或改善:
列字段是數(shù)據(jù)排序、篩選、分類匯總、數(shù)據(jù)透視表的字段依據(jù)。
常見的不規(guī)范做法就是將表格的首行或首行在內(nèi)的區(qū)域設(shè)置為表格名稱, 所以要盡量避免讓表格名稱占據(jù)數(shù)據(jù)表的首行(用來展示數(shù)據(jù)分析結(jié)果的報(bào)表可以)。而表格標(biāo)題在Excel中可以用其它的方式來表示:用工作簿或工作表的名稱來表示,如果需要打印數(shù)據(jù)源表格,也可以在頁面設(shè)置中用表格名稱來自定義頁眉。
另外,列字段不得為空白。
首行列字段使用多行表頭和斜線表頭同樣會(huì)破壞數(shù)據(jù)關(guān)系或數(shù)據(jù)結(jié)構(gòu)。單行表頭才能表示數(shù)據(jù)記錄的列字段。
在數(shù)據(jù)表使用合并單元格會(huì)嚴(yán)重破壞數(shù)據(jù)表的數(shù)據(jù)結(jié)構(gòu)。
當(dāng)數(shù)據(jù)源中有合并單元格,常常會(huì)給數(shù)據(jù)分析帶來困擾,或直接出現(xiàn)錯(cuò)誤提示,特別是使用數(shù)據(jù)透視表時(shí)。對(duì)于數(shù)據(jù)表本身一些功能的使用也會(huì)帶來困難,如造成數(shù)據(jù)表排序、篩選、分類匯總的功能失效。
當(dāng)然,合并單元格也并不是一無是處,如果使用在呈現(xiàn)數(shù)據(jù)結(jié)果的報(bào)表或不需用作數(shù)據(jù)分析源的表格中,使用合并單元格可以讓數(shù)據(jù)顯得更加美觀、大方、簡(jiǎn)潔。
在數(shù)據(jù)表中人為插入空白列或空白行,會(huì)破壞數(shù)據(jù)區(qū)域的連續(xù)性,使數(shù)據(jù)表的排序、篩選的功能失效?;蛘咴斐蓴?shù)據(jù)透視表的數(shù)據(jù)源選擇出錯(cuò)。
在數(shù)據(jù)表中,不能用一個(gè)字段來保存多種類別數(shù)據(jù),也不能使用多個(gè)字段來保存同一屬性的數(shù)據(jù)。
如字段名為“銷售數(shù)量”的列中不能是文本類型,字段名為“日期”的列也不能是文本類型。當(dāng)然更要避免就某一列的某個(gè)單元格單獨(dú)修改為其它數(shù)據(jù)類型。
當(dāng)在單元格中的數(shù)據(jù)的首尾或中間有空格或不可見字符時(shí),會(huì)給數(shù)據(jù)分析(應(yīng)用函數(shù)或數(shù)據(jù)透視表)時(shí)帶來困擾,如同樣的數(shù)據(jù)值,但當(dāng)有的單元格的尾部有空格、有的沒有空格時(shí),會(huì)被分析為不同的字段值。
當(dāng)在單元格中使用“Alt+Enter'組合鍵進(jìn)行換行時(shí),字段值只是第一行的數(shù)據(jù)。
也就是不要對(duì)同一數(shù)值在不同區(qū)域交替使用簡(jiǎn)寫、別稱、全稱,要統(tǒng)一使用全稱、或簡(jiǎn)寫。如字段名為“部門”的列,不要時(shí)而是“人事部”,時(shí)而又是“人力資源部”或“人力部”。
在稱呼事物、應(yīng)用函數(shù)(如vlookup函數(shù))、數(shù)據(jù)透視表時(shí)必須通過對(duì)統(tǒng)計(jì)或分析的對(duì)象通過唯一的編號(hào)來避免歧義。
如在公司、學(xué)?;蛘咂渌M織中,姓名并不能確保唯一,可以使用身份證號(hào)、工號(hào)、學(xué)號(hào)等編號(hào)。在貨物管理中,也需要通過貨物編號(hào)來代表某一貨物名稱及其規(guī)格,確保一物一碼。
數(shù)據(jù)表作為數(shù)據(jù)源并不需要在數(shù)據(jù)表中一邊增加記錄,一邊進(jìn)行各種小計(jì)、合計(jì)的操作,這樣在后續(xù)的分類匯總、數(shù)據(jù)透視表操作時(shí)會(huì)出錯(cuò)。數(shù)據(jù)源表格中只需增加記錄、修改記錄就可以了。
如Excel中正確的日期數(shù)據(jù)格式類型為2017-7-31或2017/7/31,而不要采用2017.7.31或20170731等非法的日期格式。
數(shù)據(jù)字段設(shè)置的合理與否對(duì)數(shù)據(jù)分析結(jié)果很關(guān)鍵。同時(shí),要避免將字段作為行標(biāo)題(要用列標(biāo)題作為字段,首行以外的其它行只是做為字段的值作為記錄)。
如有人喜歡按月去記錄相同結(jié)構(gòu)的數(shù)據(jù),這樣在分析數(shù)據(jù)時(shí)會(huì)帶來極大不便(當(dāng)然,通過VBA可以將不同工作表中相同結(jié)構(gòu)的數(shù)據(jù)合并到一起)。很顯然進(jìn)行全年匯總、篩選、排序、遠(yuǎn)不如在一張工作表中合適。
使用外部鏈接,不但影響表格的打開速度,而且當(dāng)工作表移動(dòng)或者刪除時(shí),還容易出現(xiàn)斷鏈,不易于查找和修復(fù)。
一般對(duì)少量特殊的單元格內(nèi)容可以使用批注進(jìn)行特別說明,但是如果在大范圍內(nèi)需要對(duì)單元格說明時(shí)遠(yuǎn)不如設(shè)置“備注”字段,因?yàn)榱凶侄蜗啾扰碚f,更方便數(shù)據(jù)分析。
“25+50”的單元格是無法進(jìn)行數(shù)據(jù)的數(shù)值類型的運(yùn)算的。當(dāng)想讓數(shù)據(jù)內(nèi)涵更豐富、更有追溯性時(shí)可以寫成'=25+50'的形式。
多個(gè)主題宜規(guī)劃多個(gè)工作表。
Excel適合處理小規(guī)模數(shù)據(jù)(大規(guī)模數(shù)據(jù)宜使用數(shù)據(jù)庫),Word適合用來處理文字,而PPT則側(cè)重于演示匯報(bào)數(shù)據(jù)。
因?yàn)檫M(jìn)行多步驟處理時(shí),一旦中間某個(gè)環(huán)節(jié)出現(xiàn)失誤,無法將數(shù)據(jù)恢復(fù)到最初的狀態(tài)。
因?yàn)榇罅渴褂盟鼈儠?huì)明顯降低表格的計(jì)算速度。
如不使用Round函數(shù),會(huì)出現(xiàn)四舍五入、浮點(diǎn)運(yùn)算導(dǎo)致的誤差。
問題項(xiàng) | 解決方法 |
每一列中數(shù)據(jù)格式是否一致 | 用IS類函數(shù)檢測(cè)數(shù)據(jù)類型,采取刷新、分列、type函數(shù)等方法 |
是否存在重復(fù)的數(shù)據(jù) | 刪除、標(biāo)記重復(fù)項(xiàng) |
數(shù)據(jù)中是否包含多余的空格或者不可見字符 | 批量替換、利用記事本或Word處理、Trim、Clean、Numbervalue等函數(shù)去掉不可見字符、定位條件刪除 |
單元格中是否存在換行符 | 查找替換對(duì)話框的查找內(nèi)容中按Alt+10組合鍵,批量替換換行符,或使用Clean()函數(shù) |
是否存在數(shù)據(jù)長(zhǎng)度不一致 | 用len函數(shù)檢查數(shù)據(jù)長(zhǎng)度 |
文本型數(shù)據(jù)是否存在大小不一致的問題 | 利用Upper、Lower、Proper函數(shù)轉(zhuǎn)換大小寫 |
是否存在不應(yīng)是空白狀態(tài)的空白單元格 | 利用Isblank函數(shù)等檢查是否真的為空白 |
表格中無法插入行或列 | 刪除空白列或者空白列、取消合并單元格調(diào)整后再插入 |
報(bào)表不同于作為數(shù)據(jù)源的數(shù)據(jù)表,在報(bào)表中可以使用合并單元格、多表頭、斜線進(jìn)行美化。但報(bào)表的設(shè)計(jì)應(yīng)力求結(jié)構(gòu)合理、層次清晰、重點(diǎn)突出、排版美觀、方便閱讀和打印。
聯(lián)系客服