背景:我們?cè)谧鰯?shù)據(jù)遷移或者拆分的時(shí)候,使用Tablespace transcation 這種解決方案時(shí),很有可能就會(huì)遇到 從庫(kù)復(fù)制出錯(cuò),報(bào): Last_SQL_Errno: 1146
那么具體錯(cuò)誤內(nèi)容可能會(huì)有如下:
Last_SQL_Error: Error 'Table 'spider.tb_city_population_rank' doesn't exist' on query. Default database: 'spider'. Query: 'alter table tb_city_population_rank discard tablespace'
Last_SQL_Error: Error 'Table 'spider.tb_city_population_rank' doesn't exist' on query. Default database: 'spider'. Query: 'alter table tb_city_population_rank import tablespace'
那么我們遇到這樣的問題的時(shí)候該如何恰當(dāng)?shù)奶幚砟??考慮如下幾點(diǎn):
1. 我們整個(gè)庫(kù)的容量有多大?
2. 業(yè)務(wù)容忍的最大延遲時(shí)間多久?
3. 我們恢復(fù)需要多久?恢復(fù)的難易程度如何?
通過考慮到以上幾點(diǎn), 我們就可以根據(jù)實(shí)際情況做出抉擇,采用什么樣的辦法盡快的恢復(fù)從庫(kù);對(duì)于這樣的問題,簡(jiǎn)單粗暴的方案就是重建從庫(kù),當(dāng)然還有別的辦法, 且聽我慢慢道來(lái):
首先我們先看看我們是如何通過Transport tablespace 遷移數(shù)據(jù)的,大概步驟如下:
1.庫(kù)A執(zhí)行: show create table xxx1; 拿到簡(jiǎn)表語(yǔ)句;
2.庫(kù)B執(zhí)行: create table xxx1; 在從庫(kù)上建立基本的表結(jié)構(gòu);
3.庫(kù)B執(zhí)行: alter table xxx1 discard tablespace; 讓mysql自己刪掉ibd文件;
4.庫(kù)A執(zhí)行: flush tables xxxx1,xxxx2 for export;把內(nèi)存的臟數(shù)據(jù)刷到磁盤,使得ibd文件數(shù)據(jù)一致;
5.庫(kù)A執(zhí)行: scp xxxx1.ibd xxx2.ibd xxxx1.cfg xxx2.cfg slave_host:/data/ 把ibd文件拷貝到從庫(kù);
6.庫(kù)B執(zhí)行: alter table xxx1 import tablespace 導(dǎo)入數(shù)據(jù)文件。
好了我們知道了整個(gè)遷移的具體步驟,那么我們就可以輕松的應(yīng)對(duì)在遷移過程中復(fù)制出錯(cuò)的問題了。
那么我們首先來(lái)看一下:
Last_SQL_Errno: 1146
Last_SQL_Error: Error 'Table 'spider.tb_city_population_rank' doesn't exist' on query. Default database: 'spider'. Query: 'alter table tb_city_population_rank discard tablespace'
其大概的意思就是我們?cè)趶膸?kù)上沒有找到 這個(gè)表的完整定義信息,觀察一下磁盤上的文件我們就明白了:
[root@GZ_NF_DB_RP_002 spider]# ls -lhrt |grep tb_city_population_rank
-rw-r----- 1 mysql mysql 8.3G Mar 31 20:03 tb_city_population_rank.ibd
果然沒有 這個(gè)表的 frm 文件, 那么怎么辦呢?由于是 slave 的sql_thread 線程報(bào)錯(cuò), 那么我們可采取取巧的辦法:
用超級(jí)用戶登錄從庫(kù),先備份一下 這個(gè)ibd 文件:[root@GZ_NF_DB_RP_002 spider]# mv tb_city_population_rank.ibd tb_city_population_rank.ibd.bak
然后拿到這個(gè)文件的表結(jié)構(gòu), 在從庫(kù)上執(zhí)行建表語(yǔ)句,這樣一樣來(lái), 我們從庫(kù)就有了 ibd frm 文件, 那么 此時(shí)我們開啟slave sql_thread,這時(shí)就會(huì)執(zhí)行時(shí)主庫(kù)傳過來(lái)的 語(yǔ)句:
alter table tb_city_population_rank discard tablespace ; 那么當(dāng)我們?cè)僖淮蔚挠^看此盤數(shù)據(jù)文件的時(shí)候,ibd 文件又不見了,此時(shí)slave 也就已經(jīng)出錯(cuò)了,其錯(cuò)誤信息如下:
Last_SQL_Errno: 1146
Last_SQL_Error: Error 'Table 'spider.tb_city_population_rank' doesn't exist' on query. Default database: 'spider'. Query: 'alter table tb_city_population_rank import tablespace'
那么我們此時(shí)需要做的就是: 把剛才mv 的文件 再 mv 回去, 也就是說:[root@GZ_NF_DB_RP_002 spider]# mv tb_city_population_rank.ibd.bak tb_city_population_rank.ibd ; 完成這個(gè)命令后我們?cè)賵?zhí)行 start slave sql_thread ; 此時(shí)這個(gè)表就正常了, 我們可以執(zhí)行select * from tb_city_population_rank limit 100; 來(lái)驗(yàn)證一下是否可讀。
那么此時(shí),我們算完整的解決了因一個(gè)表導(dǎo)致的復(fù)制出錯(cuò)的問題, 那么如果遷移了多張表(經(jīng)常是) , 那么我們就可以按照這個(gè)解決方案,一步一步的來(lái)解決復(fù)制出錯(cuò)。其大概的思路就是, 缺什么我們補(bǔ)什么,多了什么我們?nèi)サ羰裁础?/span>
聯(lián)系客服