1. 1. 準(zhǔn)備工作
(1) 兩臺(tái)主機(jī)(P650)A,B節(jié)點(diǎn)名分別為(NODEA,NODEB)后面集群配置要用到,兩臺(tái)主機(jī)之間可以正常PING通,并且每臺(tái)主機(jī)有兩個(gè)不同網(wǎng)絡(luò)的物理網(wǎng)卡(boot1,stby1或boot2,stby2)
(2) 每臺(tái)主機(jī)的/etc/hosts文件一致,并配置或添加需要的IP和對應(yīng)主機(jī)
舉例說明:比如兩臺(tái)主機(jī)分別為A,B 對應(yīng)IP地址主機(jī)名為:
主機(jī) IP地址 主機(jī)名
A 192.168.100.240(boot1) p520 (p1)
10.10.10.5(stby1)
B 192.168.100.241(boot2) p520(p2)
10.10.10.6(stby2)
修改HOSTS文件如下:
通過VI命令,修改hosts文件(以主機(jī)A為例,B主機(jī)與A主機(jī)HOSTS文件相同)
vi /etc/hosts
127.0.0.1 loopback localhost
192.168.100.240 boot1 p1
10.10.10.5 stby1 p1 (可以不填寫)
192.168.100.241 boot2 p2
10.10.10.6 stby2 p2
192.168.128.2 server(用來與程序的客戶端通信之用,主機(jī)當(dāng)機(jī)后,該IP就會(huì)從主機(jī)飄逸到另外一臺(tái)備用機(jī)器B,原理就是通過該HOSTS文件來解析的)
注:以上服務(wù)IP有的時(shí)候可以是兩個(gè);另外一臺(tái)主機(jī)也同A主機(jī)一樣,HOSTS文件配置相同。
(3) 每臺(tái)主機(jī)/.rhosts文件一致,并使其權(quán)限為600
VI .rhosts
P1
Boot1
Stby1
Server
P2
Boot2
Stby2
server
主機(jī)A:chmod 600 ..rhosts(修改權(quán)限)
B:chmod 600 .rhosts
(4) 兩臺(tái)主機(jī)通過串口做心跳,并確保已通過tty的測試
配置或添加TTY(串口設(shè)備)--兩臺(tái)主機(jī)都必須做相同的配置工作,添加串口
Smitty tty
選擇“Add a TTY”
TTY
Move cursor to desired item and press Enter.
List All Defined TTYs
Add a TTY
Move a TTY to Another Port
Change / Show Characteristics of a TTY
Remove a TTY
Configure a Defined TTY
Generate Error Report
Trace a TTY
Type or select values in entry fields.
Press Enter AFTER making all desired changes.
[TOP] [Entry Fields]
TTY type tty
TTY interface rs232
Description Asynchronous Terminal
Parent adapter sa2
* PORT number [0] +
Enable LOGIN disable +
BAUD rate [9600]
PARITY [none] +
BITS per character [8] +
Number of STOP BITS [1] +
TIME before advancing to next port setting [0] +
TERMINAL type [dumb]
FLOW CONTROL to be used [xon]
心跳線測試
Lsdev –Cc tty 查看新增串口,會(huì)有如下顯示:
tty0 Available 00-00-S3-00 Asynchronous Terminal
序號(hào)
主機(jī)
內(nèi)容
1.
主機(jī)A
stty </dev/tty0
2.
主機(jī)B
stty </dev/tty0
這時(shí)在兩臺(tái)主機(jī)的命令行下會(huì)有內(nèi)容的顯示,否則,tty配置失敗。示例如下:
speed 9600 baud; -parity hupcl
eol2 = ^?
brkint -inpck -istrip icrnl -ixany ixoff onlcr tab3
echo echoe echok
3.
主機(jī)A
cat /etc/hosts > /dev/tty0
4.
主機(jī)B
cat < /dev/tty0
這時(shí)在主機(jī)2的命令行下有主機(jī)1的/etc/hosts文件的內(nèi)容,否則,tty配置失敗。
完成串口測試
注:同上,B機(jī)器也增加串口,并配置和測試。
(5)安裝HACMP時(shí),需要補(bǔ)丁包,AIX操作系統(tǒng)需要的補(bǔ)丁包:
bos.adt.* Bos.net.* bos.rte.* bos.data bos.clvm.enh rsct.compat.* rsct.core.*( rsct.compat.basic.hacmp 2.4.2.0 rsct.compat.clients.hacmp 2.4.2.0 rsct.core.sec 2.4.2.1 rsct.compat.basic.hacmp 2.3.6.0 rsct.compat.clients.hacmp 2.3.6.0 rsct.core.sec 2.3.6.1 rsct.core.rmc 2.3.6. rsct.core.rmc 2.4.2.1 這幾個(gè)包主要用于通信)
HACMP軟件補(bǔ)丁包:
cluster.es
HACMP/ES Basic software
cluster.es.cfs
HACMP/ES Cluster File System Support
Cluster.es.cspoc
HACMP/ES CSPOC
Cluster.es.plugins
HACMP/ES plug-in software
Cluster.license
HACMP Electronic License
cluster.man.en_US.es
以上補(bǔ)丁在安裝HACMP之前必須安裝,否則可能會(huì)影響雙機(jī)的啟動(dòng)。
注:hacmp卸載命令:smit/smitty install_remove
通過F7來選擇要?jiǎng)h除的CLUSTER包。
(6)配置HACMP (以下我們以主機(jī)A作為主機(jī),B作為備用機(jī))
(cluster name-cluster node-discover 發(fā)現(xiàn)-HACMP networks<這里需要配置串口心跳網(wǎng)絡(luò)和IP網(wǎng)絡(luò)>-添加HACMP IP地址或hacmp communication interfaces/deves 接口和串口設(shè)備-hacmp persistent NODE ip label/address 添加現(xiàn)有節(jié)點(diǎn)的IP及標(biāo)識(shí),地址。)HACMP的配置都是在一臺(tái)主機(jī)上做配置,作完之后,只需要同步另外一臺(tái)主機(jī)即可。節(jié)點(diǎn)名兩臺(tái)主機(jī)要分別添加。
詳細(xì)配置
<1>配置CLUSTER NAME 及節(jié)點(diǎn);分別將NODE加入CLUSTER集群中,然后在發(fā)現(xiàn)一下。
Communication path to node 這一步選擇通過發(fā)現(xiàn)方式來選擇node對應(yīng)的主機(jī)(boot1/boot2),分兩次來完成,不同的node來對應(yīng)不同的主機(jī)
<2>給HACMP添加IP網(wǎng)絡(luò)
Smit/smitty hacmp—Extended Topology Configuration-->Configure HACMP Networks->Add a Network to the HACMP cluster
選擇ETHERNET,添加IP網(wǎng)絡(luò)(該信息都是自動(dòng)獲取無需修改任何參數(shù)設(shè)置,只需要修改最后一項(xiàng),選擇YES OR NO)
其中Enable IP Takeover via IP Aliases項(xiàng),如果SVC IP地址與boot1地址在同一網(wǎng)段,則選擇“NO”,反之選擇“YES
<3>添加非IP網(wǎng)絡(luò),即串口心跳網(wǎng)絡(luò)
Extended Configuration>Extended Topology Configuration>
Configure HACMP Networks>Add a Network to the HACMP Cluster
選擇RS232,添加串口心跳。(自動(dòng)獲取網(wǎng)絡(luò)名和類型)
<4>添加IP地址(HACMP IP地址和串口地址)即網(wǎng)絡(luò)接口和,心跳或磁盤設(shè)備
Extended Configuratin>Extended Topology Configuration>
Configure HACMP Communication interfaces/Devices(HACMP通信接口或串口設(shè)備配置)
>Add Communication interfaces/Devices
添加串口設(shè)備IP地址
Extended Configuratin>Extended Topology Configuration>
Configure HACMP Communication interfaces/Devices(HACMP通信接口或串口設(shè)備配置)
>Add Communication interfaces/Devices
Device Name 自己自定義名稱。如:hisser1_tty0
Device path 一般都是:/dev/tty0
Node name 選擇主機(jī)A作為NODE A,如圖就是hisser1
<5>添加對外IP 也就是服務(wù)IP即:server(添加資源組之前必須先添加服務(wù)IP,否則資源組就無法和SERVER IP綁定在一起)
Extended Configuration>Extended Resource Configuration>
HACMP Extended Resources Configuration>Configure HACMP server IP
Labels /Addresses >Add a Service IP Label/Address
<6>添加應(yīng)用腳本,可先用空腳本來替代,單獨(dú)測試HACMP
Extended Configuration > Extended Resource Configuration >
HACMP Extended Resources Configuration > Configure HACMP Applications >
Configure HACMP Application Servers > Add an Application Server
<7>添加資源組,首先需要添加的是共享磁盤VG和FS
前期工作,在添加資源組之前(添加共享VG的時(shí)候,首先用命令:cfgmgr 連接DISK磁盤和小型機(jī)設(shè)備,查看用命令:lsdev –Cc disk,看到DISK上的相關(guān)信息后,然后創(chuàng)建VG,PV就是DISK上的所有PV,完成之后創(chuàng)建一個(gè)目錄,然后在創(chuàng)建一個(gè)文件系統(tǒng),掛載文件系統(tǒng)
,然后在主機(jī)A上先停止掉剛才所創(chuàng)建的卷組(varyoffvg 卷組名),在另外一臺(tái)機(jī)器上smit vg—import vg 即可,在同步配置)
在同步的時(shí)候,一定要停止HACMP,發(fā)現(xiàn)共享磁盤的PV后,然后在某一臺(tái)主機(jī)上(A),創(chuàng)建VG,SMIT MKVG(SKYNET)----創(chuàng)建邏輯卷組(SKYNETLV)-----在根目錄下創(chuàng)建一個(gè)/SKY---創(chuàng)建文件系統(tǒng)---VARYOFFVG SKYNET-----在B機(jī)器上IMPORT導(dǎo)入卷組,此時(shí)PHYSICAL VOLUME NAME 要手工輸入即可(輸入實(shí)際的磁盤名稱,即磁盤柜)----同步(其中一個(gè)機(jī)器要停止卷組一個(gè)激活)---添加資源組SMIT進(jìn)去—自定義組名-然后回車。
注:
Extended Configuration>Extended Resource Configuration>
HACMP Extended Resource Group Configuration>
Add a Resource Group (添加一個(gè)資源組)
“Participating Nodes (Default Node Priority)”項(xiàng),可以用F4或ESC+F4發(fā)現(xiàn)兩個(gè)節(jié)點(diǎn)NODE A,NODE B,用F7來選擇兩個(gè)NODE
注意:step1:先創(chuàng)建serice IP step2:創(chuàng)建資源組 step3:修改資源組 綁定Service IP 及相關(guān)IP和VG等
<8>同步兩臺(tái)主機(jī)的HACMP配置
Extended Configuration > Extended Verification and Synchronization
“Automatically correct errors found during verification?”項(xiàng),選擇“YES”
接管測試
用(#smit clstart)啟動(dòng) HACMP。
用(#tail -f /tmp/hacmp.out)跟蹤輸出。
用(#netstat -in)查看 en0、en1的狀態(tài),看是否已從 boot 地址切換成 service 地址。
用(#lsvg -o) 查看是否datavg 已經(jīng)激活。
正常啟動(dòng)后,用(#smit clstop)通過 takeover 方式 down掉一個(gè)node,查看是否 IP 被另一個(gè)node接管,進(jìn)去之后選擇最后一項(xiàng)模式MOVE RESOURCE GROUP)通過 takeover 方式 down
掉一個(gè)node,查看是否 IP 被另一個(gè)node接管。(切換過來之后,另外一臺(tái)備用AIX里,NETSTAT –IN 就出現(xiàn)了一條服務(wù)IP,切換之前只是存在于主AIX上)
手工拔插網(wǎng)線,驗(yàn)證HACMP的接管
注:建議使用AIX HACMP自身攜帶的測試工具進(jìn)行接管測試,smit hamcp進(jìn)去找到測試工具測試即可看到所有相關(guān)測試結(jié)果。