UPS叫整晚,今天早上去機房看,UPS顯示電池異常。
目前切換到室電,
與KSF聯絡過,預計星期三晚上20:00歲修,並看一下UPS狀況。
備份硬碟滿出來了,目前只能保留21天的備份資料,我請ksf多買一顆200G以上的IDE硬碟.
外接盒子部分,這兩天我會去採購 (因為要與目前的外接盒子一樣).這樣就可以備份到一個月了
剛剛我要進行log備份,發現tech當機,出現SCSI I/O error,甚至無法重新開機。經過檢測並與tjy聯繫,知道這是mirror smart(tech用的小mirror 設備)SCSI terminator旁邊的螺絲鬆開,導致terminator無法確實的與SCSI接頭接觸。於是我緊急把前一段時間更換下來的BBS RAID外殼的SCSI接頭螺絲拆下來換。但是RAID外殼的SCSI接頭螺絲比較小,只能鎖上terminator,但無法穩固固定在mirror smart的外殼上。不管如何,我已經先開機使用,系統也已經回復了,但是請各位維修人員小心,tech的mirror smart terminator不是很穩固,不要隨變動它。並且請tjy或者是誰,有空找一下螺絲來替換,這樣才會比較穩固。不過這件事情並不急,因為是機械上的不穩定,電氣信號上是沒問題的。
我已經將四台機器的log都弄下來,等一下燒錄即可。不過目前四個月備份一次,log的大小已經是4.2G,未來應該要改成三個月備份一次。為了簡化備份log的措施,我已經寫了一個簡單的 script:backup_log.sh 希望對大家有幫助
這回恆春地震,第二次地震時高雄的震度到達五級(921時高雄只有四級),還好機房並沒有意外狀況傳出。 閱讀全文 地震影響
剛剛重新開機,應該沒問題. 閱讀全文 life tech更新kernel
今天下午由ksf與廠商進行RAID基座更換,短暫停機之後完成。但是由於Kernel正好更新,導致開機之後bbs程式無法正常啟動,新的kernel編譯又有點問題,於是晚上我們就持續解決這些問題,終於在剛剛全部都處理完畢。我們應該可以過一個系統穩固的聖誕節了,呵呵!
根據廠商的診斷意見,RAID的系統可能因為電源不穩導致問題。我們預計週三下午更換RAID的電源模組,因此預計要停機一、兩個小時,請大家多多包涵。 閱讀全文 BBS RAID維修計畫:預計2006年12月20日下午短暫停機維修
今天下午KSF跟廠商去upgrade了BBS與LIFE這兩台機器的firmware。原本預計還要看一下event log的,無奈BBS的RAID機器比較老一點,沒有RS232的port,所以廠商建議更新RAID的座(包含power和RS 232 port)大概要四五千元……
今天BBS、Bible這台機器的RAID出了問題,連續當機兩次,原因不明,造成bible.fhl.net的資料大量損毀。因此我們已經緊急由北美站把資料救回來 ,不過springbible.fhl.net的資料也造成損毀,得要由備份中取回(我正在努力中)。
我們已經聯絡廠商,預計2006年12月18日下午進行維修,屆時可能會有不定期的停機,還請大家多多包涵。