早上起床看tech不會動,到機房一看也無法由console登入。主機與mirro smart燈號正常,關電之後發
現mirro smart似乎認為有新的硬碟放入,在做複製資料的動作,我等十分鐘,上班去。ksf今天放假,預
計複製資料要兩個小時,到時候ksf在去開機......
Trackback URL: http://blog.fhl.net/trackback.php?id=74
今天晚上八點到十點半,tjy與ksf搞了兩台機器的年度保養,bbs與tech。
tech狀況正常。bbs開機後二十分鐘掛掉,我從家裡趕回機房,發現機器不動,重開機時一直嗶嗶叫,
把ram重插搞定(奇怪我們又沒動到ram),目前在硬碟重整中,應該會好。
為了debug我暫時把它移出機架,再觀察看看。我用編號第四號的consol線(剛發現鍵盤似乎不會動)
UPS的問題應該是UPS主機的問題 ,拔掉電池它無法偵測到已經拔掉電池,這個ksf會請廠商來看。
Trackback URL: http://blog.fhl.net/trackback.php?id=67
剛剛我要進行log備份,發現tech當機,出現SCSI I/O error,甚至無法重新開機。經過檢測並與tjy聯繫,知道這是mirror smart(tech用的小mirror 設備)SCSI terminator旁邊的螺絲鬆開,導致terminator無法確實的與SCSI接頭接觸。於是我緊急把前一段時間更換下來的BBS RAID外殼的SCSI接頭螺絲拆下來換。但是RAID外殼的SCSI接頭螺絲比較小,只能鎖上terminator,但無法穩固固定在mirror smart的外殼上。不管如何,我已經先開機使用,系統也已經回復了,但是請各位維修人員小心,tech的mirror smart terminator不是很穩固,不要隨變動它。並且請tjy或者是誰,有空找一下螺絲來替換,這樣才會比較穩固。不過這件事情並不急,因為是機械上的不穩定,電氣信號上是沒問題的。
我已經將四台機器的log都弄下來,等一下燒錄即可。不過目前四個月備份一次,log的大小已經是4.2G,未來應該要改成三個月備份一次。為了簡化備份log的措施,我已經寫了一個簡單的 script:backup_log.sh 希望對大家有幫助
Trackback URL: http://blog.fhl.net/trackback.php?id=56
今天BBS、Bible這台機器的RAID出了問題,連續當機兩次,原因不明,造成bible.fhl.net的資料大量損毀。因此我們已經緊急由北美站把資料救回來 ,不過springbible.fhl.net的資料也造成損毀,得要由備份中取回(我正在努力中)。
我們已經聯絡廠商,預計2006年12月18日下午進行維修,屆時可能會有不定期的停機,還請大家多多包涵。
Trackback URL: http://blog.fhl.net/trackback.php?id=46
本週六(9/12/2006)晚上我們將進行 bbs與life機器的系統重開測試。
這是為了檢驗系統重開網路線是否會互換。如果一切正常,應該十分鐘之內就會復原。
另外如果可以買到新SCSI卡,我們也會利用tech進行 SCSI卡安裝測試,這時候tech將會有一段時間的不穩定。這將不會影響bbs與life的系統穩定度。tech如果運作正常之後,我們才會擇期對bbs與life進行SCSI卡更換作業。
另外,使用信望愛站服務的人可以考慮訂閱這個分類的RSS,我們會將維修公告發佈在這裡。
Trackback URL: http://blog.fhl.net/trackback.php?id=42
| « | 十一月 2008 | » | ||||
|---|---|---|---|---|---|---|
| 一 | 二 | 三 | 四 | 五 | 六 | 日 |
| 1 | 2 | |||||
| 3 | 4 | 5 | 6 | 7 | 8 | 9 |
| 10 | 11 | 12 | 13 | 14 | 15 | 16 |
| 17 | 18 | 19 | 20 | 21 | 22 | 23 |
| 24 | 25 | 26 | 27 | 28 | 29 | 30 |