tech掛掉
tjy | 12 二月, 2007, 09:04 | 維修公告 | (718 Reads)

早上起床看tech不會動,到機房一看也無法由console登入。主機與mirro smart燈號正常,關電之後發

現mirro smart似乎認為有新的硬碟放入,在做複製資料的動作,我等十分鐘,上班去。ksf今天放假,預

計複製資料要兩個小時,到時候ksf在去開機......

Trackback URL: http://blog.fhl.net/trackback.php?id=74

LIFE歲修完畢
tjy | 07 二月, 2007, 21:13 | 維修公告 | (706 Reads)
剛剛把LIFE歲修了一下,沒有什麼大問題。除了顯示卡的電風扇好像有點卡卡的之外。
Trackback URL: http://blog.fhl.net/trackback.php?id=71

年度保養狀況報告
tjy | 24 元月, 2007, 23:22 | 維修公告 | (869 Reads)

今天晚上八點到十點半,tjy與ksf搞了兩台機器的年度保養,bbs與tech。

 

tech狀況正常。bbs開機後二十分鐘掛掉,我從家裡趕回機房,發現機器不動,重開機時一直嗶嗶叫,

 

把ram重插搞定(奇怪我們又沒動到ram),目前在硬碟重整中,應該會好。

 

為了debug我暫時把它移出機架,再觀察看看。我用編號第四號的consol線(剛發現鍵盤似乎不會動)

 

UPS的問題應該是UPS主機的問題 ,拔掉電池它無法偵測到已經拔掉電池,這個ksf會請廠商來看。

Trackback URL: http://blog.fhl.net/trackback.php?id=67

東森剛剛斷線
tjy | 23 元月, 2007, 13:24 | 維修公告 | (864 Reads)

事情越來越多啦,東森剛剛斷線,我遠端遙控小烏龜,關電再開。

目前恢復正常。希望力霸的事件不會影響東森網路。

Trackback URL: http://blog.fhl.net/trackback.php?id=66

UPS顯示電池異常
tjy | 23 元月, 2007, 09:55 | 維修公告 | (664 Reads)

UPS叫整晚,今天早上去機房看,UPS顯示電池異常。

目前切換到室電,

與KSF聯絡過,預計星期三晚上20:00歲修,並看一下UPS狀況。

Trackback URL: http://blog.fhl.net/trackback.php?id=65

更新kernel
tjy | 05 元月, 2007, 18:59 | 維修公告 | (741 Reads)

剛剛life和tech更新kernel

所以reboot

  

Trackback URL: http://blog.fhl.net/trackback.php?id=59

備份硬碟
tjy | 02 元月, 2007, 21:32 | 維修公告 | (807 Reads)

備份硬碟滿出來了,目前只能保留21天的備份資料,我請ksf多買一顆200G以上的IDE硬碟.

外接盒子部分,這兩天我會去採購 (因為要與目前的外接盒子一樣).這樣就可以備份到一個月了

Trackback URL: http://blog.fhl.net/trackback.php?id=57

tech當機與log備份
tjm | 01 元月, 2007, 10:37 | 維修公告 | (723 Reads)

剛剛我要進行log備份,發現tech當機,出現SCSI I/O error,甚至無法重新開機。經過檢測並與tjy聯繫,知道這是mirror smart(tech用的小mirror 設備)SCSI terminator旁邊的螺絲鬆開,導致terminator無法確實的與SCSI接頭接觸。於是我緊急把前一段時間更換下來的BBS RAID外殼的SCSI接頭螺絲拆下來換。但是RAID外殼的SCSI接頭螺絲比較小,只能鎖上terminator,但無法穩固固定在mirror smart的外殼上。不管如何,我已經先開機使用,系統也已經回復了,但是請各位維修人員小心,tech的mirror smart terminator不是很穩固,不要隨變動它。並且請tjy或者是誰,有空找一下螺絲來替換,這樣才會比較穩固。不過這件事情並不急,因為是機械上的不穩定,電氣信號上是沒問題的。

我已經將四台機器的log都弄下來,等一下燒錄即可。不過目前四個月備份一次,log的大小已經是4.2G,未來應該要改成三個月備份一次。為了簡化備份log的措施,我已經寫了一個簡單的 script:backup_log.sh 希望對大家有幫助

Trackback URL: http://blog.fhl.net/trackback.php?id=56

地震影響
tjy | 27 十二月, 2006, 12:30 | 維修公告 | (785 Reads)
這回恆春地震,第二次地震時高雄的震度到達五級(921時高雄只有四級),還好機房並沒有意外狀況傳出。
Trackback URL: http://blog.fhl.net/trackback.php?id=53

life tech更新kernel
tjy | 25 十二月, 2006, 09:46 | 維修公告 | (663 Reads)
剛剛重新開機,應該沒問題.
Trackback URL: http://blog.fhl.net/trackback.php?id=52

BBS RAID基座更換完成
tjm | 21 十二月, 2006, 21:26 | 維修公告 | (714 Reads)

今天下午由ksf與廠商進行RAID基座更換,短暫停機之後完成。但是由於Kernel正好更新,導致開機之後bbs程式無法正常啟動,新的kernel編譯又有點問題,於是晚上我們就持續解決這些問題,終於在剛剛全部都處理完畢。我們應該可以過一個系統穩固的聖誕節了,呵呵!

Trackback URL: http://blog.fhl.net/trackback.php?id=50

BBS RAID維修計畫:預計2006年12月20日下午短暫停機維修
tjm | 18 十二月, 2006, 21:09 | 維修公告 | (713 Reads)
根據廠商的診斷意見,RAID的系統可能因為電源不穩導致問題。我們預計週三下午更換RAID的電源模組,因此預計要停機一、兩個小時,請大家多多包涵。
Trackback URL: http://blog.fhl.net/trackback.php?id=48

BBS的RAID狀況
tjy | 18 十二月, 2006, 15:48 | 維修公告 | (725 Reads)

今天下午KSF跟廠商去upgrade了BBS與LIFE這兩台機器的firmware。原本預計還要看一下event log的,無奈BBS的RAID機器比較老一點,沒有RS232的port,所以廠商建議更新RAID的座(包含power和RS 232 port)大概要四五千元......

Trackback URL: http://blog.fhl.net/trackback.php?id=47

BBS raid出問題,2006年12月18日下午進行維修
tjm | 17 十二月, 2006, 22:01 | 維修公告 | (695 Reads)

今天BBS、Bible這台機器的RAID出了問題,連續當機兩次,原因不明,造成bible.fhl.net的資料大量損毀。因此我們已經緊急由北美站把資料救回來 ,不過springbible.fhl.net的資料也造成損毀,得要由備份中取回(我正在努力中)。

我們已經聯絡廠商,預計2006年12月18日下午進行維修,屆時可能會有不定期的停機,還請大家多多包涵。 

Trackback URL: http://blog.fhl.net/trackback.php?id=46

系統重開機測試
tjm | 07 十二月, 2006, 23:27 | 維修公告 | (803 Reads)

本週六(9/12/2006)晚上我們將進行 bbs與life機器的系統重開測試。

這是為了檢驗系統重開網路線是否會互換。如果一切正常,應該十分鐘之內就會復原。

另外如果可以買到新SCSI卡,我們也會利用tech進行 SCSI卡安裝測試,這時候tech將會有一段時間的不穩定。這將不會影響bbs與life的系統穩定度。tech如果運作正常之後,我們才會擇期對bbs與life進行SCSI卡更換作業。

另外,使用信望愛站服務的人可以考慮訂閱這個分類的RSS,我們會將維修公告發佈在這裡。 

Trackback URL: http://blog.fhl.net/trackback.php?id=42

«上一篇   1 2