月份彙整: 2006 年 11 月

採購新的備份硬碟

最近我們發現原先拿來備份用的60G 2.5吋硬碟已經不夠用了,需要考慮更大容量的備份設備。我們考慮再三,發現2.5吋的硬碟有一段時間沒有降價了,所以我們還是犧牲一下自己的方便性,改用3.5吋的硬碟配合USB 2.0外接盒。

3.5吋的硬碟外接盒一定要外接電源,無法直接使用USB的電源驅動,而且體積比較大。不過目前200G的3.5吋硬碟也不到五千元台幣,算起來實在很划算。所以我們就決定改用這個解決方案了。 閱讀全文 採購新的備份硬碟

備援觀念的引進與備份解決方案

以往我們只著重在資料備份,期待系統出問題之後,能夠盡快的復原。隨著網路資源的增加,我們更往前走了一步,引進了備援的觀念,希望在單一硬體或線路出問題時,系統還可以繼續運作。

基於這個備援的理念,我們在台北也成立了機房,每個機房並配置有兩條對外線路。對單一機房而言,透過routing table的設定(這個需要用到policy route的技術)與DNS的調整,可以在單一線路回報失誤(透過簡訊)時,短時間內就將所有的服務全部改由另一條線路進出。當然,這樣會造成反應速度降 低,但總比什麼都沒有來得好(如果真的是對外網路斷線,修復常常是需要一天左右的時間)。

對於南北兩機房而言,平日我們就透過rsync一類的程式將資料備份到兩邊,然後必要的時候就透過DNS的指向來讓使用者看到另一個機房的資料。當然,這 部分其實也牽涉到DNS的組態問題,我們目前還沒有完全建置完成(DNS自動fail over部分),不過我們將會盡快完成這部分的設定。未來,我們也希望多幾個備援的機房,而且最後在台灣之外,這樣才能確保資料的安全無虞。

這幾年來我們發現磁帶設備,其實並沒有如想像中的穩固耐用。我手邊的兩台磁帶機都已經壽終正寢,而壽終正寢前都出現過幾次磁頭髒了卻無法清潔,只好送廠維 修的狀況。再者,磁帶機的容量相對於信望愛站的容量,實在是太小了,速度也太慢了,所以我們改用USB 2.0配合外接式2.5吋硬碟來備份。

相對於磁帶價格,一個2.5吋硬碟的單價還是很高,所以我們不可能用一個硬碟只備份一份資料。再加上硬碟的速度遠比磁帶快,於是我們引進了增量備份 (incremental backup)的觀念,平日只備份變動的資訊,週日才備份整個的資料。這樣我們用兩個60G的 2.5吋硬碟可以備份兩個月的資料。

為什麼用2.5吋的硬碟呢?主要是希望執行備份的人可以輕鬆的攜帶,安裝也會比較簡易一些。如果用3.5吋的硬碟,那就必須外接電源,雖然價格比較便宜,但是就會浪費執行備份的人的時間。我們目前是每週更換一次備份硬碟,並將離線的備份硬碟放在距離機房有相當距離的地方。

使用USB 2.0的設備的確是讓我們擁有快速的備份與備份取回的能力,不過其穩定性似乎還沒有達到一定的水準。我們必須精心搭配連接線、外接盒才能得到穩固的備份品 質。不過除了這些偶爾的小問題之外,整體而言用硬碟備份還算是一個不錯的解決方案,我們應該會持續使用一段時間。

順便把一些失敗的經驗跟大家報告一下:我們用過DVD燒錄設備,但是Linux似乎沒有辦法穩定的處理DVD燒錄設備,甚至造成系統當機。弄到最後只好靠 技術人員手工將備份資料down load到windows系統中燒錄,這樣簡直就是一種折磨。再加上DVD燒錄片的容量並不是很大(4.7G),所以很快的我們就放棄這個解決方案。

我自己在學校的備份,是使用3.5吋的USB 2.0硬碟外接盒,不過Linux似乎會挑設備。某些硬碟配合外接盒就是不能在Linux上穩定的使用(在windows上倒是可以穩定的使用),有些機 器則是根本無法在Linux上使用硬碟外接盒,所以看起來Linux似乎也還有一些相容性的問題必須要解決。相信這些問題,未來都會被解決,但是目前仍然 是一個困擾就是。 閱讀全文 備援觀念的引進與備份解決方案

硬體策略

其實,「便宜、強大、穩定」一直是我們的硬體策略,不過離開學生時代越遠,我們越瞭解「時間」也是一個很重要的成本,越懂得不要去計較那三、五百塊錢,而換得更快速的問題解決方案,以節省技術人員的時間並降低系統當機時間。

不過,因為信望愛站的技術組中有一位硬體的DIY高手,所以我們主機的組裝、維修與整理還是可以自己來,不過如果缺乏這樣的DIY高手,我們可能就會改用現成Server硬體,而不再自己拼裝了。

至於硬體的品牌,我們倒是不怎麼挑剔。除了主機要考慮散熱問題外,其他的設備多半相當穩定可靠,我們都是購買市場上熱賣的「中上」等級的產品來使用,並不追求名牌。我剛剛去看了一下舊文章發現我們好多硬體都已經用了三、四年,卻還工作正常,所以算起來這個硬體策略算是成功的。

講到硬體設備的維修,其實最討厭的就是風扇了,每每兩年一到,系統的風扇就會出現雜音、甚至停止轉動。我們裡面的DIY高手教了我們一個訣竅:在安裝新硬 體或新風扇之前,先把風扇的商標標籤取下,將軸心添加點黃油,然後這個風扇的壽命就會延長很多。我們利用歲修的時候,把信望愛南站內所有的風扇(包括 UPS的)都換新並且加黃油,目前就一切運作正常,或許兩年後我們又可以來檢驗看看風扇是否壽命延長了。

另外,由於目前的系統速度越來越快,我們也發現常常不穩定的來源居然是「線」。前一陣子我們就被SCSI的外接排線搞死了,系統三天兩頭當機,最後換了高 檔的排線,ㄟ!就穩定下來了。我想未來我們使用的各種線材,一定要用高檔貨,不然為了這點小錢,讓系統處於不穩定的狀況,實在是得不償失。

舊文章提到我們用華碩的板子來測試系統是否更為穩固,結果答案是否定的。時間一到,還是漸漸不穩定了。也許好廠商的板子會壽命會持續久一點,不過我們還是 感覺不到有很明顯的差距就是。未來,我們應該還是會買好一點的主機板,不過我們也不會期待名牌的板子可以讓我們的系統長治久安就是。現在信望愛站的主機板 是雜牌軍,因為有位曾在主機板製造廠工作的網友奉獻給我們一塊主機板,我們自己為了應急也去買了板子,所以就亂了套了。其實也無妨,反正能穩定的用就好 了。

最近為了備份,我們引進了USB 2.0的外接式硬碟,USB 2.0速度頗快,對硬體設備也成了新的挑戰。我們的USB 2.0備份外接盒壞了不少次,其間因為線路品質問題或者沒有插好也曾經造成系統不穩。雖然我們覺得USB 2.0還是目前備份的最佳選擇,不過這種剛出來的高速I/O設備還是需要多注意其穩定性的。

說起來,Intel的網路卡是我們的硬體設備中最長壽的,到現在大概五、六年了還沒壞掉,呵呵!UPS也還不錯,除了電池與電風扇更換過之外,主體倒是沒 有損壞過。對於UPS的停電偵測,我們最後採取了一個低級的解決方案:「用無線AP不接UPS測試市電是否停止供應」。其實用任何一個具有IP的設備來測 試都可以,只是我們機房正好需要無線網路,就順便使用無線AP來當UPS停電測試設備。只要寫個script,定期去測試無線AP的IP是否會通即可知道 有沒有停電。

會用這種低級的方法,是因為目前的UPS並沒有什麼統一的協定。不管用什麼解決方案都必須搭配每個不同廠牌的UPS的不同協定,實在是太過麻煩了。說起來 我們也不需要監測UPS的電容量或電壓一類的細節資訊,只需要知道何時停電,然後停電四小時之後要自動關機,四小時之內電來了就自動停止關機,這種需求根 本用不到太精細的監測數據。

另外,我們也把簡訊通報整合進系統之中,UPS斷電或者網路斷線,系統都會自動以簡訊通報技術人員。簡訊系統是個很麻煩的東西,跟UPS一樣,各家有各家的協定,還好我們只要鎖定一家,寫完了就用那家的簡訊就是。

最後,我們以往都使用多個硬碟的外接式RAID,跑RAID 5來當我們的主要儲存解決方案。可是硬碟技術的進步真的太快了,一開始我們使用SCSI硬碟的RAID,後來改用IDE硬碟的RAID(就節省了大約一半 的經費)。現在,一個IDE硬碟容量就到達 400 G,根本就超越過去整個RAID的容量。再加上目前頻寬還是整個系統中主要的瓶頸,所以我們就勇於引進兩個IDE硬碟的外接式SCSI Mirror RAID。跑RAID 1(mirror模式)來當我們的主要儲存解決方案,這樣價格立刻降為SCSI硬碟 RAID的十分之一。還用外接式,是希望我們可以快速的抽換主機接線,不用IDE介面(雖然內部硬碟用IDE硬碟)是因為我們的系統中還跑BBS,需要反 應速度快一點的解決方案。想到我們過去推動RAID專案,籌錢籌得苦哈哈,現在輕鬆就可以擁有大容量的安全儲存專案,真的是難以想像的一件事。快速的調整 硬體策略,真的是節省經費的重要關鍵。 閱讀全文 硬體策略

關注的改變

隨著技術的進步、工作的推展與人力的增加,信望愛站技術組主要關注的重點已經由使用哪一種CPU,使用哪一牌的主機板,哪一款的硬碟….等單一機器的 最佳化問題,轉移到整體系統規劃的問題。我們開始考慮:怎樣降低系統關機時間,怎樣降低整體營運成本,怎樣建立資料與服務的備援。

我們很早就放棄256K的傳統專線,改用ADSL與VDSL線路,並且持續注意最新廣域網路技術的發展。因為我們發現頻寬費用是我們營運最大的成本,所以 我們要放更多的心力在這方面。近來,台灣的網路環境變化很快,光纖到家、無線寬頻網路等技術都很可能在很短的時間內讓信望愛站的頻寬提升很多或讓頻寬價格 降低很多。因此用最快的時間做正確的決策,就會為信望愛站省下大量的經費,這方面可不能隨意輕忽過去喔!

由於我們的使用者日益增加,停機時造成的影響也大增,像過去那樣動輒停機一天維修的狀況已經不能被接受。所以我們目前採取南北雙機房、每機房雙專線的備援 策略,當系統遭遇問題時,就切換到另一條專線甚至另一個機房來服務。怎樣有效的增加備援能力,提升錯誤的偵測與維修速度,也變成我們關注的重點。最近,我 們甚至開發了自動偵測系統,定時偵測系統錯誤,並透過簡訊回報給管理者。

硬體與作業系統方面,我們還是以PC Server與Fedora(因為RedHat 已經不出免費的作業系統了,所以我們改用近似的Fedora)為準。目前南部的主伺服器是以 Athlon(tm) 64 Processor 3200+ 為CPU,記憶體都是 2G,工作用伺服器都是使用外接式的SCSI RAID(採用IDE硬碟),大小各是1T、1T、200M。

簡單的說,科技的進步總是帶來效能的提升或者價格的降低。我們隨時保持機警的心態來面對科技的變遷,並且勇於調整以往訂定的政策與規則,這樣,就能找到又便宜又強大的解決方案。 閱讀全文 關注的改變

簡單的歷史

  1994 年 12 月中,我們用為了燒錄 on-line bible 購買的 Segate 1G SCSI 硬碟、Aha-1542 SCSI卡 、32MB RAM,借用新竹校園福音團契的 486 DX2-66 主機,開始了信望愛站的網路福音工作。

  1995 年 1 月,信望愛 BBS 成立;1998 年,信望愛移出學術網路,架設屬於自己的專線; 1999 年,信望愛全球資訊網上線。多年來,在缺乏堂會支持、缺乏經費的情況下,技術、 人才與文章,成為信望愛發展的主軸,而在這些豐富恩典之下的,乃是一顆為服事上帝、將 福音帶給華文同胞所存的合一的奉獻心志。

  信望愛的技術小組起源於交大博士班,當年帶領小組的Jer-Min Tsai,今天仍舊看守著信望 愛,不過信望愛技術小組負責人已經順利傳承給tjy了;信望愛的網路技術小組認為,將上帝所賜的網路技術之 智慧來服事上帝的國度,是其負擔與使命。

  以下的文章是信望愛的技術經驗談,希望這些文章,能幫助華文的教會機構,在網路 福音工作上站穩腳步,成為推動網路福音工作的良好基礎。過去,這裡的文章使用標準的 HTML靜態網頁格式,結果導致我們技術不斷進步,但是經驗卻沒有在這裡公開傳承。2004 年7月25日晚上,我們正式把信望愛站的佈告欄引進來,希望透過Weblog的模式,能更有效的把 我們的經驗傳達出去,不過這個嘗試是失敗的,因為我們並沒有真的寫了太多經驗在這裡。現在已經是2006年11月13日了,我們再一次引進blog,這次希望能夠真的有用,呵呵!

 

閱讀全文 簡單的歷史