Simple Hosting 全新資料中心上線!
在 2 月 26 號時,我們完了成從舊資料中心 FR-SD2 遷移 Simple Hosting 到新資料中心的任務。
新的資料中心內有更好的網路架構與伺服器。也就是說,新的資料中心具備更穩定的架構與系統,可以提供更高性能的託管服務。
某些客戶在這次的遷移過程中因為儲存設備的效能問題,而導致降低了他們網站的可用性。即使我們的技術團隊已經做了最大的努力,但客戶服務需求數量龐大而回應時間較久,導致了許多客戶感到沮喪。
今天我們向您報告 Simple Hosting 伺服器的遷移步驟、分析問題與報告最近的近況。
遷移計畫總結:
- 2017-10-04:成立 FR-SD3 資料中心
- 2017-11-13:開始遷移 Simple Hosting 的伺服器到 FR-SD3
- 2017-12-21:FR-SD5 資料中心開始運作,開始遷移資料到資料中心。
- 2018-01-16:FR-SD6 資料中心開始運作,開始遷移資料到資料中心。
- 2018-02-15:所有 Simple Hosting 伺服器完成遷移。
發生的問題
因為預估的數據錯誤並且缺乏詳盡的實際測試,導致在遷移過程中出現了非常大的效能問題。
更重要的是,在過去的十幾年中,因為老舊系統不斷更新、維護與佈署的紀錄並不完全,導致了我們無法預期遷移的內容。
Simple Hosting 的效能問題
Simple Hosting 發生了錯誤(回應 503)
去年 12 月,在我們大約遷移了 20% 的客戶伺服器後,一些客戶回報網站出現緩慢或是無法使用的錯誤。
某些原因是因為新的資料中心架構上的變化。FR-SD3、FR-SD5 與 FR-SD6 這些新的資料中心能夠讓我們更靈活的增加新的程式語言或是資料庫,也能開發更多新的功能。新架構是我們持續改善服務的基礎。
然而,在遷移時,新舊資料中心之間的不相容導致某些客戶發生問題。所以我們調整了新資料中心的一些配置讓它與舊的匹配。例如我們安裝了一些 PHP 程式庫,我們還要求了客戶程式的方法來配合我們無法再提供的功能(例如某些會危及安全性的功能)。
這些性能的問題導致回應緩慢或是造成 503 錯誤,因為網頁加速器無法從後端伺服器取得資料。
我們意識到這個問題的原因是因為儲存設備無法在合理的時間內完成計算。
在了解問題後,我們嘗試修正問題但是失敗了,接者,我們試圖減少伺服器與儲存設備之間的資料傳輸,以減少儲存設備的負載,並且將一些任務改由伺服器執行。
在同時,我們也發現了伺服器的核心設置會導致伺服器與網頁加速的封包遺失,我們也做了修正。因次 503 錯誤就減少了更多。
這花了我們好幾天的時候來修正並測試結果,在 12 月 28 時我們就已佈署了這些修正程式,使得機器與儲存單元之間的資料交換大幅的減少。
網站依舊緩慢
這就為什麼我們在 1 月初時,裝上效能監控工具,讓我們能更精準的追蹤 Simple Hosting 伺服器的負載。我們也能夠限制每個伺服器的讀/寫次數。
另外,從 1 月 19 日開始,我們就進行了軟體的修正程式,這些修正程式提高了客戶伺服器的效能。
我們仍然在監測伺服器的負載,並且隨時做出調整。
最後,在2月5號,我們在每個資料中心增加了更多儲存設備。使我們能更好的分配負載並且完成最後的 FR-SD2 遷移。
客戶服務回應時間過長
儘管我們已經嘗試增加客服人手來處理已知的大量客服,但仍然因為過多的客服單而導致我們無法即時處理,我們對此影響感到非常抱歉。
1、2 月份發生的幾起其他事件影響了這些數據中心的部分服務,雖然我們能夠即時做出反應,但依舊產生了大量的客服。
目前情況已受到控制
到今天為止,除了一些特殊的狀況外,其他所有客戶都已恢復正常,並且我們依舊積極的監控所有設備的資源,避免在未來新功能上線時影響到儲存設備的效能。
如果監控中心發現您的伺服器出現問題,我們可能會將它遷移到其他儲存設備上。如果發生這種情況,您的網站會出現簡短的停機時間。
客服數量目前也已經回到正常狀態,我們希望能回復到去年三月時的服務水平。感謝您的耐心與配合,請在這個過渡時期依舊選擇 Gandi。我們仍在開發一些的項目,並且會儘快推出各種新功能。
Tagged in 簡易代管