Gandi Mail 中断的主要问题

03.16.2018  - 作者  在 域名

在3月12号週一(巴黎时间),我们的 Gandi Mail 服务发生了重大的网路问题,导致我们的客户有好几个小时都无法使用电子邮件。目前此问题已经解决,服务已经正常运作。但因为我们的邮件伺服器目前暂时被列入了黑名单,除了发送到雅虎的邮件之外,其他所堆积的邮件都已完成发送。

造成此事情的原因与我们将旧的资料中心 FR-SD2 迁移到新的资料中心有关。在週日(巴黎时间)时,我们将 Gandi Mail 服务平台从 FR-SD2 迁移出去。

时间轴(巴黎时间):

週一早上,巴黎的资料中心通常网路流量都很高,我们注意到了近期所使用的网路架构中有一个问题:频宽容量不足以负荷週一早上的流量。

结果,网路达到满载,并且影响到其他服务也不稳定。我们的团队首先进行 Gandi Mail 服务的网路流量隔离动作,这样可以停止它对其他服务的影响。

週一中午,Gandi Mail 服务的网路就已经完全隔离独立,但是服务仍然不稳定。

同时,我们的工程师立即重新设计了 Gandi Mail 平台的网路架构,以提高频宽,在週一下午的时候我们就打算佈署新的网路架构。

为了加快时间,我们决定在下午时放宽电子邮件监控工具的规则。该工具能协助我们检查客户的电子邮件不受殭尸网路的入侵。

在放宽规则后,不幸的事发生了,殭尸网路开始透过我们的主机发送大量的垃圾邮件。但在发送数万封电子邮件之前,其他服务商就将我们的伺服器列为黑名单,特别是雅虎与微软(Hotmail 与 Outlook)。

在这段时间内要寄出的电子邮件都被积压在我们的邮件伫列。

还好有这些邮件伫列,在邮件没有递送完成之前都被保留在伫列中。例如,如果你要向某人发送电子邮件,但是对方的邮件伺服器暂时无法提供服务,您的信件不会遗失,会放在伫列中等待下次发送。每次发送失败的话,邮件在伫列中等待的时间就会增加(即间隔发送的时间会越来越长)。

由于这个原因,邮件伺服器修復后,较旧的邮件会比新的邮件更慢才送达。

所以在週二早上时,还有一些週一早上要寄出的邮件并未寄出。

目前的状况:

  • Gandi Mail 服务现在已经稳定了;我们从我们其他的资料中心测试邮件的收发已经没有问题,包含了有附件的电子邮件。
  • 需要寄送到雅虎(Yahoo)的电子邮件目前仍然没有发送,我们的团队正在与雅虎积极联络,让邮件能畅通。
  • 週一时需要寄出的信件已全数寄出。
如果您仍然有电子邮件的收发问题,请使用 https://help.gandi.net 我们的客户服务团队联络,,请描述您的问题是收信或是发送、使用的软体(Thunderbird 或是 WebMail)、寄件人与收件人位址。

 

主要是因为我们要关闭 FR-SD2 这个旧的资料中心。我们已经计画迁移资料中心数个月了,技术团队花很多的时间研究如何迁移 Simple Hosting 、云端、Gandi 部落格与 Gandi 邮件服务平台。

迁移将于本週完成,FR-SD2 关闭后,我们将会检讨本次迁移事件并从中获取经验,在未来才能提供好的服务和强化我们的内部流程。

必须强调的是,迁移是必须要执行的,我们需要将 FR-SD2 旧的资料中心迁移到我们新的架构上,我们才能发展更多服务给我们的客户。我们新的数据中心 FR-SD3、FR-SD4 与 FR-SD5 将提供您更弹性的网路架构、新的服务并更好的体验。

当然我们了解这次的事件对我们的服务品质造成了严重的影响,造成您的任何不便,我们深表歉意。请放心,Gandi 的所有团队都会很努力与您一起度过这个过渡期,并提供给您最需要的协助。