亚马逊已经确定了一个员工的错误导致了周三的一些亚马逊网络服务(AWS)S3系统的出现。
中断影响了流行的网站和服务,包括Slack,Medium,Quora和各种其他网站,而Amazon本身由于Amazon S3的依赖性而无法通过AWS服务健康仪表板报告服务状态。
亚马逊表示,当一个团队成员不正确输入命令时,亚马逊正在调试计费系统问题,该命令只删除少量服务器。相反,“更大的服务器被删除而不是预期的。”
由于近年来S3系统的“大规模增长”,重新启动和验证系统的过程比预期更长。S3最终开始在最初的错误后超过四小时运行。
该公司表示,即使删除能力是其运营的关键,员工使用的工具也导致太多的容量删除了太快。
“我们已修改此工具更慢地删除容量,并添加安全措施,以防止在将任何子系统中删除的容量删除,因此在一个语句中表示。
亚马逊还表示,它优先考虑了确保S3子系统能够在未来更快地恢复的工作。