在你使用的每个完美应用程序背后,都有一整套的架构、测试、监控和安全措施。今天,让我们来看看一个生产就绪应用程序的非常高层次的架构。
CI/CD 管道
我们的第一个关键领域是持续集成和持续部署——CI/CD 管道。
这确保我们的代码从存储库经过一系列测试和管道检查,无需任何手动干预就进入生产服务器。
它配置了像 Jenkins 或 GitHub Actions 这样的平台,用于自动化我们的部署流程。
与服务器的交互
一旦我们的应用程序投入生产,它就必须处理大量用户请求。这由我们的负载均衡器和反向代理(如 Nginx)管理。
它们确保用户请求均匀分布在多个服务器上,即使在流量激增期间也能保持平稳的用户体验。
骨干:数据存储和外部 API
我们的服务器还需要存储数据。为此,我们还有一个不运行在相同生产服务器上的外部存储服务器。相反,它通过网络连接。
我们的服务器可能还与其他服务器通信。而且我们可以有多个这样的服务,不仅仅是一个。
监控、日志和警报:默默的保护者
为了确保一切运行顺利,我们有日志记录和监控系统,对每个微观交互保持敏锐的关注,存储日志并分析数据。
将日志存储在外部服务上是一种标准做法,通常不在我们的主要生产服务器上。
对于后端,像 PM2 这样的工具可以用于日志记录和监控。对于前端,像 Sentry 这样的平台可以用于实时捕获和报告错误。
警报服务
当事情不按计划进行时,也就是我们的日志系统检测到失败的请求或异常时?
首先,它通知我们的警报服务。之后,推送通知被发送,以保持用户的知情。从一般的“出现问题了”到具体的“支付失败”,有效的沟通确保用户不会被置于黑暗中,培养了信任和可靠性。
现代做法是将这些警报直接集成到我们常用的平台中,如 Slack。
想象一下一个专门的 Slack 频道,警报在问题出现的瞬间弹出。这使开发人员几乎可以立即采取行动,在问题升级之前解决根本原因。
在生产环境中调试
之后,开发人员必须调试问题。
日志查看:首先,需要识别问题。我们之前提到的那些日志?它们是我们首选的工具。开发人员通过它们筛选,寻找可能指向问题源的模式或异常。
在安全环境中复制:黄金法则是——永远不要直接在生产环境中调试。相反,开发人员在‘staging’或‘test’环境中重新创建问题。这确保用户不会受到调试过程的影响。
开发人员使用工具来查看运行中的应用程序并开始调试。
热修复:一旦错误修复,就会推出‘hotfix’。这是一个快速的、临时的修复,旨在让事情再次运行起来。这就像在更永久的解决方案可以实施之前的一个补丁。