

在我负责的一项海外API加速业务中,香港节点常年承担高并发流量代理任务。近期在接入一组东南亚用户集群后,业务层频繁反馈“TCP连接超时”、“服务响应变慢”。我登...




我们的主业务节点因电力故障导致的完全不可达,原本应当自动切换至香港备用节点的流量却依然打向已失联的主节点,直接造成了约26分钟的服务中断。这让我痛下决心,彻底重...


在一次故障复盘会上,我意识到团队部署在香港的监控系统正成为业务稳定性的瓶颈。Prometheus 的采集量在高并发业务高峰期急剧增长,直接拖垮了我们部署在物理服...

在过去几个月中,我负责优化一个部署于中国大陆与海外之间的跨境应用系统,用户频繁反馈延迟抖动大、丢包严重。链路瓶颈集中在公网BGP波动以及GFW干扰上,尤其是涉及...

