最近季度,笔者用了一些时间尝试在实际生产系统 (分布式存储领域) 中引入大模型 LLM 和 Agent 技术,以探索大模型在日常开发、运维、以及系统问题分析的能力边界。投入使用也一段时间了,写下一篇小品文和大家学习交流。
最近季度,笔者用了一些时间尝试在实际生产系统 (分布式存储领域) 中引入大模型 LLM 和 Agent 技术,以探索大模型在日常开发、运维、以及系统问题分析的能力边界。投入使用也一段时间了,写下一篇小品文和大家学习交流。
RocksDB 可靠性和高性能是众所周知的。将其部署在分布式文件系统也是一种趋势,体现了存算分离的思路。本文先讨论官方的分布式改造论文 Disaggregating RocksDB: A Production Experience,随后记录一些自己的想法。
在扩展到分布式之前,我们先来弄明白单机 IO 的手段。同步/异步/Poller/线程池,眼花缭乱的名词,是否在故弄玄虚?
项目使用 tikv 作为分布式 KV 引擎构建了元数据服务。随着业务增长,P99 延迟急剧升高。在调优 tikv server 收获甚微后,我们把目光转回 tikv-client,结合源码和线上 metrics 分析可能的瓶颈和优化手段。
限流器是服务治理的重要一环。但常见的讨论集中于对 频率 的限制。本文结合笔者最近的需求,分析 Go 官方限流器 time/rate 的实现原理,结合实践对 带宽/流量限制 可能遇到的问题进行讨论。
近一个月从底层翻阅了 Apache Traffic Server 的磁盘缓存引擎,俞发觉得精妙。另外自己在开发的 web 代理缓存 hitori 中,也确实需要一款大容量磁盘缓存引擎。便实现了一个磁盘缓存引擎库,名字叫做 bakemono。
上节中,我们了解了自治系统AS和BGP协议。这次我们将使用MyTraceroute工具,亲手追踪我们发出数据包的路径。并介绍了一篇文献,如果我们要“感知全球的网络拓扑信息”,建设一个动态的分布式全球网络链路监测系统,可以做哪些操作。
上节中,我们认识了Internet物理上的拓扑。但网络是如何找到较优的线路进行连接呢?今天我们将在逻辑组成上进行探究,包括自治系统AS和BGP协议。
作为用户或开发者,我们仿佛已经对《畅通的互联网连接》这一事实深信不疑。但是,互联网世界究竟是怎么组织起来的呢? 本文为系列第1篇文章,涉及互联网网络物理组成上的不同层级。