在早期的设计中,还包含了通过远端存储的API拉取LogSegments元数据的章节,(译者:这应该是曾经讨论的某次中间版本)它在HDFS接入时,看起来一切运行的很好。依赖远端存储来维护元数据的问题之一是:整个分层存储是需要强一致性的,它不仅影响元数据,还影响Segments日志段数据本身。其次也要考虑远端存储中存储元数据的耗时,在S3中,frequent LIST APIs导致了巨大的开销
Lx = Local log start offset Lz = Local log end offset Ly = Last stable offset(LSO) Ry = Remote log end offset Rx = Remote log start offset Lz >= Ly >= Lx and Ly >= Ry >= Rx