A lightweight model predicting layer-wise expert activation and load. Its role is 'proactive scheduling': identifying bottlenecks to guide elastic scaling and placement before loads arrive, avoiding runtime blocking. 该轻量级模型实时预测输入序列各层的专家激活及负载。核心作用是“前瞻性调度”:提前识别潜在瓶颈,指导资源管理器在负载到达前进行弹性扩缩容和优化放置,避免运行时阻塞。 各層のエキスパート活性化と負荷を予測する軽量モデルです。役割は「プロアクティブなスケジューリング」で、負荷到着前にスケーリングや配置を最適化し、実行時のブロッキングを防ぎます。