It profiles the routing frequency (how many tokens each expert handles) on a small calibration set, then selects the top-k most frequently routed experts per layer for LoRA fine-tuning. 它首先在一个小型校准集上分析每个专家的路由频率(处理了多少token),然后选择每层中路由频率最高的前k个专家进行LoRA微调。 小規模なキャリブレーションセットで各エキスパートのルーティング頻度(処理したトークン数)をプロファイリングし、層ごとにルーティング頻度が最も高い上位k個のエキスパートをLoRAファインチューニングの対象として選択します。