transformer_lens.model_bridge.supported_architectures.qwen2 module¶

Qwen2 architecture adapter.

class transformer_lens.model_bridge.supported_architectures.qwen2.Qwen2ArchitectureAdapter(cfg: Any)¶

Architecture adapter for Qwen2 models.

Optional Parameters (may not exist in state_dict):¶

Qwen2 models do NOT have biases on any linear layers:

Weight processing must handle these missing biases gracefully using ProcessWeights._safe_get_tensor() or by checking for None values.

setup_component_testing(hf_model: Any, bridge_model: Any = None) → None¶

Set up rotary embedding references for Qwen2 component testing.

Qwen2 uses RoPE (Rotary Position Embeddings). We set the rotary_emb reference on all attention bridge instances for component testing.

Parameters:

hf_model – The HuggingFace Qwen2 model instance
bridge_model – The TransformerBridge model (if available, set rotary_emb on actual instances)