Alibaba QwenactiveOpen Source

Qwen3.5-2B

qwen3.5-2b

Compact model for edge and mobile with native multimodal support.

Context Window

262.1K

tokens

Max Output

8.2K

tokens

Input Price

—

per 1M tokens

Output Price

—

per 1M tokens

Details

Familyqwen3.5

Parameters2B

Training Cutoff2025-12-01

ReleasedMarch 1, 2026

Capabilities

VisionStreamingCodeMultimodal

Documentation

Quick Access

curl pikaainews.com/api/models/qwen-qwen3-5-2b

npx pika-models info qwen-qwen3-5-2b

Get API Access

Official

DashScope (Alibaba)

Official Qwen API via Alibaba Cloud.

Third-Party Providers & Aggregators

Cerebras

Wafer-scale inference. 1000+ tokens/sec for select models.

DeepInfra

Lowest per-token rates for open-source models.

Fireworks AI

Fastest inference engine. Multimodal support, HIPAA/SOC2.

Groq

Ultra-fast LPU inference. Best latency for real-time apps.

OpenRouter

500+ models, one API key. Pay-per-token, no minimums.

SiliconFlow

China-optimized inference. Strong Qwen/DeepSeek support.

Together AI

Fast open-source model inference. Sub-100ms latency.

Other qwen3.5 models

Qwen

Qwen3.5-0.8B

qwen3.5-0.8b

262.1K ctx

Qwen

Qwen3.5-4B

qwen3.5-4b

262.1K ctx

Qwen

Qwen3.5-9B

qwen3.5-9b

262.1K ctx

Qwen

Qwen3.5-27B

qwen3.5-27b

262.1K ctx

Qwen

Qwen3.5-122B-A10B

qwen3.5-122b-a10b

262.1K ctx

Qwen

Qwen3.5-35B-A3B

qwen3.5-35b-a3b

262.1K ctx

Qwen

Qwen3.5-397B-A17B

qwen3.5-397b-a17b

256K ctx$0.18/1M

Qwen

Qwen3.5-Plus

qwen3.5-plus

1M ctx$0.50/1M