想喺自己部機跑開源大語言模型?Qwen3 係阿里巴巴開源嘅旗艦模型,支持 128K 上下文、多語言、超強推理能力。呢篇教你兩種部署方式:Ollama 30 秒起服務,或者用 vLLM 榨乾 GPU 效能。