Kuwa v0.4.0 已包含由 仨宇股份有限公司 貢獻的 Qualcomm NPU 支援,可大幅提升AI模型的生成速度,同時降低功耗。由於 Kuwa 無法在所有系統上可靠的偵測 NPU 是否可用,因此此功能預設未啟用。請按照以下步驟啟用 Qualcomm NPU 支援:
-
更新 Kuwa: 確保您正在執行最新版本的 Kuwa。點擊開始選單中的「Upgrade Kuwa」圖示。
-
存取 Maintenance Tool: 從開始選單開啟「Maintenance Tool」以存取 Kuwa 的內部工具程式。
-
安裝 QNN 相依套件: 在 Maintenance Tool 的控制台(輸入
cmd
開啟它)中,執行命令build.bat qnn
。這將安裝 Qualcomm AI Engine Direct SDK 等相依套件。 -
啟動 Kuwa: 重新啟動 Kuwa。您現在將看到幾個新的聊天機器人,其名稱後面附加了「@NPU」,表示支援 NPU。
-
第一次聊天和模型下載: 與其中一個啟用 NPU 的機器人開始對話。模型將在第一次互動時下載,這將導致初始回應時間略長。
-
驗證 NPU 使用情況: 初始下載後,您將觀察到模型正在 NPU 上運行,提供明顯更快的生成速度。
訊息
若要獲得具有較強效能且預先優化過的使用體驗,請考慮使用仨宇提供的 Qualcomm AI Hackathon Turu 版本。