3 篇文章含有標籤「v0.3.2」

檢視所有標籤

Cool-Whisper教學

2024年7月18日 · 閱讀時間約 3 分鐘

Yung-Hsiang Hu

Contributor

台大曾亮軒同學和 NTU COOL 團隊於昨晚(7/17)釋出適合辨識台灣口音中文或是中英交雜音檔的 Cool-Whisper 模型，
Kuwa 透過簡單修改 Modelfile 即可直接套用。

訊息

2024/07/18 12:00 左右該模型因為隱私安全疑慮，暫時下架，
想使用這個模型的朋友可以持續關注該模型的 HuggingFace Hub，
待重新上架即可使用。

建置步驟

參考Whisper 建置教學啟動 Whisper executor
- Cool-Whisper 模型大小約為 1.5 GB，執行時最多會佔用約 10 GB 的 VRAM

RAG 自訂參數教學

2024年7月5日 · 閱讀時間約 2 分鐘

Yung-Hsiang Hu

Contributor

Kuwa 的 RAG 應用 (DocQA/WebQA/DatabaseQA/SearchQA) 從 v0.3.1 版本起支援透過 Bot 的 modelfile 自訂進階參數，可以讓單個 Executor 虛擬化成多個 RAG 應用，詳細參數說明及範例如下。

參數說明

以下參數內容為 v0.3.1 RAG應用的預設值。

所有 RAG 的共用參數

PARAMETER retriever_embedding_model "thenlper/gte-base-zh" # embedding model名稱
PARAMETER retriever_mmr_fetch_k 12 # MMR前取幾個chunk
PARAMETER retriever_mmr_k 6 # MMR取幾個chunk
PARAMETER retriever_chunk_size 512 # 每個chunk的長度，以字元為單位 (DatabaseQA不受限制)
PARAMETER retriever_chunk_overlap 128 # chunk間的交疊長度，以字元為單位 (DatabaseQA不受限制)
PARAMETER generator_model None # 指定哪個模型回答，None表示自動選擇
PARAMETER generator_limit 3072 # 整個prompt的長度限制，以字元為單位
PARAMETER display_hide_ref False # 不顯示參考資料

DocQA, WebQA, SearchQA 專用參數

PARAMETER crawler_user_agent "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/117.0.0.0 Safari/537.36" # 爬蟲的UA字串

SearchQA 專用參數

PARAMETER search_advanced_params "" # 進階搜尋參數 (SearchQA專用)
PARAMETER search_num_url 3 # 取用幾個搜尋結果[1~10] (SearchQA專用)

DatabaseQA專用參數

PARAMETER retriever_database None # Executor本機的向量資料庫路徑

使用範例

假如要建立一個 DatabaseQA 知識庫並指定模型回答，可以建立一個 Bot，
基底模型選擇 DocQA，並填入以下 Modelfile。

PARAMETER generator_model "model_access_code" # 指定哪個模型回答，None表示自動選擇
PARAMETER generator_limit 3072 # 整個prompt的長度限制，以字元為單位
PARAMETER retriever_database "/path/to/local/database/on/executor" # Executor本機的向量資料庫路徑

自訂 Tool 教學

2024年7月5日 · 閱讀時間約 1 分鐘

Yung-Hsiang Hu

Contributor

Kuwa 設計上支援串接各種非 LLM 的 Tool，最簡單的 Tool 可以參考 src/executor/debug.py，
以下是內容說明。

import os
import sys
import asyncio
import logging
import json
sys.path.append(os.path.dirname(os.path.abspath(__file__)))

from kuwa.executor import LLMExecutor, Modelfile

logger = logging.getLogger(__name__)

class DebugExecutor(LLMExecutor):
    def __init__(self):
        super().__init__()

    def extend_arguments(self, parser):
        """
        Override this method to add custom command-line arguments.
        """
        parser.add_argument('--delay', type=float, default=0.02, help='Inter-token delay')

    def setup(self):
        self.stop = False

    async def llm_compute(self, history: list[dict], modelfile:Modelfile):
        """
        Responsible for handling the requests, the input is chat history (in
        OpenAI format) and parsed Modelfile (you can refer to
        `genai-os/src/executor/src/kuwa/executor/modelfile.py`), it will return an
        Asynchronous Generators to represent the output stream.
        """
        try:
            self.stop = False
            for i in "".join([i['content'] for i in history]).strip():
                yield i
                if self.stop:
                    self.stop = False
                    break
                await asyncio.sleep(modelfile.parameters.get("llm_delay", self.args.delay))
        except Exception as e:
            logger.exception("Error occurs during generation.")
            yield str(e)
        finally:
            logger.debug("finished")

    async def abort(self):
        """
        This method is invoked when the user presses the interrupt generation button.
        """
        self.stop = True
        logger.debug("aborted")
        return "Aborted"

if __name__ == "__main__":
    executor = DebugExecutor()
    executor.run()

建置步驟​

參數說明​

所有 RAG 的共用參數​

DocQA, WebQA, SearchQA 專用參數​

SearchQA 專用參數​

DatabaseQA專用參數​

使用範例​

建置步驟

參數說明

所有 RAG 的共用參數

DocQA, WebQA, SearchQA 專用參數

SearchQA 專用參數

DatabaseQA專用參數

使用範例