aTrain

使用教學

功能與特色

  1. 採用 faster-whisper 實作 OpenAI Whisper 模型,提供頂級的辨識品質,同時在本地電腦上保有較快的處理速度。
  2. 具備說話者辨識(Speaker Detection)功能,可分析每段文字屬於哪位說話者。
  3. 完全離線運作,不需要網路連線,經驗證不會上傳資料至任何伺服器。
  4. 支援 Windows 10 與 11,可透過 Microsoft Store 直接安裝。
  5. 完全免費、開源,原始碼公開於 GitHub。
  6. 支援多語言,包含中文。
    • 經測試,中文語音會轉換為簡體中文,需透過簡轉繁工具轉換為繁體中文。

注意事項

  • 支援 NVIDIA GPU 加速,但需要額外安裝 CUDA Toolkit,一般使用者建議直接使用 CPU 模式即可。
  • 中文辨識品質建議選擇較大的模型(large),準確度明顯優於 small / medium。
  • 輸出的文字仍需人工校對,專有名詞、人名、課程術語容易出現錯誤。
  • 第一次使用時需要下載模型檔案,檔案較大,建議在網路穩定的環境下完成初次設定。