Chuyển giọng nói thành văn bản

Chuyển đổi file âm thanh thành văn bản với độ chính xác cao và tính năng nâng cao

Nguồn âm thanh

URL phải công khai hoặc pre-signed. Kích thước tối đa: 2GB

Cài đặt chuyển đổi

Model ổn định cho hầu hết các trường hợp
Cao hơn = đa dạng hơn, thấp hơn = xác định hơn

Định dạng xuất bổ sung

Kết quả chuyển đổi

Chuyển đổi âm thanh để xem kết quả

💡 Mẹo

  • Chất lượng âm thanh: Sử dụng âm thanh rõ ràng, ít tiếng ồn
  • Định dạng hỗ trợ: MP3, WAV, M4A, FLAC, MP4, MOV
  • Kích thước: File tối đa 1GB, Cloud storage tối đa 2GB
  • Phân tách người nói: Hoạt động tốt nhất với 2-5 người nói
  • Ngôn ngữ: Chọn ngôn ngữ cụ thể để cải thiện độ chính xác
  • Temperature: 0 = xác định, 2 = đa dạng

Thông tin mô hình

Hiện tại: Scribe v1 (Standard)

Model ổn định cho hầu hết các trường hợp

Hỗ trợ 25+ ngôn ngữ
Phân tách người nói (tối đa 32)
Dấu thời gian theo từ/ký tự
Xuất nhiều định dạng