Glass Image Background

Hướng dẫn sử dụng OpenAI TTS để tạo giọng đọc đa ngôn ngữ từ văn bản!


OpenAI TTS là ứng dụng Text to Speech của OpenAI.


Hiện tại đang có 6 giọng (4 nam, 2 nữ) và có thể đọc 55 ngôn ngữ bao gồm Tiếng Việt.

Chất lượng voice và độ nhấn nhá của OpenAI TTS khá tốt để có thể làm content về podcast, kể truyện, đọc truyện,...



Hiện chưa có web chính thức từ nhà phát triển mà chỉ dùng phổ biến qua API (google colab, python..) hoặc trên giao diện playground của OpenAI.

image.png

Link thông tin chính thức: Text to speech - OpenAI API



Chi Phí

Chi phí sử dụng thì là khá rẻ, tầm 3$ cho 200k kí tự (Tầm hơn 200 phút audio) với model thường và gấp đôi (6$) cho model HD.

image.png

Link thông tin chi phí: Pricing | OpenAI



Hướng dẫn nạp & lấy API key:

Hình ảnh

(Nạp min 5$ - max 96$ mỗi lần)

Hình ảnh



Hướng dẫn sử dụng ngay trên Playground của OpenAI:

Hình ảnh



Hướng dẫn sử dụng trên Google Colab:

  • Link: OpenAI TTS Colab
  • Run code từng ô theo thứ tự
  • Chọn Voice - Model - Nhập text - tính cost - Nhập API Key - chạy code
Hình ảnhHình ảnhHình ảnh



Hướng dẫn dùng OpenAI TTS trên Gradio UI:

  • B1: Git link hoặc tải repo về máy: https://github.com/arham-kk/openai-tts
  • B2: Giải nén và mở CMD trong folder đã giải nén
  • B3: Set up môi trường, nhập lệnh pip install -r requirements.txt
  • B4: Update openai trong trường hợp bị lỗi - nhập lệnh pip install --upgrade openai
  • B5: Chạy giao diện Gradio - nhập lệnh python app.py và copy link webui
Hình ảnhHình ảnhHình ảnhHình ảnhHình ảnhHình ảnh


2

This post is part of a community

F5 AI Team

On Facebook

841 Members

Free

Hosted by

F5 AI Team

đây bản đồ cho hành trình học AI của người mới bắt đầu.
Built with
en