it-swarm-vi.tech

Giải pháp chuyển văn bản thành giọng nói tốt cho Windows

Tôi đang chạy Windows 7 và tôi biết nó có khả năng đọc văn bản cho tôi trong các ứng dụng của mình, nhưng tôi đang tìm kiếm một tiện ích tốt để lưu các đoạn văn bản dưới dạng tệp wav hoặc mp3. Nó có thể đã được tích hợp vào HĐH, nhưng được ngụy trang khéo léo. Tôi biết tôi có thể viết chương trình để gọi API, đây là bước tiếp theo của tôi nếu chưa có giải pháp tốt.

Tôi thực sự thích chất lượng của hệ thống AT & T , nhưng nó có một số hạn chế khá lớn khi sử dụng MP3 được sản xuất. Tôi muốn sử dụng chúng trong podcast của tôi.

Dựa trên web cũng được, miễn là nó dễ dàng tạo ra một Wav, MP3 hoặc Creative Commons khá không bị cản trở (Tên miền công cộng hoặc Creative Commons). Đương nhiên tôi thích mã nguồn mở hoặc miễn phí hơn thương mại, nhưng đó không phải là một yêu cầu.

9
Jim McKeeth

Tôi đã thử đặc biệt , lễ hộiMaryTTS . Tất cả đều tạo ra tiếng nói dễ hiểu cho hầu hết các phần nhưng chúng không tự nhiên lắm. Ngay cả khi tải xuống bằng giọng nói bổ sung cho các hệ thống này (ví dụ: Mbrola, CMU Bắc Cực), giọng nói cũng không tuyệt lắm.

IVONA giọng nói hay nhất tôi từng nghe từ trước đến nay. Họ cung cấp cho bạn bản demo miễn phí 30 ngày là đủ nếu bạn có một nhiệm vụ một lần phải làm. Sau đó, họ giống như $ 45/giọng nói. Amazon chỉ mua công ty để bạn biết nó vững chắc ( http://www.ivona.com/us/news/amazoncom-announces-acquisition-of-ivona-software/ ).

Chúng hoạt động với giao diện SAPI của Microsoft, có nghĩa là các giọng nói có sẵn cho bất kỳ chương trình nào hỗ trợ điều đó (ví dụ: Adobe Reader). Tôi đã sử dụng chúng với Text To Wav chương trình Rất hay để chuyển đổi hàng loạt tệp văn bản thành tệp sóng.

Chỉnh sửa

Trên thực tế chỉ cần đọc lại câu hỏi của bạn và tôi nghĩ rằng để sử dụng phi cá nhân (ví dụ: podcast), giá có thể cao hơn rất nhiều cho IVONA. Trong trường hợp đó tôi muốn nói hãy kiểm tra MaryTTS.

4
User

eSpeak là nguồn mở và miễn phí và cung cấp mọi thứ bạn cần.

[.___.] Nó có thể chạy như một chương trình dòng lệnh để nói văn bản từ một tệp hoặc từ stdin. [.__.] Phiên bản thư viện dùng chung cũng có sẵn. [.__.] [.___] , có các đặc điểm có thể được thay đổi. [.___.] * Có thể tạo đầu ra giọng nói dưới dạng tệp WAV. [.___ . [.__.] * Kích thước nhỏ gọn. Chương trình và dữ liệu của nó, bao gồm nhiều ngôn ngữ, [.__.] Tổng cộng khoảng 1 Mbyte. [.___ công cụ tổng hợp. [.__.] * Tiềm năng cho các ngôn ngữ khác. Một số được bao gồm trong các giai đoạn khác nhau [.__.] Của tiến trình. Sự giúp đỡ từ người bản ngữ cho những ngôn ngữ này hoặc các ngôn ngữ khác là [.__.] Rất hoan nghênh. [.__.] * Các công cụ phát triển có sẵn để sản xuất và điều chỉnh dữ liệu âm vị. [.__.
6
John T