it-swarm-vi.tech

Người tạo bản ghi OR Phát biểu thành văn bản

Tôi nghe một podcast hàng ngày dài khoảng 4 giờ. Tôi nghĩ rằng nó sẽ là một dự án tuyệt vời nếu tôi có thể đi kèm với một số cách để tạo ra bản sao của nó tự động. Có phần mềm nào sẽ "nghe" mp3 và tạo văn bản về những gì họ đang nói không?

Tôi không quan tâm lắm đến việc phân biệt ai đang nói vì tôi nghĩ điều đó sẽ đòi hỏi quá nhiều. Có 4 người chính nói và những người khác ít thường xuyên hơn.

3
AndyMcKenna

Các bước:

  1. Tải xuống Express Scribe trình phát và sao chép miễn phí. [.__.]
    1. Khi ứng dụng được cài đặt, bạn sẽ tìm thấy một tệp chính tả ví dụ đã được tải. Điều này sẽ cung cấp cho bạn cơ hội để chơi xung quanh với các điều khiển và tùy chọn để thiết lập ứng dụng phù hợp với nhu cầu của bạn.
    2. Từ giao diện chính, nhấp vào nút Cài đặt.
    3. Express Scribe cho phép bạn thay đổi hoặc thiết lập khá nhiều tham số bao gồm Tua lại và Tốc độ chuyển tiếp nhanh, Phím nóng hệ thống (để điều khiển ứng dụng mà không cần sử dụng chuột), thiết lập Điều khiển bàn đạp chân (nếu bạn có), Tự động tải các tệp từ thư mục LAN hoặc Máy chủ FTP, lựa chọn loại tệp để cho phép (hơn 20 được hỗ trợ) và thiết lập Công cụ nhận dạng giọng nói.
    4. Khi bạn đã thiết lập các tùy chọn của mình, bây giờ bạn có thể tải tệp âm thanh đầu tiên của mình. Tùy thuộc vào nơi bạn nhận được từ bạn, bạn có thể nhấp vào Tải (nó sẽ mở hộp thoại cho phép bạn duyệt tìm tệp trên PC), Tải ngay (nếu bạn đã thiết lập kết nối LAN hoặc FTP) hoặc Dock (nếu bạn phải ghi âm chính tả kỹ thuật số hoặc băng cassette với bạn).
    5. Chọn tệp âm thanh trong cửa sổ giao diện chính và nhấp vào nút Phát để bắt đầu. Nếu cần làm chậm hoặc tăng tốc độ phát lại âm thanh bằng cách sử dụng điều khiển tốc độ ở góc dưới cùng bên phải. Trên điều khiển này, bạn cũng có thể điều chỉnh âm lượng phát lại.
    6. Nếu bạn muốn Express Scibe nổi hơn ứng dụng xử lý Word của bạn, bạn có thể chọn Scribe Mini từ thanh công cụ giao diện chính. Như tên cho thấy tùy chọn này cung cấp một phiên bản thu nhỏ của ứng dụng.
    7. Khi bạn đã hoàn tất việc sao chép các tệp âm thanh của mình, bạn có thể đánh dấu chúng là "Xong" (xóa tệp khỏi danh sách của bạn) hoặc "Công văn" (trả lại và gửi email cho người gửi ban đầu cùng với tệp đính kèm trext của bạn và xóa tệp âm thanh khỏi danh sách của bạn .

Lời khuyên

  • Hãy dành chút thời gian để khám phá tất cả các tùy chọn của ứng dụng.
  • Nếu bạn nhận được tệp âm thanh chất lượng kém, bạn có thể chọn Quy trình âm thanh đặc biệt từ menu Tệp để thử và dọn sạch.
  • Khi Express Scribe nhận được tệp âm thanh, nó được lưu trữ trong C:\Documents and Settings\username\Application Data\NCH Swift Sound\scribe\Current
  • Nếu bạn đã đánh dấu một tệp âm thanh là "Xong" nhưng muốn lấy lại nó, bạn có thể khôi phục các tệp cũ từ menu Tệp.
3
ToreTrygg

Một điều bạn có thể thử (mặc dù không phải trên cơ sở hàng ngày) là tải âm thanh dưới dạng video lên Youtube, sau đó yêu cầu YouTube phiên âm video, cung cấp cho bạn chú thích bằng tiếng Anh ... có thể mất tới 24 giờ để YouTube thực hiện việc này, tuy nhiên ... Tệp chú thích thậm chí có thể tải xuống và bạn có thể tự chỉnh sửa chúng, vì vậy bạn có thể sao chép và dán văn bản vào bất cứ nơi nào bạn muốn ...

1
studiohack

Đã thử wave thành văn bản ? Đó chỉ là cửa sổ và có bản dùng thử miễn phí có giới hạn.

Có bao nhiêu tiếng nói trong các tập tin này? Có phải tất cả các tập tin có chứa bài phát biểu từ một giọng nói (có thể đào tạo)? Chất lượng âm thanh là gì? Nếu câu trả lời cho những câu hỏi này không phải là: 'Chỉ tôi', 'Có' và 'Chất lượng CD', @Snark là đúng, bạn cần thực hiện việc này một cách cơ bản. Có được một chương trình nhận dạng giọng nói tốt, dành thời gian đào tạo nó và phát lại các tệp của bạn trong khi bạn cố gắng nói những gì họ nói.

Mong đợi khoảng 90% - 95% phiên âm thành công, nghe có vẻ tuyệt vời cho đến khi bạn nhận ra rằng có nghĩa là 1 hoặc 2 trong số 20 từ là sai.

Các yếu tố khác có thể ảnh hưởng đến độ chính xác:

  1. Rất nhiều từ viết tắt trong bài phát biểu của bạn
  2. câu không hoàn chỉnh - lời nói thành văn bản có xu hướng hoạt động tốt hơn nhiều với các manh mối bối cảnh mà nó nhận được từ các câu hoàn chỉnh.
0
DaveParillo

tôi đang sử dụng Dragon NaturalSpeaking để sao chép. phần mềm tuyệt vời!

nhưng nó không miễn phí, Amazon cung cấp thực tế phiên bản 10 với giá 45 đô la , nếu bạn nhìn xung quanh bạn sẽ nhận được DNS9 thậm chí rẻ hơn.

0
Molly7244

Vấn đề với Dragon Natatural Talking trong một bối cảnh như thế này là bạn thực sự sẽ không thể trải qua quá trình đào tạo, nơi nó học cách diễn giải chính xác bài phát biểu. Nó không dành cho loại sử dụng này. Có lẽ NSA có một số phần mềm để thực hiện loại việc này. :)

0
user33795

Bạn cần một phần mềm nhận dạng giọng nói .

Một số chương trình tồn tại cho điều đó, nhưng tôi không biết bất kỳ chương trình nào có thể thực hiện chuyển đổi hàng loạt. Tôi khá chắc chắn rằng đó là một tính năng của ít nhất một trong số họ. Lưu ý hầu hết trong số họ là xa giá rẻ.

0
Snark