Phần mềm phát biểu thành văn bản tốt nhất: Kết quả chính tả

Phần mềm nhận dạng giọng nói đang trở nên tốt hơn mọi lúc. Mặc dù nổi tiếng là không hoạt động tốt, các công cụ hiện đại có thể thực hiện tốt công việc dịch giọng nói của bạn thành văn bản để đọc chính tả và nhập lệnh. Chúng tôi đã xem xét một số tùy chọn để mang đến cho bạn cái nhìn tổng quan về phần mềm chuyển lời nói thành văn bản tốt nhất này. Yêu thích của chúng tôi là Dragon NataturalSpeaking, nhưng cũng có rất nhiều tùy chọn miễn phí (hoặc ít nhất là rẻ hơn) xung quanh.


Nếu bạn muốn ra lệnh trong khi làm những việc khác, lời nói thành văn bản là hoàn hảo. Bạn có thể viết một bài phát biểu cho công việc trong khi nấu ăn, ví dụ. Hầu hết mọi người nói nhanh hơn họ gõ, vì vậy nó có thể làm cho họ làm việc hiệu quả hơn, miễn là phần mềm này chính xác. Đối với những người bị suy yếu về thể chất, đó có thể là cách duy nhất để họ sử dụng máy tính, làm cho độ chính xác trở nên quan trọng hơn.

Số dặm có thể thay đổi tùy thuộc vào ngôn ngữ hoặc giọng của bạn. Những người trong chúng ta từ những nơi xa xôi hơn trên thế giới có thể thấy giọng của chúng ta ít có khả năng được nhận ra hơn những người khác. Người Mỹ được phục vụ tốt hơn so với những người từ Scotland, ví dụ. Các ngôn ngữ khác nhau đưa ra những thách thức khác nhau cho các hệ thống giải thích máy tính. Chúng tôi sẽ tập trung vào tiếng Anh trong bài kiểm tra của mình, nhưng có thể đưa vào các đoạn ngôn ngữ khác để xem điều gì xảy ra.

Đối với thử nghiệm của chúng tôi, điều chính mà chúng tôi sẽ xem xét là độ chính xác. Chúng tôi sẽ đọc một bộ văn bản cố định cho từng công cụ để so sánh cách xử lý nó. Chúng tôi cũng sẽ xem xét nhận dạng lệnh khi thích hợp.

Câu hỏi lớn mà chúng tôi muốn hỏi là liệu phần mềm nhận dạng giọng nói có chuyển từ một sự mới lạ đôi khi hữu ích sang một thứ gì đó mang lại sự thay thế hợp lý, hoặc thậm chí vượt trội hơn cho việc gõ không.

Micro của chúng tôi là một tai nghe tiêu chuẩn, không có gì lạ mắt. Chúng tôi sẽ thực hiện hầu hết các thử nghiệm trên cùng một PC và sẽ sử dụng điện thoại iPad và Android để xem các đề xuất từ ​​Apple và Google. Mac mini của chúng tôi không thể nhận diện được đầu vào mic, do đó, mặc định ra ngoài.

windows-speech-Recognition-lắng nghe

Windows Speech Recognition

Windows Speech Recognition được tích hợp sẵn trong Windows. Tất cả những gì bạn cần làm để thiết lập nó là tìm kiếm nhận dạng giọng nói của Cameron trong hộp tìm kiếm của Windows, sau đó nhấp qua trình hướng dẫn cài đặt. Bạn cần phải lặp lại một vài câu. Khi bạn đã hoàn thành, nó ngay lập tức đề nghị cải thiện chính nó bằng cách lướt qua email và tài liệu của bạn. Không, cảm ơn.

windows-speech-Recogn-setup

Bạn có thể lo ngại về việc cho phép nhận dạng giọng nói trên Windows với hồ sơ về quyền riêng tư. Nếu vậy, bài viết của chúng tôi về cài đặt quyền riêng tư của Windows 10 đáng để kiểm tra.

Tiếp tục, Windows thực sự khuyên chúng ta nên thực hiện một hướng dẫn bằng giọng nói. Thật kỳ lạ, mặc dù chúng tôi đang sử dụng Windows 10, chúng tôi chỉ có thể chọn Windows 7 hoặc 8.1. Hướng dẫn là một video đi qua danh sách lệnh và chúng tôi nói rõ Windows 10 ở trên cùng, vì vậy chúng tôi đã bỏ qua để thử..

Chúng tôi bắt đầu với một thành công và mở cửa sổ tìm kiếm như dự định. Cố gắng thêm một dòng mới vào một tài liệu đã cho chúng ta một cuốn sách đó là gì? tin nhắn, mặc dù. Nó cũng tương tự với lần thử thứ hai Lần thử thứ ba đã mở một tài liệu mới và lần thứ tư đã cố gắng chọn tất cả các số trong tài liệu của chúng tôi, vì vậy nó rất hữu ích.

Nói ra thì bắt đầu câu, bắt chúng tôi bắt đầu câu đánh máy. Đi đến cuối câu, làm việc cũng vậy. Cả hai mất nhiều thời gian hơn nhấn phím nhà hoặc kết thúc, mặc dù.

Clippy có thể nói, nhưng nó có thể nhảy?

PC của chúng tôi đã phải vật lộn nhiều như chúng tôi đã ở thời điểm đó. Hệ thống kiểm tra i5-7600 của chúng tôi gặp phải sự cố giảm hiệu suất đáng lo ngại khi sử dụng nhận dạng giọng nói và chúng tôi gặp sự cố khi lật giữa các tài liệu và tab trình duyệt theo cách nhắc nhở chúng tôi về Clippy cũ của Microsoft, Clippy.

windows-speech-Recogn-what

Windows Speech Recognition tắt nhanh chóng, thay vì mất 45 giây để tải một hình ảnh động của chính nó vào khoảng cách, vì vậy cảm ơn vì sự thương xót nhỏ. Nó cũng là một điều tốt nhất mà Microsoft Speech Recognition không thể hiện với chúng tôi bằng một cú đấm trực diện. Màn hình aren bền như trước đây.

Vì nó thường làm sai khi giải thích sai các lệnh của chúng tôi, thay vì không có gì, chúng tôi tự cho mình may mắn vì nó đã không làm gì nghiêm trọng trong khi chúng tôi đang sử dụng nó. Tuy nhiên, tiềm năng cho một thảm họa liên quan đến công việc là có. Nó vẫn tiếp tục hoạt động sau khi chúng tôi đặt mic xuống.

Thật công bằng khi nói rằng chúng tôi đã thành công lẫn lộn với Windows Speech Recognition. Thật ấn tượng khi nó hoạt động, nhưng nó bị sai quá thường xuyên để sử dụng thường xuyên. Nó có thể hữu ích cho người khuyết tật, nhưng có những lựa chọn tốt hơn.

Siri phát biểu thành văn bản

Bị Microsoft làm cho thất vọng, chúng tôi nghĩ Apple sẽ làm chúng tôi thất vọng; Rốt cuộc, nó được cung cấp bởi Nuance, cùng một công ty đằng sau Dragon. Mặc dù vậy, họ đã làm điều đó bằng cách từ chối nhận ra đầu vào mic của chúng tôi, vì vậy thay vì nhìn vào bài phát biểu trên máy tính để bàn của Apple, chúng tôi đã quyết định thử nghiệm Siri trên iPad.

Siri là dịch vụ cấu hình cao nhất xung quanh, với câu thần chú iPhone phổ biến khái niệm lời nói thành văn bản và phá vỡ các kỷ lục cho công nghệ được thể hiện nhiều nhất trong các quán bar.

Các thiết bị của Apple luôn trông đẹp mắt và hướng đến sự thân thiện với người dùng. Chúng tôi rất háo hức xem liệu điều đó sẽ chuyển sang phần mềm nhận dạng giọng nói chức năng. Hãy để chúng tôi thấy Siri đã sợ như thế nào trong quá trình thử nghiệm của chúng tôi.

dạng sóng táo

Sau khi ra mắt ứng dụng Ghi chú, chúng tôi đã tham gia đọc chính tả, bao gồm đầu vào được gửi lên đám mây để Apple xử lý. Nếu bạn quan tâm đến khía cạnh riêng tư của vấn đề này, hãy đọc bài viết của chúng tôi về luật riêng tư trên đám mây tốt nhất.

Sử dụng đám mây cho phép ném rất nhiều mã lực điện toán vào việc diễn giải những gì bạn nói. Bạn có thể nghĩ rằng cách tiếp cận đó sẽ chậm, nhưng nó nhanh đến mức đáng kinh ngạc. Có một độ trễ đáng chú ý, nhưng nó không lâu và vẫn hoạt động nhanh hơn so với gõ.

bàn phím táo

Sử dụng nhận dạng giọng nói iPad rất đơn giản. Bạn chỉ cần nhấp vào mic bất cứ khi nào bàn phím hiển thị, đó là cách mà hầu hết các ứng dụng sử dụng bàn phím làm điều đó.

Những gì các Dickens?

Apple đã làm một công việc tốt, nhưng nó vẫn gặp rắc rối với Dickens. Hầu hết các từ trong bài kiểm tra của chúng tôi đều được kết xuất chính xác, nhưng vẫn còn những người kỳ quặc, chẳng hạn như, Oliver Oliver đã liều lĩnh với Missouri.

Nó tốt hơn với các cụm từ đơn giản và hầu hết những gì chúng ta nói đã được nghe chính xác miễn là chúng ta giữ được một từ vựng cơ bản. Nó bỏ từ thỉnh thoảng, mặc dù.

Đối với các tìm kiếm trên web, hỏi Siri thường nhanh hơn gõ, đặc biệt là trên các thiết bị nhỏ hơn với bàn phím khó.

kết quả táo

Tiếp theo chúng tôi đã thử nghiệm nó với một vài từ nước ngoài và tên địa danh. Nó đã xử lý các loại ketichi wa, hay nhưng không thể nhận ra tên của các thành viên ban nhạc Kpop. Tuy nhiên, theo tín dụng của Apple, chúng tôi cảm thấy đủ tự tin để cung cấp cho nó một shot.

Nhìn chung, Siri làm rất tốt với các cụm từ đơn giản và nó đủ tốt để sử dụng khi bạn muốn tìm kiếm một cái gì đó vội vàng. Tuy nhiên, vì người dùng của nó sẽ nhận thức được, nó có rất nhiều lỗi và khá hạn chế. Tuy nhiên, đó là một nỗ lực tốt từ Apple.

Nhập tài liệu Google Docs

Google Docs Voice Typing miễn phí và khả dụng ở mọi nơi có Chrome. Nó không yêu cầu thiết lập và có thể được kích hoạt từ menu công cụ trong bất kỳ tài liệu nào.

google-giọng nói-gõ-mic

Bắt đầu với thử nghiệm Dickens của chúng tôi, chúng tôi nhận thấy rằng Oliver Oliver Twist đôi khi là Oliver Oliver và đôi khi là toàn bộ. Nhiều từ đã bị bỏ qua và kết quả đầy lỗi. Google Docs Voice Typing tự động tắt và tại một thời điểm, đã dừng phản hồi mặc dù đang bật, vì vậy chúng tôi cần lặp lại một phần.

google-giọng nói-gõ-oliver

Sau khi nhận được kết quả kém trong các bài kiểm tra chính tả của chúng tôi, chúng tôi đã thử đưa ra các mệnh lệnh và đã tốt hơn. Chúng tôi đã chuyển đổi giữa chữ in nghiêng và chữ in đậm, thêm dấu chấm câu và từ chính tả, tất cả đều được công nhận.

Tuy nhiên, Google Docs Voice Typing rất dễ sử dụng, ngay cả khi độ chính xác của nó để lại thứ gì đó mong muốn. Nó dường như làm tốt hơn nếu bạn nói to và rõ ràng, mặc dù.

Khi mọi thứ được giữ chậm và đơn giản, nó sẽ đúng hơn, nhưng nó không đủ chính xác để trở thành một mánh lới quảng cáo. Nếu bạn cần ra lệnh rảnh tay trong một thời gian, bạn có thể làm như vậy và sửa lỗi sau đó, nhưng sẽ có rất nhiều trong số đó.

google-giọng nói-gõ-trang

Nhận dạng giọng nói Google Google hoạt động tốt hơn trên thiết bị di động so với máy tính để bàn

Thất vọng với hiệu suất máy tính để bàn của nó, chúng tôi quyết định cho Google một cơ hội khác. Lần này, chúng tôi đã sử dụng Gmail trên Android và thật ngạc nhiên, nó tốt hơn nhiều. Độ chính xác là gần 100 phần trăm cho chính tả và văn bản, nhưng các bài kiểm tra của Dickens thấy nó giảm đáng kể. Tuy nhiên, nhìn chung, chúng tôi thấy rằng phiên bản Android hoạt động tốt hơn nhiều so với phiên bản dành cho máy tính để bàn.

Rõ ràng, có tiềm năng trong công nghệ Google Google. Android đã cho chúng tôi kết quả tốt hơn và, nếu bạn sẵn sàng chịu đựng nhiều lỗi, có thể là một sự thay thế hữu ích cho bàn phím của nó.

Speechote

Speechnotes là một dịch vụ chuyển lời nói thành văn bản dựa trên trình duyệt cho phép bạn đọc chính tả trình duyệt của mình. Nó không yêu cầu thiết lập ngoài việc cấp cho nó quyền sử dụng mic của bạn, vì vậy bạn có thể đi thẳng vào việc ra lệnh.

Nó không thể đơn giản hơn để sử dụng. Có một khu vực lớn để gõ văn bản và micrô lớn để nhấp khi bạn muốn bắt đầu và ngừng đọc chính tả.

Đối với bài kiểm tra đầu tiên của chúng tôi, chúng tôi đã thử đánh nó bằng rap và nó đã làm tốt như nó có thể được mong đợi nhờ chất lượng của các vần điệu của chúng tôi. Nó đã sơ sài hơn khi chúng tôi kiểm tra dấu câu. Toàn bộ điểm dừng, dấu phẩy và dấu chấm hỏi hoạt động hầu hết thời gian, nhưng dấu hai chấm trở thành mã codon, hay Kyle Kyle Long, người mà chúng tôi chưa bao giờ nghe nói đến.

speechnotes-rap

Các lệnh biểu tượng cảm xúc đã mang lại nụ cười cho khuôn mặt của chúng ta, cũng như màn hình của chúng ta, nhưng dấu gạch ngang và dấu gạch ngang được hiển thị như là dodge Hartford.

Thử nghiệm Dickens của chúng tôi đã quay trở lại, Viking Oliver Twist đã tuyệt vọng với cơn đói và bữa sáng với sự khốn khổ, ít nhất, đó là, theo tinh thần của câu chuyện. Mặc dù vậy, ông Bumble sẽ rất tức giận khi thấy mình được mô tả là một người mẹ alpha, mặc dù, đặc biệt là trong khi chúng tôi đã chọn tiếng Anh Anh.

speechnotes-oliver

Chúng tôi đã cố gắng đặt nó sang tiếng Anh Hoa Kỳ và nói bằng giọng Mỹ tốt nhất của chúng tôi chỉ để khám phá ra mẹ mẹ đã biến thành bom bom. Đó là vô vọng. Lo sợ rằng đó có thể là từ điển của chúng tôi, chúng tôi đã chuyển sang James Earl Jones. Một bản ghi của một cảnh mang tính biểu tượng từ một bộ phim nhất định không thể đăng ký chính xác. Chúng tôi đã cố gắng hét vào mic của chúng tôi. Điều đó cũng không giúp được gì.

Giữ nó đơn giản

Chúng tôi đã làm tốt hơn khi chúng tôi sử dụng các cụm từ đơn giản. Nó đã làm một công việc tốt để làm mọi thứ đúng, mặc dù vẫn còn lỗi.

Bạn có thể sử dụng Speechnote để tạo một bản nháp thô, với điều kiện mọi thứ được giữ đơn giản và bạn nói chậm. Tuy nhiên, sẽ có khá nhiều sai lầm để sửa chữa, cho chúng ta ấn tượng về một máy rửa chén giành được công việc của Keith trừ khi bạn rửa đĩa trước khi đặt chúng vào.

Speechnotes hoạt động trong mọi trình duyệt, miễn là trình duyệt là Chrome. Bạn có thể xuất sang định dạng .doc hoặc .txt hoặc tải nó lên Google Drive.

Phiên âm

Phiên âm tập trung vào tập trung vào âm thanh dựa trên tập tin, vì vậy nếu bạn muốn ghi lại một .mp3 và sao chép nó sau, thì nó là công cụ cho bạn. Mặc dù vậy, chúng tôi không kiểm tra điều đó. Chúng tôi chỉ nhìn vào khả năng đọc chính tả của nó.

Nó tuyên bố rằng tính năng đọc chính tả của nó cho phép bạn làm việc nhanh hơn hai đến ba lần so với gõ. Để điều đó trở thành sự thật, nó cần dịch bài phát biểu của bạn thành văn bản chính xác. Tuy nhiên, như trang web của chính nó chỉ ra, làm như vậy với độ chính xác hoàn toàn vẫn là một giấc mơ xa vời.

Nó cung cấp cho bạn một tuần dịch vụ miễn phí, sau đó tính phí $ 20 mỗi năm. Điều đó đã thắng phá vỡ ngân hàng và có một khoản phí liên tục, thay vì một khoản phí một lần khổng lồ, cho thấy công ty tự tin rằng họ sẽ giữ bạn như một khách hàng. Việc đăng ký cũng có nghĩa là bạn luôn có thể tận dụng phiên bản mới nhất của phần mềm.

phiên âm chính

Tuy nhiên, là một dịch vụ trả phí, onus được phiên âm để cung cấp. Tuy nhiên, với các đối thủ cạnh tranh chủ yếu là không cung cấp bất cứ điều gì theo cách cạnh tranh gay gắt, thanh này vẫn chưa được đặt lên cao. Hãy cùng tìm hiểu xem Transcribe có thể xóa nó không.

Sau khi đăng ký, chúng tôi có một chuyến tham quan ngắn với một cửa sổ bật lên giải thích một vài công cụ và điều khiển. Sau đó, chúng tôi hướng đến nút chính tả, mong muốn xem Transcribe sẽ làm gì cho việc lan man của chúng tôi.

Chúng tôi bắt đầu với Oliver. Như thường lệ, chúng tôi có độ chính xác khoảng 50 phần trăm, với câu lẻ được diễn giải hoàn hảo và những câu khác trở lại với chúng tôi khi tiến tới chủ, bò rừng và Spoon trong tay, đã phá vỡ phần nào câu thần chú. Oliver cũng được đổi tên thành toàn bộ trên khắp thế giới.

phiên âm

Hiệu suất phiên âm cải thiện với các câu đơn giản. Nó bắt đầu bằng cách nhận tám câu liên tiếp đúng 100 phần trăm. Sai lầm đầu tiên xảy ra khi chúng tôi quá tự tin và bắt đầu nói ra những từ có tốc độ, nhưng nó đã đúng khi chúng tôi quay lại và lặp lại chính mình chậm hơn.

phiên âm-câu đơn giản

Một công việc hợp lý là hữu ích

So với Windows, Speechnotes và Google, Transcribe vượt xa về phía trước và nó vượt xa Siri về độ tin cậy. Nó vẫn có thể quản lý các bộ phận của Oliver Oliver Twist, nhưng thực hiện tốt các câu đơn giản. Nó không hiểu tiếng Pháp của chúng tôi, nhưng khó có thể đổ lỗi cho điều đó, như rất ít người Pháp làm, hoặc.

Nếu bạn có thể loại Gõ hoặc quá tệ đến mức bạn mắc một hoặc hai câu mỗi câu, bạn có thể thấy Transcribe cải thiện năng suất của bạn. Nó cũng có thể hữu ích để ghi lại các cuộc họp hoặc cuộc hội thoại trong các tình huống mà bạn chỉ cần ghi chú thô hoặc vui lòng quay lại và sửa lỗi sau.

Phiên âm dựa trên trình duyệt, nhưng chính tả chỉ hoạt động trong Chrome. Tuy nhiên, bạn có thể xuất sang .doc, do đó, bạn không bị ràng buộc với dịch vụ.

Rồng tự nhiên

Chúng tôi đã xem Dragon NataturalSpeaking cuối cùng, đây là thứ đắt nhất trong danh sách này. Chúng tôi đã thử nghiệm phiên bản rẻ nhất, Home, trên PC của chúng tôi. Nó tuyên bố rằng nó nắm bắt được suy nghĩ của bạn nhanh như bạn có thể nói chúng. Sau khi thất vọng bởi các phần mềm khác, chúng tôi hy vọng nó đã làm, nhưng đã hoài nghi.

Thiết lập là một thử thách, với các liên kết tải xuống vụng về và một số sê-ri cần được nhập vào năm trường khác nhau mà không cho phép người dùng dán toàn bộ nội dung cùng một lúc. Nhìn vào các tùy chọn cài đặt, chúng tôi tìm thấy một số mô-đun tiếng Anh có sẵn. Bạn có thể chọn từ Úc, Canada, Hoa Kỳ, Hoa Kỳ, Ấn Độ hoặc Đông Nam Á, rất ấn tượng, nhưng bạn có thể muốn vô hiệu hóa những thứ bạn không muốn khi họ ăn hơn 200 MB dung lượng mỗi.

Nó đã gây nhầm lẫn khi chọn khu vực và giọng của chúng tôi, mặc dù. Nếu chúng tôi chọn Hoa Kỳ là khu vực của mình, chúng tôi có thể chọn từ tất cả các dấu có sẵn, nhưng khi chúng tôi chọn Hoa Kỳ, chúng tôi không thể chọn giọng Tây Ban Nha hoặc Pakistan. Với khu vực của chúng tôi được đặt ở Ấn Độ, Úc hoặc New Zealand, chúng tôi không thể chọn giọng của mình.

Khách du lịch đặt khu vực của họ ở vị trí của họ mà không kiểm tra cẩn thận có thể không nhận ra họ có thể điều chỉnh Dragon theo giọng của họ, điều này có vẻ như là một sai lầm từ quan điểm khả dụng.

Giả sử rằng giọng U.K. của chúng tôi là tiêu chuẩn, chúng tôi đã tiến hành. Có các tùy chọn nâng cao để chọn loại từ vựng của chúng tôi, nhưng chỉ có sẵn lớn. Bạn cũng có thể chọn mô hình âm thanh giọng nói, nhưng nó chỉ cung cấp phiên bản trước của BestMatch V mặc định.

Nhập rồng

Dragon-NataturalSpeaking-Logo

Khi khởi động, chúng tôi được cung cấp tùy chọn khởi chạy ở chế độ dùng thử, mặc dù không tìm thấy liên kết dùng thử miễn phí trên trang web hoặc kích hoạt sản phẩm mà chúng tôi đã chọn.

Nó yêu cầu chúng tôi đọc một số văn bản để xác nhận micro của chúng tôi hoạt động. Dragon rất tự tin, nó cắt đứt chúng tôi giữa chừng, cho phép chúng tôi chuyển sang hướng dẫn. Vượt qua những mô phỏng tiến bộ này và bạn sẽ học được những kỹ năng quan trọng một cách hiệu quả! nó đã thông báo.

Các hướng dẫn có vẻ vụng về, nhưng tốt hơn khi nói đến nội dung. Cơ hội đầu tiên của chúng tôi để kiểm tra nhận dạng giọng nói Rồng, đã đến khi nó yêu cầu chúng tôi tắt micrô bằng giọng nói của mình. Làm như vậy mất hai lần thử. Thử nghiệm đọc chính tả hướng dẫn đầu tiên cũng mất hai lần thử trước khi nghe chúng tôi, nhưng vấn đề đã biến mất ngoài hướng dẫn, vì vậy, đó là vấn đề nghiêm trọng.

Từ thời điểm đó trở đi, nó đã làm mọi thứ đúng, bao gồm một số dấu câu phức tạp và đầu vào số. Vì chúng tôi chỉ nói những gì nó nói với chúng tôi, mặc dù vậy, chúng tôi bảo lưu phán quyết của chúng tôi.

Hướng dẫn cho bạn lời khuyên về cách nói khi sử dụng ứng dụng, điều này rất đáng hoan nghênh và sẽ giúp cải thiện cơ hội được hiểu của người dùng. Nó cũng dạy bạn sử dụng menu chính xác của Cameron khi nó mắc lỗi.

Tại một thời điểm, một cửa sổ bật lên xuất hiện để cho chúng tôi biết những gì chúng tôi nói không thể nhận ra. Chúng tôi tự hỏi nếu nó thực sự là lỗi của chúng tôi. Một cửa sổ bật lên khác được cung cấp để cài đặt tiện ích mở rộng trình duyệt cho chúng tôi. Một số có thể thấy những cửa sổ bật lên này hữu ích, những người khác có thể coi chúng là một chất gây kích thích.

Sử dụng Dragon NataturalSpeaking

Sau khi nhảy qua tất cả các vòng, Dragon rất dễ sử dụng. Thanh menu của nó nằm ở phía trên màn hình và có micrô lớn màu đỏ để nhấp khi bạn muốn bật. Một cách khôn ngoan, Dragon không cho phép bạn bắt đầu bằng cách nói micro trên. Bạn phải bấm để bắt đầu.

speechtotext-dragon-bar

Thanh menu được thiết kế tốt và cho phép bạn truy cập vào nhiều tính năng hữu ích. Dragon cho phép bạn chọn hồ sơ người dùng, rất hữu ích nếu bạn có những người có giọng khác nhau sử dụng cùng một máy. Nó có thể phân tích từ vựng của bạn bằng cách xem các tài liệu do người dùng chọn, nghĩa là bạn có thể huấn luyện nó với dữ liệu phản ánh việc sử dụng ngôn ngữ cá nhân của bạn.

Có một số tùy chọn hiệu chỉnh âm thanh và một tính năng cho phép bạn huấn luyện các cụm từ cụ thể. Bạn cũng có thể xem lịch sử nhận dạng để xem có bất cứ điều gì Rồng thường xuyên bị lỗi không.

Nó cũng có một loạt các tính năng trợ giúp. Có một trợ lý hiệu suất và một số tùy chọn trợ giúp và hỗ trợ. Trang web này bao gồm rất nhiều tài liệu, nhưng có vẻ như scattershot. Liên kết hướng dẫn sử dụng mà chúng tôi đã thấy didn bao gồm nhiều hơn cài đặt. Có các hướng dẫn lệnh hữu ích cho các phiên bản Chuyên nghiệp và Pháp lý, nhưng chúng tôi không thể tìm thấy một cho Trang chủ.

Ngoài ra còn có một kiến ​​thức, vì vậy nếu bạn cần hỗ trợ, có rất nhiều lựa chọn. Khi duyệt qua điều này, chúng tôi đã học được rằng chỉ có một người dùng trên mỗi máy được cho phép, vì vậy việc tận dụng tính năng nhiều cấu hình sẽ tốn kém.

Menu chính xác của Nhật Bản rất hữu ích và cung cấp cho bạn một danh sách các giải thích thay thế cho những gì bạn nói. Chúng được liệt kê để bạn có thể chọn chúng theo số nếu bạn thấy cái bạn muốn.

Bị ấn tượng bởi các tính năng của nó, nhưng thất vọng vì các vấn đề nhỏ về khả năng sử dụng trong quá trình thiết lập, chúng tôi đã bắt đầu bài kiểm tra chính tả của Oliver Oliver Twist của chúng tôi tự hỏi liệu Dragon có biện minh được giá của nó không.

Năm phút sau, chúng tôi đã có câu trả lời. Dragon rất ngạc nhiên khi nói đến tính năng cốt lõi của nó là nhận ra những gì bạn nói. Hãy xem kết quả kiểm tra chính tả của chúng tôi.

speechtotext-rồng-chính tả

Đó là 200 từ của văn xuôi thế kỷ 19 được đưa ra với ba sai lầm. Rô bốt Rebel trở thành người gắn bó với nhau, người hâm mộ đã trở thành người nổi tiếng và đã không có cơ hội với ông Mr. Limbkins. Dấu câu sơ sài là thuộc về chúng ta, và dù sao thì đó cũng là một chuỗi hạt?

Chúng tôi biết con người mà aren rất giỏi trong việc diễn giải lời nói. Thật là tốt khi chúng tôi phải nhờ đến Mary Marypinpins để nhận một lỗi sai thú vị từ đó, với siêu supercalifragilisticexpialidocious đã trở thành siêu phẩm niêm yết của California.

Dragon bao gồm một trung tâm học tập tiện dụng, tiện ích, hiển thị cho bạn các lệnh có liên quan đến bất cứ điều gì bạn làm Đó là một cách hay để tìm hiểu về phần mềm, đặc biệt là khi bắt đầu. Đọc chính tả cơ bản là đơn giản và có thể được sử dụng mà không cần hỗ trợ, mặc dù.

speechtotext-dragon-learning-centre

Phần mềm chuyển lời nói thành văn bản tốt nhất?

Tại gian hàng $ 150},

Lời phán quyết

Chúng tôi đã vui vẻ thử nghiệm các công cụ này và phơi bày những hạn chế của chúng. Có nhiều sai lầm giải trí. Các nhà văn hài kịch với nhà văn khối block có thể làm điều tồi tệ hơn là ra lệnh cho một số ứng dụng này và xem những dòng hài hước nào thành hiện thực.

Ấn tượng ban đầu của chúng tôi khi nhìn vào các tùy chọn miễn phí là công nghệ này rất ấn tượng khi hoạt động, nhưng cần trở nên đáng tin cậy hơn để nhận ra tiềm năng của nó.

Nhìn vào Dragon đã thay đổi điều đó. Nó ở một cấp độ khác so với các độ chính xác khác. Sự khác biệt là ngày và đêm và chúng ta có thể thấy mình sử dụng Dragon trong các tình huống mà không có công cụ nào khác có thể tồn tại.

Các tùy chọn di động đáng để sử dụng cho tìm kiếm, miễn là bạn chuẩn bị hướng tới bàn phím ảo trong nhiều trường hợp chúng không hoạt động.

Transcribe thực hiện một nỗ lực chính xác ở mức độ chính xác, nhưng không đủ tốt và, để sử dụng chuyên nghiệp, chúng tôi coi Dragon đáng đồng tiền cho hiệu suất bổ sung.

Trong khi chúng tôi vui vẻ, bài viết này đã phần nào là một bài tập để xem tại sao các dịch vụ này lại được sử dụng rộng rãi hơn. Các tùy chọn miễn phí, mặc dù không phải không có công đức, để lại nhiều mong muốn. Tuy nhiên, không có hại gì khi thử chúng và, ai biết được, bạn có thể thấy họ nhận ra mọi điều bạn nói.

Phần mềm nhận dạng giọng nói tốt nhất

Nếu bạn sẵn sàng trả 150 đô la cho Rồng, mọi thứ sẽ thay đổi hoàn toàn. Hy vọng, công nghệ của nó sẽ lọc xuống các dịch vụ miễn phí. Đó có thể là một người thay đổi trò chơi và thay đổi cách chúng ta tương tác với các thiết bị của mình mãi mãi.

Giấc mơ khoa học viễn tưởng về máy tính của chúng ta phản ứng với lời nói của chúng ta có thể gần hơn chúng ta nghĩ, mặc dù trong hầu hết các trường hợp, bạn sẽ cần một sự khoan dung cao cho những sai lầm.

Nếu bạn có bất kỳ khuyến nghị cho các dịch vụ khác, hãy cho chúng tôi biết. Chúng tôi rất thích thú khi nghe bạn làm thế nào với họ. Có thể là những người có giọng nói khác nhau có những trải nghiệm khác nhau, vì vậy hãy mua sắm xung quanh nếu bạn không thích như khuyến nghị của chúng tôi. Cảm ơn vì đã đọc.

Kim Martin Administrator
Sorry! The Author has not filled his profile.
follow me
    Like this post? Please share to your friends:
    Adblock
    detector
    map