Perangkat lunak speech to text terbaik pada tahun 2020: Aplikasi dan layanan pengenal suara gratis, berbayar, dan online

Sementara teks-ke-teks yang digunakan hanya khusus untuk desktop, pengembangan perangkat seluler dan ledakan aplikasi yang mudah diakses berarti transkripsi sekarang dapat dilakukan pada smartphone atau tablet.

Ini telah membuat aplikasi pidato-ke-teks semakin bernilai bagi pengguna di berbagai lingkungan yang berbeda, dari pendidikan hingga bisnis. Ini tidak lain karena teknologi telah matang ke tingkat di mana kesalahan dalam transkripsi relatif jarang terjadi, dengan beberapa layanan tepat membanggakan tingkat keberhasilan 99,9% dari audio jernih

Layanan pidato / teks lainnya

Meski begitu, ini berlaku terutama untuk situasi dan keadaan biasa, dan menghalangi penggunaan terminologi teknis seperti yang disyaratkan dalam profesi hukum atau medis. Meskipun demikian, transkripsi digital masih dapat melayani kebutuhan seperti pembuatan catatan dasar yang masih dapat dengan mudah dilakukan menggunakan aplikasi telepon, menyederhanakan proses dikte.

Namun, program bicara-ke-teks yang berbeda memiliki tingkat kemampuan dan kompleksitas yang berbeda, dengan beberapa menggunakan pembelajaran mesin canggih untuk terus memperbaiki kesalahan yang ditandai oleh pengguna sehingga tidak berulang. Lainnya adalah perangkat lunak yang dapat diunduh yang hanya sebagus pembaruan terbarunya.

Inilah yang terbaik dalam program pengenalan ucapan-ke-teks, yang seharusnya lebih dari mampu untuk sebagian besar situasi dan keadaan.

Atau lompat langsung ke:

Aplikasi wicara ke teks yang dibayar terbaik

  1. Naga Profesional
  2. Naga mana saja
  3. Berang-berang
  4. Verbit
  5. Pidato
  6. Braina Pro
  7. Amazon Menuliskan
  8. Microsoft Azure Speech to Text
  9. Watson Speech to Text

(Kredit gambar: Nuansa)

1. Naga Profesional

Fitur yang kuat

Didesain untuk para profesional

Dikte 160 wpm

Jika Anda mencari aplikasi dikte kelas bisnis, taruhan terbaik Anda adalah Naga Profesional. Ditujukan untuk pengguna pro, perangkat lunak memberi Anda alat untuk mendikte dan mengedit dokumen, membuat spreadsheet, dan menjelajahi web menggunakan suara Anda.

Menurut Nuance, solusinya mampu mengambil dikte pada kecepatan mengetik setara 160 kata per menit, dengan tingkat akurasi 99% – dan itu out-of-the-box, sebelum pelatihan dilakukan (di mana aplikasi beradaptasi dengan suara dan kata-kata yang biasa Anda gunakan).

Selain membuat dokumen menggunakan suara Anda, Anda juga dapat mengimpor daftar kata khusus. Ada juga aplikasi seluler tambahan yang memungkinkan Anda menyalin file audio dan mengirimkannya kembali ke komputer Anda.

Ini adalah alat yang kuat, fleksibel, dan sangat berguna yang sangat baik untuk individu, seperti profesional dan freelancer, memungkinkan pengetikan dan manajemen dokumen dilakukan lebih fleksibel dan mudah.

Secara keseluruhan, antarmuka mudah digunakan, dan jika Anda buntu sama sekali, Anda dapat mengakses serangkaian tutorial bantuan. Dan meskipun perangkat lunaknya dapat terlihat mahal dengan $ 300, itu adalah biaya satu kali dan bersaing dengan layanan transkripsi berlangganan berbayar.

(Kredit gambar: Dragon)

2. Naga Di Mana Saja

Pengenalan ucapan berkualitas tinggi

Sinkronisasi dengan perangkat lunak desktop Dragon

Dikte terbatas dalam aplikasi

Membutuhkan koneksi internet untuk berjalan

Dragon Anywhere adalah produk seluler untuk perangkat Android dan iOS, namun ini bukan aplikasi 'lite', melainkan menawarkan kemampuan dikte yang terbentuk sepenuhnya yang didukung melalui cloud.

Jadi pada dasarnya Anda mendapatkan pengenalan suara yang sama bagusnya seperti yang terlihat pada perangkat lunak desktop – satu-satunya perbedaan yang berarti yang kami perhatikan adalah sedikit keterlambatan dalam kata-kata yang kami ucapkan muncul di layar (tidak diragukan lagi karena diproses di cloud). Namun, perlu diketahui bahwa aplikasi ini secara keseluruhan masih cukup responsif.

Ini juga menawarkan dukungan untuk potongan teks boilerplate yang dapat diatur dan dimasukkan ke dalam dokumen dengan perintah sederhana, dan ini, bersama dengan kosakata khusus, disinkronkan di aplikasi seluler dan perangkat lunak desktop Naga. Selain itu, Anda dapat berbagi dokumen di seluruh perangkat melalui Evernote atau layanan cloud (seperti Dropbox).

Namun, ini tidak sefleksibel aplikasi desktop, karena dikte terbatas pada Dragon Anywhere – Anda tidak dapat mendikte langsung di aplikasi lain (meskipun Anda dapat menyalin teks dari pad dikte Dragon Anywhere ke aplikasi pihak ketiga ). Peringatan lainnya adalah perlunya koneksi internet agar aplikasi berfungsi (karena sifatnya yang didukung cloud), dan fakta bahwa itu adalah penawaran berlangganan tanpa opsi pembelian satu kali, yang mungkin tidak sesuai dengan selera semua orang.

Meskipun dengan mengingat batasan-batasan ini, meskipun, merupakan anugerah pasti untuk memiliki pengenalan suara yang kuat dan kuat dengan kualitas sterling yang sama dengan perangkat lunak desktop, bersarang di ponsel atau tablet Anda saat Anda jauh dari kantor.

Nuance Communications menawarkan uji coba 7 hari gratis untuk memberikan aplikasi berputar sebelum Anda berkomitmen untuk berlangganan.

(Kredit gambar: Otter)

3. Berang-berang

Tingkat gratis

Kolaborasi tim

Opsi ekspor

Teks langsung

Otter adalah program speech to text berbasis cloud yang khusus ditujukan untuk penggunaan mobile, seperti pada laptop atau smartphone. Aplikasi ini menyediakan transkripsi real-time, yang memungkinkan Anda untuk mencari, mengedit, memutar, dan mengatur sesuai kebutuhan.

Otter dipasarkan sebagai aplikasi khusus untuk pertemuan, wawancara, dan kuliah, untuk membuatnya lebih mudah untuk membuat catatan kaya. Namun, ini juga dibangun untuk bekerja dengan kolaborasi antar tim, dan penutur berbeda ditugaskan ID penutur berbeda untuk membuatnya lebih mudah untuk memahami transkripsi.

Ada tiga paket pembayaran yang berbeda, dengan paket dasar yang bebas untuk digunakan dan selain dari fitur yang disebutkan di atas juga termasuk ringkasan kata kunci dan wordcloud untuk membuatnya lebih mudah untuk menemukan penyebutan topik tertentu. Anda juga dapat mengatur dan berbagi, mengimpor audio dan video untuk transkripsi, dan menyediakan layanan gratis selama 600 menit.

Paket Premium hadir dengan $ 8,33 per bulan bila dibayar setiap tahun, dan di atas fitur yang ada juga mencakup opsi ekspor tingkat lanjut dan massal, kemampuan untuk menyinkronkan audio dari Dropbox, kecepatan pemutaran tambahan termasuk kemampuan untuk melewati jeda diam. Paket Premium juga memungkinkan hingga 6.000 menit pidato ke teks.

Paket Teams masuk pada $ 12,50 per pengguna untuk minimal tiga pengguna, dan juga menambahkan otentikasi dua faktor, manajemen pengguna dan penagihan terpusat, serta statistik pengguna, voiceprints, dan captioning langsung.

(Kredit gambar: Verbit)

4. Verbit

Layanan perusahaan

Kerja tim

AI cerdas

Tidak selalu hidup

Verbit bertujuan untuk menawarkan layanan percakapan ke teks yang lebih cerdas, menggunakan AI untuk transkripsi dan penulisan teks. Layanan ini secara khusus ditargetkan pada perusahaan dan lembaga pendidikan.

Verbit menggunakan campuran model ucapan, menggunakan jaringan saraf dan algoritma untuk mengurangi kebisingan latar belakang, fokus pada persyaratan serta membedakan antara speaker tanpa memandang aksen, serta menggabungkan peristiwa kontekstual seperti berita dan informasi perusahaan ke dalam rekaman.

Meskipun Verbit memang menawarkan versi langsung untuk transkripsi dan captioning, yang bertujuan untuk tingkat akurasi yang tinggi, rencana lain menawarkan editor manusia untuk memastikan transkripsi sepenuhnya akurat, dan mengiklankan waktu penyelesaian selama empat jam.

Secara keseluruhan, sementara Verbit memang menawarkan pidato langsung ke layanan teks, itu mungkin lebih baik dianggap sebagai layanan transkripsi, tetapi fokus pada perusahaan dan pendidikan, serta penggunaan tim, berarti Verbit mendapatkan tempat di sini sebagai opsi untuk dipertimbangkan.

(Kredit gambar: Pidato)

5. Pidato

Mendukung aksen yang berbeda

Keterangan media

Pemicu kata kunci

Speechmatics menawarkan solusi pembelajaran mesin untuk mengubah ucapan menjadi teks, dengan solusi pengenalan suara otomatis yang tersedia untuk digunakan pada file audio dan video yang ada serta untuk penggunaan langsung.

Tidak seperti beberapa perangkat lunak transkripsi otomatis yang dapat berjuang dengan aksen atau membebankan biaya lebih untuk mereka, Speechmatics mengiklankan dirinya sebagai mampu mendukung semua aksen utama Inggris, terlepas dari kebangsaan. Dengan begitu ia bertujuan untuk mengatasi tidak hanya aksen Inggris dan Inggris yang berbeda, tetapi juga aksen Afrika Selatan dan Jamaika.

Speechmatics menawarkan jumlah transkrip yang lebih banyak menggunakan transkripsi daripada banyak penyedia lainnya. Contohnya termasuk mengambil rekaman telepon pusat panggilan dan mengonversinya menjadi teks yang dapat dicari atau dokumen Word. Perangkat lunak ini juga berfungsi dengan video dan media lain untuk penulisan teks serta menggunakan pemicu kata kunci untuk manajemen.

Secara keseluruhan, Speechmatics bertujuan untuk menawarkan layanan percakapan ke teks yang lebih fleksibel dan komprehensif daripada banyak penyedia lainnya, dan penggunaan otomatisasi harus membuat mereka tetap kompetitif.

(Kredit gambar: Brainasoft)

6. Braina Pro

Asisten digital yang kuat

Aplikasi Android yang bagus untuk mengendalikan PC dari jarak jauh

Hanya berlangganan (tidak ada pembelian satu kali pun)

Braina adalah perangkat lunak pengenalan suara yang dibangun tidak hanya untuk dikte, tetapi juga sebagai asisten digital serba guna untuk membantu Anda mencapai berbagai tugas pada PC Anda. Ini mendukung dikte untuk perangkat lunak pihak ketiga tidak hanya dalam bahasa Inggris tetapi hampir 90 bahasa yang berbeda, dengan potongan-potongan pengenalan suara yang mengesankan.

Selain itu, ini adalah asisten virtual yang dapat diinstruksikan untuk mengatur alarm, mencari file di PC, atau mencari di internet, memutar file MP3, membaca ebook dengan keras, plus Anda dapat menerapkan berbagai perintah kustom.

Itu Windows Program ini juga memiliki pendamping Aplikasi Android yang dapat mengontrol PC Anda dari jarak jauh, dan menggunakan jaringan Wi-Fi lokal untuk mengirimkan perintah ke komputer Anda, sehingga Anda dapat memunculkan daftar putar musik, misalnya, di mana pun Anda berada. Bagus.

Ada versi gratis Braina yang hadir dengan fungsi terbatas, tetapi mencakup semua perintah PC dasar, bersama dengan uji coba 7-hari dari pengenalan suara yang memungkinkan Anda menguji kekuatannya sendiri sebelum Anda berkomitmen untuk berlangganan. Ya, ini adalah produk lain yang hanya berlangganan tanpa opsi untuk membeli dengan biaya satu kali saja. Perhatikan juga bahwa Anda harus daring dan peramban Chrome Google diinstal agar fungsi pengenalan suara berfungsi.

(Kredit gambar: Amazon )

7. Amazon Menuliskan

Untuk perusahaan

Pengeditan kosakata

Audio untuk aplikasi

Mengenali speaker dan saluran

Amazon Transkrip adalah platform pengenalan suara otomatis berbasis cloud yang dikembangkan khusus untuk mengonversi audio ke teks untuk aplikasi. Ini terutama bertujuan untuk memberikan layanan yang lebih akurat dan komprehensif daripada penyedia tradisional, seperti mampu menangani rekaman yang ber-fi rendah dan berisik, seperti yang mungkin Anda dapatkan di pusat kontak.

Amazon Transkrip menggunakan proses pembelajaran mendalam yang secara otomatis menambahkan tanda baca dan pemformatan, serta proses dengan streaming langsung yang aman atau mentranskripsikan pidato ke teks dengan pemrosesan batch.

Selain menawarkan cap waktu untuk kata-kata individual untuk pencarian yang mudah, ini juga dapat mengidentifikasi suara yang berbeda dan saluran yang berbeda serta catatan dokumen yang sesuai untuk menjelaskan hal ini.

Ada juga beberapa fitur bagus untuk mengedit dan mengelola teks yang ditranskripsi, seperti pemfilteran kosakata dan kata-kata pengganti yang dapat digunakan untuk menjaga nama produk konsisten dan karenanya transkripsi berikut lebih mudah untuk dianalisis.

Secara keseluruhan, Amazon Transkrip adalah salah satu platform paling kuat di luar sana, meskipun lebih ditujukan untuk pengguna bisnis dan perusahaan daripada individu.

Microsoft Azure Speech to Text

(Kredit gambar: Microsoft)

8. Microsoft Azure Speech to Text

Transkripsi waktu nyata

Kustomisasi untuk kata benda yang tepat

Menangani beberapa speaker

Layanan cloud Azure Microsoft menawarkan pengenalan suara tingkat lanjut sebagai bagian dari layanan pidato platform untuk menghadirkan Fungsi Microsoft Azure Speech to Text.

Fitur ini memungkinkan Anda membuat teks dengan mudah dan mudah dari berbagai sumber audio. Ada juga opsi penyesuaian yang tersedia untuk bekerja lebih baik dengan pola bicara, register, dan bahkan suara latar belakang yang berbeda. Anda juga dapat mengubah pengaturan untuk menangani berbagai kosa kata spesialis, seperti nama produk, informasi teknis, dan nama tempat.

Fitur Azure Speech to Text dari Microsoft ditenagai oleh model jaringan saraf yang dalam dan memungkinkan transkripsi audio real-time yang dapat diatur untuk menangani beberapa speaker.

Sebagai bagian dari layanan cloud Azure, Anda bisa menjalankan Azure Speech to Text di cloud, di lokasi, atau di komputasi tepi. Dalam hal penetapan harga, Anda dapat menjalankan fitur dalam wadah gratis dengan satu permintaan bersamaan hingga 5 jam audio gratis per bulan. Setelah itu harga mulai dari $ 1 per jam audio.

Watson Speech to Text

(Kredit gambar: IBM)

9. Pidato Watson ke Teks

IBM Watson Speech to Text works adalah solusi cloud-native ketiga dalam daftar ini, dengan fitur yang didukung oleh AI dan pembelajaran mesin sebagai bagian dari layanan cloud IBM.

Meskipun ada opsi untuk menyalin pidato ke teks secara real-time, ada juga opsi untuk mengonversi file audio dan memprosesnya melalui berbagai bahasa, frekuensi audio, dan opsi output lainnya.

Anda juga dapat menandai transkripsi dengan label speaker, pemformatan pintar, dan cap waktu, serta menerapkan pengeditan global untuk kata atau frasa teknis, akronim, dan untuk penggunaan angka.

Seperti layanan cloud lainnya, Watson Speech to Text memungkinkan penyebaran yang mudah baik di cloud maupun di lokasi di belakang firewall Anda sendiri untuk memastikan keamanan tetap terjaga.

Aplikasi gratis berbicara ke teks

  1. Google Gboard
  2. Cukup Tekan Rekam
  3. Catatan Pidato
  4. Menuliskan
  5. Windows 10 Pengenalan ucapan

(Kredit gambar: Google)

1. Google Keyboard

Gratis

Mudah digunakan

Fitur tambahan

Tidak ada perintah pintas

Jika Anda sudah memiliki perangkat seluler Android, maka jika belum diinstal maka unduh Google Keyboard dari Google Play store dan Anda akan memiliki aplikasi teks-ke-ucapan instan. Meskipun ini terutama dirancang sebagai keyboard untuk input fisik, ia juga memiliki opsi input ucapan yang langsung tersedia. Dan karena semua kekuatan perangkat keras Google ada di belakangnya, itu adalah alat yang kuat dan responsif.

Jika itu tidak cukup maka ada fitur tambahan. Selain input fisik seperti menggesekkan, Anda juga dapat memicu gambar dalam teks Anda menggunakan perintah suara. Selain itu, ini juga dapat bekerja dengan Google Translate, dan diiklankan sebagai menyediakan dukungan untuk lebih dari 60 bahasa.

Meskipun Google Keyboard bukan alat transkripsi khusus, karena tidak ada perintah pintas atau pengeditan teks yang terintegrasi secara langsung, ia melakukan semua yang Anda butuhkan dari alat transkripsi dasar. Dan seperti papan ketik, itu artinya harus dapat bekerja dengan perangkat lunak apa pun yang dapat Anda jalankan di ponsel pintar Android Anda, sehingga Anda dapat mengedit, menyimpan, dan mengekspor teks menggunakan itu. Lebih baik lagi, ini gratis dan tidak ada iklan yang menghalangi Anda menggunakannya.

(Kredit gambar: Perangkat Lunak Open Planet)

2. Cukup Tekan Rekam

Mudah digunakan

Didukung oleh awan

Multilingual

Tidak ada aplikasi Android

Jika Anda menginginkan aplikasi dikte khusus, ada baiknya Anda memeriksanya Cukup Tekan Rekam. Ini adalah perekam audio seluler yang dilengkapi dengan fitur-fitur seperti rekaman satu ketuk, transkripsi dan sinkronisasi iCloud antar perangkat. Yang hebat adalah itu ditujukan untuk hampir semua orang dan sangat mudah digunakan.

Ketika datang untuk merekam catatan, yang harus Anda lakukan adalah menekan satu tombol, dan Anda mendapatkan waktu perekaman yang tidak terbatas. Namun, hal yang sangat hebat tentang aplikasi ini adalah ia juga menawarkan layanan transkripsi yang kuat.

Melalui itu, Anda dapat dengan cepat dan mudah mengubah ucapan menjadi teks yang dapat dicari. Setelah menyalin file, Anda dapat mengeditnya dari dalam aplikasi. Ada juga dukungan untuk lebih dari 30 bahasa, menjadikannya aplikasi yang sempurna jika Anda bekerja di luar negeri atau dengan tim internasional. Fitur bagus lainnya adalah pengenalan tanda baca, memastikan transkripsi Anda bebas dari kesalahan ketik.

Aplikasi ini didukung oleh teknologi cloud, artinya Anda dapat mengakses catatan dari perangkat apa pun (yang online). Anda juga dapat berbagi file audio dan teks ke aplikasi iOS lainnya, dan ketika mengaturnya, Anda dapat melihat rekaman dalam file yang komprehensif. Aplikasi ini tersedia di iOS perangkat seharga $ 4,99.

(Kredit gambar: Pidato)

3. Catatan Pidato

Teknologi pengenalan suara Google bawaan

Mengenali tanda baca

Mudah digunakan

Tidak ada aplikasi iOS

Ucapan terima kasih adalah aplikasi dikte lain yang mudah digunakan. Sentuhan yang bermanfaat di sini adalah Anda tidak perlu membuat akun atau semacamnya; Anda baru saja membuka aplikasi dan menekan ikon mikrofon, dan Anda tidak aktif.

Aplikasi ini didukung oleh teknologi pengenalan suara Google. Saat merekam, Anda dapat dengan mudah mendikte tanda baca melalui perintah suara, atau dengan menggunakan keyboard tanda baca bawaan.

Untuk membuat segalanya lebih mudah, Anda dapat dengan cepat menambahkan nama, tanda tangan, salam dan teks yang sering digunakan lainnya dengan menggunakan satu set tombol khusus pada keyboard bawaan. Ada juga kapitalisasi otomatis, dan setiap perubahan yang dilakukan pada catatan disimpan ke cloud.

Ketika datang untuk menyesuaikan catatan, Anda dapat mengakses sejumlah besar font dan ukuran teks. Aplikasi ini gratis untuk diunduh dari Google Play Store, tetapi Anda dapat melakukan pembelian dalam aplikasi untuk mengakses fitur premium (ada juga versi browser untuk Chrome).

(Kredit gambar: Transkripsi)

4. Transkrip

Pos terkait

Back to top button