MacWhisper — безкоштовне програмне забезпечення для транскрипції, на яке я чекав

Ви шукаєте програмне забезпечення Mac для транскрипції аудіофайлів у письмові текстові файли? Є багато платних інструментів, як-от Otter.ai і Trint, які можуть коштувати реальні гроші, якщо ви починаєте ними користуватися занадто часто. але MacWhisper це безкоштовне рішення, на яке чекав Інтернет. Або, принаймні, той, якого я чекав.

OpenAI випустив неймовірно потужну безкоштовну програму ще у вересні 2022 року, яка дозволяла людям із деякими технічними знаннями перетворювати свої аудіо- та відеофайли на неймовірно точні стенограми. Проблема полягала в тому, що він був не дуже доступним для звичайного користувача, оскільки вам потрібно було знати, як використовувати команди в програмі Terminal.

Але з MacWhisper, який вперше помітив 9to5Macхтось нарешті розробив GUI або графічний інтерфейс користувача, який будується на основі OpenAI Whisper і залишає всі заплутані технічні речі під капотом, дозволяючи вам просто перетягувати аудіофайл і дуже швидко отримати транскрипцію. І MacWhisper надзвичайно точний, тому що Whisper OpenAI навчався на ньому 680,000 годин аудіоданих в Інтернеті.

Однією з приємних речей MacWhisper є те, що ви не завантажуєте в Інтернет аудіо- чи відеофайл, який потрібно транскрибувати. Це важливо для журналістів, які, можливо, працюють над делікатною історією, або будь-кого, хто просто обережно ставиться до завантаження особистих файлів у хмару. Файл залишається на вашому робочому столі, а це означає, що ніхто не зможе перехопити ваше аудіо.

Знову ж таки, MacWhisper — це лише новий інтерфейс користувача для безкоштовної програми, представленої OpenAI наприкінці минулого року, але він справді спростить транскрипцію аудіо для будь-кого. Тому що я використовую Whisper і вважаю його надзвичайно корисним з моменту його випуску. І навіть я тепер використовуватиму MacWhsiper, тому що він обов’язково прискорить мій робочий процес.

Як один приклад, після новин про крах криптокомпанії FTX я використав Whisper, щоб переписати десятки годин старих інтерв’ю YouTube із засновником компанії Семом Бенкманом-Фрідом. Звідти я зміг шукати стенограми та знаходити дивні та цікаві ідеї для написання статей, наприклад, коли SBF сказав у червні 2021 року, що блокчейн виправив би Enron. Порівняння SBF з Enron було дивним збігом, враховуючи все, що ми тепер знаємо про крах FTX. Але я б ніколи не знайшов цей момент у старому незрозумілому інтерв’ю, не маючи десятків стенограм, які я міг би шукати. І хоча цей процес був легшим, ніж прослуховування годин і годин касет, все ж був незграбним і не дуже автоматизованим.

Після встановлення Whisper на моєму комп’ютері я вводив «whisper audiofilename.mp3 —model tiny.en» у програму терміналу Mac щоразу, коли хотів транскрибувати файл. За допомогою WhisperMac я можу просто перетягнути свій аудіофайл, і він зробить свою магію без зайвого введення.

Я протестував MacWhisper за допомогою епізоду NBC Nightly News, який завантажив із YouTube. І окрім кількох помилок, як-от тлумачення слова «windchills» як «windshills» і чуття Лестера Холта як «Lester Hold», транскрипція була дуже точною. MacWhisper є безкоштовним, але є платний рівень програмного забезпечення, який може бути трохи точнішим, оскільки використовує більш інтенсивні моделі навчання OpenAI, але безкоштовна версія просто чудово працюватиме для більшості людей.

MacWhisper дозволяє експортувати транскрибовані слова в кілька різних форматів, включаючи звичайний текст, CSV або навіть формат файлу субтитрів, наприклад SRT і VTT.

І MacWhisper не лише для англійської мови. Ви можете транскрибувати аудіо 100 різними мовами, що неймовірно зручно. Єдина функція, якої немає в MacWhisper, і якою я із задоволенням погрався на Whisper у програмі Terminal, – це переклад мови. Я перекладав вірусні відео російською та китайською мовами, і мені сказали люди, які розмовляють цими мовами в Twitter, що переклади точний.

Ще одна функція, якої немає в MacWhisper, хоча вона також недоступна в Whisper OpenAI, це можливість розрізняти динаміків. Наприклад, якщо ви транскрибуєте інтерв’ю з двома доповідачами, немає чітких позначок, які б показували, коли один доповідач зупинився, а інший почав. Але я підозрюю, що зрештою хтось створить таку здатність. Платні сервіси, такі як Trint, роблять це автоматично, і було б чудово, щоб з часом вони були безкоштовними, але ви отримуєте те, за що платите.

У MacWhisper також є функція, за допомогою якої ви можете перетворювати мовлення з мікрофона комп’ютера на текст, що може бути зручно, якщо ви хочете транскрибувати щось на льоту.

Я витратив місяці, гадаючи, коли хтось нарешті розробить графічний інтерфейс для Whisper, оскільки кілька людей спробували це, але не створили нічого дуже зручного для користувача. Але MacWhisper, розроблений Jordi Bruin, — це програмне забезпечення, на яке я чекав. Bruin також розробив таке програмне забезпечення, як MacGPT, що дозволяє користувачам отримувати доступ до ChatGPT із панелі меню.

Ви можете завантажити MacWhisper безкоштовно, з реєстрацією електронною поштою, на веб-сайті Bruin.

Джерело: https://www.forbes.com/sites/mattnovak/2023/02/04/macwhisper-is-the-free-transcription-software-ive-been-waiting-for/