Ang MacWhisper Ay Ang Libreng Transcription Software na Hinihintay Ko

Naghahanap ka ba ng Mac software upang i-transcribe ang mga audio file sa mga nakasulat na text file? Maraming mga bayad na tool, tulad ng Otter.ai at Trint, na maaaring magastos ng tunay na pera kapag sinimulan mong gamitin ang mga ito nang labis. Pero MacWhisper ay ang libreng solusyon na hinihintay ng internet. O, at least, yung hinihintay ko.

Ang OpenAI ay naglabas ng isang napakalakas na libreng programa noong Setyembre 2022 na nagbigay-daan sa mga taong may ilang tech savvy na i-convert ang kanilang mga audio at video file sa hindi kapani-paniwalang tumpak na mga transcript. Ang problema ay hindi ito masyadong naa-access sa karaniwang user, dahil kailangan mong maging pamilyar sa paggamit ng mga command sa Terminal app.

Ngunit sa MacWhisper, na unang nakita ni 9to5Mac, may isang tao na sa wakas ay nakabuo ng isang GUI, o graphical na user interface, na binuo sa ibabaw ng OpenAI's Whisper at iniiwan ang lahat ng nakakalito na tech na bagay sa ilalim ng hood, hinahayaan kang i-drag at i-drop ang iyong audio file at makakuha ng transkripsyon nang napakabilis. At ang MacWhisper ay lubos na tumpak dahil ang OpenAI's Whisper ay sinanay sa 680,000 oras ng data ng audio sa web.

Isa sa mga magagandang bagay tungkol sa MacWhisper ay hindi mo ina-upload ang audio o video file na gusto mong i-transcribe sa internet. Mahalaga iyon para sa mga mamamahayag na maaaring gumagawa ng isang sensitibong kuwento, o sinumang karaniwang nag-iingat sa pag-upload ng kanilang mga personal na file sa cloud. Ang file ay nananatili sa iyong desktop, ibig sabihin ay walang pagkakataong mahadlangan ng sinuman ang iyong audio.

Muli, ang MacWhisper ay isang bagong user interface lamang para sa isang libreng programa na ipinakilala ng OpenAI noong nakaraang taon, ngunit talagang gagawin nitong madali ang audio transcription para sa kahit sino. Dahil gumagamit ako ng Whisper at natagpuan ko itong lubhang kapaki-pakinabang mula nang ilabas ito. At kahit ako ay gagamit na ngayon ng MacWhsiper, dahil siguradong mapabilis nito ang daloy ng trabaho ko.

Bilang isang halimbawa lamang, pagkatapos ng balita ng pagbagsak ng kumpanya ng crypto na FTX, ginamit ko ang Whisper upang i-transcribe ang dose-dosenang mga oras ng lumang panayam sa YouTube kasama ang tagapagtatag ng kumpanya na si Sam Bankman-Fried. Mula doon, nagawa kong maghanap sa mga transcript at makahanap ng kakaiba at kawili-wiling mga ideya para sa mga artikulong isusulat, tulad noong sinabi ng SBF noong Hunyo 2021 na Inayos sana ng blockchain ang Enron. Ang paghahambing ng SBF kay Enron ay isang kakaibang pagkakataon, dahil sa lahat ng nalalaman natin ngayon tungkol sa kung paano bumagsak ang FTX. Ngunit hindi ko kailanman mahahanap ang sandaling iyon sa isang lumang hindi malinaw na panayam nang walang dose-dosenang mga transcript na maaari kong hanapin. At ang prosesong iyon, habang mas madali kaysa sa pakikinig sa mga oras at oras ng mga teyp, ay clunky pa rin at hindi masyadong awtomatiko.

Pagkatapos ma-install ang Whisper sa aking makina, nag-type ako ng "whisper audiofilename.mp3 —model tiny.en" sa Terminal app ng Mac anumang oras na gusto kong mag-transcribe ng isang file. Sa WhisperMac, maaari ko lang i-drag at i-drop ang aking audio file at ginagawa nito ang magic nito nang walang anumang karagdagang pag-type.

Sinubukan ko ang MacWhisper sa isang episode ng NBC Nightly News na na-download ko mula sa YouTube. At bukod sa ilang mga pagkakamali, tulad ng pagbibigay-kahulugan sa salitang "windchills" bilang "windhills," at marinig si Lester Holt bilang "Lester Hold," napakatumpak ng transcript. Ang MacWhisper ay libre, ngunit mayroong isang bayad na tier ng software na maaaring bahagyang mas tumpak dahil gumagamit ito ng mas masinsinang mga modelo ng pagsasanay ng OpenAI, ngunit ang libreng bersyon ay gagana nang mahusay para sa karamihan ng mga tao.

Binibigyang-daan ka ng MacWhisper na i-export ang na-transcribe na salita sa ilang iba't ibang format, kabilang ang plain text, CSV o kahit isang subtitle na format ng file tulad ng SRT at VTT.

At ang MacWhisper ay hindi lang para sa English. Maaari kang mag-transcribe ng audio sa 100 iba't ibang wika, na hindi kapani-paniwalang madaling gamitin. Ang tanging feature na wala sa MacWhisper, na kinagigiliwan kong paglaruan sa Whisper sa Terminal app, ay ang pagsasalin ng wika. Nagsalin ako ng mga viral na video sa Russian at Chinese at sinabihan ako ng mga taong nagsasalita ng mga wika sa Twitter na ang mga pagsasalin ay tama.

Ang iba pang tampok na wala sa MacWhisper, kahit na hindi rin ito magagamit mula sa OpenAI's Whisper, ay ang kakayahang mag-iba ng mga nagsasalita. Halimbawa, kung nagta-transcribe ka ng isang panayam sa dalawang tagapagsalita, walang malinaw na marka na nagpapakita kapag huminto ang isang tagapagsalita at nagsimula na ang isa pa. Ngunit pinaghihinalaan ko ang isang tao ay bubuo ng kakayahang iyon sa kalaunan. Awtomatikong ginagawa ito ng mga bayad na serbisyo tulad ng Trint, at magiging mainam na magkaroon ng libre sa huli, ngunit nakukuha mo ang binabayaran mo.

Mayroon ding feature sa MacWhisper kung saan maaari mong i-convert ang speech mula sa mikropono ng iyong computer sa text, na maaaring maging madaling gamitin kung gusto mong mag-transcribe ng isang bagay sa mabilisang paraan.

Ilang buwan akong nag-iisip kung kailan ang isang tao sa wakas ay bubuo ng isang GUI para sa Whisper, dahil ang ilang mga tao ay sinubukan ito ngunit hindi lumikha ng anumang bagay na napaka-user friendly. Ngunit ang MacWhisper, na binuo ni Jordi Bruin, ay ang software na hinihintay ko. Si Bruin ay nakabuo din ng software tulad ng MacGPT, na nagpapahintulot sa mga user na ma-access ang ChatGPT mula sa kanilang menubar.

Maaari mong i-download ang MacWhisper libre, na may pagpaparehistro ng email, sa website ni Bruin.

Pinagmulan: https://www.forbes.com/sites/mattnovak/2023/02/04/macwhisper-is-the-free-transcription-software-ive-been-waiting-for/