Tekoälyavustettua podcast-litterointia IV: Uusi toivo

Erkki Mervaala
3 min readFeb 20, 2024

--

DEMO IV: Word. Eh.

Aiemmista kolmesta osasta poiketen tämä osa käsittelee AssemblyAI:n lisäksi Microsoft Wordin tarjoamaa litterointityökalua. Itse olen käyttänyt monen monet kerrat Wordin sanelinta, ja se on toiminut ihan hyvin niihin käyttötarkoituksiin mihin sitä olen tarvinnut. Perussanelu ja esim. podcastin äänitrailereiden litterointi ovat olleet peruspurkkaratkaisuja, joihin se on soveltunut.

Siinä missä AA on ilmainen, Wordin litterointityökalua varten tarvitaan 365 Premium -tilaus. Perus 365-tilauksella työkalua ei ole mahdollista käyttää. Mikäli tilaus löytyy, on litterointityökalun käyttäminen sangen yksinkertaista. Kirjaudu sisään osoitteessa microsoft365.com, avaa uusi Word-tiedosto, valitse Sanelin-valikon (mikrofonin kuva) nuolesta Litteroi, valitse oikea kieli (tässä tapauksessa suomi) ja lataa äänitiedosto koneeltasi Wordiin. Hetken ruksuttelun jälkeen litterointi on valmis ja puhujat on tunnistettu. Tämän jälkeen voidaan valita, miten litterointi tuodaan asiakirjaan. Vaihtoehtoja ovat litterointi puhujilla tai ilman ja aikakoodeilla tai ilman. Alla kuva tästä Wordin näkymästä ja esimerkki Kristallipallon 3. jakson litteroinnista.

Näkymä kun olen saattanut Wordin litteroiman podcastin tekstiin.

Vähemmän tarkkasilmäisimpiä varten tässä vielä ensimmäisen puhujan (minä) ensimmäinen lausuma Wordin tulkitsemana:

Hei ja tervetuloa kristallipallon äänin muotoiselle matkalle kohti hyvinvointivaltiota. Minä olen erkki määrä palajaa. Tänään keskustelemme sangen ajankohtaisesta teemasta, nimittäin pandemiasta. Kristallipallo loppui suuria teemoja eklöv kotivaltion lokakuumasta ja tänään pandemiasta puhumaan pääsevät tutkijatohtori lauri lahikainen ja historian professori marjaana niemi Tampereen yliop.

Ainakin aiempia osia lukeneet huomaavat, että Wordin tuottama litterointi on AA:n tarjoamaa heikompaa. Vaikka nimeni on väärin AA:nkin tuotoksissa, se on lähes aina yhden kirjaimen päässä (useimmiten Mervala). ”Erkki määrä palajaa” on kauempana kuin mitä Wordin sanelinkaan on minulle koskaan keksinyt. Sama meno jatkuu seuraavassa lauseessa, kun ”Kristallipallolla puimme suuria teemoja ekohyvinvointivaltion näkökulmasta” muuntuu muotoon ”Kristallipallo loppui suuria teemoja eklöv kotivaltion lokakuumasta”. Mainitsinko jo, että tämä on maksullisen tilauksen ominaisuus?

No niin, kyllä tämäkin varmasti kehittyy, mutta toistaiseksi AA:n ilmaisellakin kikkareella pääsee parempiin tuloksiin. Tein vertailun vuoksi saman jakson litteroinnin AA:lla toisen osan työnkulkua noudattaen, ja lopputulos vastaa aiempien osien tasoa:

00:00:06 Erkki Mervaala: Hei ja tervetuloa kristallipallolle äänimuotoiselle matkalle kohti ekohyvinvointivaltiota. Minä olen Erkki Mervala ja tänään keskustelemme Sangen ajankohtaisesta teemasta nimittäin pandemiasta. Kristallipallolla puimme suuria teemoja ekohyvinvointivaltion näkökulmasta ja tänään pandemiasta puhumaan pääsevät tutkija tohtori Lauri Lahikainen ja historian professori Marjaana Niemi Tampereen yliopistosta. Miltä käynnissä oleva koronaepidemia ja sen vaikutukset näyttävät historiantutkijalle? Marianna Niemi.

Nimissä edelleen hieman hakemista (Mervala, Marjaana — Marianna), mutta muuten merkittävästi Wordin tuotosta parempi. Mutta jos Word riittää ja se Premium-tilaus löytyy, niin tämä tekee varmasti tarpeeksi hyvää jälkeä joihinkin tarkoituksiin. Itse erityisesti pidin siitä, että aikakoodit ja puhujat saa heitettyä suoraan asiakirjaan. Ja tietty tämä ei vaadi lainkaan koodaamista, mille on tietysti oma, suuri yleisönsä. Lisäksi, mikäli tekee tutkimusorganisaatiossa työtä muutenkin Microsoft-työkaluilla eikä datan pilveen päätymisestä ole haittaa niin tämä lienee instituutiotason tietoturvatahojenkin mielestä varsin varteenotettava vaihtoehto. Mutta selvittäkää ensin asianmukaisten tahojenne kautta ja kanssa! Minä litteroin täällä vain vanhoja podcastejani!

Vaikka toistaiseksi AA näyttäisi parhaalta vaihtoehdolta sitä varten, mitä näiden podien kanssa puuhailen, aion jatkossa kuitenkin testailla mm. GoodTapea ja mahdollisuuksien mukaan myös WhisperAI:ta, josta minulle on kuiskittu, että sitä voisi käyttää myös tietoturvallisen lokaalisti. Mene ja tiedä, en ole perehtynyt, mutta aie on, jahka speksit selviää.

Erkki out.

Osa 5 täällä ja aiemmat osat täällä.

--

--

Erkki Mervaala
Erkki Mervaala

Written by Erkki Mervaala

Researcher at the Finnish Environment Institute. Doing PhD at Helsinki University. Researcher member @ Puistokatu 4. Writer of many things but here mainly on AI

No responses yet