kelly sikkema X etICbUKec unsplash ef124c2a3bdc437ba895e65bbf3669f2 scaled

Tärkeimmät oppimispisteet

  • DeepZen käyttää tekoälyä (AI) luodakseen yllättävän realistisia äänikirjoja tekstistä.
  • Tekniikka käyttää oikeita ääninäyttelijöitä rakennuspalikoiden toimittamiseen.
  • Amazon ja Audible eivät tällä hetkellä hyväksy tietokoneella luotuja äänikirjoja.
DeepZen on yritys, joka valmistaa äänikirjoissa käytettäviä tietokoneääniä, jotka perustuvat ihmisnäyttelijöiden todellisiin ääniin. Laatu on pelottavaa – helposti riittävän hyvä kuunneltavaksi tuntikausia. Kikka tässä on AI (tekoäly) -komponentti, joka voi lukea tekstin ja päätellä oikean tunnereaktion kontekstin perusteella. Sitten se tuo tunteen ääneen. Se on vaikuttava ja erittäin hyödyllinen. Mutta haluammeko todella homogenisoidun äänikirjakokemuksen? Entä ne ääninäyttelijät? «Indie-kustantajan näkökulmasta kaikki, mikä alentaa äänikirjojen tuotannon kustannuksia, on erittäin mielenkiintoista», Rick Carlile, riippumattoman kustantajan Carlile Median omistaja, kertoi Lifewirelle sähköpostitse. «Mutta tämä vetoomus olettaa, että tuote olisi samaa laatua kuin perinteinen kerronta. En usko, että olemme vielä 100-prosenttisesti perillä. Älä ymmärrä minua väärin, DeepZen on uskomattoman hyvä. Se on loistava läpimurto ja sen tekijät ansaitsevat paljon kiitosta ja menestystä, mutta se ei ole vielä täydellinen.»

Ääni, joka on «tarpeeksi hyvä»

Paras tapa ymmärtää DeepZenin laatu on kuunnella näytteitä. Jos et tiennyt, että ne on luotu tietokoneella, et ehkä edes tajua sitä. Ei vähään aikaan. Oletetaan, että DeepZenin tekoäly on täydellinen, eikä se koskaan tulkitse väärin tunnesävyjä, joihin sen pitäisi osua.

Silloinkin ihminen voi tarjota vivahteikkaampia ja usein yllättävämpiäkin tulkintoja. Näyttelijä voi laittaa odottamattomiin käänteisiin sanoihin, joita tietokone ei koskaan harkitse. Ja todellisuudessa tekoälyn tulkinta ei todellakaan ole aivan yhtä hyvä kuin ammattimaisena ääninäyttelijänä. «Elokuvien parissa ja viime aikoina äänikerronnan parissa työskentelevänä henkilönä, samalla kun kunnioitan tekoälyä, olen varma, että siellä on syviä merkityksiä, joita kone ei voi tulkita», sanoi ammattimainen ääninäyttelijä Paul Cram. Lifewireen sähköpostitse. «Tuleeko tuntemattomien tekijöiden aalto käyttämään sitä? Takaan, että käytät sitä, koska se on «riittävän hyvää». Riittävän hyvä oleminen yhdistettynä mukavuuteen ja kustannussäästöihin saattaa riittää houkuttelemaan indie-julkaisijoita palveluun. «Äänikirjat voivat maksaa jopa 500 dollaria per tunti suoritettua ääntä (paljon enemmän julkkisäänelle), ja se ei sisällä hallinta- ja hallintoaikakustannuksia», Carlile sanoo. «Mahdollisuus puolittaa nämä kustannukset yksinkertaisesti lataamalla käsikirjoitus DeepZenin kaltaiselle palveluntarjoajalle on erittäin houkuttelevaa.»

Puhumisen ongelmat

Se ei ole niin yksinkertaista kuin ääninäyttelijöiden ampuminen ja käsikirjoitusten lataaminen DeepZeniin. Äänikirjan tekoälypuhelimella on tällä hetkellä yksi este, ja se tulee Amazonilta.

«Tällä hetkellä ACX, kustantajan reitti Audiblen ja Amazonin äänikirjojen jakeluun, ei hyväksy äänikirjoja, jotka eivät ole ihmisen äänittämiä», Carlile sanoo. Miksi? Laatu. Tässä on usein kysyttyjen kysymysten kohta verkkosivustolta: «Tekstistä puheeksi tai muut automaattiset tallenteet eivät ole sallittuja. Kuuluvat kuuntelijat valitsevat äänikirjat materiaalin ja tarinan esittämiseen. Tämän odotuksen täyttämiseksi äänikirjasi on imeydyttävä ihminen.» Tämä tarkoittaa, että DeepZenin luomat äänikirjat ovat ulkona – ainakin toistaiseksi. Tämä on puhdasta spekulaatiota, mutta DeepZen näyttää melko hyvältä hyödykkeeltä Amazonille, koska se antaa sen myydä palvelua ja säilyttää sen yksinomaan Audible-kirjoille. Ja vaikka ei, jos tietokoneella luotujen äänikirjojen laatu on yhtä hyvä kuin tämä, ei näytä olevan juurikaan syytä olla tekemättä poikkeusta tähän sääntöön. Haluaisitko kuunnella tällä tavalla tehtyjä äänikirjoja? Kun se tapahtuu, useimmat ihmiset eivät edes epäile sitä. Jotkut saattavat pitää parempana tietokoneella luotujen äänien täydellisyydestä, koska ne ovat vapaita lauluäänistä ja -tavoista, jotka voivat toisinaan häiritä. Tekniikka soveltuu myös videopeleihin, TV- ja radiomainoksiin ja kaikkiin muihin skenaarioihin, joissa palkkaat ääninäyttelijän. DeepZenin tekniikka olisi myös loistava tapa luoda automaattisesti uutispodcasteja kirjoitetuista artikkeleista, joista voisi olla hyötyä työmatkalla. Entä ne ääninäyttelijät? No, siellä on ainakin yksi mahdollisuus: he voivat alkaa työskennellä DeepZenille.

Por Markus