GettyImages 1152311608 338947b37f904e72aef96d1d408e0b4d

Tärkeimmät oppimispisteet

  • Google on julkaissut uuden työkalun, jonka avulla käyttäjät voivat etsiä kappaleita hyräilemällä, laulamalla tai viheltämällä.
  • Uusi työkalu yhdistää koneoppimisen avulla huminaan kappaleen yli puolen miljoonan kappaleen tietokantaan, jota päivitetään jatkuvasti.
  • Googlen käyttäjät kysyvät, mikä kappale soitetaan lähes 100 kertaa kuukaudessa.
Google on julkaissut uuden «Hum to Search» -ominaisuuden ratkaistakseen turhauttavan ongelman: kappaleen juuttuminen päähän etkä pysty ymmärtämään, mikä sen nimi on. Ajatus huminasta kappaleen löytämiseksi vaikuttaa uskomattoman yksinkertaiselta, joten miksi Google ei julkaise tätä ominaisuutta ennen vuotta 2020? No, käy ilmi, että kappaleiden tunnistaminen tällä tavalla on itse asiassa melko monimutkaista, osittain siksi, että huminaversiomme ovat melko erilaisia ​​kuin alkuperäinen kappale. Äskettäisessä AI-bloginsa viestissä Google selittää, kuinka se on käyttänyt koneoppimista ratkaistakseen tämän ongelman ja auttaakseen ihmisiä löytämään kappaleen hyräilemällä, viheltämällä tai laulamalla melodiaa, vaikka niiden esitys ei olisikaan aivan tarkka. «Hum to Search keskittyy auttamaan ihmisiä tunnistamaan ja löytämään musiikkia, joka juuttuu heidän päähänsä», sanoi Googlen tiedottaja. elinehto sähköpostissa.

Alkaa vain hyräillä

Googlen käyttäjät kysyvät, mitä kappaletta soitetaan lähes 100 miljoonaa kertaa kuukaudessa, sanoi Aparna Chennapragada, Googlen varatoimitusjohtaja ja kuluttajaostoksista vastaava johtaja videossa, joka esittelee useita uusia hakuominaisuuksia. Nyt on tapa selvittää. «Hum to Search» -ominaisuus on sisäänrakennettu Googlen mobiilisovellukseen, Google Search -widgetiin ja Google Assistantiin. Pääset sovellukseen napauttamalla mikrofonikuvaketta ja sanomalla «What’s this song?» Myös «Etsi kappale» -painikkeen valitseminen toimii. Toimiakseen oikein toiminto edellyttää huminaa vähintään 10-15 sekuntia. Android-käyttäjät voivat hyräillä löytääkseen kappaleita yli 20 kielellä, kun taas iPhonessa vain englanninkieliset kappaleet toimivat. Työkalu ei aina tunnista kappaletta heti, mutta kun se tunnistaa, tulokset ovat melko hyviä. ”Yli puolet kappaleista useista eri muuttujista (ääni, sävelkorkeus, äänenvoimakkuus jne.) tunnistaa algoritmimme, mutta tarkkuus riippuu luonnollisesti huminan laadusta, kappaleen tyypistä ja muusta. Googlen tiedottaja kertoi elinehto sähköpostissa. «Mutta kun se tunnistetaan, noin neljä viidestä vastauksesta on oikeita.» Tämä ei kuitenkaan ole ensimmäinen kerta, kun huminaa käytetään musiikintunnistussovelluksessa. SoundHound tarjoaa samanlaisen ominaisuuden, kuten CNN Business totesi, ja se on saatavana myös Androidille ja iOS:lle. Googlen tiedottajan mukaan uusi ominaisuus ei aiheuta tietosuojaongelmia, eikä se muuta «tapaa, jolla Google käsittelee äänipohjaisia ​​vuorovaikutuksia», he sanoivat. elinehto sähköpostissa.

koneoppiminen

Konseptin yksinkertaisuudesta huolimatta on teknisesti melko vaikeaa hyräillä kappaletta löytääkseen studiotallenteen. Tähän on useita syitä, selittää Christian Frank Google Researchista 12. marraskuuta päivätyssä blogikirjoituksessa. Ensinnäkin kappaleen hyrätty versio voi olla hyvin erilainen kuin varsinainen tallenne, mikä tekee näiden kahden yhteensovittamisen vaikeaksi. Joten vaikka Shazam ja monet muut sovellukset ovat jo olemassa ravintolassa tai muussa julkisessa paikassa kuulemasi kappaleen tunnistamiseksi, humisevan melodian käyttäminen haun perustana voi olla hankalampaa. «Sanoitusten, taustalaulujen ja instrumenttien avulla musiikin tai studiotallenteen ääni voi olla hyvin erilainen kuin humina», Frank kirjoittaa. «Kun joku hyräilee kappaleen tulkintaansa vahingossa tai suunnittelemalla, sävelkorkeus, sävelen, tempo tai rytmi voivat usein vaihdella jonkin verran tai jopa merkittävästi.»

Googlen visualisointi huminasta leikeestä vastaavan studiotallenteen rinnalla.

Koska kappaleiden huminat versiot voivat olla niin erilaisia ​​kuin alkuperäiset, Frank huomauttaa, että monet aiemmat menetelmät vaativat henkilön virittämistä sellaiseen kappaleen versioon, jossa on vain melodia, tai lauluun, joka sisältää huminaa. Tämä on tehnyt reaalimaailman käytöstä haastavaa, koska nämä numerot sisältävät tietokannat voivat olla rajoitettuja ja ne on päivitettävä manuaalisesti. Google selittää, että Hum to Search -ominaisuus käyttää koneoppimismalleja äänen muuntamiseen «numeropohjaiseksi sekvenssiksi», joka edustaa kappaleen melodiaa. Sen sanomaa voidaan pitää «sormenjäljenä».

Käyttäjäystävällisempi

Googlen Hum to Search -ominaisuuden koneoppimisen käyttö tekee työkalusta lopulta paljon helpompi käyttää todellisessa maailmassa. Koska Hum to Search virittää hakijan humina-virityksen varsinaiseen kappaleeseen, työkalu voi toimia uusien kappaleiden kanssa niiden julkaisuhetkellä sen sijaan, että se olisi tietokanta, jota on päivitettävä jatkuvasti kunkin kappaleen humina-versioilla. Lisäksi sinun ei tarvitse täydellistä sävelkorkeutta käyttääksesi sitä. «Nykyinen järjestelmä saavuttaa korkean tarkkuuden kappaletietokannassa, joka sisältää yli puoli miljoonaa kappaletta, joita päivitämme jatkuvasti», Google sanoi Hum to Search -ilmoituksessa. «Tällä laulukorpuksella on vielä tilaa kasvaa sisältämään enemmän maailman monista melodioista.»

Por Markus