GettyImages 1164217839 74f7eeb30f4b49e3b186c21374c2df29

Tärkeimmät oppimispisteet

  • Uudet tekniikat voivat johtaa tietokoneisiin, jotka ymmärtävät paremmin ihmisen puhetta.
  • Microsoft ja NVIDIA julkistivat äskettäin uuden tekoälypohjaisen menetelmän kielen tulkitsemiseen.
  • Kvanttilaskenta voisi olla toinen tapa edistää kielenkäsittelyn alaa.
Nykyään on monia älykkäitä laitteita komentojen antamiseen, mutta olemme vielä kaukana tietokoneista, jotka ymmärtävät keskustelupuhetta. Microsoft ja NVIDIA julkistivat äskettäin uuden tekoälyyn perustuvan puheen tulkintamenetelmän, joka voi muuttaa tapaa, jolla keskustelemme elektroniikkamme kanssa. Se on osa kasvavaa liikettä, joka muuttaa sitä, miten tietokoneet ymmärtävät puhetta, joka tunnetaan nimellä Natural Language Processing (NLP). «NLP:tä mahdollistavat mallit kasvavat ja kehittyvät yhä enemmän ja lähemmäs ihmisen ymmärrystä», tekoälyasiantuntija Hamish Ogilvy kertoi Lifewirelle sähköpostihaastattelussa. «Yksi suurista edistysaskeleista on, että NLP menee yksinkertaisia ​​avainsanoja pidemmälle. Nykyään saatat olla tottunut kirjoittamaan tai lausumaan avainsanan tai kaksi saadaksesi hakutuloksia, mutta uudemmat luonnollisen kielen käsittelymallit käyttävät kontekstia rikkaampien tulosten tuottamiseksi. tarjous.»

chatbotit

NVIDIA ja Microsoft ovat tehneet yhteistyötä luodakseen Megatron-Turing Natural Language Generation (MTNLG) -mallin, joka kaksikon mukaan on «tehokkain tähän mennessä koulutettu monoliittinen muuntajakielimalli». AI-malli toimii supertietokoneissa. Mutta tutkijat havaitsivat, että MTNLG-malli otti huomioon ihmisen ennakkoluuloja, kun se kampasi vuorten läpi ihmisen puhenäytteitä. «Vaikka jättimäiset kielimallit edistävät kielten sukupolven huippua, ne kärsivät myös ongelmista, kuten vinoudesta ja myrkyllisyydestä», tutkijat kirjoittivat blogikirjoituksessaan. «Havaintomme MT-NLG:n kanssa ovat, että malli poimii stereotypiat ja ennakkoluuloja datasta, johon se on koulutettu.» Tietokoneet, jotka ymmärtävät puhetta paremmin, eivät vain paranna älykkäitä kaiuttimia, kuten Alexa, Ogilvy sanoo. Tekstipohjaiset hakusivustot, kuten Amazon, ymmärtävät myös paremmin kirjoitetut kyselyt. «Googlella on ollut selkeä etu tässä, mutta NLP-tekniikka tulee olemaan kaikkialla», Ogilvy sanoi. «Teksti- ja puhepohjaisissa hauissa käyttäjät voivat olla kuvaavampia, koska NLP ymmärtää muutakin kuin vain tekstiä; se ymmärtää etsimäsi kontekstin antaakseen parempia tuloksia.»

Kvanttichatit?

Kvanttilaskenta voisi olla yksi tapa edistää NLP:tä. Keskiviikkona yhtiö julkisti Cambridge Quantum lambeqin, jonka se väittää olevan ensimmäinen kvanttityökalupaketti NLP:lle. «…NLP ymmärtää enemmän kuin vain tekstiä; se ymmärtää etsimäsi kontekstin saadakseen parempia tuloksia.» Yhtiön mukaan työkalu mahdollistaa lauseiden kääntämisen luonnollisille kielille kvanttitietokoneissa toimivilla kvanttipiireillä. Kvanttilaskenta on eräänlainen laskenta, joka käyttää kvanttitilojen epätavallisia ominaisuuksia, kuten superpositiota, interferenssiä ja kietoutumista, laskelmien suorittamiseen. «Tapa, jolla kvanttitietokoneet ovat vuorovaikutuksessa NLP:n kanssa, eroaa suuresti klassisista koneista. Itse asiassa NLP on «kvanttialkuperäinen», Cambridge Quantumin johtava tutkija Bob Coecke kertoi Lifewirelle sähköpostihaastattelussa. «Tämä johtuu useita vuosia sitten tekemästämme löydöstä, jonka mukaan lauseita ja merkityksiä hallitsevalla kieliopillaan on hyvin samanlainen rakenne kuin kvanttitietokoneiden ohjelmointiin käytetyllä matematiikalla.» Coecke sanoi, että kvantti-NLP voisi johtaa parempiin ääniavustajiin ja käännöstyökaluihin. Toinen lupaava lähestymistapa puheentunnistuksen parantamiseen, nimeltään keskeinen tekoäly, lanseerattiin aiemmin tänä vuonna. Keskeinen tekoäly keskittyy mallin kouluttamiseen käytetyn tiedon laatuun algoritmien parantamisen sijaan. «Keskeinen lähestymistapa on osoittautunut tehokkaammaksi kuin perinteinen mallikeskeinen lähestymistapa tekoälytehtävien parantamisen kannalta», Hypergiantin datatutkija Zac Liu kertoi Lifewirelle sähköpostihaastattelussa. «Periaatteessa, kun datatieteilijät parantavat NLP-tietoja, se melkein takaa, että heillä on parempi NLP-malli ja paremmat NLP-ominaisuudet.»

Lapsi vuorovaikutuksessa robotin kanssa.

Seuraava askel on integroida tietokonenäkömallit NLP:hen, kuten AI-mallin kouluttaminen katsomaan videoita ja luomaan videosta tekstitiivistelmä, Liu sanoi. «Näiden edistysten soveltaminen voi olla rajatonta terveydenhoidosta, radiologisten elokuvien lukemisesta ja alustavan diagnoosin tekemisestä kodin, vaatteiden, korujen tai vastaavien esineiden suunnitteluun», hän lisäsi. «Asiakas voi selittää vaatimukset suullisesti tai kirjallisesti, ja tämä kuvaus voidaan muuntaa automaattisesti kuviksi tai videoiksi paremman visualisoinnin saamiseksi.»

Por Markus