Taustalt kostuv müra võib videokõne ajal üsna häiriv olla. Skype‘i uus müra summutamise funktsioon tuleb teile sellistes olukordades appi.

22.02.2021 | Skype‘i ajaveebid | mürasummutus

Igasugune taustamüra, näiteks inimeste rääkimine, laste kilked mängimisel, ehituslärm naabrite juures või teie koera haukumine kujuteldava koletise peale, võib olla väga häiriv, kui te üritate samal ajal Skype'is rääkida.

Enam ei pea te selle pärast muretsema!

Meil on hea meel tutvustada Skype'i töölauarakenduse uusimat taustamüra summutamise funktsiooni.* Algselt Microsoft Teamsi jaoks välja töötatud uus funktsioon on loodud summutama kõiki helisid, välja arvatud teie häält, kui te Skype'is vestlete.

Vaata meie videost, kuidas see toimib.

Mürasummutuse GIF-pilt


Selle käepärase uue funktsiooni aktiveerimiseks Skype'i töölauarakenduses vaadake seda artiklit meie tugiteenuste jaotises.

Selle funktsiooni tehnoloogia

Nendele, kes soovivad mõista funktsiooni tehnoloogiat: see töötab, analüüsides teie audiosisendit ja kasutades seejärel spetsiaalselt treenitud sügavaid neurovõrke, et filtreerida välja müra kõneleja häält mõjutamata. Kui traditsioonilised mürasummutusalgoritmid suudavad eristada lihtsaid, pidevalt esinevaid helisid, nagu ventilaatori müra, on need uued neurovõrgud võimelised õppima vahet tegema kõnel ja keerulisematel, mitteregulaarselt esinevatel häälitsustel, nagu klaviatuuril tippimine, pakendite krõbisemine ja koera ulgumine.

See tehnoloogia tugineb masinaõppele (MÕ), et õppida eristama selget kõnet ja müra, ning seda nimetatakse sageli tehisintellektiks (TI). Masinõppemudeli treenimiseks kasutatakse representatiivset andmekomplekti, et see toimiks tõhusalt enamikus olukordades, mida meie Skype'i kasutajad kogevad. Andmekomplektis peab olema piisavalt näiteid selgest kõnest, erinevatest müra tüüpidest ja keskkondadest, mis on meie veebipõhiste kõnede kasutajatele iseloomulikud.

Selle mitmekesisuse saavutamiseks sisaldab meie kasutatav andmekomplekt ligikaudu 760 tundi näiteid selge kõne kohta ja 180 tundi näiteid mürast. Microsofti rangete privaatsusstandardite järgimiseks ei kogutud selle andmekomplekti jaoks kliendiandmeid. Selle asemel kasutasime konkreetsete stsenaariumide kogumiseks kas avalikult kättesaadavaid andmeid või rahvahanget. Puhta kõne korral kasutasime naiste ja meeste häält võrdselt. Samuti kogusime andmeid rohkem kui 10 keelest, sealhulgas toonikeeltest, tagamaks, et mudel ei muuda lause tähendust, moonutades sõnade tooni. Müra andmete korral kaasasime 150 müra tüüpi, et hõlmata erinevaid olukordi, millega meie kasutajad võivad kokku puutuda, nagu klaviatuuril tippimine, vee laskmine segistist, norskamine ja palju muud. Kaasasime oma selge kõne andmete hulka ka emotsioonid, nii et näiteks naeru või nuttu ei summutataks. Nende keskkondade omadused, milles meie kasutajad Skype'i koosolekute ajal viibivad, avaldavad tugevat mõju ka kõnesignaalile. Selle mitmekesisuse jäädvustamiseks treenisime oma mudelit enam kui 3000 reaalse ruumikeskkonna ja enam kui 115 000 tehislikult loodud ruumi andmetega.

Kuna kasutame süvaõpet, siis on oluline omada võimsat mudeli treenimise taristut. Kasutame Microsoft Azure'i, et meie meeskond saaks välja töötada meie masinõppemudeli täiustatud versioonid. Veel üks väljakutse on tuvastada algne selge kõne mürast nii, nagu seda tajub inimkõrv. Kuna puuduvad objektiivsed mõõdikud, mis on tõhusalt korrelatsioonis inimese tajuga, siis arendasime välja raamistiku, mis võimaldas meil saata töödeldud heliproove rahvahanke korraldajatele, kes lasid inimestel kuulata ja hinnata helikvaliteeti viietärnilisel skaalal, et arvutada keskmise arvamuse skoor (MOS). Tänu nendele hinnangutele suutsime välja töötada uue kujuteldava mõõdiku, mis koos inimeste subjektiivsete hinnangutega võimaldas meil teha kiireid edusamme oma süvaõppe mudelite kvaliteedi parandamisel.

Selle valdkonna teadusuuringute edendamiseks avalikustasime oma andmekomplekti ja rahvahanke raamistiku. See on olnud kolme võistluse alustala, mida korraldasime osana konverentsidest Interspeech 2020, Interspeech 2021 ja ICASSP 2021, nagu kirjeldatud artiklis: Müra summutamise väljakutse – INTERSPEECH 2021 - Microsoft Research

Lõpuks lõime oma süvaõppe mudeli, et Skype'i töölauarakenduses reaalajas tõhusalt töötada. Optimeerides inimtaju, suutsime saavutada hea tasakaalu kvaliteedi ja keerukuse vahel, mis tähendab, et enamik Windowsi seadmeid, mida meie kasutajad kasutavad, saavad kasutada meie TI-põhist mürasummutust. See funktsioon on saadaval ka Maci jaoks ning meie meeskond töötab ka selle funktsiooni mobiiliplatvormidel kättesaadavaks muutmise nimel.

*Müra summutamise funktsioon pole praegu Skype'i veebi- või mobiiliversioonides saadaval.