مصادر الإلهاء الصاخبة ليست ممتعة كثيرًا عندما تكون في مكالمة فيديو. يمكن لميزة Skype الجديدة لإزالة الضوضاء أن تعمل بكفاءة!
2021/02/22 | مدونات Skype | إلغاء الضوضاء
سواء تعلق الأمر بالأشخاص الذين يتحدثون، أوأطفال يلعبون، أو عمال البناء المجاورين، أو كلبك الأليف يخيف هذا الوحش الخيالي بعيدًا عن الشرفة الأمامية، فإن ضوضاء الخلفية يمكن أن تشتت انتباهك حقًا عندما تحاول التحدث على Skype.
حسنًا، لا للمزيد!
يسعدنا أن نعلن عن إصدار أحدث ميزة لإزالة الضوضاء في الخلفية في تطبيق Skype لسطح المكتب.* تم تطوير هذه الميزة الجديدة في الأصل لـ Microsoft Teams وهي مصممة لجعل كل شيء تقريبًا صامتًا باستثناء صوتك عند الاجتماع على Skype.
للاطلاع على كيفية عملها، شاهد الفيديو أدناه.
لتنشيط هذه الميزة الجديدة المفيدة في تطبيق Skype لسطح المكتب، اطلع على هذه المقالة في قسم الدعم الخاص بنا.
التكنولوجيا وراء الميزة
بالنسبة لأولئك الذين يرغبون في فهم التقنية الكامنة وراء الميزة: فهي تعمل من خلال تحليل تغذية الصوت ثم استخدام الشبكات العصبية العميقة المدربة خصيصًا لتصفية الضوضاء دون التأثير على صوت المتحدّث. في حين أن خوارزميات إزالة الضوضاء التقليدية يمكنها معالجة ضوضاء بسيطة ومتسقة مثل ضوضاء المروحة، يمكن لهذه الشبكات العصبية أن تتعلم الفرق بين الكلام والأصوات الأكثر تعقيدًا، وغير المتسقة مثل الكتابة على لوحة المفاتيح وصوت غلاف الطعام، وأيضاً صوت عواء الكلب.
تعتمد هذه التقنية على التعلم الآلي (ML) لمعرفة الفرق بين الكلام النظيف والضوضاء وغالبًا ما يشار إليها باسم الذكاء الاصطناعي (AI). تُستخدم مجموعة بيانات تمثيلية لتدريب نموذج التعلم الآلي على العمل في معظم المواقف التي يواجهها مستخدمو Skype لدينا. يجب أن يكون هناك تنوع كافٍ في مجموعة البيانات من حيث الكلام النظيف وأنواع الضوضاء والبيئات التي ينضم منها المستخدمون إلى المكالمات عبر الإنترنت.
لتحقيق هذا التنوع، تحتوي مجموعة البيانات التي نستخدمها على ما يقرب من 760 ساعة من بيانات الكلام النظيف و180 ساعة من بيانات الضوضاء. للامتثال لمعايير الخصوصية الصارمة لشركة Microsoft، لم يتم جمع أي بيانات للعملاء لمجموعة البيانات هذه. بدلاً من ذلك، استخدمنا إما البيانات المتاحة للجمهور أو التعهيد الجماعي لجمع سيناريوهات محددة. من أجل الكلام النظيف، استخدمنا توازنًا بين كلام الأنثى والذكور. قمنا أيضًا بجمع بيانات من أكثر من 10 لغات، بما في ذلك اللغات النغمية، للمساعدة في ضمان أن النموذج لا يغير معنى الجملة من خلال تشويه نبرة الكلمات. بالنسبة لبيانات الضوضاء، قمنا بتضمين 150 نوعًا من الضوضاء لتغطية السيناريوهات المتنوعة التي قد يواجهها المستخدمون من كتابة لوحة المفاتيح إلى المياه الجارية والشخير وغير ذلك. قمنا أيضًا بتضمين المشاعر في حديثنا النظيف حتى لا يتم إلغاء تعبيرات مثل الضحك أو البكاء. إن خصائص البيئة التي يلتقي المستخدمون من خلالها مع اجتماع Skype لها تأثير قوي على إشارة الكلام أيضًا. لالتقاط هذا التنوع، قمنا بتدريب نموذج ببياناتنا من أكثر من 3000 بيئة غرفة حقيقية وأكثر من 115000 غرفة تم إنشاؤها تركيبياً.
نظرًا لأننا نستخدم التعلم العميق، فمن المهم أن يكون لدينا بنية أساسية قوية لتدريب النماذج. نستخدم Microsoft Azure للسماح لفريقنا بتطوير إصدارات محسّنة من نموذج التعلّم الآلي الخاص بنا. هناك تحدٍ آخر لاستخراج الكلام النظيف الأصلي من الضوضاء يجب القيام به بطريقة تجعل الأذن البشرية تنظر إليه على أنه طبيعي وممتع. نظرًا لعدم وجود مقاييس موضوعية ترتبط ارتباطًا وثيقًا بالإدراك البشري، فقد قمنا بتطوير إطار عمل يسمح لنا بإرسال عينات صوتية مُعالجة إلى البائعين الذين يقومون بالتعهيد الجماعي حيث قام المستمعون البشريون بتصنيف جودة صوتهم على مقياس من نجمة واحدة إلى خمس نجوم لإنتاج نتائج رأي متوسطة (MOS). من خلال هذه التقييمات البشرية تمكنا من تطوير مقياس إدراكي جديد سمح لنا، جنبًا إلى جنب مع التقييمات البشرية الذاتية، بإحراز تقدم سريع في تحسين جودة نماذج التعلم العميق لدينا.
لتعزيز البحث في هذا المجال، قمنا بفتح مجموعة بياناتنا وإطار التعهيد الجماعي للجودة الإدراكية. كان هذا أساس ثلاث مسابقات استضفناها كجزء من مؤتمرات Interspeech 2020 وInterspeech2021 وICASSP 2021 كما هو موضح هنا: تحدي إزالة الضوضاء العميقة - INTERSPEECH 2021 - أبحاث Microsoft
أخيرًا، أنشأنا نموذج التعلم العميق الخاص بنا للتشغيل بكفاءة على تطبيق Skype لسطح المكتب في التوقيت الحقيقي. من خلال تحسين الإدراك البشري، تمكنا من تحقيق مفاضلة جيدة بين الجودة والتعقيد مما يعني أن معظم أجهزة Windows التي يستخدمها مستخدمونا يمكنها الاستفادة من نظام إزالة الضوضاء القائم على الذكاء الاصطناعي. تتوفر هذه الميزة أيضًا على أجهزة Mac ويعمل فريقنا على توفير هذه الميزة على الأنظمة الأساسية للأجهزة المحمولة أيضًا.
* لا تتوفر ميزة إزالة الضوضاء حاليًا في إصدارات الويب أو الأجهزة المحمولة من Skype.