AIT Newsتكنولوجيا

نظام ذكاء اصطناعي جديد لتحسين السمع في البيئات الصاخبة.. إليك التفاصيل

الرئيسية|محاور تقنية|نصائح تكنولوجية|نظام ذكاء اصطناعي جديد لتحسين السمع في البيئات الصاخبة.. إليك التفاصيل
منوعات تقنيةنصائح تكنولوجية

نظام ذكاء اصطناعي جديد لتحسين السمع في البيئات الصاخبة.. إليك التفاصيل

أصبحت السماعات الداعمة لخاصية إلغاء الضوضاء منتشرة كثيرًا، وتطورت بنحو كبير لضمان عزل الأصوات المزعجة المحيطة بك في أثناء الاستماع إلى المقاطع الصوتية، ومع ذلك فإن الحاجة إلى التحدث إلى شخص ما في أثناء وضع السماعة يتطلب تقليل مستوى إلغاء الضوضاء؛ مما يؤدي إلى تسرب العديد من الأصوات المحيطة بك.

ولكن ماذا لو كان من الممكن تدريب سماعات الرأس الخاصة بك لالتقاط صوت شخص واحد وتضخيمه بمجرد البدء بالتحدث إليه، حتى في أثناء تواجدك في غرفة مليئة بالضجيج؟

يحقق نظام (سماع الكلام المستهدف) Target Speech Hearing (TSH) تقدمًا في هذا المجال، وهو نظام ذكاء اصطناعي رائد طوّره باحثون في جامعة واشنطن.

إليك المزيد من التفاصيل حول هذا النظام، وكيف يتيح لك سماع صوت الشخص الذي تتحدث إليه في البيئات الصاخبة:

أولًا: كيف يعمل نظام سماع الكلام المستهدف (TSH):

لاستخدام TSH، يحتاج الشخص الذي يرتدي السماعات المجهزة بهذا النظام إلى النظر إلى الشخص الذي يريد سماعه لبضع ثوانٍ. وتسمح هذه المدة القصيرة لنظام الذكاء الاصطناعي بتعلم الأنماط الصوتية الفريدة للمتحدث المستهدف.

إليك المزيد من التفاصيل حول كيفية عمل هذه السماعات:

يضغط المستخدم على الزر الخاص بالسماعة في أثناء توجيه رأسه نحو الشخص المُتحدث لمدة تتراوح بين 3 و 5 ثوانٍ.
تلتقط الميكروفونات الموجودة على جانبي السماعة الموجات الصوتية من صوت المُتحدث.
تنقل السماعات هذه الإشارة الصوتية إلى حاسوب مدمج.
يحلل برنامج التعلم الآلي الصوت ويُنشئ نموذجًا للخصائص الصوتية المميزة لصوت المتحدث. ويستخدم نظام الذكاء الاصطناعي هذا النموذج لعزل صوت المُتحدث لحظيًا وتضخيمه حتى في أثناء وجود المستخدم في بيئة صاخبة.

كلما تحدث المتحدث المستهدف مدة أطول، زادت بيانات التدريب التي يتلقاها النظام؛ مما يسمح له بالتركيز بنحو أفضل في الصوت المطلوب وزيادة وضوحه. 

يفتح هذا النهج المبتكر عالمًا من الإمكانيات لتحسين التواصل في البيئات الصاخبة وتحسين تجربة الاستماع للذين يعانون مشكلات سمعية. وقد قال (Shyam Gollakota) المؤلف الرئيسي للورقة البحثية والأستاذ بجامعة واشنطن في كلية (Paul G. Allen) لعلوم وهندسة الحاسوب: “نحن نميل إلى التفكير في الذكاء الاصطناعي الآن باعتباره روبوتات دردشة قائمة على الويب تجيب عن الأسئلة. لكن في هذا المشروع، طوّرنا الذكاء الاصطناعي لتعديل الإدراك السمعي لأي شخص يرتدي سماعات الرأس وفقًا لرغباته. وباستخدام أجهزتنا، يمكنك الآن سماع صوت واحد بوضوح حتى لو كنت في بيئة صاخبة حيث يتحدث الكثير من الأشخاص الآخرين.”

ثانيًا: اختبار نظام الذكاء الاصطناعي TSH الجديد:

أجرى فريق البحث دراسة مع 21 مشاركًا لتجربة النظام الجديد، وارتدى كل مشارك سماعات تدعم نظام TSH وتحدث معهم شخص في بيئة صاخبة. وكانت النتائج مثيرة للإعجاب، وقيّم المستخدمون وضوح صوت المتحدث بأنه أفضل بما يقارب الضعف مقارنة بعدم استخدام هذا النظام.

يعتمد هذا الإنجاز على عمل سابق لفريق البحث متعلق بمجال (السمع الدلالي) semantic hearing الذي سمح للمستخدمين بتصفية الأصوات المحيطة بهم بناءً على تصنيفات صوتية محددة سابقًا مثل: زقزقة الطيور أو الأصوات البشرية. ويأخذ نظام TSH هذا المفهوم خطوة أخرى إلى الأمام من خلال تمكين التضخيم الانتقائي لصوت شخص معين.

إن الآثار المترتبة على ذلك كبيرة، فهذا النظام يعزز المحادثات الشخصية في البيئات الصاخبة ويُحسّن تجربة الاستماع للذين يعانون ضعف السمع. ومع تطور التكنولوجيا، يمكن لهذا النظام وأنظمة أخرى تعزيز التجربة السمعية بنحو غير مسبوق.

ثالثًا: ما قيود نظام سماع الكلام المستهدف الجديد؟

مع أن نظام سماع الكلام المستهدف يمثل قفزة كبيرة إلى الأمام في استخدام الذكاء الاصطناعي في مجال تحسين السمع في البيئات الصاخبة، فإن هذا النظام لديه بعض القيود في الوقت الحالي ومنها:

إمكانية تسجيل صوت متحدث واحد: في الوقت الحالي لا يمكن تدريب نظام TSH إلا على التركيز في متحدث واحد في كل مرة. وتسجيل عدة متحدثين في وقت واحد ليس ممكنًا بعد.
التداخل من مصادر صوتية مماثلة: إذا كان هناك صوت عالٍ آخر يأتي من الاتجاه نفسه للمتحدث المستهدف في أثناء عملية التسجيل، فقد يواجه النظام صعوبة في عزل الأنماط الصوتية للشخص المُستهدف.
إعادة التسجيل: إذا كان المستخدم غير راضٍ عن جودة الصوت بعد التدريب الأولي، فيجب عليه إعادة تسجيل صوت المتحدث المستهدف لتحسين الوضوح.

وعلى الرغم من هذه القيود، يعمل فريق جامعة واشنطن باستمرار لتحسين قدرات نظام TSH. ومن أهدافهم الأساسية إمكانية إدماج هذا النظام بسلاسة في المنتجات الاستهلاكية مثل: سماعات الأذن وأجهزة السمع.

Follow @aitnews
تم نسخ الرابط

تابعنا


للمزيد من التفاصيل: Read More

مقالات ذات صلة

زر الذهاب إلى الأعلى