أي أسئلة؟ اتصل بنا: +86-23-67305242
على الانترنت رسالتك
أخبار الشركة صناعة الأخبار

مركز الأخبار
المهنية المتكاملة الهوية الحل الموردين.

المساواة بين الجنسين في التعرف على الكلام تحدي بطبيعته

البلاغ: huifan   الوقت: 2018-03-15

 

Biometric industry news voice recognition

 

تعتبر تقنية التعرف على الصوت أقل دقة عند تطبيقها على النساء أكثر من الرجال ، ويرجع ذلك جزئياً إلى تصميم أنظمة الكلام ، ولكن أيضاً بسبب الاختلافات الفيزيولوجية المتأصلة ، وفقًا لما نشره ديبل راو ، المؤسس المشارك لمنظمة AI للتعرّف على الكلام StartupR7 Speech Sciences. 
إن معدلات الخطأ التفاضلية لعينات الكلام من المتحدثين من الذكور والإناث تجعل من تدريب أنظمة الذكاء الاصطناعي التعرف على كل من الصعوبة بنفس القدر ، كما يكتب راو ، وغالبا ما تتفاقم المشكلة من خلال تقنيات شائعة الاستخدام مثل MFCCs (معاملات cepstral ميل ميل). 
متوسط ​​التردد الأساسي ، أو متوسط ​​F0 ، المرتبط بمفهوم الملعب ، عادة ما يكون حوالي 120 هرتز بالنسبة للرجال ، وأقرب إلى 200 هرتز للنساء ، ويمكن أن يعتمد أيضًا على العرق والتدخين والمرض وعوامل أخرى. كما يلاحظ راو أن مفهوم الجندر في الوسط F0 يقتصر على الجنس البيولوجي عند البلوغ. 
"أنظمة الكلام المصممة دون الانتباه إلى مدى هذه المشكلة يمكن أن تجعل مشكلة صعبة بالفعل أسوأ ،" يكتب. "لحسن الحظ ، مع النماذج الحديثة العميقة للخطاب ، يمكننا بناء نماذج تتعلم مباشرة من أشكال الموجات الخام ، وإلقاء الكثير من البيانات وحسابها ، ونأمل أن يكون لدى النماذج قدرة كافية على ترميز الاختلافات النوعية بشكل موثوق به. وهذا أمر جذاب ، ولكنه نوع من تفضيل الشركات الكبيرة من الشركات الناشئة الصغيرة التي تدفع التقنيات الجديدة طوال الوقت. ولكن مع التفكير الكافي ، يمكن استبدال العديد من النماذج العميقة التي يتم توفيرها بشكل زائد بنماذج عميقة أبسط ". 
قال راتشيل تاتمان ، المحلل في مجال إعداد البيانات في Kaggle ، لـ The Registerthat في حين أن MFCCs ليست أقل تأثيراً بطبيعتها في نمذجة خطاب المرأة ، "هناك إشارة صوتية أقل قوة نسبيًا بالنسبة إلى النساء ، وأكثر سهولة من خلال حجبها ، مثل المروحة أو حركة المرور في الخلفية ، مما يجعل من الصعب على أنظمة التعرف على الكلام. سيؤثر ذلك على كل ما تستخدمه في نمذجة الصوت ، وهو ما تستخدمه MFCCs. " 
يقترح راو أنه مع تزايد شعبية المساعدين الرقميين المنشطين بالصوت مثل سيري من أبل ، ينبغي البحث عن آراء النساء الباحثات في الكلام حول نماذج الكلام في الإنتاج ، وكيفية تحسينها. 
وقد تبين أن أنظمة التعرف على الوجه أقل دقة بالنسبة للنساء ، وللأشخاص ذوي البشرة الداكنة ، مما يؤدي إلى النظر في المشكلة من قبل لجنة فرعية تابعة للكونغرس لتوجيه تطبيق الحكومة لمنظمة العفو الدولية.

تحتاج كثير معلومة؟

لا تتردد في الاتصال بأحد ممثلينا

٥. إذا لكم أي طلب واقتراح للمنتجات فتفضلوا بترك الرسالة لنا، ونجيب أسئلتكم في أول وقت، وشكرا لكم على التأييد.