الاثنين، 24 أكتوبر 2016

رسميا تكنولوجيا التعرف على الكلام من مايكروسوفت وصلت دقّة البشر


تم تحقيق "التكافؤ مع البشر"

     دراسة نشرت الاثنين الماضي، بشرت بأنها نصر تاريخي لمايكروسوفت، وفي التفاصيل عن تكنولوجيا التعرف على الكلام  الجديدة، فإنّ هذه التكنولوجيا قادرة على نسخ خطاب تحادثي بنفس كفاءة البشر او على الاقل بنفس كفاءة خبير في كتابة النصوص (أي انه افضل من غالبية البشر). 

     هذه التكنولوجيا سجلت معدل خطأ عالمي لم يتجاوز 5.9% و الذي هو اخفض من 6.3% نسبة الخطأ على متسوي العالم التي سجلت الشهر الماضي فقط و هي النسبة الاخفض على الاطلاق من المسجلة قبلها في لوحة سجلات معايير هذه الصناعة، معدل الخطا هو نفسه او حتى اقل من شخص خبير في كتابة النصوص و الذي يكتبها بنفسه، "لقد وصلنا لمساواة مع البشر" يقول أكسويدنج هوانج. كبير علماء تكنولوجيا الخطاب و الكلام في مايكروسوفت. التكنولوجيا الجديدة تستخدم نماذج اللغة العصبية و التي تسمح بتعميم اكثر فعالية بواسطة تجميع الكلمات المتشابهة سوياً.

     هذا النصر و النجاح اتى بعد عقود من دراسة خطاب التعرف على الانماط لأول مرة في سبعينيات القرن الماضي . ومع عمل محرك العقل العميق لجوجل (Deep Mind) في عمل موجات تصاعدية في تكنولوجيا التعرف على الكلام و الصور (والتحدّث مثل البشر)، فهذه التكنولوجيا تعتبر مساهمة مايكروسوفت في الوقت المناسب للبحث والتطوير الصاعد بخطاً حثيثة في مجال لذكاء الاصطناعي.

    وقد أعلن عن هذا الإنجاز من قبل حزمة أدوات الحسابات الشبكية (Computational Network Toolkit)، وهي نظام مايكروسوفت الداخلي للتعلم العميق.

الخطوة التالية: الفهم

     التطبيقات للتكنولوجيا الجديدة مرتبطة بتطوير خبرة المستخدم للمساعد الصوتي الخاص بميكروسوفت و تحديدا الخاص بويندوز و الأكس بوكس."هذا سوف يجعل كورتانا اكثر قوة و فعالية مما يجعل عمل مساعد ذكي حقيقي ممكنا" قالها هاري شوم متحمسا. و هو نائب الرئيس التنفيذي لمجموعة الذكاء الاصطناعي و الابحاث في ميكروسوفت. وبالطبع ستطور برامج لتحويل الكلام الى نص افضل من الحالية ايضا. 

     تصرّح ميكروسوفت بأنه على أية حال فإنّ التكافؤ لا يعني المثالية، فالحاسوب لا يسجل جميع الكلمات بوضوح. الامر الذي يصعب على البشر القيام به ايضا كما لا يستطيع القيام به "سيري"(المساعد الصوتي الخاص بشركة أبل) او اي مساعد صوتي موجود حتى الآن.

مما يثير للأعجاب بقدر هذا الإنجاز ايضا الفسحة المتبقية للتطوير فالهدف القادم هو تحويل التسجيل الى فهم حسب قول غروفر زويج، رئيس مجموعة البحث الكلامي والحوار في مايكروسوفت.

0 التعليقات :

إرسال تعليق