مايكروسوفت تطوّر نموذج "ذكاء" يتحكم في برامج ويندوز

تعمل مايكروسوفت على تطوير نموذج ذكاء اصطناعي جديد باسم "Large Action Model أو LAM"، يتميز بقدرته على تشغيل برامج ويندوز وتنفيذ المهام بنحو مستقل، ويشكّل نقلة نوعية في هذه التقنية.

يمكن لنموذج LAM تنفيذ عمليات شراء عبر التنقل في واجهة الموقع

وقالت شركة مايكروسوفت إن نموذج LAM الجديد يتميز بالقدرة على تحويل طلبات المستخدمين إلى أفعال حقيقية، سواء كان ذلك تشغيل البرامج أو التحكم في الأجهزة، كما يعد أول نموذج يُدرَّب بنحو خاص للعمل مع منتجات مايكروسوفت أوفيس المكتبية وغيرها من تطبيقات ويندوز.

وأضافت أن النموذج الجديد يختلف عن النماذج التقليدية في أنه عند التسوق عبر الإنترنت مثلا، تستطيع النماذج التقليدية تقديم تعليمات نصية حول كيفية الشراء، في حين يمكن لنموذج LAM تنفيذ عملية الشراء نفسها من خلال التنقل في واجهة الموقع.

وأشارت مايكروسوفت إلى أن تطوير هذا النموذج يتطلب 4 مراحل رئيسية هي: التدريب على تخطيط المهام وتقسيم المهمة إلى خطوات منطقية، والتعلم من نماذج متقدمة (مثل GPT-4o) لتحويل الخطط إلى أفعال، والاستكشاف الذاتي الذي يتيح للنموذج البحث عن حلول جديدة وتجاوز العقبات التي تعجز عنها النماذج الأخرى، بالإضافة إلى التدريب المستند إلى المكافآت لتحسين دقة التنفيذ.

وقام مختصون بتجربة نموذج LAM في بيئة اختبار خاصة ببرنامج تحرير النصوص "وورد"، ونجح النموذج بالفعل في تنفيذ المهام بنسبة قدرها 71%، متفوقًا على GPT-4o الذي حقق نسبة نجاح بلغت 63% دون معلومات بصرية، كما كان نموذج LAM أسرع، إذ استغرق 30 ثانية فقط لتنفيذ المهمة مقارنةً بـ 86 ثانية لـ GPT-4o. ومع ذلك، عند تزويد GPT-4o بمعلومات بصرية، تحسنت دقته لتصل إلى 75.5%.

ومع ذلك يواجه نموذج LAM بعض التحديات، وفق مختصين، منها تنفيذ أفعال بنحو خطأ، وبعض القضايا التنظيمية التي تحتاج إلى حلول، وقيود تقنية تؤثر في قابلية التوسع والتطبيق في مجالات مختلفة.

أضف تعليقك

أخبار ذات صلة