10:10AM
كشفت "غوغل ديب مايند" عن إطار جديد لتقييم دقة نماذج الذكاء الاصطناعي تحت اسم FACTS Benchmark Suite، يهدف إلى قياس مدى موثوقية هذه النماذج في تقديم معلومات صحيحة.
ويخضع الاختبار النماذج لأربعة محاور أساسية، تشمل الإجابة اعتماداً على المعرفة الداخلية، وحسن توظيف البحث عبر الإنترنت، والتحقق من صحة الإجابات بالاستناد إلى وثائق مطوّلة، إضافة إلى فهم الصور وتفسيرها.
ووفقاً للتقييم، سجّل نموذج "جيميني 3 برو" من غوغل أعلى نتيجة بدقة بلغت 69%، متقدّماً بفارق واضح على نماذج منافسة، إلا أن النتائج أظهرت استمرار فجوة كبيرة بين سرعة النماذج وقدرتها اللغوية وبين موثوقيتها في تقديم حقائق دقيقة.
وتبرز أهمية هذه النتائج في القطاعات الحساسة، مثل المال والصحة والقانون، حيث قد تؤدي أخطاء بسيطة إلى تبعات جسيمة، ما يجعل معايير «FACTS» بمثابة إنذار مبكر وخارطة طريق لتحسين دقة الذكاء الاصطناعي، الذي لا يزال يخطئ في نحو ثلث إجاباته.
شارك هذا الخبر
ترامب: هجوم سيدني ينطوي بوضوح على معاداة للسامية
مقتل 4 عناصر من الأمن السوري على أيدي مسلّحين في ريف إدلب
المطران خيرالله ترأس قداس عيد القديس نعمة الله الحرديني في كفيفان
من البقاع إلى دمشق: ذكرى انتصار الثورة السورية تؤكد أن الحرية واحدة والاستبداد إلى زوال
خالد حدادة ينفي ترشحه للانتخابات النيابية ويؤكد رفضه القانون الطائفي
لبنان يودّع النائب غسان سكاف في مأتم رسمي وشعبي حاشد في عيتا الفخار
الغزال وريفي يناقشان آليات تفعيل مجلس طرابلس الاقتصادي ودوره في تحريك العجلة التنموية
قيومجيان بتكليف من جعجع يتصل بسفير أستراليا مستنكراً الهجوم الإرهابي في سيدني
آخر الأخبار
أهم الأخبار و الفيديوهات في بريدك الالكتروني
إشتراك
Contact us on
[email protected] | +96176111721
Copyright 2023 © - Elsiyasa