Close Menu
  • الاخبار
    • اخبار الخليج
    • اخبار السعودية
    • اخبار العالم
    • اخبار المغرب العربي
    • اخبار مصر
  • المال والأعمال
  • التقنية
  • الرياضة
  • السياحة والسفر
  • الصحة والجمال
  • المزيد
    • ترشيحات المحرر
    • الموضة والأزياء
    • ثقافة وفنون
    • منوعات
فيسبوك X (Twitter) الانستغرام
الخليج العربي
  • الاخبار
    • اخبار الخليج
    • اخبار السعودية
    • اخبار العالم
    • اخبار المغرب العربي
    • اخبار مصر
  • المال والأعمال
  • التقنية
  • الرياضة
  • السياحة والسفر
  • الصحة والجمال
  • المزيد
    • ترشيحات المحرر
    • الموضة والأزياء
    • ثقافة وفنون
    • منوعات
الرئيسية»اخبار التقنية»أنثروبيك تطور تقنية ثورية لمنع إساءة استخدام نماذج الذكاء الاصطناعي
اخبار التقنية

أنثروبيك تطور تقنية ثورية لمنع إساءة استخدام نماذج الذكاء الاصطناعي

اسلام جمالبواسطة اسلام جمال4 فبراير، 20253 دقائق
فيسبوك تويتر بينتيريست تيلقرام لينكدإن Tumblr واتساب البريد الإلكتروني
شاركها
فيسبوك تويتر لينكدإن بينتيريست تيلقرام البريد الإلكتروني

كشفت شركة أنثروبيك الناشئة في مجال الذكاء الاصطناعي عن تقنية جديدة تهدف إلى منع المستخدمين من إساءة استخدام نماذجها، واستخراج محتوى ضار منها، في خطوة تعكس تسابق كبرى الشركات التقنية لتعزيز معايير الأمان في هذا المجال المتطور.

وأوضحت الشركة في ورقة بحثية أنها طوّرت نظامًا جديدًا يُعرف باسم “المُصنّفات الدستورية”، وهو طبقة حماية تعمل فوق نماذج اللغة الكبيرة، مثل نموذج Claude التابع لها، ويتيح هذا النظام مراقبة المدخلات والمخرجات، لمنع إنتاج أي محتوى غير آمن.

ويأتي هذا التطوير في ظل تصاعد المخاوف بشأن ما يُعرف بـ “اختراق الذكاء الاصطناعي Jailbreaking”، وهي محاولات لاستغلال النماذج لتوليد معلومات غير قانونية أو خطِرة، مثل تعليمات تصنيع الأسلحة الكيميائية. ومع تزايد هذه التهديدات، تتسابق الشركات لإيجاد حلول تحمي نماذجها، مما يساعدها في تجنب التدقيق التنظيمي، وكسب ثقة المؤسسات.

وقد طرحت مايكروسوفت بالفعل تقنية “الدروع التوجيهية Prompt Shields” في مارس الماضي، في حين أطلقت ميتا نموذج “حارس التوجيه Prompt Guard” في يوليو من عام 2023، الذي تعرض للاختراق في البداية، لكنه خضع لاحقًا لتحسينات أمنية.

وقال مرينانك شارما، أحد أعضاء الفريق التقني في أنثروبيك: “إن الدافع الرئيسي وراء تطوير النظام كان التعامل مع الأخطار الشديدة، مثل تصنيع الأسلحة الكيميائية، ولكن الميزة الأهم هي القدرة على التكيف والاستجابة السريعة”.

ومع أن أنثروبيك لم تدمج هذه التقنية في نماذج Claude الحالية، فإنها أشارت إلى احتمال استخدامها مستقبلًا عند إطلاق نماذج أكثر تطورًا وأعلى خطورة.

ويعتمد النظام الجديد على “دستور” من القواعد التي تحدد المحتوى المسموح والمحظور، ويمكن تعديله للتعامل مع أنواع مختلفة من المواد الخطِرة. وتُستخدم طرق متنوعة لاختراق النماذج، مثل إعادة صياغة الطلبات بأسلوب غير مألوف، أو مطالبة النموذج بالتصرف كشخصية خيالية لتجاوز قيود الأمان.

ولضمان فاعلية النظام، قدمت أنثروبيك مكافآت تصل إلى 15,000 دولار للباحثين الأمنيين الذين تمكنوا من اختراق النموذج في إطار برنامج “مكافآت اكتشاف الثغرات Bug Bounty”.

ووفقًا لنتائج الاختبارات، فقد نجح نموذج Claude 3.5 Sonnet في رفض أكثر من 95% من محاولات الاختراق عند تشغيل التقنية الأمنية الجديدة، مقارنةً بنسبة قدرها 14% فقط عند عدم تفعيلها.

وتحاول شركات الذكاء الاصطناعي تحقيق توازن بين الأمان وكفاءة النماذج، إذ تؤدي إجراءات المراقبة الصارمة أحيانًا إلى رفض الطلبات المشروعة. وقد شهدت نماذج مثل Gemini و Llama 2 مشكلات في هذا الجانب عند إطلاقها الأولي، لكن أنثروبيك أكدت أن نظامها أدى إلى زيادة طفيفة فقط في معدلات الرفض غير الضرورية.

وتأتي إضافة هذه الطبقة الأمنية بتكلفة تشغيلية إضافية، إذ أشارت الشركة إلى أن تشغيلها يزيد استهلاك الموارد الحاسوبية بنسبة قدرها 24%، وهو ما يشكّل تحديًا في ظل ارتفاع تكاليف تشغيل نماذج الذكاء الاصطناعي.

تم نسخ الرابط

شاركها. فيسبوك تويتر بينتيريست لينكدإن Tumblr البريد الإلكتروني

المقالات ذات الصلة

شركة CNTXT AI تستحوذ على Actualize لتعزيز ريادتها في الذكاء الاصطناعي الصوتي العربي للمؤسسات والجهات الحكومية في دول مجلس التعاون الخليجي

4 يونيو، 2026

شركة CNTXT AI تكشف عن «منصت إيدج» (Munsit Edge): تقنية ذكاء اصطناعي عربية تتيح التحويل الفوري والخاص للكلام إلى نص على الهواتف والسيارات والأجهزة الذكية

14 مايو، 2026

تقارير: سامسونج تستعد لإطلاق لابتوبات Galaxy Book بنظام أندرويد وواجهة One UI 9

1 مايو، 2026

شركة CNTXT AI تطلق نموذج “مُنصِت” الإماراتي لتحويل النص إلى كلام، أدق نموذج صوتي إماراتي أصيل، واضعةً معياراً جديداً لدقة وتطوّر تقنيات النطق باللغة العربية

25 أبريل، 2026

شركة CNTXT AI تطلق نموذج “مُنصِت” الإماراتي لتحويل النص إلى كلام، أدق نموذج صوتي إماراتي أصيل، واضعةً معياراً جديداً لدقة وتطوّر تقنيات النطق باللغة العربية

25 أبريل، 2026

سامسونج Galaxy Z Flip 8 قد يخيّب آمال المستخدمين بسبب غياب ترقيتين أساسيتين

21 أبريل، 2026
اقسام الموقع
  • اخبار التقنية (4٬948)
  • اخبار الخليج (31٬732)
  • اخبار الرياضة (47٬182)
  • اخبار السعودية (23٬465)
  • اخبار العالم (26٬650)
  • اخبار المغرب العربي (26٬655)
  • اخبار مصر (3٬058)
  • اخر الاخبار (3)
  • اقتصاد (1)
  • الاخبار (9٬854)
  • التعليم (1)
  • السياحة والسفر (49)
  • الصحة والجمال (15٬946)
  • المال والأعمال (349)
  • الموضة والأزياء (315)
  • ترشيحات المحرر (4٬880)
  • تعليم (1)
  • تكنولوجيا (9)
  • ثقافة وفنون (81)
  • غير مصنف (26٬612)
  • منوعات (4٬758)
© 2026 الخليج العربي. جميع الحقوق محفوظة.
  • سياسة الخصوصية
  • اتصل بنا

اكتب كلمة البحث ثم اضغط على زر Enter