قائمة النماذج المتقدمة في ثقة
كل حساب تاجر على ثقة يستطيع اختيار نموذجه لكل بوت. القائمة الحالية، كما في أبريل 2026:
السؤال ليس أبداً "أيهم الأفضل." بل "أيهم الأفضل لهذا البوت المحدد بهذا السعر بهذا التأخير."
كيف نختبر النماذج للعربية فعلاً
قوائم التصنيف تقيس متوسطات على معايير معظمها إنجليزية. بنينا مجموعة تقييم داخلية بـ ~600 محادثة عربية حقيقية مأخوذة (مجهولة) من أسطول ثقة. كل محادثة مقيّمة على:
طلاقة اللهجة
هل الرد يبدو كمتحدث أصلي بلهجة العميل، وليس روبوتاً مترجماً من الإنجليزية؟
اتباع التعليمات
إذا قيل للبوت "لا تقتبس سعراً — اعرض دائماً رابط الكتالوج"، هل يطيع تحت الضغط؟
الهلوسة
هل اخترع البوت رقم تتبع، كود خصم، أو ميزة منتج؟
الاستناد على المستندات
عندما تكون الإجابة في حزمة RAG، هل يجدها النموذج ويستشهد بها، أم يخمّن؟
معالجة الصوت
بتفريغ Whisper فوضوي مع لهجة + ضوضاء، هل لا يزال يجيب بصحة؟
معالجة الرؤية
بصورة منتج، هل يطابق SKU الصحيح أم يختلق مشابهاً؟
التأخير
وقت أول رمز وإجمالي وقت الاستجابة تحت حمل الإنتاج.
التكلفة لكل محادثة
تكلفة الرموز × متوسط طول المحادثة.
Claude Opus 4.5: المفكّر
Claude Opus 4.5 يفوز عندنا على ثلاثة محاور: (أ) الأفضل في اتباع موجهات النظام الطويلة دون الانحراف، (ب) الأفضل في الاستدلال العربي — خاصة عندما يكون سؤال العميل غير مباشر أو محمّل ثقافياً، (ج) نافذة 200 ألف رمز تسمح لنا بلصق كامل قاعدة معرفة العمل + تاريخ المحادثة في موجه واحد.
مثال ملموس: عميل عربي يسأل "هل المنتج ده مناسب لابني اللي عنده حساسية من القطن؟". Opus يقرأ الكتالوج، يرى تركيب المواد، يربطه مع ملاحظة المحسسات، ويجيب بصدق — بما في ذلك قول "لا" عندما يكون الجواب الصحيح. GPT-4o أحياناً يقول "نعم" ليكون مهذباً.
أين يخسر Opus: التأخير الصافي (أبطأ قليلاً في أول رمز) والسعر لكل مليون رمز (الأعلى في القائمة). نوجّه المحادثات عالية المخاطر — الشكاوى، الطلبات عالية القيمة، الدعم المعقد — إلى Opus وندع حركة الحجم تذهب لمكان آخر.
GPT-4o: الحصان الافتراضي
GPT-4o هو البوت الذي سيبدأ عليه معظم التجار والكثيرون لن يحتاجوا تركه. يتعامل مع العربية جيداً (ليس بأصالة Opus لكن محادثي بشكل مريح)، لديه رؤية ممتازة، سريع، والسعر مناسب للاستخدام عالي الحجم.
أين يتألق GPT-4o: أسئلة المنتجات قصيرة الدور، فرز قائم على الصور، والبوتات المهيمنة بالإنجليزية. أين يتعثّر: محادثات متعددة الأدوار طويلة جداً (السياق يضبب بعد ~50 دور) والصياغة العربية غير المباشرة حيث يتابع Opus لكن GPT-4o يهلوس تفسيراً.
Gemini 3 Pro: وحش السياق
نافذة 1 مليون رمز ليست حيلة — لتاجر بدليل منتج 300 صفحة + 50 ألف محادثة سابقة، Gemini 3 Pro هو النموذج الوحيد الذي يستطيع الاحتفاظ بكل شيء في موجه واحد. هذا يلغي الكثير من أخطاء الاسترجاع لأن النموذج يستطيع رؤية كل شيء.
الرؤية على Gemini 3 Pro قوية حقاً لـ OCR العربي — الملاحظات المكتوبة يدوياً، لافتات المتاجر المصممة، والتخطيطات بنص LTR/RTL مختلط هي حيث يتقدّم. العيب هو التكلفة لكل رمز بسياق 1 مليون، لذا نستخدم Gemini حيث يبرر السياق فعلاً بدلاً من الافتراضي.
Qwen VL + Grok: المتخصصون
Qwen VL (Alibaba) يكسب مكاناً للتجار الذين يريدون رؤية بحجم كبير دون السعر المتقدم. التعرف على النص العربي منافس، والأسعار تسمح للبوتات عالية الحجم (مثل خدمة عملاء تجارة إلكترونية بـ 10 آلاف+ سؤال صورة شهرياً) بالبقاء ضمن الميزانية.
Grok له مؤيدون متخصصون بين التجار التقنيين — بوتات دعم SaaS، حالات استخدام قريبة من الكود. لمحل زهور في الرياض، هو إفراط. لشركة أدوات مطورين تدير دعم وثائق إنجليزي-عربي ثنائي، هو منافس شرعي.
كيف نوجّه الحركة فعلاً في الإنتاج
التجار يستطيعون اختيار نموذج واحد لكل بوت. المستخدمون المتقدمون يضعون قواعد توجيه:
النموذج الافتراضي
GPT-4o للرسائل اليومية. سريع، قادر على الرؤية، عربي جيد.
كشف الشكاوى → Opus
إذا كشف اكتشاف النية شكوى، أعد الرد عبر Claude Opus 4.5 قبل الإرسال. تكلفة أعلى، لكن معدل استرداد التهذيب أفضل قابل للقياس.
التدفقات المليئة بالصور → GPT-4o أو Gemini
حسب اللغة: إنجليزي/مختلط → GPT-4o؛ نص عربي في الصور → Gemini 3 Pro.
الطلبات عالية القيمة → Opus
للطلبات فوق حد قابل للتكوين من التاجر، يحصل المفكّر على الرد.
قاطع الدائرة
إذا أرجع المزود المختار 3 إخفاقات متتالية، ثقة تفشل تلقائياً للنموذج الثاني لمدة 60 ثانية.
الفكرة: النماذج المتقدمة سلع الآن. القيمة في التوجيه، حواجز الحماية، وذاكرة المحادثة — وليس في اختيار "فائز" واحد.
الأسئلة الشائعة
هل يمكنني تبديل النماذج دون إعادة بناء بوتي؟
نعم. اختيار النموذج لكل بوت، في إعدادات البوت. التبديل بين Claude Opus و GPT-4o قائمة منسدلة — المطالبات، قاعدة المعرفة، والتدفقات تبقى كما هي.
هل ترفع ثقة أسعار النماذج؟
لا. نمرّر أسعار المزودين بالتكلفة لاستخدام API ونفوتر الوصول للمنصة برسوم شهرية ثابتة (10-40 دولار). كل مستأجر جديد يحصل على رصيد AI بداية 5 دولار.
ماذا يحدث إذا كان لنموذجي المختار انقطاع؟
قاطع دائرة ثقة يفشل تلقائياً للنموذج الثانوي لمدة 60 ثانية بعد 3 إخفاقات متتالية. يمكنك تكوين ترتيب الرجوع.
هل يمكنني إحضار مفتاح API الخاص بي؟
نعم، خطة المؤسسات تدعم إحضار-مفتاحك-الخاص (BYOK) لـ Claude و OpenAI و Gemini و Qwen — المحادثة لا تزال تمر عبر تنسيق ثقة لكن الفوترة تذهب مباشرة للمزود.
أي نموذج الأرخص لكل محادثة؟
GPT-4o mini عادةً الأرخص للأسئلة القصيرة. Qwen VL منافس بحجم عالٍ. Claude Opus 4.5 الأغلى لكن يحل القضايا المعقدة في أدوار أقل، لذا إجمالي التكلفة قد يكون أقل.
جرّب كل نموذج على بوتك الخاص
رصيد البداية 5 دولار من ثقة يغطي ~10,000 دور GPT-4o أو ~2,000 دور Claude Opus. اختبر النماذج على محادثات عملائك الحقيقية قبل الالتزام.
ابدأ تجربة مجانية