لماذا نشغّل Claude Opus 4.5 و GPT-4o في الإنتاج للبوتات العربية

قائمة النماذج المتقدمة في ثقه

كل حساب تاجر على ثقه يستطيع اختيار نموذجه لكل بوت. القائمة الحالية، كما في أبريل 2026:

Claude Opus 4.5

Anthropic

200 ألف رمز سياق · رؤية · اتباع تعليمات قوي · أفضل في الاستدلال العربي

Claude Sonnet 4

Anthropic

Claude أسرع وأرخص للبوتات عالية الحجم. ما زال 200 ألف رمز سياق.

GPT-4o

OpenAI

128 ألف رمز سياق · رؤية · سريع · إنجليزي قوي + عربي جيد. افتراضياً لدينا.

GPT-4o mini

OpenAI

أرخص نموذج قادر على الرؤية. جيد للتحيات والبوتات المكثفة بالأسئلة الشائعة.

OpenAI

نموذج استدلال. مفيد لحل المشاكل المعقدة حيث الدقة أهم من السرعة.

Gemini 3 Pro

Google

حتى 1 مليون رمز سياق · رؤية ممتازة بما في ذلك OCR العربي.

Qwen VL

Alibaba

نص عربي قوي + رؤية منافسة بحجم عالٍ.

Grok

xAI

سريع · رؤية · استدلال كود وتقنية جيد.

السؤال ليس أبداً "أيهم الأفضل." بل "أيهم الأفضل لهذا البوت المحدد بهذا السعر بهذا التأخير."

كيف نختبر النماذج للعربية فعلاً

قوائم التصنيف تقيس متوسطات على معايير معظمها إنجليزية. بنينا مجموعة تقييم داخلية بـ ~600 محادثة عربية حقيقية مأخوذة (مجهولة) من أسطول ثقه. كل محادثة مقيّمة على:

طلاقة اللهجة

هل الرد يبدو كمتحدث أصلي بلهجة العميل، وليس روبوتاً مترجماً من الإنجليزية؟

اتباع التعليمات

إذا قيل للبوت "لا تقتبس سعراً — اعرض دائماً رابط الكتالوج"، هل يطيع تحت الضغط؟

الهلوسة

هل اخترع البوت رقم تتبع، كود خصم، أو ميزة منتج؟

الاستناد على المستندات

عندما تكون الإجابة في حزمة RAG، هل يجدها النموذج ويستشهد بها، أم يخمّن؟

معالجة الصوت

بتفريغ Whisper فوضوي مع لهجة + ضوضاء، هل لا يزال يجيب بصحة؟

معالجة الرؤية

بصورة منتج، هل يطابق SKU الصحيح أم يختلق مشابهاً؟

التأخير

وقت أول رمز وإجمالي وقت الاستجابة تحت حمل الإنتاج.

التكلفة لكل محادثة

تكلفة الرموز × متوسط طول المحادثة.

Claude Opus 4.5: المفكّر

Claude Opus 4.5 يفوز عندنا على ثلاثة محاور: (أ) الأفضل في اتباع موجهات النظام الطويلة دون الانحراف، (ب) الأفضل في الاستدلال العربي — خاصة عندما يكون سؤال العميل غير مباشر أو محمّل ثقافياً، (ج) نافذة 200 ألف رمز تسمح لنا بلصق كامل قاعدة معرفة العمل + تاريخ المحادثة في موجه واحد.

مثال ملموس: عميل عربي يسأل "هل المنتج ده مناسب لابني اللي عنده حساسية من القطن؟". Opus يقرأ الكتالوج، يرى تركيب المواد، يربطه مع ملاحظة المحسسات، ويجيب بصدق — بما في ذلك قول "لا" عندما يكون الجواب الصحيح. GPT-4o أحياناً يقول "نعم" ليكون مهذباً.

أين يخسر Opus: التأخير الصافي (أبطأ قليلاً في أول رمز) والسعر لكل مليون رمز (الأعلى في القائمة). نوجّه المحادثات عالية المخاطر — الشكاوى، الطلبات عالية القيمة، الدعم المعقد — إلى Opus وندع حركة الحجم تذهب لمكان آخر.

GPT-4o: الحصان الافتراضي

GPT-4o هو البوت الذي سيبدأ عليه معظم التجار والكثيرون لن يحتاجوا تركه. يتعامل مع العربية جيداً (ليس بأصالة Opus لكن محادثي بشكل مريح)، لديه رؤية ممتازة، سريع، والسعر مناسب للاستخدام عالي الحجم.

أين يتألق GPT-4o: أسئلة المنتجات قصيرة الدور، فرز قائم على الصور، والبوتات المهيمنة بالإنجليزية. أين يتعثّر: محادثات متعددة الأدوار طويلة جداً (السياق يضبب بعد ~50 دور) والصياغة العربية غير المباشرة حيث يتابع Opus لكن GPT-4o يهلوس تفسيراً.

Gemini 3 Pro: وحش السياق

نافذة 1 مليون رمز ليست حيلة — لتاجر بدليل منتج 300 صفحة + 50 ألف محادثة سابقة، Gemini 3 Pro هو النموذج الوحيد الذي يستطيع الاحتفاظ بكل شيء في موجه واحد. هذا يلغي الكثير من أخطاء الاسترجاع لأن النموذج يستطيع رؤية كل شيء.

الرؤية على Gemini 3 Pro قوية حقاً لـ OCR العربي — الملاحظات المكتوبة يدوياً، لافتات المتاجر المصممة، والتخطيطات بنص LTR/RTL مختلط هي حيث يتقدّم. العيب هو التكلفة لكل رمز بسياق 1 مليون، لذا نستخدم Gemini حيث يبرر السياق فعلاً بدلاً من الافتراضي.

Qwen VL + Grok: المتخصصون

Qwen VL (Alibaba) يكسب مكاناً للتجار الذين يريدون رؤية بحجم كبير دون السعر المتقدم. التعرف على النص العربي منافس، والأسعار تسمح للبوتات عالية الحجم (مثل خدمة عملاء تجارة إلكترونية بـ 10 آلاف+ سؤال صورة شهرياً) بالبقاء ضمن الميزانية.

Grok له مؤيدون متخصصون بين التجار التقنيين — بوتات دعم SaaS، حالات استخدام قريبة من الكود. لمحل زهور في الرياض، هو إفراط. لشركة أدوات مطورين تدير دعم وثائق إنجليزي-عربي ثنائي، هو منافس شرعي.

كيف نوجّه الحركة فعلاً في الإنتاج

التجار يستطيعون اختيار نموذج واحد لكل بوت. المستخدمون المتقدمون يضعون قواعد توجيه:

النموذج الافتراضي

GPT-4o للرسائل اليومية. سريع، قادر على الرؤية، عربي جيد.

كشف الشكاوى → Opus

إذا كشف اكتشاف النية شكوى، أعد الرد عبر Claude Opus 4.5 قبل الإرسال. تكلفة أعلى، لكن معدل استرداد التهذيب أفضل قابل للقياس.

التدفقات المليئة بالصور → GPT-4o أو Gemini

حسب اللغة: إنجليزي/مختلط → GPT-4o؛ نص عربي في الصور → Gemini 3 Pro.

الطلبات عالية القيمة → Opus

للطلبات فوق حد قابل للتكوين من التاجر، يحصل المفكّر على الرد.

قاطع الدائرة

إذا أرجع المزود المختار 3 إخفاقات متتالية، ثقه تفشل تلقائياً للنموذج الثاني لمدة 60 ثانية.

الفكرة: النماذج المتقدمة سلع الآن. القيمة في التوجيه، حواجز الحماية، وذاكرة المحادثة — وليس في اختيار "فائز" واحد.

الأسئلة الشائعة

هل يمكنني تبديل النماذج دون إعادة بناء بوتي؟

نعم. اختيار النموذج لكل بوت، في إعدادات البوت. التبديل بين Claude Opus و GPT-4o قائمة منسدلة — المطالبات، قاعدة المعرفة، والتدفقات تبقى كما هي.

هل ترفع ثقه أسعار النماذج؟

لا. نمرّر أسعار المزودين بالتكلفة لاستخدام API ونفوتر الوصول للمنصة برسوم شهرية ثابتة (19.99-49.99 دولار). كل مستأجر جديد يحصل على رصيد AI بداية 5 دولار.

ماذا يحدث إذا كان لنموذجي المختار انقطاع؟

قاطع دائرة ثقه يفشل تلقائياً للنموذج الثانوي لمدة 60 ثانية بعد 3 إخفاقات متتالية. يمكنك تكوين ترتيب الرجوع.

هل يمكنني إحضار مفتاح API الخاص بي؟

نعم، خطة المؤسسات تدعم إحضار-مفتاحك-الخاص (BYOK) لـ Claude و OpenAI و Gemini و Qwen — المحادثة لا تزال تمر عبر تنسيق ثقه لكن الفوترة تذهب مباشرة للمزود.

أي نموذج الأرخص لكل محادثة؟

GPT-4o mini عادةً الأرخص للأسئلة القصيرة. Qwen VL منافس بحجم عالٍ. Claude Opus 4.5 الأغلى لكن يحل القضايا المعقدة في أدوار أقل، لذا إجمالي التكلفة قد يكون أقل.

جرّب كل نموذج على بوتك الخاص

رصيد البداية 5 دولار من ثقه يغطي ~10,000 دور GPT-4o أو ~2,000 دور Claude Opus. اختبر النماذج على محادثات عملائك الحقيقية قبل الالتزام.

ابدأ تجربة مجانية

لماذا نشغّل Claude Opus 4.5 و GPT-4o في الإنتاج للبوتات العربية

قائمة النماذج المتقدمة في ثقه

كيف نختبر النماذج للعربية فعلاً

طلاقة اللهجة

اتباع التعليمات

الهلوسة

الاستناد على المستندات

معالجة الصوت

معالجة الرؤية

التأخير

التكلفة لكل محادثة

Claude Opus 4.5: المفكّر

GPT-4o: الحصان الافتراضي

Gemini 3 Pro: وحش السياق

Qwen VL + Grok: المتخصصون

كيف نوجّه الحركة فعلاً في الإنتاج

النموذج الافتراضي

كشف الشكاوى → Opus

التدفقات المليئة بالصور → GPT-4o أو Gemini

الطلبات عالية القيمة → Opus

قاطع الدائرة

الأسئلة الشائعة

جرّب كل نموذج على بوتك الخاص

مقالات ذات صلة

الرسائل الصوتية العربية إلى طلبات

ذكاء اصطناعي يرى الإيصالات

اللهجات العربية عملياً

عائد بوت AI للمتاجر الصغيرة