دليل الدردشة بالرؤية في LLM Resayil

غالبًا ما يحتاج المطورون الذين يبنون روبوتات دردشة متعددة اللغات إلى أكثر من مجرد نص عادي. يفتح فهم الصور أبوابًا للمساعدين البصريين، وتحليل المستندات، وتجارب مستخدم أكثر ثراءً—خاصة عندما يجب أن يتعامل التطبيق أيضًا مع المحتوى العربي. تقدم LLM Resayil قدرة دردشة مدعومة بالرؤية تعمل من خلال نفس نقطة نهاية API المتوافقة مع OpenAI المستخدمة للنص، مما يسمح لك بإرسال الصور جنبًا إلى جنب مع الأوامر. في هذا الدليل، نشرح ما تعنيه الدردشة المدعومة بالرؤية على Resayil، وكيفية استدعائها، والنماذج التي يمكنها معالجة الصور، والتسعير، والميزات المتقدمة، وكيف تقارن بـ OpenAI و Anthropic.

مقدمة

مقارنة سريعة

| الميزة | LLM Resayil | OpenAI | |---|---|---| | توافق API | متوافق مع OpenAI و Anthropic | أصلي لـ OpenAI | | دعم اللغة العربية | ✅ (مدمج) | ✅ (عبر الأوامر) | | الرؤية (إدخال الصور) | ✅ (ميزة مدعومة) | ✅ (GPT‑4‑Vision) | | استجابات البث المباشر | ✅ | ✅ | | استدعاء الدوال | ✅ | ✅ | | استخدام الأدوات | ✅ | ✅ | | الفواتير حسب الاستخدام | ✅ (رصيد) | ✅ (الدفع حسب الاستخدام) | | العملة المدعومة | دولار أمريكي فقط | متعددة | | طرق الدفع | سترايب، باي بال | بطاقة ائتمان، باي بال | | موقع الاستضافة | الولايات المتحدة الأمريكية | مناطق متعددة |

ما نقدمه

تتموضع LLM Resayil كمصدر موثوق وحيد للمطورين الذين يحتاجون إلى واجهة برمجة تطبيقات LLM مرنة ومتعددة اللغات. توفر المنصة:

توافق مع OpenAI و Anthropic – يمكنك استخدام مجموعات تطوير البرمجيات (SDKs) الرسمية من أي من النظامين البيئيين دون تغييرات في الكود.
دعم اللغة العربية – النماذج تفهم وتولد اللغة العربية خارج الصندوق، وهو أمر أساسي لأسواق الشرق الأوسط.
قدرة الرؤية – يمكن تضمين بيانات الصور في استدعاءات /v1/chat/completions أو /v1/messages، مما يتيح الاستدلال البصري.
البث المباشر، واستدعاء الدوال، واستخدام الأدوات – كل هذه الميزات المتقدمة تعمل معًا مع الرؤية، مما يسمح باستجابات قائمة على الصور في الوقت الفعلي ومخرجات مهيكلة.
رصيد حسب الاستخدام – يتم فرض الفواتير عليك فقط مقابل الرموز (Tokens) التي تستهلكها، بدون مستويات خفية.
التكاملات – موصلات جاهزة للاستخدام لـ n8n، و LangChain، و LiteLLM، و OpenAI SDK، و Anthropic SDK، بالإضافة إلى الاستخدام المباشر من Python أو JavaScript أو cURL.

ما تقدمه OpenAI

تقدم OpenAI مجموعة قوية من النماذج، بما في ذلك سلسلة GPT‑4‑Vision، التي تقبل مدخلات الصور وتعيد نصًا أو JSON. واجهة برمجة التطبيقات الخاصة بها متوافقة أيضًا مع OpenAI، مع بث مباشر مدمج واستدعاء للدوال. تدعم OpenAI نطاقًا أوسع من عملات الفواتير وتقدم بنية تحتية عالمية يمكنها تقليل زمن الوصول للمستخدمين خارج الولايات المتحدة.

لماذا تفوز LLM Resayil في الدردشة المدعومة بالرؤية

إذا كان متطلبك الأساسي هو دمج دعم اللغة العربية مع فهم الصور، فإن Resayil تقدم نقطة نهاية موحدة تتعامل مع كليهما بالفعل. تتجنب النفقات العامة لإدارة مقدمي خدمات منفصلين للنص والرؤية، وتحتفظ بجميع الاستخدامات تحت نموذج فواتير موحد قائم على الرصيد. تسمح القدرة على استدعاء الدوال وبث الاستجابات أثناء معالجة الصور ببناء وكلاء محادثة متطورين دون الحاجة إلى ربط خدمات متعددة معًا.

ما الذي تحصل عليه باستخدام LLM Resayil

سطح API واحد للنص، والكود، والرؤية، واستخدام الأدوات.
فواتير موحدة بالدولار الأمريكي عبر سترايب أو باي بال، مما يبسط المحاسبة.
الوصول إلى 39 نموذجًا نشطًا، العديد منها مضبوط لمهام مختلفة (دردشة، تفكير، كود، رؤية).
تكاملات صديقة للمطورين تتيح لك إضافة OpenAI أو Anthropic SDKs والبدء في إرسال الصور فورًا.
دعم عربي كامل المكدس، من فهم الأمر إلى المخرجات المولدة.

ما تعنيه الدردشة المدعومة بالرؤية على LLM Resayil؟

تشير الدردشة المدعومة بالرؤية إلى القدرة على تضمين صورة كجزء من طلب محادثة. عند استدعاء نقطة النهاية /v1/chat/completions، يمكنك إرفاق كتلة content من النوع image_url (أو صورة مشفرة base64) جنبًا إلى جنب مع رسائل النص العادية. يتلقى النموذج السياق البصري، ويعالجه، ويمكنه توليد استجابة تشير إلى الكائنات أو النص أو المشاهد في الصورة. هذه الميزة مدرجة ضمن القدرات المدعومة في Resayil، جنبًا إلى جنب مع البث المباشر، واستدعاء الدوال، واستخدام الأدوات. تعمل بنفس الطريقة لأوامر اللغة العربية، مما يسمح لك بطرح أسئلة مثل "ما معنى هذا النص في الصورة؟" وتلقي إجابة عربية.

كيفية استخدام إدخال الصور مع واجهة برمجة تطبيقات LLM Resayil

فيما يلي دليل خطوة بخطوة لإرسال صورة إلى نقطة نهاية الدردشة.

اختر نقطة النهاية – إما /v1/chat/completions (واجهة برمجة التطبيقات الأحدث على نمط الدردشة) أو /v1/messages (الإصدار القديم). كلاهما يقبلان نفس هيكل payload للصور.
أعد الصورة – يمكنك توفير URL عام أو تضمين الصورة كسلسلة base64. اسم الحقل هو image_url لعناوين URL أو image_base64 للبيانات المضمنة.
أنشئ جسم الطلب – ضمّن مصفوفة messages حيث يمكن أن تكون كل-entry عبارة عن role (user، assistant، system) ومصفوفة content. يمكن أن تحتوي مصفوفة content على جزء نصي وجزء صورة.
اضبط النموذج – اختر أي نموذج يدعم الرؤية. يمكنك اكتشاف النماذج التي تمتلك هذه القدرة عن طريق الاستعلام عن /v1/models وفحص البيانات الوصفية المستعادة.
أضف معلمات اختيارية – stream لاستلام أجزاء متزايدة، functions لتمكين استدعاء الدوال، أو tools لاستخدام الأدوات.
أرسل الطلب – استخدم عميل HTTP المفضل لديك. فيما يلي أمثلة في cURL و Python.

مثال cURL

curl https://api.llm.resayil.io/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen3-vl:235b",
    "messages": [
      {"role": "user", "content": [
        {"type": "text", "text": "صف ما يحدث في هذه الصورة باللغة العربية."},
        {"type": "image_url", "image_url": {"url": "https://example.com/image.jpg"}}
      ]}
    ],
    "stream": false
  }'

مثال Python (OpenAI SDK)

import openai

client = openai.OpenAI(base_url="https://api.llm.resayil.io/v1")
response = client.chat.completions.create(
    model="qwen3-vl:235b",
    messages=[
        {
            "role": "user",
            "content": [
                {"type": "text", "text": "اشرح المخطط باللغة العربية."},
                {"type": "image_url", "image_url": {"url": "https://example.com/diagram.png"}}
            ]
        }
    ]
)
print(response.choices[0].message.content)

يوضح كلا المقطعين كيفية إرفاق الصورة وكيفية تلقي الاستجابة باللغة العربية. يعمل نفس النمط لصور base64 – فقط استبدل كتلة image_url بكتلة image_base64 تحتوي على السلسلة المشفرة.

أي النماذج تدعم الرؤية على LLM Resayil؟

يحتوي كتالوج Resayil على 39 نموذجًا نشطًا تغطي فئات الدردشة، والتفكير، والكود، والرؤية. للعثور على النماذج التي تقبل الصور، اتصل بنقطة النهاية /v1/models. تتضمن الاستجابة بيانات وصفية لكل نموذج، وستتم الإشارة إلى النماذج التي تمتلك قدرة الرؤية وفقًا لذلك. بينما لا ندرج أسماء النماذج الفردية هنا، يمكنك تصفية القائمة برمجيًا للحصول على الخيارات المدعومة بالرؤية فقط. بمجرد الحصول على slug (على سبيل المثال، qwen3-vl:235b)، قم بتوصيله في payload الطلب كما هو موضح في الأمثلة السابقة.

التسعير والفواتير لطلبات الرؤية

يتم فرض الفواتير على طلبات الرؤية بنفس الطريقة تمامًا مثل طلبات النص فقط – على أساس رصيد حسب الاستخدام. لا توجد رسوم إضافية منفصلة لمعالجة الصور. يتم خصم الرصيد بناءً على عدد الرموز (Tokens) المولدة و، حيث ينطبق، الرموز المحسوبة لـ payload الصورة. تتم جميع عمليات الفواتير بـ الدولار الأمريكي (USD) ويمكنك الدفع عبر سترايب أو باي بال. يمكنك عرض الأسعار الحالية على نقطة النهاية /v1/pricing أو صفحة التسعير في لوحة التحكم.

البث المباشر، واستدعاء الدوال، واستخدام الأدوات مع الرؤية

إحدى نقاط قوة Resayil هي القدرة على مزج الرؤية مع ميزات متقدمة أخرى.

البث المباشر – اضبط stream: true في طلبك واستلم أحداث Server‑Sent (SSE) التي تقدم إجابة النموذج جزءًا جزءًا. يعمل هذا حتى عندما يتضمن الطلب صورة، مما يسمح لك بعرض النتائج الجزئية بمجرد توليدها.
استدعاء الدوال – حدد مخطط دالة في مصفوفة functions. عندما يقرر النموذج أنه يجب استدعاء دالة (على سبيل المثال، لاستخراج بيانات مهيكلة من صورة مخطط)، سيعيد كائن function_call يمكنك تنفيذه على الخلفية الخاصة بك.
استخدام الأدوات – مشابه لاستدعاء الدوال، تتيح لك الأدوات ربط خدمات خارجية بالمحادثة. يمكن لصورة إيصال أن触发 أداة تقوم بتحليل المبلغ الإجمالي وإعادة كائن إيصال مهيكلة.

من خلال الجمع بين هذه، يمكنك بناء وكلاء متطورين مثل روبوت دعم عملاء بصري يتلقى لقطة شاشة، ويبث إجابة مفيدة، وينشئ تلقائيًا تذكرة دعم عبر أداة.

مقارنة دعم الرؤية في LLM Resayil مع OpenAI و Anthropic

أصدرت كل من OpenAI و Anthropic نماذج مدعومة بالرؤية (على سبيل المثال، GPT‑4‑Vision، Claude‑3‑Opus مع إدخال الصور). تتطلب واجهات برمجة التطبيقات الخاصة بهما نقاط نهاية منفصلة أو هياكل طلب خاصة. مع Resayil، تحصل على نقطة نهاية واحدة متوافقة مع OpenAI تحترم أيضًا تنسيق طلب Anthropic، مما يعني أنه يمكنك التبديل بين عائلات النماذج دون تغيير الكود. بالإضافة إلى ذلك، إزالة التعامل المدمج مع اللغة العربية في Resayيل الحاجة إلى حيل هندسة الأوامر التي غالبًا ما تكون مطلوبة على المنصات الأخرى لتحقيق مخرجات عربية عالية الجودة. تبسط الفواتير الموحدة والاستضافة مقرها الولايات المتحدة الامتثال للفرق التي تحتاج إلى نقطة اتصال واحدة.

جرّب واجهة LLM Resayil البرمجية

ابدأ مجاناً

مثال كود: إرسال صورة إلى نموذج رؤية

{
  "model": "qwen3-vl:235b",
  "messages": [
    {
      "role": "user",
      "content": [
        {"type": "text", "text": "ما هو النص الموجود في هذه الصورة؟"},
        {"type": "image_url", "image_url": {"url": "https://example.com/arabic-sign.jpg"}}
      ]
    }
  ],
  "stream": true,
  "functions": [
    {
      "name": "extract_text",
      "description": "استخراج النص العربي من الصورة",
      "parameters": {
        "type": "object",
        "properties": {
          "text": {"type": "string", "description": "النص العربي المستخرج"}
        },
        "required": ["text"]
      }
    }
  ]
}

يمكن إرسال payload JSON أعلاه مباشرة إلى /v1/chat/completions. يقوم ببث الإجابة، وإذا قرر النموذج أنه يجب استدعاء الدالة extract_text، سيعيد كائن function_call يمكنك التصرف بناءً عليه.

الأسئلة الشائعة

س: هل يمكنني إرسال صور إلى LLM Resayil باستخدام OpenAI SDK؟

ج: نعم. لأن واجهة برمجة تطبيقات Resayil متوافقة مع OpenAI، يمكنك استخدام OpenAI Python SDK الرسمي. ضمّن كتلة image_url (أو image_base64) داخل مصفوفة content لرسالة user، كما هو موضح في مثال Python أعلاه.

س: هل يدعم LLM Resayil البث المباشر مع مدخلات الرؤية؟

ج: بالتأكيد. يعمل علم stream لأي طلب، بما في ذلك تلك التي تحتوي على صور. يتم تسليم الاستجابات عبر أحداث Server‑Sent، مما يسمح لك بعرض المخرجات الجزئية بمجرد توليدها.

س: كيف أتحقق من النماذج التي تدعم إدخال الصور على LLM Resayil؟

ج: اتصل بنقطة النهاية /v1/models. تتضمن قائمة النماذج المستعادة بيانات وصفية تشير إلى ما إذا كان النموذج يمتلك قدرة الرؤية. قم بتصفية القائمة لتلك المدخلات للحصول على slugs التي يمكنك استخدامها لاستدعاءات القائمة على الصور.

س: هل هناك تكلفة منفصلة لطلبات الرؤية على LLM Resayil؟

ج: لا. يتم فرض الفواتير على طلبات الرؤية على نفس نموذج الرصيد حسب الاستخدام مثل طلبات النص. يعتمد التسعير على الرموز المستهلكة؛ لا توجد رسوم إضافية لـ payloads الصور.

س: هل يمكنني استخدام استدعاء الدوال مع مدخلات الصور على LLM Resayil؟

ج: نعم. حدد الدوال في payload الطلب، ويمكن للنموذج أن يقرر استدعاءها بعد تحليل الصورة. ستحتوي الاستجابة على كائن function_call يمكنك تنفيذه على الخلفية الخاصة بك.

اتخذ الخطوة التالية

هل أنت مستعد لإضافة الذكاء البصري إلى روبوت الدردشة العربي الخاص بك؟ اشترك في تسجيل Resayil، واستكشف صفحة التسعير، وتعمق في الوثائق للحصول على مراجع API مفصلة. مع الرؤية، والبث المباشر، واستدعاء الدوال كلها تحت نموذج واحد حسب الاستخدام، تمنحك LLM Resayil الأدوات لبناء تجارب محادثة من الجيل التالي.