almessadi.
العودة إلى المشاريع

دراسة حالة مشروع

خادم Gemini Embedding 2 MCP_

خادم MCP محلي للاسترجاع متعدد النماذج، تم بناؤه ليتيح لأدوات الذكاء الاصطناعي بحثًا خاصًا عن الرموز والمستندات والصور والصوت والفيديو دون نقل البيانات إلى نظام خارجي مستضاف.

مشكلة السياق المحلي

لا تزال وكالات الذكاء الاصطناعي ضعيفة في شيء عملي يحتاجه المطورون كل يوم: العمل بأمان ضد مجموعة محلية من الرموز والمستندات دون دفع تلك المجموعة بالكامل إلى نظام خارجي مستضاف.

لقد أنشأت هذا الخادم MCP لجعل الاسترجاع المحلي عمليًا. كانت الهدف واضحًا:

  • الاحتفاظ بمجموعة البيانات المفهرسة على الجهاز المحلي
  • دعم أكثر من النص العادي
  • توفير واجهة استرجاع مستقرة لأدوات الذكاء الاصطناعي

الهندسة المعمارية

يعمل الخادم محليًا كعملية بايثون ويربط نموذج تضمين Gemini بنسخة محلية من ChromaDB في ~/.gemini_mcp_db. وهذا يعني أن مخزن المتجهات يبقى على القرص تحت سيطرة المطور بدلاً من أن يصبح اعتمادًا مستضافًا آخر.

الجزء المثير للاهتمام هو مسار الإدخال. لا يتعامل النظام فقط مع ملفات النص. يمكنه معالجة الصور والصوت والفيديو وPDFs، باستخدام قدرات Gemini متعددة الوسائط للحفاظ على المزيد من الإشارة الأصلية مقارنة بخط أنابيب الاستخراج النصي البسيط.

المشكلة الهندسية الحقيقية

يبدو أن الاسترجاع المحلي سهل حتى تبدأ وكيل في إعادة فهرسة نفس الأدلة مرارًا وتكرارًا. هنا تظهر التكاليف والكمون واستنفاد الحصص.

للسيطرة على ذلك، أضفت:

  • حظر باستخدام النمط للأدلة غير ذات الصلة
  • إزالة التكرار المعتمدة على MD5 للملفات غير المتغيرة
  • نموذج تخزين محلي أول للحفاظ على توقع الفهرسة

يهمني هذا المشروع لأنه يعامل أدوات الذكاء الاصطناعي كبنية تحتية. الربح ليس في عرض لامع. الربح هو توفير طبقة استرجاع للوكالات المحلية تكون خاصة وعملية وصعبة سوء استخدامها عن طريق الخطأ.