انتقل إلى المحتوى الرئيسي

تشغيل نماذج اللغة الكبيرة المحلية مع Cursor: دليل الإعداد الكامل

إذا كنت تعمل على كود ملكي، أو تتعامل مع بيانات حساسة، أو ببساطة لا تريد أن تغادر مقتطفات الكود جهازك، فإن تشغيل نموذج LLM محلي مع Cursor هو خيار ممتاز. يشرح هذا الدليل خطوات الإعداد العملية لـ Ollama و LM Studio، بالإضافة إلى المفاضلات التي يجب أن تعرفها قبل التبديل.

لماذا تستخدم النماذج المحلية؟

هناك ثلاثة أسباب تتكرر باستمرار في المجتمع:

  • الخصوصية: لا يغادر كودك شبكتك المحلية أبدًا. لا يوجد API خارجي، ولا سياسة احتفاظ بالبيانات تحتاج لتحليلها.
  • التكلفة: بعد تكاليف الأجهزة، يكون الاستدلال مجانيًا. لا فوترة لكل رمز، ولا ارتفاعات مفاجئة في الاستخدام.
  • الوصول دون اتصال: يعمل على الطائرات، وفي الشبكات المؤسسية المقيدة، أو في أي مكان بدون إنترنت.
تلميح

النماذج المحلية ممتازة في إنشاء القوالب الجاهزة، وإعادة البناء البسيطة، والأسئلة السريعة حول قاعدة الكود الخاصة بك. لا تحتاج إلى GPT-4 لكل شيء.

الواجهات الخلفية المدعومة للنماذج المحلية

لا يأتي Cursor بدعم مدمج للنماذج المحلية بنفس الطريقة التي يدعم بها واجهات OpenAI أو Anthropic. بدلاً من ذلك، تقوم بتوجيه Cursor إلى خادم محلي يعرض واجهة برمجة تطبيقات متوافقة مع OpenAI. الخيارات الثلاثة الأكثر شيوعًا:

الواجهة الخلفيةالأفضل لـتعقيد الإعداد
Ollamaالبدء السريع، إدارة النماذجمنخفض
LM Studioمحبي الواجهات الرسومية، مستخدمي Windows/Macمنخفض
llama.cppأقصى درجات التحكم، الحد الأدنى من النفقات العامةمتوسط

يركز هذا الدليل على Ollama و LM Studio لأنهما الأكثر استخدامًا من قبل المطورين في العمل اليومي.

Ollama + Cursor: خطوة بخطوة

1. تثبيت Ollama

قم بالتحميل من ollama.com والتثبيت. يعمل كخدمة خلفية على macOS و Linux و Windows.

تحقق من أنه يعمل:

ollama --version

2. سحب نموذج

ابدأ بنموذج قادر على التعامل مع الكود. المفضلات في المجتمع هي:

  • codellama:7b-code أو codellama:13b-code — سريع، جيد للمهام البسيطة
  • deepseek-coder:6.7b — قوي في إكمال الكود
  • qwen2.5-coder:7b أو 14b — توازن جيد بين السرعة والجودة
ollama pull deepseek-coder:6.7b

3. تشغيل الخادم المتوافق مع OpenAI

يعرض Ollama واجهة برمجة تطبيقات متوافقة مع OpenAI على localhost:11434. اتركه يعمل:

ollama serve

أو دع الخدمة الخلفية تتولى ذلك.

4. إعداد Cursor

افتح إعدادات Cursor (Ctrl/Cmd + ,) وانتقل إلى:

الإعدادات > النماذج > مفتاح OpenAI API

اضبط عنوان URL الأساسي على:

http://localhost:11434/v1

اترك حقل مفتاح API فارغًا أو أدخل أي سلسلة وهمية (تتطلب بعض الإصدارات قيمة غير فارغة).

اختر اسم النموذج الذي يطابق ما قمت بسحبه. على سبيل المثال:

deepseek-coder:6.7b
معلومات

يرسل Cursor الطلبات بتنسيق دردشة OpenAI. تقوم نقطة نهاية /v1 في Ollama بترجمتها تلقائيًا. لا تحتاج إلى وكيل.

5. اختباره

افتح ملفًا واضغط على Ctrl/Cmd + L لفتح لوحة الدردشة. اسأل شيئًا بسيطًا:

اكتب دالة Python تعكس سلسلة نصية دون استخدام التقطيع.

إذا حصلت على رد، فأنت متصل. إذا توقف، تحقق من أن ollama serve يعمل وأن اسم النموذج يطابق تمامًا.

LM Studio + Cursor: خطوة بخطوة

LM Studio هو الخيار الأفضل إذا كنت تريد واجهة رسومية لتنزيل النماذج والتبديل بينها.

1. تثبيت LM Studio

قم بالتحميل من lmstudio.ai. متاح لـ macOS و Windows و Linux.

2. تنزيل نموذج

افتح LM Studio، انتقل إلى علامة التبويب Discover، وابحث عن نموذج كود. خيارات جيدة:

  • TheBloke/CodeLlama-7B-Instruct-GGUF
  • TheBloke/DeepSeek-Coder-6.7B-Instruct-GGUF
  • Qwen/Qwen2.5-Coder-7B-Instruct-GGUF

قم بتنزيل التكميم Q4_K_M أو Q5_K_M لتحقيق توازن بين الحجم والجودة.

3. تشغيل الخادم المحلي

في LM Studio، انتقل إلى علامة التبويب الخادم المحلي على اليسار. حمّل نموذجك، ثم انقر على بدء الخادم.

بشكل افتراضي، يعمل على:

http://localhost:1234/v1

4. إعداد Cursor

نفس العملية كـ Ollama. في إعدادات Cursor > النماذج > مفتاح OpenAI API، اضبط:

http://localhost:1234/v1

يمكن ترك حقل اسم النموذج كـ local-model أو أي قيمة نائبة يتوقعها LM Studio. يتجاهل LM Studio اسم النموذج ويستخدم ما هو محمّل حاليًا.

5. التحقق

شغّل نفس موجه الاختبار. تُظهر سجلات خادم LM Studio الطلبات الواردة، وهو أمر مفيد لتصحيح الأخطاء.

ما يعمل وما لا يعمل

النماذج المحلية ليست بديلاً مباشرًا لـ Claude 3.5 Sonnet أو GPT-4o. إليك التحليل الصريح:

المهمةمحلي 7B-13Bالسحابة (Claude/GPT-4)
إعادة البناء البسيطةجيدممتاز
إنشاء القوالب الجاهزةجيدممتاز
قرارات البنية المعقدةضعيفممتاز
فهم قواعد الكود الكبيرةضعيفممتاز
التعديلات متعددة الملفاتضعيفجيد
السرعة (مع GPU)سريعيعتمد على الشبكة
السرعة (CPU فقط)بطيءيعتمد على الشبكة
warning

قد يستغرق تشغيل نموذج 13B على CPU من 10 إلى 30 ثانية لكل رد. تجلب GPU الحديثة (RTX 3060 أو أفضل) هذا إلى 1-3 ثوانٍ. ضع توقعاتك في الاعتبار.

الاستراتيجية الهجينة: النهج العملي

معظم المطورين الذين يلتزمون بالنماذج المحلية يستخدمون سير عمل هجينًا بدلاً من الاعتماد الكامل:

  1. نموذج محلي للمهام السريعة والآمنة: إصلاحات lint، إعادة التسمية، تعبيرات regex البسيطة، شرح دالة.
  2. نموذج سحابي للمهام الثقيلة: تصميم ميزات جديدة، تصحيح أخطاء صعبة، إعادة البناء عبر الملفات.
  3. التبديل بناءً على المشروع: كود مفتوح المصدر أو غير حساس → سحابة؛ كود ملكي أو خاضع للتنظيم → محلي.

يجعل Cursor هذا سهلاً لأنه يمكنك تغيير النموذج في الإعدادات دون إعادة تشغيل IDE. يبقي بعض المستخدمين نافذتي Cursor مفتوحتين — واحدة موجهة إلى المحلي، وأخرى إلى السحابة — على الرغم من أن هذا أكثر حلاً بديلاً من كونه ميزة.

تلميح

إذا كان لديك Mac بمعالج Apple Silicon، فإن Ollama يستفيد من Neural Engine بشكل جيد. يمكن لـ MacBook Pro M3 Pro تشغيل نموذج 13B بسرعات قابلة للاستخدام دون استنزاف البطارية كما تفعل GPU المنفصلة.

استكشاف الأخطاء وإصلاحها

أخطاء "Connection refused"

  • تحقق من أن الخادم يعمل (ollama serve أو علامة تبويب خادم LM Studio).
  • تحقق من المنفذ: يستخدم Ollama 11434، ويستخدم LM Studio 1234.
  • تحقق من جدار الحماية أو الوكيل المؤسسي.

ردود بطيئة

  • استخدم نموذجًا أصغر أو تكميمًا أعلى (Q4 بدلاً من Q5).
  • تأكد من أن GPU يُستخدم. تُظهر سجلات Ollama GPU أو CPU عند التحميل.
  • أغلق التطبيقات الأخرى التي تستهلك GPU.

مخرجات لا معنى لها

  • قد لا يتطابق اسم النموذج. Ollama حساس بشأن الأسماء الدقيقة.
  • قد تحتاج بعض النماذج إلى تنسيق موجه محدد. تعمل نماذج التعليمات بشكل أفضل من النماذج الأساسية للدردشة.

يتجاهل Cursor الإعداد المحلي

  • تأكد من أنك تتجاوز عنوان URL الأساسي لـ OpenAI، وليس مجرد إضافة نموذج مخصص.
  • أعد تشغيل Cursor بعد تغيير عنوان URL الأساسي.

الخاتمة

نماذج LLM المحلية مع Cursor قابلة للتطبيق اليوم لمجموعة فرعية من المهام. إنها ليست بنفس قدرة النماذج السحابية، ولكن للمطورين المهتمين بالخصوصية أو أولئك الذين يعملون في بيئات مقيدة، غالبًا ما تكون جيدة بما فيه الكفاية. ابدأ بـ Ollama إذا كنت تريد سرعة الإعداد، أو LM Studio إذا كنت تفضل واجهة رسومية. توقع أن تكرر في اختيار النموذج وسير العمل قبل أن تجد ما يناسب مشاريعك.