تشغيل نماذج اللغة الكبيرة المحلية مع Cursor: دليل الإعداد الكامل
إذا كنت تعمل على كود ملكي، أو تتعامل مع بيانات حساسة، أو ببساطة لا تريد أن تغادر مقتطفات الكود جهازك، فإن تشغيل نموذج LLM محلي مع Cursor هو خيار ممتاز. يشرح هذا الدليل خطوات الإعداد العملية لـ Ollama و LM Studio، بالإضافة إلى المفاضلات التي يجب أن تعرفها قبل التبديل.
لماذا تستخدم النماذج المحلية؟
هناك ثلاثة أسباب تتكرر باستمرار في المجتمع:
- الخصوصية: لا يغادر كودك شبكتك المحلية أبدًا. لا يوجد API خارجي، ولا سياسة احتفاظ بالبيانات تحتاج لتحليلها.
- التكلفة: بعد تكاليف الأجهزة، يكون الاستدلال مجانيًا. لا فوترة لكل رمز، ولا ارتفاعات مفاجئة في الاستخدام.
- الوصول دون اتصال: يعمل على الطائرات، وفي الشبكات المؤسسية المقيدة، أو في أي مكان بدون إنترنت.
النماذج المحلية ممتازة في إنشاء القوالب الجاهزة، وإعادة البناء البسيطة، والأسئلة السريعة حول قاعدة الكود الخاصة بك. لا تحتاج إلى GPT-4 لكل شيء.
الواجهات الخلفية المدعومة للنماذج المحلية
لا يأتي Cursor بدعم مدمج للنماذج المحلية بنفس الطريقة التي يدعم بها واجهات OpenAI أو Anthropic. بدلاً من ذلك، تقوم بتوجيه Cursor إلى خادم محلي يعرض واجهة برمجة تطبيقات متوافقة مع OpenAI. الخيارات الثلاثة الأكثر شيوعًا:
| الواجهة الخلفية | الأفضل لـ | تعقيد الإعداد |
|---|---|---|
| Ollama | البدء السريع، إدارة النماذج | منخفض |
| LM Studio | محبي الواجهات الرسومية، مستخدمي Windows/Mac | منخفض |
| llama.cpp | أقصى درجات التحكم، الحد الأدنى من النفقات العامة | متوسط |
يركز هذا الدليل على Ollama و LM Studio لأنهما الأكثر استخدامًا من قبل المطورين في العمل اليومي.
Ollama + Cursor: خطوة بخطوة
1. تثبيت Ollama
قم بالتحميل من ollama.com والتثبيت. يعمل كخدمة خلفية على macOS و Linux و Windows.
تحقق من أنه يعمل:
ollama --version
2. سحب نموذج
ابدأ بنموذج قادر على التعامل مع الكود. المفضلات في المجتمع هي:
codellama:7b-codeأوcodellama:13b-code— سريع، جيد للمهام البسيطةdeepseek-coder:6.7b— قوي في إكمال الكودqwen2.5-coder:7bأو14b— توازن جيد بين السرعة والجودة
ollama pull deepseek-coder:6.7b
3. تشغيل الخادم المتوافق مع OpenAI
يعرض Ollama واجهة برمجة تطبيقات متوافقة مع OpenAI على localhost:11434. اتركه يعمل:
ollama serve
أو دع الخدمة الخلفية تتولى ذلك.
4. إعداد Cursor
افتح إعدادات Cursor (Ctrl/Cmd + ,) وانتقل إلى:
الإعدادات > النماذج > مفتاح OpenAI API
اضبط عنوان URL الأساسي على:
http://localhost:11434/v1
اترك حقل مفتاح API فارغًا أو أدخل أي سلسلة وهمية (تتطلب بعض الإصدارات قيمة غير فارغة).
اختر اسم النموذج الذي يطابق ما قمت بسحبه. على سبيل المثال:
deepseek-coder:6.7b
يرسل Cursor الطلبات بتنسيق دردشة OpenAI. تقوم نقطة نهاية /v1 في Ollama بترجمتها تلقائيًا. لا تحتاج إلى وكيل.
5. اختباره
افتح ملفًا واضغط على Ctrl/Cmd + L لفتح لوحة الدردشة. اسأل شيئًا بسيطًا:
اكتب دالة Python تعكس سلسلة نصية دون استخدام التقطيع.
إذا حصلت على رد، فأنت متصل. إذا توقف، تحقق من أن ollama serve يعمل وأن اسم النموذج يطابق تمامًا.
LM Studio + Cursor: خطوة بخطوة
LM Studio هو الخيار الأفضل إذا كنت تريد واجهة رسومية لتنزيل النماذج والتبديل بينها.
1. تثبيت LM Studio
قم بالتحميل من lmstudio.ai. متاح لـ macOS و Windows و Linux.
2. تنزيل نموذج
افتح LM Studio، انتقل إلى علامة التبويب Discover، وابحث عن نموذج كود. خيارات جيدة:
TheBloke/CodeLlama-7B-Instruct-GGUFTheBloke/DeepSeek-Coder-6.7B-Instruct-GGUFQwen/Qwen2.5-Coder-7B-Instruct-GGUF
قم بتنزيل التكميم Q4_K_M أو Q5_K_M لتحقيق توازن بين الحجم والجودة.
3. تشغيل الخادم المحلي
في LM Studio، انتقل إلى علامة التبويب الخادم المحلي على اليسار. حمّل نموذجك، ثم انقر على بدء الخادم.
بشكل افتراضي، يعمل على:
http://localhost:1234/v1
4. إعداد Cursor
نفس العملية كـ Ollama. في إعدادات Cursor > النماذج > مفتاح OpenAI API، اضبط:
http://localhost:1234/v1
يمكن ترك حقل اسم النموذج كـ local-model أو أي قيمة نائبة يتوقعها LM Studio. يتجاهل LM Studio اسم النموذج ويستخدم ما هو محمّل حاليًا.
5. التحقق
شغّل نفس موجه الاختبار. تُظهر سجلات خادم LM Studio الطلبات الواردة، وهو أمر مفيد لتصحيح الأخطاء.
ما يعمل وما لا يعمل
النماذج المحلية ليست بديلاً مباشرًا لـ Claude 3.5 Sonnet أو GPT-4o. إليك التحليل الصريح:
| المهمة | محلي 7B-13B | السحابة (Claude/GPT-4) |
|---|---|---|
| إعادة البناء البسيطة | جيد | ممتاز |
| إنشاء القوالب الجاهزة | جيد | ممتاز |
| قرارات البنية المعقدة | ضعيف | ممتاز |
| فهم قواعد الكود الكبيرة | ضعيف | ممتاز |
| التعديلات متعددة الملفات | ضعيف | جيد |
| السرعة (مع GPU) | سريع | يعتمد على الشبكة |
| السرعة (CPU فقط) | بطيء | يعتمد على الشبكة |
قد يستغرق تشغيل نموذج 13B على CPU من 10 إلى 30 ثانية لكل رد. تجلب GPU الحديثة (RTX 3060 أو أفضل) هذا إلى 1-3 ثوانٍ. ضع توقعاتك في الاعتبار.
الاستراتيجية الهجينة: النهج العملي
معظم المطورين الذين يلتزمون بالنماذج المحلية يستخدمون سير عمل هجينًا بدلاً من الاعتماد الكامل:
- نموذج محلي للمهام السريعة والآمنة: إصلاحات lint، إعادة التسمية، تعبيرات regex البسيطة، شرح دالة.
- نموذج سحابي للمهام الثقيلة: تصميم ميزات جديدة، تصحيح أخطاء صعبة، إعادة البناء عبر الملفات.
- التبديل بناءً على المشروع: كود مفتوح المصدر أو غير حساس → سحابة؛ كود ملكي أو خاضع للتنظيم → محلي.
يجعل Cursor هذا سهلاً لأنه يمكنك تغيير النموذج في الإعدادات دون إعادة تشغيل IDE. يبقي بعض المستخدمين نافذتي Cursor مفتوحتين — واحدة موجهة إلى المحلي، وأخرى إلى السحابة — على الرغم من أن هذا أكثر حلاً بديلاً من كونه ميزة.
إذا كان لديك Mac بمعالج Apple Silicon، فإن Ollama يستفيد من Neural Engine بشكل جيد. يمكن لـ MacBook Pro M3 Pro تشغيل نموذج 13B بسرعات قابلة للاستخدام دون استنزاف البطارية كما تفعل GPU المنفصلة.
استكشاف الأخطاء وإصلاحها
أخطاء "Connection refused"
- تحقق من أن الخادم يعمل (
ollama serveأو علامة تبويب خادم LM Studio). - تحقق من المنفذ: يستخدم Ollama 11434، ويستخدم LM Studio 1234.
- تحقق من جدار الحماية أو الوكيل المؤسسي.
ردود بطيئة
- استخدم نموذجًا أصغر أو تكميمًا أعلى (Q4 بدلاً من Q5).
- تأكد من أن GPU يُستخدم. تُظهر سجلات Ollama
GPUأوCPUعند التحميل. - أغلق التطبيقات الأخرى التي تستهلك GPU.
مخرجات لا معنى لها
- قد لا يتطابق اسم النموذج. Ollama حساس بشأن الأسماء الدقيقة.
- قد تحتاج بعض النماذج إلى تنسيق موجه محدد. تعمل نماذج التعليمات بشكل أفضل من النماذج الأساسية للدردشة.
يتجاهل Cursor الإعداد المحلي
- تأكد من أنك تتجاوز عنوان URL الأساسي لـ OpenAI، وليس مجرد إضافة نموذج مخصص.
- أعد تشغيل Cursor بعد تغيير عنوان URL الأساسي.
الخاتمة
نماذج LLM المحلية مع Cursor قابلة للتطبيق اليوم لمجموعة فرعية من المهام. إنها ليست بنفس قدرة النماذج السحابية، ولكن للمطورين المهتمين بالخصوصية أو أولئك الذين يعملون في بيئات مقيدة، غالبًا ما تكون جيدة بما فيه الكفاية. ابدأ بـ Ollama إذا كنت تريد سرعة الإعداد، أو LM Studio إذا كنت تفضل واجهة رسومية. توقع أن تكرر في اختيار النموذج وسير العمل قبل أن تجد ما يناسب مشاريعك.