Usando Modelos DeepSeek no Cursor: Guia Completo de Configuração

Os modelos DeepSeek oferecem poderosas capacidades de raciocínio a preços competitivos. O Cursor suporta a integração DeepSeek por meio de vários métodos, desde suporte de API nativo até implantação local via Ollama. Este guia cobre todas as abordagens para fazer o DeepSeek funcionar no seu fluxo de trabalho do Cursor.
Modelos DeepSeek Disponíveis
| Modelo | Contexto | Melhor para | Suporte do Cursor |
|---|---|---|---|
| DeepSeek V3 | 64K | Codificação geral, chat | Nativo |
| DeepSeek R1 | 64K | Raciocínio, matemática, lógica | Nativo |
| DeepSeek V4 | 128K | Análise complexa | Via Ollama/Proxy |
| DeepSeek Coder | 16K | Tarefas específicas de código | Via OpenRouter |
Método 1: Suporte Nativo DeepSeek (Recomendado)
O Cursor tem suporte integrado para DeepSeek V3 e R1.
Etapa 1: Obter Chave de API
- Visite DeepSeek Platform
- Crie uma conta ou faça login
- Navegue até "API Keys"
- Gere uma nova chave e copie-a
Etapa 2: Configurar no Cursor
- Abra as configurações do Cursor (
Cmd/Ctrl + ,) - Vá para "Models" ou "AI Features"
- Encontre "Custom API Key" ou "Add Provider"
- Selecione "DeepSeek" como provedor
- Cole sua chave de API
- Salve as configurações
Etapa 3: Selecionar o Modelo DeepSeek
Em qualquer chat ou sessão do Composer:
- Clique no seletor de modelo (topo do chat)
- Escolha "DeepSeek V3" ou "DeepSeek R1"
- Comece a codificar
Método 2: Usando DeepSeek via OpenRouter
Para modelos não suportados nativamente, use o OpenRouter como ponte.
Configuração
- Obtenha uma chave de API OpenRouter
- Nas configurações do Cursor, adicione o OpenRouter como provedor:
{
"customModels": [
{
"name": "deepseek/deepseek-chat",
"provider": "openrouter",
"apiKey": "your-openrouter-key"
}
]
}
Modelos DeepSeek OpenRouter Disponíveis
deepseek/deepseek-chat # DeepSeek V3
deepseek/deepseek-reasoner # DeepSeek R1
deepseek/deepseek-coder # DeepSeek Coder
Método 3: DeepSeek Local com Ollama
Execute o DeepSeek localmente para privacidade e uso offline.
Instalar Ollama
# macOS
brew install ollama
# Linux
curl -fsSL https://ollama.com/install.sh | sh
# Windows
# Baixe de https://ollama.com/download
Baixar o Modelo DeepSeek
# DeepSeek Coder (recomendado para codificação)
ollama pull deepseek-coder:6.7b
# Para contexto maior (requer mais RAM)
ollama pull deepseek-coder:33b
Configurar Cursor para Ollama
- Certifique-se de que o Ollama está em execução:
ollama serve
- Nas configurações do Cursor, adicione o modelo local:
{
"customModels": [
{
"name": "deepseek-coder",
"provider": "ollama",
"baseUrl": "http://localhost:11434"
}
]
}
Solução de Problemas de Conexão Ollama
Se o Cursor não conseguir se conectar ao Ollama:
# Verifique se o Ollama está em execução
curl http://localhost:11434/api/tags
# Defina a variável de ambiente para o host Ollama
export OLLAMA_HOST=0.0.0.0
# No macOS, permita acesso à rede
launchctl setenv OLLAMA_HOST "0.0.0.0"
Método 4: DeepSeek V4 via Proxy LiteLLM
Para DeepSeek V4 Pro (nuvem), use o LiteLLM como proxy.
Configurar LiteLLM
pip install litellm
Crie litellm_config.yaml:
model_list:
- model_name: deepseek-v4
litellm_params:
model: deepseek/deepseek-chat-v4
api_key: os.environ/DEEPSEEK_API_KEY
Execute o proxy:
litellm --config litellm_config.yaml --port 8000
Configurar Cursor
{
"customModels": [
{
"name": "deepseek-v4",
"provider": "openai-compatible",
"apiKey": "sk-any",
"baseUrl": "http://localhost:8000"
}
]
}
Lidando com Conteúdo de Raciocínio
O DeepSeek R1 produz conteúdo de raciocínio que precisa de tratamento especial.
O Problema
O R1 retorna tanto o raciocínio quanto a resposta final:
{
"choices": [{
"message": {
"content": "Resposta final aqui...",
"reasoning_content": "Deixe-me pensar... Passo 1... Passo 2..."
}
}]
}
Solução: Filtrar com Proxy
Use um proxy simples para remover o conteúdo de raciocínio:
# deepseek_proxy.py
from flask import Flask, request, Response
import requests
app = Flask(__name__)
@app.route('/v1/chat/completions', methods=['POST'])
def proxy():
resp = requests.post(
'https://api.deepseek.com/v1/chat/completions',
headers={'Authorization': f'Bearer {API_KEY}'},
json=request.get_json()
)
data = resp.json()
# Remover reasoning_content
for choice in data.get('choices', []):
msg = choice.get('message', {})
msg.pop('reasoning_content', None)
return Response(
json.dumps(data),
mimetype='application/json'
)
Otimizando DeepSeek para Codificação
Prompt de Sistema
Adicione isso às suas regras do Cursor para melhor desempenho do DeepSeek:
Ao usar modelos DeepSeek:
- Seja explícito sobre caminhos de arquivo e números de linha
- Solicite raciocínio passo a passo para tarefas complexas
- Use formatos de saída estruturados (JSON, tabelas markdown)
- Especifique o comprimento de resposta esperado
Configurações de Temperatura
| Tarefa | Temperatura Recomendada |
|---|---|
| Geração de código | 0.1 - 0.3 |
| Depuração | 0.2 - 0.4 |
| Exploração criativa | 0.5 - 0.7 |
| Revisão de código | 0.1 - 0.2 |
Comparação de Custos
| Modelo | Entrada/1M tokens | Saída/1M tokens |
|---|---|---|
| DeepSeek V3 | $0.14 | $0.28 |
| DeepSeek R1 | $0.55 | $2.19 |
| GPT-4o | $5.00 | $15.00 |
| Claude 3.5 Sonnet | $3.00 | $15.00 |
Preços a partir de 2026. DeepSeek é significativamente mais econômico.
Solução de Problemas
| Problema | Solução |
|---|---|
| "Modelo não disponível" | Verifique se a chave de API é válida e tem créditos |
| Respostas lentas | Use um modelo menor ou habilite streaming |
| Conteúdo de raciocínio visível | Use um proxy ou filtro (veja acima) |
| Conexão Ollama recusada | Certifique-se de que o Ollama está em execução e a porta está acessível |
| Saída em chinês | Adicione "Respond in English" ao seu prompt |
Referência Rápida
# Testar API DeepSeek
curl https://api.deepseek.com/v1/chat/completions \
-H "Authorization: Bearer $DEEPSEEK_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "deepseek-chat",
"messages": [{"role": "user", "content": "Hello"}]
}'
# Listar modelos Ollama
ollama list
# Verificar status Ollama
curl http://localhost:11434/api/tags