Continue.dev 설치해서 VS Code에서 로컬 AI 코딩 어시스턴트 쓰기 — Ollama 연동부터 커스텀 프롬프트까지

요즘 AI 코딩 어시스턴트는 개발 생산성의 핵심이 되었다. GitHub Copilot도 좋지만, 매월 결제해야 하고 코드가 클라우드로 전송되는 게 껄끄러운 사람들이 있을 거다. 오늘은 완전히 로컬에서 돌아가는 Continue.dev를 소개한다. VS Code 확장으로 제공되는 Continue.dev는 Ollama를 통해 로컬 LLM을 연결할 수 있고, 필요하면 Claude나 OpenAI 같은 클라우드 API도 함께 쓸 수 있다. 이 글은 직접 설치해본 경험을 바탕으로 작성했다.

1. Continue.dev란 무엇인가

GitHub Copilot의 오픈소스 대안

Continue.dev는 GitHub Copilot처럼 VS Code에서 AI 코딩 자동완성과 채팅을 제공하는 오픈소스 확장이다. 핵심 차이점은 완전한 자유도에 있다. Continue.dev는 어떤 LLM이든 가져다 쓸 수 있다. Ollama로 로컬에서 돌리는 오픈소스 모델부터 시작해서, Claude API, OpenAI, 심지어 Hugging Face 같은 커스텀 엔드포인트까지 모두 지원한다. 프로비저닝도 자유롭다. 회사 내부 서버에 배포할 수도 있고, 개인 PC에만 설치할 수도 있다.

왜 로컬 AI인가

클라우드 기반 Copilot은 비용, 레이턴시, 프라이버시 문제가 있다. 특히 NDA가 있는 회사라면 코드를 외부로 보낼 수 없다. 반면 Ollama 같은 로컬 LLM을 쓰면 코드가 절대 밖으로 나가지 않는다. 한 번 설정해두면 인터넷 연결 없이도 작동한다. 물론 성능은 클라우드 모델에 미치지 못하지만, CodeLlama나 Deepseek 같은 모델들도 작은 코드 스니펫은 충분히 잘 생성한다.

2. 사전 준비: Ollama 설치 및 모델 다운로드

Ollama 설치하기

Continue.dev가 로컬 LLM과 통신하려면 LLM 실행 엔진이 필요하다. Ollama가 가장 간단하다. ollama.ai에서 Mac, Linux, Windows 인스톨러를 다운로드할 수 있다. 필자는 Mac에서 테스트했고, 설치 후 터미널을 다시 시작하면 ollama 명령어를 바로 쓸 수 있다.

curl -fsSL https://ollama.ai/install.sh | sh

이 명령어로 한 번에 설치된다. 또는 공식 웹사이트에서 직접 인스톨러를 받아 설치해도 된다.

모델 다운로드

설치가 끝나면 코딩에 특화된 모델을 받아야 한다. CodeLlama는 코딩에 최적화된 오픈소스 모델이다. 모델은 Ollama가 자동으로 관리하는 디렉토리에 저장된다. 모델 크기는 품질과 속도를 결정한다.

ollama pull codellama:7b

7B 모델은 약 4GB 정도 받는다. GPU가 있으면 훨씬 빠르지만, CPU에서도 돈다. 더 강력한 모델을 원하면 codellama:13b를 받아도 좋다. 다만 메모리 요구량이 늘어난다.

ollama pull codellama:13b

Ollama는 한 번 받은 모델을 캐시하므로, 두 번째부터는 훨씬 빠르게 로드된다. 다른 추천 모델로는 Deepseek-Coder, Mistral-Instruct 등이 있다. 여러 모델을 받아두고 Continue.dev 설정에서 상황에 맞게 전환할 수 있다.

Ollama 서버 실행 확인

Ollama를 설치하면 백그라운드에서 자동으로 서버가 돈다. 포트 11434에서 로컬 API를 제공한다. 정상 작동을 확인하려면 터미널에서 간단한 명령어를 시도해보면 된다.

ollama run codellama:7b "Hello, what is 2+2?"

이 명령어를 실행하면 모델이 로드되고 질문에 답한다. 응답이 정상으로 나오면 준비가 끝난 것이다. 언제든지 종료하려면 터미널에서 Ctrl+C를 누르면 된다.

3. VS Code에서 Continue.dev 확장 설치

확장 마켓플레이스에서 설치

VS Code를 열고 왼쪽 사이드바에서 확장 탭을 클릭한다. 검색창에 Continue를 입력하면 Continue 확장이 맨 위에 나타난다. 설치 버튼을 누르면 된다. 설치가 완료되면 Continue 아이콘이 좌측 메뉴에 추가된다.

확장 활성화 및 첫 실행

설치 직후 VS Code를 재시작하거나 명령 팔레트에서 Developer: Reload Window를 실행하면 확장이 활성화된다. 그러면 좌측 사이드바에 Continue 아이콘이 생긴다. 아이콘을 클릭하면 Continue 패널이 열린다. 처음에는 설정이 필요하다는 메시지가 나타난다. 이때 설정 파일 열기 같은 버튼을 눌러서 config.json으로 이동할 수 있다.

확장 권한 설정

VS Code는 보안을 위해 확장의 일부 기능에 대해 사용 허가를 요청한다. Continue.dev가 에디터의 현재 파일을 읽고, 선택 영역을 분석하고, 터미널 명령어를 제안하려면 이런 권한들이 필요하다. 설정 대화에서 모두 허용해주면 된다.

4. config.json 설정: 모델 연결부터 컨텍스트까지

config.json 위치와 기본 구조

Continue.dev의 모든 설정은 config.json에서 이루어진다. 파일 위치는 OS마다 다르다.

macOS: ~/Library/Application Support/Continue/config.json
Linux: ~/.config/Continue/config.json
Windows: %APPDATA%\Continue\config.json

VS Code의 Continue 패널에서 설정 버튼을 클릭하면 이 파일이 VS Code에서 열린다. 처음에는 기본 템플릿이 자동으로 생성된다.

Ollama 모델 연결하기

가장 중요한 부분은 모델 정의다. 다음은 CodeLlama를 로컬 Ollama로 연결하는 설정 예제다.

{
  "models": [
    {
      "title": "CodeLlama 7B",
      "provider": "ollama",
      "model": "codellama:7b",
      "apiBase": "http://localhost:11434"
    }
  ],
  "tabAutocompleteModel": {
    "title": "CodeLlama 7B",
    "provider": "ollama",
    "model": "codellama:7b",
    "apiBase": "http://localhost:11434"
  }
}

models 배열에는 채팅과 코드 분석에 사용할 모델을 정의한다. tabAutocompleteModel은 탭 자동완성(인라인 추천)에 쓸 모델을 지정한다. 일반적으로 두 가지 모두 같은 모델을 쓰면 된다. 다만 더 빠른 응답이 필요하면 더 작은 모델을 자동완성용으로 따로 설정할 수도 있다.

여러 모델 설정하기

Continue.dev에서는 여러 모델을 동시에 설정할 수 있다. 채팅할 때 드롭다운에서 모델을 전환할 수 있다. 예를 들어 CodeLlama와 Deepseek-Coder를 모두 쓰고 싶다면 다음처럼 설정한다.

{
  "models": [
    {
      "title": "CodeLlama 7B",
      "provider": "ollama",
      "model": "codellama:7b",
      "apiBase": "http://localhost:11434"
    },
    {
      "title": "Deepseek Coder",
      "provider": "ollama",
      "model": "deepseek-coder:6.7b",
      "apiBase": "http://localhost:11434"
    }
  ],
  "tabAutocompleteModel": {
    "title": "CodeLlama 7B",
    "provider": "ollama",
    "model": "codellama:7b",
    "apiBase": "http://localhost:11434"
  }
}

Ollama 포트가 11434가 아니거나 원격 서버에서 돌고 있다면 apiBase를 수정하면 된다. 예를 들어 http://192.168.1.100:11434 같이 IP 주소를 입력할 수도 있다.

시스템 프롬프트와 컨텍스트

모델의 기본 동작을 조정하려면 systemMessage를 추가한다. 이것은 모델이 어떤 역할을 해야 하는지 알려주는 지시사항이다.

{
  "models": [
    {
      "title": "CodeLlama 7B",
      "provider": "ollama",
      "model": "codellama:7b",
      "apiBase": "http://localhost:11434",
      "systemMessage": "You are an expert Python developer. Always provide clean, well-documented code with type hints. Focus on best practices and performance."
    }
  ]
}

한국어로도 설정할 수 있다. 예를 들어 Python 전문가처럼 대답하라는 프롬프트를 한국어로 작성할 수 있다.

5. 실전 사용법: 자동완성, 채팅, 코드 설명

탭 자동완성으로 빠른 코딩

Continue.dev 설정이 끝나면 VS Code에서 코드를 작성할 때 자동으로 제안이 나타난다. 함수 이름이나 변수명을 몇 글자 입력하면 모델이 다음 코드를 예측한다. 제안을 수락하려면 Tab 키를 누르면 된다. 부분적으로만 수락하고 싶으면 Ctrl+Right Arrow로 단어 단위로 이동할 수 있다. 제안이 마음에 안 들면 Escape를 누르거나 그냥 무시하고 계속 입력하면 된다.

자동완성은 빠를수록 좋다. 그래서 일반적으로 더 작은 모델을 쓰는 게 좋다. 7B 모델은 대부분 실시간으로 응답하지만, 13B 이상은 약간의 레이턴시가 생길 수 있다.

Continue 채팅으로 대화형 코딩

자동완성 외에도 Continue 패널에서 AI와 대화할 수 있다. 왼쪽 사이드바의 Continue 아이콘을 클릭하면 채팅 창이 열린다. 여기서는 자유로운 질문이 가능하다.

VS Code 에디터에 현재 파일이나 선택된 코드가 있으면, 채팅창 하단의 파일 추가 버튼을 눌러서 그 코드를 컨텍스트로 전달할 수 있다. 예를 들어 함수를 선택한 후 "이 함수를 리팩토링해줘"라고 하면 모델이 선택된 함수를 보고 개선안을 제시한다.

명령 팔레트(Cmd+Shift+P 또는 Ctrl+Shift+P)에서 Continue: Explain을 실행하면 선택된 코드를 설명해준다. Continue: Edit는 선택된 코드를 수정하는 창을 연다. Continue: Generate Tests는 테스트 코드를 자동으로 생성한다.

인라인 채팅

코드 에디터에서 직접 AI와 대화할 수도 있다. Ctrl+I (Mac은 Cmd+I)를 누르면 현재 커서 위치에서 인라인 채팅 창이 열린다. 여기서 명령을 입력하면 모델이 그 자리에 코드를 삽입하거나 수정한다.

/ fix this function
/ add error handling
/ write a docstring

슬래시로 시작하는 명령은 Continue.dev의 빌트인 명령어다. 첫 몇 글자를 입력하면 자동완성이 나타난다.

6. 커스텀 프롬프트와 컨텍스트 설정

재사용 가능한 프롬프트 만들기

자주 반복되는 작업이 있다면 프롬프트 템플릿을 저장할 수 있다. config.json에 customCommands 섹션을 추가한다.

{
  "customCommands": [
    {
      "name": "generateTests",
      "prompt": "Write comprehensive unit tests for the selected code using pytest. Include edge cases and error handling.",
      "description": "Generate pytest tests"
    },
    {
      "name": "docstring",
      "prompt": "Add detailed Google-style docstrings to the selected code. Include parameter types, return types, and examples.",
      "description": "Add docstrings"
    }
  ]
}

이렇게 설정하면 명령 팔레트에서 Continue: generateTests 또는 Continue: docstring으로 빠르게 실행할 수 있다.

파일 기반 컨텍스트

모델이 현재 파일뿐만 아니라 프로젝트의 다른 파일도 참조하도록 할 수 있다. 예를 들어 기존의 유사한 코드를 분석하게 하려면 채팅창에서 파일을 여러 개 추가한다. 파일 추가 버튼을 여러 번 클릭하면 된다. 이렇게 하면 모델이 더 나은 답변을 줄 수 있다.

.continueignore 파일

프로젝트 루트에 .continueignore 파일을 만들면 Continue.dev가 특정 파일이나 디렉토리를 무시하도록 할 수 있다. .gitignore와 비슷한 문법을 쓴다.

node_modules/
dist/
*.log
build/

이렇게 하면 채팅 때 불필요한 파일들이 포함되지 않아서 컨텍스트 토큰을 절약할 수 있다.

7. 클라우드 모델 연동: Claude API와 OpenAI

Claude API 키 설정

로컬 모델만으로 부족할 때는 Claude나 OpenAI 같은 클라우드 API를 함께 쓸 수 있다. Claude API 키를 받은 후 config.json에 추가한다.

{
  "models": [
    {
      "title": "Claude 3 Opus",
      "provider": "anthropic",
      "model": "claude-3-opus-20240229",
      "apiKey": "sk-ant-..."
    }
  ]
}

API 키는 절대 공개 저장소에 커밋하면 안 된다. 대신 환경 변수로 관리하는 게 좋다. Continue.dev는 환경 변수를 읽을 수 있다.

{
  "models": [
    {
      "title": "Claude 3 Opus",
      "provider": "anthropic",
      "model": "claude-3-opus-20240229",
      "apiKey": "${ANTHROPIC_API_KEY}"
    }
  ]
}

터미널에서 환경 변수를 설정한 후 VS Code를 시작하면 된다.

export ANTHROPIC_API_KEY="sk-ant-..."
code .

OpenAI API 연동

OpenAI의 GPT-4 같은 모델을 쓸 수도 있다. 설정은 유사하다.

{
  "models": [
    {
      "title": "GPT-4",
      "provider": "openai",
      "model": "gpt-4",
      "apiKey": "${OPENAI_API_KEY}"
    }
  ]
}

로컬 모델과 클라우드 모델을 함께 등록해두면, 빠른 작업은 로컬에서, 복잡한 작업은 클라우드에서 하는 식으로 유연하게 사용할 수 있다. 채팅 창에서 모델을 드롭다운으로 선택해서 전환한다.

8. 트러블슈팅: 자주 발생하는 오류와 해결법

Ollama 연결 오류

가장 흔한 오류는 Continue.dev가 Ollama를 찾지 못하는 것이다. "Connection refused" 같은 메시지가 나오면 먼저 Ollama가 실행 중인지 확인한다.

lsof -i :11434

이 명령어가 아무것도 반환하지 않으면 Ollama가 안 돌고 있다는 뜻이다. 터미널에서 ollama serve를 실행해서 수동으로 시작한다.

ollama serve

또는 Mac에서는 설정된 대로 백그라운드 데몬이 돌아야 한다. 시스템 환경설정에서 Ollama를 확인하거나, 맥의 메뉴바에 Ollama 아이콘이 있는지 본다. 없으면 응용프로그램 폴더에서 Ollama를 다시 실행한다.

모델 로드 오류

모델을 다운로드했는데 "Model not found" 오류가 나면, 모델이 제대로 설치되지 않았을 가능성이 있다. 먼저 다운로드된 모델을 확인한다.

ollama list

출력되지 않는 모델은 다시 받아야 한다. 또는 모델명에 태그를 빠뜨렸을 수도 있다. codellama:7b가 아닌 codellama라고만 쓰면 안 된다.

응답이 너무 느림

모델이 너무 느리면 더 작은 모델로 바꾸거나, GPU를 사용하도록 설정한다. Ollama는 기본적으로 GPU를 인식하면 자동으로 사용한다. 하지만 환경에 따라 명시적으로 설정해야 할 수도 있다. Mac M1/M2는 자동으로 Metal 가속을 쓴다.

또한 Ollama의 메모리 설정을 조정할 수 있다. 더 큰 모델을 로드할 때는 시스템 RAM이 충분해야 한다. 부족하면 스왑 메모리를 사용하게 되어 매우 느려진다.

config.json 문법 오류

JSON 파일에 쉼표나 따옴표를 빠뜨리면 오류가 난다. Continue.dev는 보통 어느 줄에서 문제인지 알려준다. VS Code의 JSON 검증 기능을 활용하면 자동으로 오류를 찾을 수 있다.

9. 자주 묻는 질문

Continue.dev는 정말 무료인가?

Continue.dev 자체는 오픈소스이고 무료다. 다만 사용하는 모델이 유료일 수 있다. Ollama로 로컬에서 오픈소스 모델을 돌리면 완전히 무료다. Claude나 OpenAI 같은 클라우드 API는 사용량에 따라 요금이 붙는다.

로컬 모델의 정확도는?

CodeLlama 7B는 많은 경우 충분히 좋다. 특히 자동완성이나 간단한 버그 수정에는 매우 유용하다. 복잡한 알고리즘을 생성하거나 여러 파일의 컨텍스트를 이해해야 할 때는 CloudGPT 같은 더 큰 모델이 낫다. 하지만 이런 경우는 드물다.

Continue.dev가 내 코드를 외부로 보내나?

로컬 Ollama 모델만 쓰면 코드가 절대 밖으로 나가지 않는다. API를 사용하면 당연히 API 제공자에게 전송된다. 민감한 코드는 로컬 모델로만 분석하거나, 회사 정책을 확인해야 한다.

여러 개발자가 함께 쓸 수 있나?

Ollama 서버를 원격에 배포하면 팀 전체가 공유 모델을 쓸 수 있다. Ollama를 서버로 실행하고 apiBase를 팀 서버 주소로 설정하면 된다. 하지만 보안과 성능을 고려해야 한다.

Continue.dev와 다른 AI 코딩 도구의 차이는?

GitHub Copilot은 가장 대중적이지만 유료이고 코드가 클라우드로 간다. Codeium은 무료지만 회사 정보를 수집한다는 우려가 있다. Continue.dev는 완전히 오픈소스이고, 사용자가 100% 제어할 수 있다는 게 장점이다.

결론

Continue.dev와 Ollama의 조합은 개발자에게 큰 자유도를 준다. 초기 설정은 약간 번거롭지만, 한 번 설정하면 매일 사용할 수 있는 강력한 도구가 된다. 로컬에서 돌아가므로 보안 걱정이 없고, 인터넷 없이도 작동한다. GitHub Copilot의 월정액이 아깝거나, 코드 보안이 중요한 환경이라면 Continue.dev는 정말 좋은 대안이다.

모델 기술은 빠르게 발전하고 있다. 더 나은 모델이 나오면 config.json을 수정해서 바꾸기만 하면 된다. 이것이 바로 Continue.dev의 강점이다. 지금 바로 시작해보길 권한다.

Disclaimer: 이 글에 소개된 서비스와 도구는 작성 시점 기준이며, 업데이트에 따라 변경될 수 있습니다.

Keywords: Continue.dev 설치, VS Code AI 코딩, Ollama 로컬 AI, AI 코딩 어시스턴트, 로컬 LLM, CodeLlama, 오픈소스 AI, 무료 AI 개발 도구

'AI 개발 활용' 카테고리의 다른 글

GitHub Copilot Workspace로 이슈에서 PR까지 자동화하기 — 설정부터 실전 워크플로우까지 (0)	2026.03.27
Windsurf에서 Cascade 기능으로 멀티파일 리팩토링하기 — 설치부터 실전 활용까지 (0)	2026.03.27
Supabase MCP 서버로 Claude에서 직접 DB 쿼리하기 — 설치부터 실전 활용까지 (0)	2026.03.26
CLAUDE.md 파일 작성법 — 프로젝트 컨텍스트 설정으로 AI 코딩 속도 10배 올리기 (1)	2026.03.25
Claude Code Channels 설치하고 Discord·Telegram에서 코딩하기 — 설정부터 실전 활용까지 (0)	2026.03.24