| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | |
| 7 | 8 | 9 | 10 | 11 | 12 | 13 |
| 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| 21 | 22 | 23 | 24 | 25 | 26 | 27 |
| 28 | 29 | 30 |
- 컨트롤러
- asahi linux
- Tarantula
- Fedora
- Mac
- 맥
- beta
- iOS 13
- sierra
- asahi
- 아이폰
- tevo
- 시에라
- 에어팟
- mojave
- AirPods
- IOS
- 업데이트
- macos
- 터미널
- 애플
- 3D 프린터
- 모하비
- high sierra
- 터치바
- 버그
- 맥북프로
- Linux
- 3D프린터
- catalina
- Today
- Total
elsa in mac
Gpt를 떠나고 Deepseek를 사용하기 시작했습니다. 본문

이번 포스트에서는 기존까지 사용하던 OpenAI의 Codex 구독을 취소하고 중국의 Deepseek를 사용하게 된 이유를 적어 봅니다.
불과 5주 전쯤., 취미 개발자의 시선에서 바라본 Gemini, Claude, Codex 비교라는 글을 통해, Gemini -> Claude -> Codex로 사용을 바꾼 이유를 포스팅했었습니다. Codex가 최종 종착지라고 생각했지만, 혹시 = 역시 라고 어제 Codex를 버리고 Deekseek로 또다시 AI 모델을 변경하게 되었습니다.
참고로 필자는 Coding 에서만 AI를 사용하고 있고, 주로 터미널 기반의 CLI, TUI , Linux Kernel Driver, Wayland Compositor 개발을 하고 있습니다. 그리고 취미 개발자입니다. 상업적인 일에 AI를 사용하고 있지 않습니다. AI를 어떠한 용도에 어느 정도, 그리고 어떠한 방식으로 사용하느냐에 따라 개인적인 만족도는 각기 달라질 수 있다는 점을 우선 말씀드리고 싶습니다.
* Codex를 떠난 이유 :
Codex, 엄밀하 말하면 Gpt 모델을 사용하면서 "아 여기에 정착해야 겠구나.." 라고 생각한 이유는 Gpt-5.3-Codex가 너무 좋았기 때문입니다. 최상위 모델은 2026년 6월 현재 5.5이고, 이전 모델이 5.4이니, 5.3이나 5.2 모델은 어찌 보면 한물간 모델입니다. 하지만, 5.3-codex가 보여준 인상은 상당히 좋았습니다. 너무 과하게 추론하지 않으면서도 사용자의 의도를 정확하 파악하고 핵삼만 딱 집어서 정확하게 일을 처리해 주었습니다. 반응성도 빠르고, 답변도 짧고 핵심만 정리해서 말해 줍니다. Token 소모량도 최신모델보다 훨씬 적어서 5시간 제한에 걸린 적이 한 번도 없었고, 주간 사용량도 늘 20 ~ 40% 정도가 남을 정도로 여유가 있었습니다. 너무 좋았습니다. ~
그런데, 6월 2일..
일과를 마치고 집에서 컴퓨터를 켜고 Codex Desktop을 실행한 후, 질문을 하는 순간!... 해당 모델을 사용할 수 없다는 메시지가 뜨더군요. "어~ 이거 뭐야 ?" 학인을 해 보니, Codex-5.3-Codex 모델을 더 이상 구독 모델에서 서비스하지 않으며, API 모델로 변경하였다는 사실을 알게 됩니다. 젠장. 이제 딱 1달 정도 써가고 있는데..

내용인즉슨, Plus, Pro 등의 일반 구독제 서비스에서 GPT-5.3-Codex 모델을 제외시킨다는 것입니다. 이유는 후속 모델인 GPT-5.5, GPT-5.6 등을 위한 GPU 인프로 공간 확보 및 연구 전용 연산 장치 재배치를 위한 조치로, 구독제에서는 사라졌지만, API를 통해서 사용할 수 있다는 내용입니다.
얼핏 읽어보면 말이 안됩니다.
주력모델을 위한 자원 확보차원에서 과거의 모델을 제외시킨다는 부분까지는 이해가 가지만, API로는 쓸 수 있다? 그렇다면 GPT-5.3-Codex를 위한 자원을 유지한다는 말이기 때문입니다. 정보를 좀 더 조사해 보니, 최근에 상장한 CS-3 거대 AI 가속기를 개발하고 운영하는 Cerebras 와의 협업을 통해 Gpt-5.3-Codex 모델을 Cerebras 인프라로 돌린 것 같습니다.
상황이 어찌 되었던, 이제 Gpt-5.3-Codex 초 가성비 모델을 사용할 수 없으니, 상위 모델인 5.4 나 5.5를 사용해야 하는데, 이 부분이 난감합니다. 당연히 Token 소모량은 5.3-Codex 모델보다 더 클 것이지만, 토큰 소모량이 문제가 아니고 성능이 오히려 못하다는 점입니다. 5.4 모델이나 5.5 모델을 사용하면서 느낀 가장 불편한 점은 추론을 한답시고, 시간을 오래 잡아먹는 것은 물론이거니와 결국 문제를 분석하고 코드를 수정하지만 수정된 코드를 검토해 보면 결코 근본적인 코드의 결함을 찾거나 논리적 버그를 찾아서 수정한 것이 아니라는 점입니다. 일종의 뭐랄까 대충 때려 맞춰 수정한 추측성 추론을 하는 것 같다고나 랄까.. 필자가 5.3-Codex 모델을 좋아했던 이유는 5.3-Codex에서는 이런 추측성 추론을 하지 않는다는 것 때문이였습니다. 20달러 구독 서비스 사용자로서 선택할 수 있는 모델이 딱 3개(5.5, 5.4, 5.4-mini)인데, 이런 추론 수준이라면 사용할 수 없다는 결론에 다다르게 됩니다.
여러 번의 수정 요청 후에도 동일한 문제가 반복되었을 경우, "너 추측한 거 아니야?"라고 물어보면, "네.. 맞습니다. 제가 추측을 했습니다..."라고 답변을 하는데, 와.. 내가 이걸 더 이상 사용할 이유가 있을까?라는 의문이 들면서 신뢰가 완전히 무너 진 것이죠.
"아.. 이건 못쓰겠네...."
그래서 5.3-Codex API 를 쓸까 하고 검토를 해 보니, 아.. 비용이 이건 뭐.. 기업체 직원이 아닌 일반 개인이 사용하기에는 감당할 수 없을 것 같은 느낌적인 느낌..
그러던 찰나.. 2026년 5월 23일날 발표된 Deepseek 관련 기사를 하나 접하게 됩니다.

Deepseek의 v4 버전에 대한 모델 사용료를 한시적으로 75% 할인하던 것을 영구 인하 하겠다고 발표한 것입니다. 회사 입장에서는 기존 가격대비 1/4 인하한 가격이며, OpenAI, Gemini, Claude와 비교해도 말도 안 되는 가격입니다.
API를 사용하는 것인데, 아래의 스샷을 보면, V4-Pro 와 V4-Flash 모델로 총 2억 토큰 좀 안되게 사용하는 지금, 비용은 0.91 달러임을 알 수 있습니다. 네, v4 flash를 주력으로 사용하면서 대략 2억 토큰에 1달러라고 생각하면 될 것 같습니다.

Codex 와의 비교를 위해 GPT-5.4-mini 와 GPT-5.3-Codex를 지난 5월 한 달 동안 사용한 토큰 수를 확인하니 대략 17억 토큰이었습니다. 5.4-mini와 5.3-codex를 3:7 정도의 비율로 사용했던 것으로 기억됩니다.

필자의 AI 사용 정도를 기준으로 20달러로 18억 토큰 정도를 소모한다고 가정하고, 이 사용 토큰량을 Deepseek에 단순히 대비해 보면, 9달러가 됩니다. 대략 1/2 , 반 가격으로 동일한 토큰을 사용할 수 있는 것입니다. 하지만, 실제로는 훨씬 더 비용은 싸질 수 있습니다. 이유는 질문과 응답의 횟수 및 추론 비용이 적으면 작을 수록 토큰 소모량도 적어지기 때문입니다. 이건 모델의 최정화 및 성능과 괘를 같이 합니다. 무조건 최신의 모델이 더 뛰어난 것일 수는 없습니다. 단 한번의 질문에 단 한번의 추론과 단 한번의 응답으로 사용자의 문제가 해결된다면 그게 가장 토큰을 적게 사용하는 것입니다. 같은 목적을 달성하기 위해 수 없이 많이 질문하고 그 질문에 대해 수 없이 추론을 반복하며 응답 메시지를 낸다면 토큰 소모량은 커 질수 밖에 없습니다.
API로 사용할 수 있다는 잇점 있습니다. 정확히 사용한 양 만큼만 차감되기 때문입니다. 구독제의 단점은 사용을 하던 안 하던 월 비용이 지출되지만, API 방식을 사용할 경우 월마다 고정비용이 지출될 일이 없습니다.


위의 스샷은 deepseek를 이용하여 만들어 본, reddit-tui 입니다. reddit rss에 대해 source 파싱 -> markdown 변환 -> rendering 이 주 기능으로 Codex로는 개발 도중에 결국 image 처리 문제를 해결하지 못해 중단했었는데, deepseek는 한 번에 깔끔하게 만들어 주었습니다. 비용은 1.23 달러가 소요되었습니다. API를 사용하므로, 실 사용에서 아래와 같이 번역기능도 사용할 수 있습니다.

또 다른 deepseek 를 사용하면서 놀라웠던 것은. Code 에 대한 분석과 이해력이 탁월하다는 점 입니다.
wayland compositor에서 기존에 flating toplevel(window) 들이 중첩되어 있을 때, 기능키로 중첩된 topelvel을들 재정렬하는 기능을 만들었었습니다. 재정렬에는 특별한 알고리즘이 당연히 필요한데, 가장 중요한 것은 toplevel들의 이동과 크기 변경을 최소화 하는 것입니다. 화면에 흩어져 있는 window들이 대규모로 이동을 하거나 resize를 크게 하면 좀 혼란스러워 보이기 때문입니다.

이 realignment에는 사용자가 기능키로 realignment를 수행하는 기능과 별개로 자동 재정렬을 해야하는 경우가 있는데, 바로 toplevel이 제거(close)되는 경우 입니다. 이 기능은 아직 없었기 때문에 deepseek에게 toplevel close 시 자동으로 재 정렬을 하도록 code를 수정해 달라고 요청했습니다. code를 분석한 후 deepseek는 기능을 구현했고, 빌드하고 확인한 후 결과를 알려 달라고 했는데, Compositor 특성상, GUI를 종료하고 다시 실행을 해야 합니다. 특벌한 문제가 없었고, opencode를 실행 후 deepseek 에게 문제가 없으니 commit 을 해 달라고 하자, 갑자기 필자에게 이렇게 대답을 합니다.
" 어 근데, 너 pin 기능하고 low_pin 기능이 있네 ? 이것도 toplevel close 와 동일한 예외 case야 . 그러니까. close 시의 재정렬이 잘 동작한다면, pin하고 low_pin 에도 이 기능을 동일하게 적용해야 해~ commit 하기 전에 수정해 줄까 ?"
"오..... 이것봐라."
기존의 claude 나 gpt 같은 경우도 suggestion(제안) 기능이 있기는 하지만, 대부분 현재 수정한 로직이나 알고리즘에 대해 "좀 더 개선할 수 있는데 어떻게 좀 해 볼래 ?" 수준이였지, 이렇게 구조적으로 코드를 분석하고 제안하는 경우는 deepseek 에서 처음 접하는 것입니다. 그것도 가장 낮은 모델에서 가장 낮은 추론 설정에서 말이죠.(deepseek v4 flash - low)

deepseek 가 토큰량에서는 압도적인 강점이 있기는 하지만 단점도 있습니다. 우선 AI 모델을 사용하는 환경에서 Codex에 밀립니다. Codex는 CLI, Desktop UI, SDK, Cloud worktree, 자동화 환경 등을 유기적으로 결합되어 있기 때문에, 보다 체계적이고 복잡한 workflow를 사용자가 효과적으로 사용할 수 있는 환경성이 뛰어 납니다. 반면, Deekseek는 그런 환경성이 약합니다. 또한, 2006년 6월 기준 API에서는 아직 이미지 분석 및 생성 기능이 없습니다. 이미지 픽셀을 생성하여 출력하는 Decoder Component가 포함되어 있지 않기 때문에 이미지를 생성할 수 없습니다. 따라서, UI 시안, 다이어그램, Graphic Asset 같은 시각적 결과물을 직접 생성해야만 하는 작업에서는 사용이 어렵습니다.
결론적으로 비용이 싸지만, 주로 text 처리 및 coding 에 제한적이라는 단점이 있는 셈입니다. 그들이 나름의 기술력으로 서버 운영비를 줄일 수 있었던 것도 있지만, 다양한 요구사항을 원하는 사용자층을 대상으로 하기보다는 주로 text 데이터를 다루는 사용자들만 사용할 수 있기 때문에, 서버용량에 여유가 생기는 셈입니다. 따라서, 필자처럼 코딩에서만 AI를 주로 사용하는 사용자에게는 좋지만, 이미지나 문서 등에 AI 모델을 사용해야 한다면 여전히 Gemini나 Codex, Claude 가 좋습니다. 물론, 중국 쪽 AI 모델 중에는 Image를 처리하는 모델들도 있을 것입니다.
Deepseek flash 모델을 사용해본 결과 개인적으로는 code를 직접 다루는 데는 큰 문제는 없어 보입니다. 요구사항을 나름 잘 이해하고 추측하거나 거짓이 없고, 질의에 대한 응답 반응성도 빠르며, 결과도 만족스럽습니다. gpt-5.3-Codex 쓸 때와 별 반 차이가 없이 만족스럽습니다.

deepseek 는 effort가 high와 max 2가지만 존재합니다. claude 나 opencode를 사용할 경우에는 effeot를 low, medium 등도 선택할 수 있지만, 이건 다양한 AI 모델을 사용할 수 있기 때문인 것이지 실제 deekseek가 해당 thinking effort를 지원하는 것은 아니니다. 내부적으로는 high 로 설정이 됩니다.
- - - - - - - -
AI를 사용하는 사용자의 요구는 정말 너무나 다양하고, 이러한 대부분의 요구사항을 수용하고자 하는 메이저 업체들의 AI 서비스 유지 비용은 높을 수 밖에 없습니다. 천문학적인 돈을 쏟아붓고도 앞으로도 더 많은 비용을 태워야 하는 근본적인 이유입니다. AI 시장은 미국 기업이 주도하고 있지만, 미국이라는 장소가 갖는 제한사항이 높은 것이 단점입니다. 비싼 전기료/임금, 각종 규제, 기업 간의 치열한 경쟁과 그에 따른 부품 및 원자재 가격 상승, 민간의 비 협조, 낙후된 인프라. 등등 이 모든 제한사항이 서비스 비용을 높게 책정할 수밖에 없는 원인으로 작동합니다.
제 아무리 AI가 기업의 비용을 줄이고 생산성을 향상시킬 수 있는 대안이라 하더라도 기준 이상의 비용을 지불해야 한다면, 기업들은 대안을 찾을 수밖에 없습니다. 그 대안에는 꼭 최고의 성능과 최고의 품질을 추구하는 메이저 기업의 AI를 사용해야 하나? 하는 의문을 만들어 낼 것이고 다른 솔루션으로 눈길을 돌리게 할 수도 있습니다.
결국, 일반 사용자들도 가성비 있는 서비스를 이용하고 싶다면 자신이 사용하고자 하는 AI 사용의 목적과 범위를 잘 식별하고, 한 곳에서 찾지 말고, 여러 다양한 서비스 중에서 찾거나 조합하는 형태를 고려하는 것이 필요해 보입니다.
'Linux' 카테고리의 다른 글
| 브라우저 기반의 무설치 오픈소스 오디오 편집기 - AudioMass (0) | 2026.05.30 |
|---|---|
| Codex Desktop GUI app을 linux에서 설치하고 사용하는 방법 (0) | 2026.05.18 |
| 깔끔한 Web Interface를 지원하는 이미지 앱 - ImageMagick WebGUI (docker - selfhosted) (0) | 2025.12.10 |
| Linux와 함께한 2025년을 마무리 하며... (0) | 2025.12.09 |
| Wayland 환경에서 사용가능한 Tablet지원 Whiteboard 앱 - drawy (0) | 2025.11.15 |