AI 코딩 어시스턴트 3개월 사용기: 취미 개발자의 시선에서 바라본 Gemini, Claude, Codex 비교

Notice

Recent Posts

Recent Comments

Link

« 2026/05 »
일	월	화	수	목	금	토
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

Tags more

Archives

Today

Total

관리 메뉴

elsa in mac

AI 코딩 어시스턴트 3개월 사용기: 취미 개발자의 시선에서 바라본 Gemini, Claude, Codex 비교 본문

애플 및 기타 IT 소식/기타 IT 소식

AI 코딩 어시스턴트 3개월 사용기: 취미 개발자의 시선에서 바라본 Gemini, Claude, Codex 비교

elsa in mac 2026. 4. 25. 12:44

이번 포스트에서는 전문 개발자가 아닌 취미 개발자로서, 지난 3개월 동안 AI 코딩 어시스턴트(Coding Assistant)를 활용하며 느낀 점을 정리해 보고자 합니다. 여전히 AI를 사용하지 않고 계신 분들도 있을 것이고, 내 일상의 어떤 부분에서 어떤 것을 사용할지 여전히 고민하고 있는 분들도 있을 것이라 생각됩니다. 분명한 것은 Internet, smart-phone이 그러했듯이 시대는 변화하고 있고, 우리는 적응을 해야 합니다. ^^

현재 터미널 환경에서 사용할 수 있는 대표적인 AI 코딩 어시스턴트로는 Google의 Gemini-CLI, Anthropic의 Claude Code, 그리고 OpenAI의 Codex-CLI가 있습니다. 필자는 이 서비스들을 Gemini-CLI > Claude Code > Codex-CLI 순으로 경험해 보았습니다. 본 비교는 지극히 개인적인 경험에 기반한 결론입니다. 현재 세 기업이 새로운 모델 출시와 성능 업그레이드를 통해 치열하게 경쟁하고 있는 만큼, 향후 양상은 언제든 바뀔 수 있습니다. 다만, 지난 3개월간 세 가지 모델을 직접 병행하며 느낀 유의미한 차이점들을 적어 봅니다.

서비스 플랜 및 사용 환경

필자는 세 서비스 모두 가장 낮은 단계의 유료 구독 플랜(Gemini Pro, Claude Pro, Codex Plus)을 이용해 왔습니다. 구독료는 세 서비스 모두 월 20달러 수준으로 비슷하며, 연속 사용 시간 및 주간 사용량 제한 옵션이 공통으로 적용됩니다. 대규모 코드베이스를 다루지 않는 취미 수준의 프로젝트에서는 대체로 사용량이 부족하지 않았으나, Claude의 경우 잦은 시간제한으로 인해 작업 흐름이 끊기는 불편함이 다소 있었습니다.

12개의 프로젝트에서 사용하고 있으며, 이 중 7개는 직접 작성한 프로젝트이고, 3개는 직접 구현중 AI 사용을 병행한 것이며, 2개는 완전 vibe coding으로 구현한 프로젝트입니다. 사용언어도 shell-script, C, C++, Rust, javascript, html, python 등의 언어를 사용합니다. git 관리는 이미 온전히 AI에 위임했습니다.

사용 모델은 Gemini는 gemini-3-flash , Claude는 Sonet 4.6 , Codex는 gpt-5.4 로 셋다 중간 수준의 모델들이며 동일하게 모두 No-thinking 모드를 사용합니다. 최상위 모델 혹은 Thinking 모드를 사용하지 않은 이유는 토큰 소모량이 상대적으로 높고 반응 속도가 느리기 때문입니다. 중간 체급의 모델만으로도 취미 개발 수준에서는 충분히 만족스러운 성능을 줍니다.

실전 코딩 능력 비교: "의도를 읽는 능력"

성능과 속도, 편의성 측면에서 2026년 4월 현시점에서 가장 뛰어난 모델은 OpenAI의 Codex였습니다. 간단한 예시로 차이점을 살펴보겠습니다. Rust로 CLI 도구를 개발하며 다음과 같이 요청했습니다.

"실행 옵션에 --provider와 --show-browser가 있는데, -p와 -s로도 사용할 수 있게 해줘."

- Gemini: 긴 옵션과 단축 옵션 사이의 관계를 명확히 유추하지 못하는 모습을 보였습니다.
- Claude: 단축 옵션을 인지하고 코드에 `-p`와 `-s`를 추가하는 수준에 그쳤습니다.
- Codex: 옵션 추가는 물론, README.md 파일을 스스로 수정하여 두 가지 옵션 방식에 대한 설명과 사용 예시까지 보강했습니다.

검증 과정에서도 차이가 있습니다. 세 모델 모두 빌드 테스트는 수행하지만, Codex는 해당 옵션이 의도대로 동작하는지 확인하는 테스트 코드(Test Code)까지 작성하여 검증을 합니다. 또한 예외 처리 능력에서도 수준 차이가 있습니다. Gemini는 단순히 기능을 추가할 뿐 예외 처리에 소홀했고, Claude는 기초적인 처리는 하나 정의되지 않은 옵션(예: `-c`) 입력 시 안내 메시지를 출력하는 디테일은 부족했습니다. 반면 Codex는 예외 처리 구문까지 완벽하게 구현해 냈습니다.

코드 완성도와 분석력

새로운 함수를 구현하거나 리팩터링(Refactoring)을 요청할 때의 안정성도 차이를 보이는데, Gemini는 함수 수정 시 변수 선언이나 초기화를 누락하는 경우가 빈번했고, 프로토타입을 빼먹어 빌드 오류를 야기하곤 해서 결과를 한 번 더 손봐야 하는 번거로움이 있습니다. Claude와 Codex에서는 이러한 기초적인 실수가 거의 발생하지 않아 신뢰도가 높았습니다.

코드 분석 능력의 경우 Gemini도 준수한 편이지만, 실제 코딩 구현 능력은 상대적으로 미흡했습니다. 종합적인 분석력은 Codex가 가장 탁월했고, 처리 속도와 분석 수준의 균형은 Claude가 우수했습니다.

최적화 검토 시, Claude와 Codex는 수정이 시급한 부분과 현 상태를 유지해도 좋은 부분을 명확히 구분했습니다. 특히 Codex는 불필요한 수정을 권하지 않는 단호함을 보여주었습니다. 반면 Gemini는 모든 요청을 수용하려다 보니 오히려 기존의 최적화가 깨지거나 예상치 못한 버그가 발생하는 부작용이 있었습니다.

다른 예로 자료구조나 메모리 사용 및 CPU/GPU 사용 최적화를 분석할 때도 차이가 있는데, Gemini와 Codex/Claude 간에 극명한 차이가 있습니다. Gemini는 가장 최신의 알고리즘과 자료구조가 더 좋다는 식의 분석을 내놓지만, Codex나 Claude는 해당 프로젝트의 규모나 사용 platform 환경 즉, Server 급인지, Desktop 인가 혹은 Mobile 환경에서 동작하는 app인지의 여부를 고려합니다. 보틍은 프로그래머 들조차도 자신들이 경험하고 작업한 환경이 다른 경우에 어떠한 자료구조나 알고리즘이 더 적절한지를 모를 때가 많습니다. 당연히 비 전문가들이 Vibe Coding을 할 경우에는 더욱 그러겠죠. 자신이 만드는 app이나 service가 어떤 grade의 성능과 자료구조, DB의 규모를 다루는 가에 따라 특정 알고리즘은 적절할 수도 혹은 비효율적일 수도 혹은, 너무 over-spec. 일 수도 있습니다. 이러한 분석력에서도 가장 좋은 결과를 내주는 것은 Codex 였습니다.

물론, 코드 수정, 코드 분석등에서 각 모델이 어떤 것들을 고려하고 어떤 것들은 하지 말아야 하는 것들을 System Prompt 기능을 통해 정의하고 제한할 수 있지만, 개인적으로는 거의 System Prompt를 정의하지 않고 사용합니다.

비용 호율성(토큰 소모량)

AI를 사용할 경우, 소모되는 토큰의 소모 정도나 가중치는 각 회사의 내부 정책에 따르기 때문에 절대적인 비교가 불가능합니다. 다만, 사용시간 대비 동일한 수준의 결과를 얻는데 소모되는 토큰 효율성은 Gemini 가 가장 여유로운 것 같고, Codex는 중간 정도이며, Claude의 경우에는 토큰 소모량이 매우 빠른 편입니다. Claude의 경우에는 신규 모델 출시 시 이러한 가중치가 가변 되는 것 같습니다. 소비자 입장에서는 기존에 사용하던 모델을 그대로 사용하는 것뿐인데, 기존과는 다르게 빠르게 소진되는 듯한 느낌을 갖게 됩니다. 물론 이건 공식적인 언급이 없기 때문에 느낌인지 진짜인지는 모르겠지만, 스트레스를 받는 것이 사실입니다. 마치 뭐랄까? 연료가 얼마 남지 않은 자동차를 고속도로에서 운전하고 있는 듯한 느낌이랄까? 불안감이랄까?

특정한 기능을 추가하거나 기존의 버그를 수정할 때, Claude의 경우는 정말 너무 빨리 소모되어서 5시간 기준 limit reset을 기준으로 봤을 때, 1시간 정도만 사용하면 이미 90%에 육박하기도 합니다. 불편하면 더 높은 구독플랜으로 업그레이드를 하면 된다지만, 굳이 대안이 있기에 그럴 필요성은 느끼지 못합니다. 반면, Gemini는 가장 여유롭고, Codex는 중간 정도인데, Gemini와 Codex를 사용하면서 5시간 limit에 걸린 적은 없습니다. 사용자 입장에서는 성능과 사용량이라는 두 가지를 고려해야 하는데, 이런 점에서 Claude는 높은 점수를 줄 수 없습니다.

단순히 소모량만 보면 Gemini가 유리해 보일 수 있으나, 원하는 결과물을 얻기 위해 대화를 여러 번 반복해야 한다는 점을 고려하면 실질적인 효율성은 Codex가 가장 뛰어나다고 볼 수 있을 것 같습니다.

- - - - - - - - -

결과적으로 필자의 경우에는 Gemini에서 Claude를 거쳐 Codex에 정착하게 되었습니다. 현재는 Gemini와 Claude의 구독을 해지한 상태이며, Codex만으로도 충분히 만족스러운 개발 환경을 유지하고 있습니다.

앞서 언급했듯이, 이는 저의 개인적인 경험일 뿐입니다. 프로젝트의 규모나 복잡도, 혹은 코딩이 아닌 다른 창작 영역에서는 각 사의 AI가 또 다른 강점을 발휘할 수 있을 것입니다. 취미 개발자로서 나에게 가장 잘 맞는 '코딩 파트너를 찾아가는 과정 자체가 또 하나의 즐거운 여정이었고, 그나마 현실에서 만족스러운 서비스를 사용할 수 있게 된 점은 다행이라고 생각하고 있습니다. (이게 언제까지 유효할지는 또 모를 일이지만..)

저작자표시 비영리 변경금지 (새창열림)

'애플 및 기타 IT 소식 > 기타 IT 소식' 카테고리의 다른 글

Anthrophic, Claude Pro 요금제 사용시 Claude Code 사용 불가 ?! (0)	2026.04.22
Google의 Gemma-4 를 사용해 봤습니다. 꽤~ 인상적이네요. (0)	2026.04.10
가속화되어가는 AI 시대 - 우리는 과연 감당할 수 있는 것일까 ? (0)	2026.03.29
Firefox가 AI Browser가 된다고 ? (0)	2025.12.19
Zen Browser를 투명하게.... (0)	2025.06.27