지난 주 동안 클로드 3.5 소넷을 집중적으로 사용하며 GPT-4와의 다양한 비교 실험을 진행했습니다. 이전에 ‘GPT 구독을 해지하고 Claude 구독을 한 이유’라는 글을 통해 제 선호도를 밝힌 바 있지만, 이번에는 두 최신 AI 모델 간의 더 깊이 있는 비교 분석을 해보았습니다. 이 글에서는 Claude 3.5 Sonnet과 GPT-4의 성능을 여러 측면에서 비교하고, 각 모델의 장단점을 상세히 살펴볼 것입니다.
일주일간의 실험 케이스
공통적으로 답변의 속도 자체는 클로드의 압승입니다. GPT는 조금 버벅 거리는 느낌이 있으나 클로드는 막힘없이 빠른 답변을 제공합니다.
1. 요리 레시피 생성
집에 있는 재료를 알려주고, 요리 레시피를 제안해 달라고 했습니다. 먹어보지 않아 맛은 어떤것이 더 나은지 알 수 없지만 답변을 보았을때는 비슷하게 느껴졌습니다.


2. 아침 15분 운동 루틴 제안
아침 15분 운동 루틴을 제안해 달라고 요청해 보았습니다. 요청할때 운동을 수행할 사람의 정보(나이, 키, 몸무게, 신체 능력 등)를 함께 제공하면 맞춤 운동 루틴을 제안해줍니다. GPT와 클로드 비슷한 답변을 주었습니다.


3. 캡쳐한 내용을 표로 만들기
이미지의 내용을 어느정도 분석할 수 있는지 확인하기 위해 표를 캡쳐하여 제공하고 표로 만들어 달라고 요청해 보았습니다. 이 부분의 클로드가 더 나은 결과를 보여주었습니다. GPT의 경우 첫번째 열의 작은 글자들을 누락했지만 이미지의 모든 글자를 완벽하게 표로 만들어 주었으며 시각적으로도 더 나은 결과를 제공해주었습니다.


4. 데이터 시각화하기
위에서 진행했던 표를 시각화 해달라고 요청해 보았습니다. 동일하게 차트를 그려달라고 요청하니 GPT는 차트 이미지를 그려줍니다. 몇 번 프롬프트를 변경하여 요청해 보았지만 결과는 비슷하게 나왔습니다. GPT에서 차트를 생성하려면 제가 예전에 포스팅한 글처럼 우회적인 방법으로만 가능할 것 같습니다. 해당 링크는 블로그 하단에 있으니 GPT를 이용해 차트를 시각화 하시려면 해당 포스팅을 읽어보세요.

클로드는 정말 이런 작업을 잘 수행하는 것 같습니다. 전문적인 프롬프트가 아니어도 사람과 대화하는 것처럼 단 한 문장으로 아래와 같은 차트를 만들어 주었습니다. 마우스를 올리면 정확한 수치가 나오는 효과도 알아서 적용해 주었네요.

5. 간단한 웹페이지 만들기
이 부분은 검색해보면 클로드가 정말 뛰어나다는 것을 알 수 있습니다. 물론 저는 비개발자이며 개발 전문가의 입장에서 보았을때 어떨지는 모르겠습니다. 코딩 능력이 없는 비개발자의 기준에서 웹페이지를 만들어 달라고 하면 GPT는 방법을 알려줍니다. 기획과 디자인을 한 후 html, css, javascript를 구현하라고 합니다. 하지만 클로드는 아래 화면처럼 사람에게 말하듯 프롬프트를 나의 생각만 입력하면 빠르게 웹페이지를 만들어냅니다.

클로드만 만든 웹페이지 입니다. 간단하게 아무 정보나 넣고 ‘운세 보기’ 버튼을 눌러보니 아래와 같은 답변을 해줍니다. 제 의도를 정확하고 빠르게 구현했습니다. 코드 생성 및 디버깅은 클로드의 결과가 훨씬 만족스러웠습니다.

디자이너 직군이라면 조금 더 딥하게 업무에 이용해 볼 수 있습니다. 이전 글 중 간단한 svg 모션 구현해 본 것이 있으니 궁금하신분은 블로그 하단 링크를 참고하여 응용해보세요.
6. 그 외 테스트
이 외에도 여러가지 테스트를 진행해 보았습니다.
데이터 분석을 위해 카카오톡 채팅방 대화를 파일로 제공해 보았는데, 클로드는 업로드하고 프롬프트를 입력하자마자 오류가 납니다. 반면 GPT는 여전히 대용량 데이터를 잘 처리합니다.
GPT를 사용할때 DALL-E 기능이 만족스럽지 않았습니다. 하지만 구독 해지 후 클로드만 사용하려니 클로드에는 이미지 생성 기능 자체가 없기 때문에 간혹 불편을 겪었습니다.
최신 정보로 대화를 시도했는데 클로드는 실패했습니다. 최근 이슈가 되고 있는 넷플릭스의 ‘흑백요리사’에 관한 것을 물었는데 엉뚱한 출연진과 내용을 알려주었습니다. 반면 GPT의 경우 매우 정확하게 대답해주었습니다. 어쩔수 없이 클로드는 웹에서 최신 정보를 검색하여 텍스트로 제공 후 그 내용 안에서 대화가 가능했습니다.
Claude의 장단점 정리
장점
- 사용자 지정 명령에 대해 클로드가 더 유연하게 대응
- 코드 생성 및 디버깅 정확하고 효과적
- 데이터 시각화 우수
- 이미지 분석 우수
단점
- 대용량 데이터 처리의 한계
- 이미지 생성 기능 부재
- 웹 검색 및 최신 정보를 잘 활용하지 못함
단점 해결을 위한 효율적 사용 전략
결국 제가 찾은 방법은 클로드를 주 사용 모델로 월 구독하기로 했고, GPT를 토큰 충전 방식으로 구독했습니다. 제 입장에서는 클로드의 사용 빈도가 더 높았고 만족스러웠기 때문입니다. 하지만 위에서 말한 클로드의 단점을 보완하기 위해 GPT가 필요했지만 두 모델을 구독하기에는 구독료가 부담스러웠습니다. GPT는 토큰 충전 방식의 결제를 제공하므로 일정 금액을 충전하고, 해당 토큰을 모두 소진할때까지 사용이 가능합니다.
결론
일주일간의 실험 결과, Claude 3.5 Sonnet이 대부분의 영역에서 GPT-4보다 우수한 성능을 보여주었습니다. 특히 중소규모 데이터 분석, 코드 생성, 창의적 작문 등에서 강점을 보였습니다. 그러나 GPT-4도 대용량 데이터 처리와 이미지 생성 등 특정 영역에서 뛰어난 능력을 보여주었습니다.
두 모델의 장단점을 고려할 때, 가장 효과적인 전략은 Claude를 주 모델로 사용하고 GPT-4를 보조적으로 활용하는 것입니다. 이 방법은 비용 효율적이면서도 각 모델의 강점을 최대한 활용할 수 있습니다. 구체적으로:
- Claude 3.5 Sonnet: 월간 구독으로 일상적인 작업, 코드 생성, 데이터 시각화 등에 주로 사용
- GPT-4: 토큰 충전 방식으로 대용량 데이터 처리, 이미지 생성, 최신 정보가 필요한 작업에 사용
이러한 조합 사용 전략은 각 모델의 한계를 상호 보완하며, 다양한 작업을 효율적으로 수행할 수 있게 해줍니다. AI 기술은 계속 발전하고 있으므로, 앞으로도 각 모델의 강점과 약점을 주시하며 유연하게 활용하는 것이 중요할 것입니다.
결국, 사용자의 필요에 따라 적절한 모델을 선택하고 조합하여 사용하는 것이 가장 효과적인 방법입니다. 이 글이 GPT-4와 Claude 구독으로 고민하시는 분들께 실질적인 도움이 되어, 각자의 요구사항에 맞는 최적의 AI 활용 전략을 수립하는 데 도움이 되었으면 좋겠습니다.