본문 바로가기
AI

챗GPT를 뛰어넘는 GPT-4의 7가지 개선점과 한계점

by haru_IT

OpenAI가 현지시간 3월 14일에 GPT-4를 공개했습니다. ChatGPT-3.5도 아직 낯선데... 벌써 GPT-4라니요?! 이 글에서는 ChatGPT-3.5 대비 GPT-4의 개선점과 사용법, 가격 및 한계점을 한눈에 정리해 보았습니다.

 

 

GPT-4란?

GPT-4는 현재 일반에게 공개된 가장 수준 높은 인공지능이라고 할 수 있을 것입니다. OpenAI 개발진들은 약 6개월의 기간 동안 GPT-4를 파인튜닝 하였다고 합니다. 특히, ChatGPT 사용자들의 피드백 및 50명 이상의 전문가 피드백을 통해 GPT-4의 성능을 향상했다고 합니다.

 

그 결과 ChatGPT-3.5는 미국 변호사 모의 시험에서 하위 10%를 차지한 반면에, GPT-4는 미국 변호사 모의시험에서 상위 10%를 차지하였다고 합니다. 이 밖에도 생물학 올림피아드에서는 GPT-4가 상위 1%의 성적을 거두는 등 더욱 똑똑한 우등생으로 거듭났습니다.😊

 

더하여 ChatGPT-3.5와 다르게 이미지 인식도 가능한 멀티 모달 기능도 탑재되어, 이미지와 텍스트를 병행해 대화를 이어갈 수 있습니다.

 

 

GPT-4의 시험 성적
GPT-4의 시험 성적

 

 

GPT-4 가격 및 사용법은?

ChatGPT-3.5가 무료와 유료 버전에서 사용할 수 있는 것과 달리 GPT-4는 월 $20의 사용료를 지불해야만 합니다. 더하여 하루 동안 이용할 수 있는 사용량에도 제한이 있습니다. 사용을 원하시면 ChatGPT에 접속해 Upgrade to Plus를 클릭하신 후, 결제 정보를 등록하시면 됩니다.

 

ChatGPT Plus
ChatGPT Plus

 

 

 

GPT-4 성능은?

 

1. 속도

ChatGPT-3.5를 사용함에 있어 불편했던 요소 중 하나는 ChatGPT-3.5의 답변 속도 일 것입니다. GPT-4의 응답속도는 약 2배 이상 빨라져서 사용할 때 훨씬 쾌적함이 느껴집니다. AI 이용에 있어 답변 속도가 가장 큰 사용자 경험 중 하나인데 GPT-4에서 보다 쾌적한 경험을 제공합니다.

 

2. 창의성

아래 예시는 A부터 Z까지 알파벳을 순차적으로 사용해서 신데렐라 줄거리를 작성하는 예시입니다. 사람이 직접 하려면 아무래도 시간이 좀 걸리겠죠? GPT-4에서는 문제를 보다 정확하고 창의적으로 풀어내는 능력이 향상되었다고 합니다.

 

GPT-4의 창의성
GPT-4의 창의성

 

 

3. 추론력

추론력에서도 답변이 정확해 졌습니다. 왼쪽이 ChatGPT-3.5인데 오답을 알려줬습니다. 반면에 GPT-4는 정확한 답변을 알려줬습니다

 

GPT-4의 추론력
GPT-4의 추론력

 

 

4. 이미지 입력

GPT-4에 이미지를 입력하면 이미지 내의 개체를 인지하고 캡션을 달거나, 분류하거나, 분석을 생성할 수 있습니다. 아래는 GPT-4에게 이미지 상의 재료들로 무엇을 만들 수 있는지 묻는 예시로, 재료들을 구분하고 무엇을 할 수 있는지 추론할 수 있는 능력을 보여줍니다. 향후 요리뿐만 아니라 의학, 공학 등 다양한 분야에서 활용될 수 있지 않을까 기대해 봅니다.

 

GPT-4 이미지 입력
GPT-4 이미지 입력

 

 

5. 더 많은 입력(Input) 가능

GPT-4는 25,000 단어 이상의 텍스트를 처리할 수 있다고 합니다. 기존 보다 더 긴 정보와 프롬프트의 입력이 가능한 것입니다. 기존 ChatGPT-3.5 대비 7배 이상 증가한 수치입니다. 더하여 ChatGPT-3.5는 사용자와의 대화가 길어짐에 따라 대화의 맥락을 기억하지 못하는 반면, GPT-4는 더 오래 동안 기억을 지속한다고 합니다.

 

 

 

6. 신뢰성 향상

지난 2년간 악성 프롬프트에 대한 대응 훈려을 통해서 보다 윤리적인 측면에 답변을 하도록 진화하였습니다. 아래를 보시면 최종 GPT-4에서는 사용자가 폭탄을 만드는 방법을 물어도 답변을 해주지 않습니다. 

 

GPT-4의 향상된 신뢰성
GPT-4의 향상된 신뢰성

 

7. 한국어 실력 향상

GPT-4의 테크니컬 리포트를 보면 한국어 능력(77%)이 여전히 하위권에 머물러 있음을 확인할 수 있습니다. 하지만 ChatGPT-3.5의 영어 실력보다 GPT-4의 한국어 능력이 우수합니다. 다만, 한국어 데이터로 학습한 것이 아니라 영어를 한국어로 번역한 데이터를 학습한 것인지라 답변이 번역체 느낌이 많이 납니다. 그리고 아직까지는 영어로 프롬프트를 작성하고 답변을 받을 때 가장 속도도 빠르고 답변의 품질도 좋은 것 같습니다.

 

GPT-4의 언어별 정확성
GPT-4의 언어별 정확성

 

 

 

GPT-4의 한계는?

GPT-4로 업그레이드 되었지만 ChatGPT-3.5가 가지고 있었던 한계도 여전히 존재합니다. 잘못된 정보를 사실처럼 말하는 환각 현상도 개선되었지만 여전히 나타나기에 사용자의 주의가 필요합니다.

 

또한, GPT-4 역시 2021년 9월 이전 데이터로 학습하였기에 최신 사실에 대해서 물어보려면 별도의 크롬 확장 프로그램이 필요하는 것도 아쉽습니다.

 

 

 

마치며

사실 가격이라는 장벽이 없다면 굳이 사용하지 않을 이유가 없을 것 같습니다. ChatGPT-3.5를 사용하며 속도의 향상만으로도 생산성이 향상됨을 많이 체감하였습니다. 앞으로 GPT-4를 보다 저렴한 가격에 사용할 수 있기를, 더하여 더욱 잘 활용할 수 있기를 희망해 봅니다.😉