
Summary
GPT 모델 : 입력에 대한 모든 사고 과정을 외부로 표현할 수 있으며, 복잡한 지시를 잘 처리합니다.
o1 모델 : 내부적으로 추론 과정을 처리하며, 답변을 간결하게 도출하여 불필요한 데이터가 누적되지 않습니다.
o1 모델의 추론 방식
입력 프롬프트와 추론 과정
o1 모델은 사용자가 제공한 입력 프롬프트를 기반으로, 여러 가지 추론을 통해 답변을 생성합니다. 이 과정에서 입력된 텍스트는 입력 토큰으로 변환되어 처리되며, 모델은 이를 바탕으로 다양한 접근 방식을 고려해 최적의 답변을 만들어냅니다. 이 추론 과정에서 사용된 중간 데이터는 사용자가 보지 않으며, 최종적으로 생성된 답변(출력 토큰)만 전달됩니다. 모델이 내부적으로 수행하는 추론 과정과 단계는 따로 저장되지 않으며, 답변을 생성하는 데만 사용됩니다.
컨텍스트 제한과 메모리
o1 모델은 대화를 이어가는 과정에서 이전에 주어진 입력과 출력 내용을 컨텍스트 윈도우 범위 내에서 기억합니다.
* 컨텍스트 윈도우는 한 번에 처리할 수 있는 최대 토큰 수를 의미함.
컨텍스트 윈도우를 초과할 경우 이전 대화의 일부는 삭제되고 새로운 대화 내용에 집중합니다. 모델이 한정된 메모리 자원을 효율적으로 사용하면서도 계속해서 일관된 대화를 이어나가기 위한 방식입니다.
(추론 과정에서 생성된 임시 데이터는 별도로 저장되지 않고, 답변 생성에만 사용됩니다.)

GPT vs o1 모델의 차이점
GPT 모델은 추론 토큰을 따로 두지 않으며, 단순한 입력과 출력 토큰만을 다룹니다. 일반적으로 GPT 모델은 사용자의 지시대로 모든 논리적 사고 과정을 외부로 보여주며, 사용자가 요구하면 단계별 사고 과정을 포함한 긴 답변을 생성할 수 있습니다. 결과적으로 컨텍스트를 많이 차지할 수 있으며, 컨텍스트 윈도우를 쉽게 넘길 수 있습니다.
o1 모델은 내부에서 사고 과정을 처리하고 그 추론 과정을 최종 답변에 반영하는 방식으로 동작하며, 불필요한 데이터를 다음 대화로 넘기지 않습니다. 이를 통해 추론 과정에서 오류가 발생할 가능성을 줄이고, 불필요한 컨텍스트가 누적되지 않도록 하는 장점이 있습니다.
*컨텍스트 윈도우(Context Window)는 대규모 언어 모델(LLM)이 텍스트를 처리하고 이해하는 데 사용하는 중요한 개념입니다.
- 컨텍스트 윈도우는 LLM이 한 번에 처리하고 응답할 수 있는 텍스트의 최대 길이를 나타냅니다.
- "작업 메모리" 또는 "단기 기억"으로 볼 수 있으며, 특정 분석이나 대화에서 모델이 고려할 수 있는 정보의 양을 결정합니다.
GPT 모델 vs o1 모델 프롬프팅 차이
링크 : OpenAI Docs
아래 이미지는 OpenAI Docs에 있는 내용입니다. 간단하게 설명하면 다음과 같습니다.
o1 시리즈 모델은 GPT-3.5, GPT-4, GPT-4o와 같은 GPT 시리즈와 다르게 간단하고 명확한 프롬프트를 요구합니다. GPT 모델은 복잡한 지시나 단계별 설명에 잘 대응하지만, o1 모델은 스스로 생각하고 효율적으로 답변을 도출하기 때문에, 너무 많은 정보를 제공할 필요가 없습니다.
다시 말해, GPT 모델에서는 프롬프트에 명확한 지시와 단계적 설명을 포함하는 것이 유리했다면, o1 모델에서는 간단하게 목적을 명확히 제시하는 것이 더 효과적입니다.
챗GPT(ChatGPT)와 대화할 때 명령을 주거나, 프롬프트 엔지니어링을 안 하시는 분들이라면 그냥 o1을 사용하여 간단하게 질문 또는 물어보는 게 좋을 것 같네요.

GPT vs o1 프롬프팅 작성 예시
GPT vs o1 글 쓰기 작성 예시
- GPT-4o : 당신은 동화 작가입니다. 어린이를 위한 교훈적인 이야기를 써 주세요. 주인공은 호기심 많은 작은 여우이며, 숲에서의 모험을 통해 친구의 소중함을 깨닫게 되는 내용으로 부탁드립니다.
- o1 : 호기심 많은 작은 여우가 숲에서 친구의 소중함을 깨닫는 동화를 써 주세요.
답변을 보면 확실히 다릅니다. o1 모델이 GPT-4o보다 표현력이 더 풍성해 보이는 걸 보실 수 있습니다.


GPT vs o1 분석 요청 예시
- GPT-4o : 현대 사회에서의 소셜 미디어의 영향에 대해 긍정적 측면과 부정적 측면을 모두 고려하여 분석해 주세요.
- o1: 소셜 미디어가 현대 사회에 미치는 영향을 설명해 주세요.
GPT-4o는 질문하는 즉시 답변을 내었지만, o1은 20초 동안 답변을 내기 위해 모델이 생각하는 과정 자체를 볼 수 있고, 어떤 과정을 통해 답변을 제공할 수 있는지 볼 수 있습니다.


GPT vs o1 영어 번역 예시 (이미지 없음)
- GPT-4o : 다음 영어 문장을 한국어로 번역해 주세요. 문화적 맥락과 뉘앙스를 고려해 자연스럽게 번역해 주세요.
"Breaking the ice at a party can be challenging." - o1: "Breaking the ice at a party can be challenging."를 한국어로 번역해 주세요.
GPT vs o1 데이터 분석 및 결과 해석 예시 (이미지 없음)
- GPT-4o : 다음 데이터 셋의 평균, 중앙값, 표준 편차를 계산하고, 그 의미를 해석해 주세요: [12, 15, 20, 22, 25, 30]
- o1: 데이터 셋 [12, 15, 20, 22, 25, 30]의 평균, 중앙값, 표준 편차를 계산해 주세요.
마지막 정리
GPT와 o1 모델은 각각의 강점을 가지고 있으며, 이를 최대한 활용하기 위해서는 프롬프팅 방식을 모델에 맞게 조정하는 것이 중요합니다.
모델 | 사용 |
GPT(GPT-3.5, GPT-4, GPT-4o, GPT-4o mini 등) | - 상세한 지시와 단계별 설명을 포함하여 질문 - 복잡한 문제나 심층적인 답변이 필요할 때 유용 |
o1(o1, o1-mini 등) | - 프롬프트를 간결하고 명확하게 질문 - 불필요한 지시나 추가 정보 없이도 효율적인 답변 가능 |