본문 바로가기

클로드 3.5 소네트 무료 사용법 - 공식 문서 리뷰(아티팩트)

hyunicecream 2024. 7. 4.

블로그 로고
블로그 로고

1. Claude 3.5 Sonnet 소개

2024년 6월 21일, Anthropic(앤트로픽) Claude 3.5 Sonnet이 출시되었습니다.

Claude 3.5 Sonnet은 향후 출시될 Claude 3.5 모델 중 첫 번째 모델로, 중간 가격대의 모델인 Claude 3 Sonnet의 속도와 비용을 유지하면서도 다양한 평가에서 경쟁 모델과 Claude 3 Opus를 능가하는 뛰어난 성능을 보여줍니다.

이미지 출처 : Anthropic(앤트로픽) 공식 홈페이지
이미지 출처 : Anthropic(앤트로픽) 공식 홈페이지

2. 성능 및 주요 기능 (벤치마크 비교)

Claude 3.5 Sonnet은 벤치마크 점수에서 다른 생성형 모델에 비해 우수한 성능을 보였습니다.

지금 현재 성능으로는 클로드 3.5 소네트가 GPT-4o 보다 성능이 좋네요.👍

2.1 추론과 지식을 평가한 벤치마크 결과

비교 회사-모델과 벤치마크는 다음과 같습니다.

회사  모델
Anthropic(앤트로픽) Claude 3.5 Sonnet
Anthropic(앤트로픽) Claude 3 Opus
OpenAI(오픈AI) GPT-4o
Google(구글) Gemini 1.5 Pro
Meta(전 페이스북) Llama -400b
0-shot은 모델이 사전 정보 없이 바로 문제를 푸는 경우를 의미합니다.
  1. Graduate level reasoning (GPQA, Diamond) - 대학원 수준의 추론
    • 대학원 수준의 복잡한 추론 문제를 얼마나 잘 해결하는지를 평가합니다.
  2. Undergraduate level knowledge (MMLU) - 대학 학부 수준의 지식
    • 대학 학부 수준의 일반 지식을 얼마나 잘 알고 있는지를 평가합니다.
  3. Code (HumanEval) - 코드 작성 능력
    • 프로그래밍 문제를 해결하기 위해 코드를 얼마나 정확하게 작성할 수 있는지를 평가합니다.
  4. Multilingual math (MGSM) - 다국어 수학
    • 여러 언어로 된 수학 문제를 얼마나 잘 해결할 수 있는지를 평가합니다.
  5. Reasoning over text (DROF, F1 score) - 텍스트 기반 추론
    • 주어진 텍스트를 기반으로 추론하여 질문에 답하는 능력을 평가합니다.
  6. Mixed evaluations (BIG-Bench-Hard) - 복합 평가
    •  다양한 유형의 어려운 문제들을 포함하며, 모델의 전반적인 문제 해결 능력을 평가합니다.
  7. Math problem-solving (MATH) - 수학 문제 해결
    • 수준 높은(어려운) 수학 문제를 얼마나 잘 해결할 수 있는지를 평가합니다.
  8. Grade school math (GSM8K) - 초등학교 수학
    • 초등학교 수준의 수학 문제를 얼마나 잘 해결할 수 있는지를 평가합니다.

Anthropic(앤트로픽) 공식 홈페이지 - 벤치마크 결과
Anthropic(앤트로픽) 공식 홈페이지 - 벤치마크 결과(추론)

결과를 보시면 확실히 클로드 3.5 소네트 모델이 성능이 다른 기업의 모델보다 성능이 높은 걸 확인하실 수 있습니다.😎

2.2 시각적 정보를 활용한 문제 해결 능력을 평가한 벤치마크 결과

  1. Visual math reasoning (MathVista, testset) - 시각적 수학 추론
    • 시각적 정보를 포함한 수학 문제를 얼마나 잘 해결하는지를 평가합니다.
  2. Science diagrams (AI2D, test) - 다이어그램 
    • 다이어그램을 해석하고 질문에 답하는 능력을 평가합니다.
  3. Visual question answering (MMIMDB/hard) - 시각적 질문 응답
    • 시각적 정보를 기반으로 질문에 답하는 능력을 평가합니다.
  4. Chart Q&A (biaised accuracy/test) - 차트 질문 응답
    • 차트를 해석하고 질문에 답하는 능력을 평가합니다.
  5. Document visual Q&A (ANLS score, test) - 문서 시각적 질문 응답
    • 문서 내의 시각적 정보를 기반으로 질문에 답하는 능력을 평가합니다.

Anthropic(앤트로픽) 공식 홈페이지 - 벤치마크 결과(시각적)
Anthropic(앤트로픽) 공식 홈페이지 - 벤치마크 결과(시각적)

이번 벤치마크에서도 클로드 3.5 소네트 모델이 성능이 다른 기업의 모델보다 성능이 높은 걸 확인하실 수 있습니다.👍

확실히 현재까지 나온 생성형 AI 중에서는 종합적으로 결과가 가장 좋다고 할 수 있습니다. 

지금 해외에서 클로드 3.5 소네트에 많이 열광하고 있습니다... 코딩 능력 + 추론이 더 좋다고 평가하는 사람이 많고, 특히 이번에 새로 생긴 기능인 아티팩트가 많은 분들을 열광시키고 있는 것 같네요. 

저도 써보니깐 괜찮아서, 챗GPT보다 사용빈도가 더 높습니다.

아직 한국은 많이 안 알려진 듯합니다.😭

3. Artifacts(아티팩트) - 새로운 기능 

Artifacts(아티팩트)는 사용자가 코드 스니펫, 텍스트 문서 또는 웹사이트 디자인과 같은 콘텐츠를 생성할 때, 생성된 결과물을 실시간으로 보고 편집할 수 있는 동적 작업 공간을 제공합니다.  

👍(대박기능)👍 

쉽게 말하면, 텍스트로 실시간으로 텍스트를 수정을 하면서  게임, 웹사이트 PPT제작 등 데모버전을 바로 실시간으로 확인하실 수 있습니다. 

(해외에서는 단 몇 줄로 해외에서 게임을 만드는 분들이 많은 것 같습니다.)

앤트로픽 공식 홈페이지에 게시되어 있는 실제 시연 영상입니다. 

텍스트로 질문하면 알아서 빠르게 코드를 작성하면서 순식간에 단 몇 번의 질문으로 게임을 만들어 냈습니다.😱

이미지를 보시면 왼쪽 화면에 있는 화면이 저희가 질문과 답변을 받는 화면이고, 오른쪽에 화면이 이번에 새로 생긴 아티팩트 기능입니다.

게임 제작 영상 - 앤트로픽 공식 유튜브
게임 제작 영상 - 앤트로픽 공식 유튜브

원하시는분은 공식 유튜브 가서 한번 보시면 좋을 것 같습니다.

앤트로픽 공식 유튜브 : 시연 영상 보러가기 

다른 시연영상은 이미지를 첨부하면, 그걸 해석하고 Json 파일 형식 좌표를 얻은 다음에, 다시 시각화하고, PPT까지 만들어 줍니다.

이미지를 첨부하고, 클로드 3.5 소네트가 Json으로 읽은 다음 다시 새로운 그래프를 만들어주고, 이걸 다시 PPT슬라이드로 만들어줍니다.

보니깐, 컬러코드를 PDF로 첨부해서 올린 후에, 활용하는 것 같습니다.

이 기능도 활용도가 무궁무진할 것 같습니다. 

비전 시연 영상 - 앤트로픽 공식 유튜브
비전 시연 영상 - 앤트로픽 공식 유튜브

앤트로픽 공식 유튜브 : 시연 영상 보러 가기

4. Projects 기능  = ChatGPT GTPs 

이건 쉽게 말해, ChatGPT에서 사용할 수 있는 GPT Store에 있는 기능이라고 생각하시면 이해하기 편합니다.

영어
In response, we’re doubling the amount of information you can relay to Claude with a limit of 200,000 tokens, translating to roughly 150,000 words, or over 500 pages of material. (원문)
한국어
논문, 계약 분석, 사업 계획 초안 작성 등 기존에 많은 사람들이 불편을 겪어 이를 해결하고자, 200,000개 토큰으로 제한하여 Claude에 전달할 수 있는 정보 양을 두 배로 늘려 약 150,000 단어 또는 500페이지 이상의 자료를 사용할 수 있다고 합니다. 

이것도 대박인 듯 👍  500 페이지면 책 한 권 학습시킬 수 있는 양입니다. 😱

Create a Project를 누르고 만드신 후에, 파일을 첨부하시면 됩니다.

영상에서는 Doc와 PDF 파일을 업로드하였습니다.

프로젝트 활용 영상1 - 앤트로픽 공식 유튜브
프로젝트 활용 영상1 - 앤트로픽 공식 유튜브

파일을 업로드하고, 질문을 합니다. 

프로젝트 활용 영상2 - 앤트로픽 공식 유튜브
프로젝트 활용 영상2 - 앤트로픽 공식 유튜브

그리고 아티팩트 창에 질문했던, 차트 형식으로 "조직도"를 만들 줍니다. 

프로젝트 활용 영상3 - 앤트로픽 공식 유튜브
프로젝트 활용 영상3 - 앤트로픽 공식 유튜브

이런 식으로 만들어 주는 것을 실시간으로 보여줍니다. 

옆에 아티팩트를 보시면 조직도를 순식간에 생성한 모습을 볼 수 있습니다.

프로젝트 활용 영상4 - 앤트로픽 공식 유튜브
프로젝트 활용 영상4 - 앤트로픽 공식 유튜브

이건 조직도 확대 화면 모습입니다. 

조직도 생성 아티팩트 화면 - 앤트로픽 공식 유튜브
조직도 생성 아티팩트 화면 - 앤트로픽 공식 유튜브

참.. 기술발전이 엄청 대단하네요. 특히나 생성형 AI가 세상에 나온 지 2년이 안되는데 엄청 빠릅니다. 

5. 아티팩트 사용 방법 - 아티팩트 활성화 방법 

아티팩트를 사용하시려면 기능 활성화 하여야 합니다.

다음 단계를 거치시면 됩니다.

  1. 왼쪽 하단에 이메일 주소 클릭
  2. 클릭 후에 Feature Preview 클릭
  3. 오른쪽 화면과 같이 Artifacts에서 On 버튼 클릭하여 활성화

🤩 아티팩트 사용 활성화를 하시면 바로 사용하실 수 있습니다.🤩

아티팩트 활성화 방법
아티팩트 활성화 방법

6. 한 줄로 게임 만들기

궁금해서 실제로 만들 수 있나 궁금해서 해봤습니다.

단, 한 줄의 명령어로 게임 만들고 어떻게 구동이 되는지 그리고 코드까지 해당 게임에 대한 코드까지 작성해서 줍니다.😱 

이제 개발자와 비-개발자와 간격이 없어진 것 같네요..

질문 : 벽돌 깨기 게임 만들어줘.

클로드 3.5 소네트가 한 줄로 만든 게임
클로드 3.5 소네트가 한 줄로 만든 게임

7. 챗GPT와 메시지 차감 형식의 차이점

무료로 사용이 가능하지만, 메시지 제약이 있습니다.

무료 회원의 경우 5시간에 9의 메세지를 보내실 수 있고, Pro 유료 회원의 경우 45 메세지입니다. 

그리고 챗GPT와 다른 형식으로 메시지가 차감되기 때문에 주의하셔야 합니다.

클로드 AI는 챗GPT와 다른게, 대화가 길어지고, 첨부되는 파일의 용량이 많거나 한 번 질문하는 양이 많으면 메세지 차감이 더 많다고 합니다. 1개가 차감되는게 양에 따라 달라지기 때문에 더 빠르게 차감 될 수 있습니다. (최대 단점)  

클로드 3.5 소네트 모델을 사용하시다가 제한이 걸리면, 모델을 바꾸어 클로드 3 Opus 모델로 사용하면 될 것 같습니다. (ChatGPT와 뭔가 시스템이 다른것 같네요)

8. 클로드 3.5 Pro(유료) 가격

20달러 + 2달러(수수료)  해서 22달러 결제 되는데, 한화로 약 30,000만원 정도 나갑니다.

환율에 따라 다르겠지만 보통 29,000원 ~ 31,000원 사이로 나간다고 보시면 됩니다.  

Pro(유료 회원) 요금제
Pro(유료 회원) 요금제

9. 안전성과 프라이버시

이번에 Claude 3.5 Sonnet은 사용자 데이터는 명시적 허가 없이는 모델 훈련에 사용하지 않았다고 합니다. 이런 쪽을 조금 강조하는 것 같네요.

10. 새로운 모델 계획, 사용 후기

올해 말까지 Claude 3.5 HaikuClaude 3.5 Opus를 포함한 Claude 3.5 모델을  완성할 계획이라고 합니다.

확실히 이번 클로드 3.5 소네트는 정말 강력하고, 활용도가 무궁무진한 것 같습니다.

실제로 써보니깐 정말 괜찮습니다.

전 유료 모델을 사용중인데, 메시지 45개 순식간에 사용합니다. 5시간에 45개😭 

실제 사용 후기 : 아티팩트 기능을 계속해서 사용하는 경우 45개 메시지보다 적게 사용했음에도 불구하고 제한이 걸렸습니다.


하지만, 사용해보니 왜 해외에 사람들이 열광하는지 알 것 같네요. Youtube와 레딧을 찾아보니깐 게임 만드는 사람 엄청 많습니다.

무료로도 사용이 가능하지만, 메시지 제약이 있습니다. 

무료 버전도 충분히 찍먹으로 사용가능하니 먼저 사용해보시면 될 것 같습니다.

참고로 무료버전은 5시간에 9개 메시지만 사용가능합니다.

댓글