ChatGPT GPT-4o 무료 사용법 - 파일 업로드 PDF 파일 (답변 신뢰도 테스트)
시작하기 전에...
이번 글에서는 ChatGPT GPT-4를 사용하여 파일을 업로드하고 분석하는 방법에 대해 소개하겠습니다. 파일 업로드는 참 유용하게 사용하실 수 있는 기능이라고 합니다. 논문, 보고서, 기사 등 .pdf파일 형식으로 업로드하여 내가 원하는 대로 정보를 얻을 수 있기 때문입니다.
PDF 파일을 어떻게 업로드하고, ChatGPT를 통해 정확한 정보를 얻는지에 대해 확인해 보겠습니다.
가장 핵심은 ChatGPT에게 받는 답이 거짓인지, 사실에 근거한 답변인지 확인하는 것이 아닐까 합니다. 파일에 있는 데이터 내용이 사실대로 말하는지 한번 판별 해보겠습니다.
순서는 다음과 같습니다.
- 파일 업로드 및 질문 준비
- 정보의 정확성 테스트 - 실제로 정확하게 정보를 전달하는지 테스트하기
- 신뢰 여부 테스트 - 실제 정답 값 찾기 (가장 중요함)
예시 파일은 고용노동부 - 노동통계 홈페이지에 있는 사업체노동력조사 2024년 1월 파일로 한번 보여드리려고 합니다.
- 파일 형식 : .pdf
- 파일 용량 : 9.5MB
- 보고서 페이지 수 : 178 페이지
보고서의 출처는 다음과 같습니다 : 사업체노동력조사 보고서 링크
GPT 모델은 ChatGPT GPT-4o 모델을 사용하시면 됩니다.
1. 파일 업로드 및 질문 준비
먼저 메시지 입력 부분 왼쪽에 클립모양으로 되어 있는 곳에 PDF 파일을 업로드합니다. 그리고 질문으로 해당 짧게 파일에 대해 설명해 주고, 어떤 목적이 있는지 설명해 줍니다.
2. 질문하기
이제 질문을 통해, 어떻게 대답하는지 한 번 확인해 보겠습니다.
2. 1. 보고서 1 페이지 화면
1페이지는 텍스트가 없습니다. 전부 이미지로 이루어져 있습니다. 여기서 답변을 어떻게 하는지 한 번 보겠습니다.
2.2. 질문 및 ChatGPT 4o 대답
1페이지에 있는 1. 고용부문에 대해 요약정리를 해달라고 질문하였습니다. 그리고 다음과 같이 ChatGPT가 답변하였습니다.
1 페이지에 있는 화면이 이지미임에도 불구하고, ❗️이미지를 읽고 저에게 그 내용을 요약해서 전달해 주는 것을 볼 수 있습니다❗️
😨😱사실 이미지에 있는 텍스트를 읽을 줄은 생각 못해봤는데... 대단하네요😨😱
궁금해서 ChatGPT 4o에게 이미지 안에 있는 텍스트를 읽을 수 있냐고 질문해 보았습니다. 읽을 수 있다고 합니다..😁
근데, 한 가지 의문인 게 2023년 12월에 대한 내용은 보고서 1페이지에는 없습니다. 전년동월대비라 `23.1월과 `24.1월만 있었습니다...(이건 3번 목차에서 적어두었습니다.)
2.3. 더 작은 이미지에 대한 질문
하나 더 질문을 해보겠습니다. 동일한 1페이지이고, 더 작은 이미지에 대해 질문을 해보겠습니다.
실제 1페이지에 있는 숙박 및 음식업점의 전년동월대비에 대한 통계는 잘 답변해 주는 것을 확인할 수 있습니다.
마지막 테스트를 위해 하나 더 질문을 해보겠습니다. 평균에 대한 질문을 하였고, ❗️이 내용은 1 페이지가 아닌 보고서 전체에 대한 질문입니다.❗️ 과연 이 답변이 거짓인지 아닌지 목차 3에서 확인해 보겠습니다.
작은 이미지에 있는 텍스트도 읽는 것을 확인할 수 있습니다. 읽을 수 있다는 것이 대박인 것 같습니다. 특히나 이미지 해상도가 별로라 읽을 수 있을까 했는데 읽는 걸 보니 😎 대단한 것 같습니다. 하지만, 여기도 여기도 2023년 12월에 대한 내용이 있습니다.
3. 신뢰할 수 있는지 정답 값 찾기 (핵심)
아마 이 글의 가장 핵심이지 않을까 합니다. 읽어도 사실이 아닌 내용을 거짓으로 만들어 답변해 준다면, ChatGPT를 이용할 때 신뢰도가 하락하기 때문입니다.
특히나 3개의 질문과 답변을 해주었던던 1페이지에는 `23년 12월에 대한 내용 자체가 없습니다. 모두 `23년 1월과 `24년 1월에 대한 통계입니다. (`23년 1월과 `24년 1월의 통계는 매칭되는 것을 위에서 확인하였음.)
하여, `23년 12월에 대한 값이실제로 PDF 보고서에 존재하는지 안 하는지 확인을 하고, 마지막에 질문했던 평균 근로일수, 평균 근로시간, 평균 급여액이 맞는지 안 맞는지 확인해 보겠습니다.
3.1. 첫 번째 질문에 대한 `23년 12월의 통계가 존재하는지 그리고, 맞는지 확인하기
2페이지에 `23년 12월에 대한 내용을 찾을 수 있었고, 이 내용을 토대로 저에게 답변을 해주었다는 것을 확인할 수 있습니다.
3.2. 숙박 및 음식점업에 대한 23년 12월의 통계가 존재하는지 그리고, 맞는지 확인하기
숙박 및 음식점업에 대한 답변이 어디서 나왔는지 찾아봤더니, 3페이지에 있는 내용인 것을 알 확인할 수 있었습니다.
마지막으로 질문하였던, 숙박 및 음식점업의 평균 근로일수와 근로시간 그리고 급여액에 대해 답변해 주었던, 답변의 근거가 실제로 보고서안에 존재하는 맞는 통계인지 아닌지 확인하였더니 결과는 다음과 같이 나왔습니다.
- 평균 근로일수 : 108페이지에 존재
- 평균 급여액 : 21 페이지 존재
- 평균 근로시간 : 23 페이지 존재
제가 질문하고, 받은 답변 모두 보고서 내 존재하는 결과인 것을 확인할 수 있습니다.
이로써, ChatGPT GPT-4o가 업로드 파일 내에서 거짓을 말하지 않는 것을 확인할 수 있었습니다.
4. 결론
화질이 별로인 이미지를 읽고, 내용을 전달할 뿐만 아니라, 업로드된 파일 내의 모든 페이지에서 내가 원하는 정보를 얻을 수 있어서 유용하게 많이 쓰일 것 같습니다.
논문, 보고서, 통계표 등 많은 복잡하거나 많은 내용을 가지고 있는 파일을 사람이 하나씩 보지 않고, GPT에게 프롬프트를 통해 결과를 얻을 수 있다면, 업무 효율성이 많이 올라갈 수 있다고 생각합니다.
하지만, 늘 경계해야 할 것들도 있습니다.
신뢰는 할 수 있지만 100% 무한 신뢰를 해서는 안됩니다(AI를 100% 믿지는 말자라는 의미). 늘 사람이 직접 사실인지 아닌지, 판별은 하셔야 합니다.
요약
*중요한 점 : 신뢰할 수 있지만 AI(인공지능)에 너무 의존적이면 안됩니다. 그래서 사람의 개입이 어느 정도는 있어야 합니다. 특히나 사실 관계를 따질 때는 꼭 확인을 하셔야 합니다. 이 과정이 귀찮더라도, 모든 과정을 직접 하는 시간보다는 훨씬 더 절약할 수 있다고 생각합니다.
댓글