인공지능 AI, 어디까지 믿고 있니?

2023. 3. 21. 23:04잡다구리-메모, 일기, 잡다한 생각들

728x90
반응형

 

Introducing ChatGPT

We’ve trained a model called ChatGPT which interacts in a conversational way. The dialogue format makes it possible for ChatGPT to answer followup questions, admit its mistakes, challenge incorrect premises, and reject inappropriate requests.

openai.com

요즘 핫한 ChatGPT다.

사람과 비슷한 자연어를 읽고 쓰고 이해하는 게 가능하고 이전 대화를 기억해 맥락을 짚어내기 때문에 대화를 하다 보면 사람과 대화하는 기분이 들 정도로 결과물이 자연스럽다.

본인 아님. 아무튼 아님.

 

 

그리고 카톡에서도 AI챗봇을 공개했다.

AskUp

 

 

AskUp

ChatGPT를 카톡에서! 업스테이지에서 제공하는 이미지 글씨도 이해하는 눈뜬 챗GPT를 만나보세요

pf.kakao.com

카톡에서 접근할 수 있어서 접근성이 매우 좋다.

 

 

 

생성 AI가 워드 쓰고, PPT 만드네…엑셀 분석도 '척척'

마이크로소프트가 생성AI 기술을 오피스 제품군에 통합한 '마이크로소프트365 코파일럿'을 선보였다. 20분간 진행된 시연에서 자연어 명령을 받은 생성AI는...

zdnet.co.kr

 

더 똑똑해진 챗GPT4...문서분석, 장애인 지원 가능한 이미지 분석도 - 주간조선

뛰어난 성능으로 전 세계에 AI(인공지능) 충격을 안긴 대화형 AI ‘챗GPT’가 4개월여 만에 더욱 강력한 성능의 AI로 업그레이드됐다. 기존 3.5 모델의 약점으로 지적됐던 비영어 언어 취약성, 빈번

weekly.chosun.com

엑셀과 PDF파일도 분석가능하다는 뉴스가 생각이 나서

과감하게 삼성전자 사업보고서의 분석을 시도해 봤다. 무려 300페이지가 넘는 PDF파일이다.

일반 카톡에서 파일 전달하듯이 주는 건 아직 안되고

클라우드에 업로드한 뒤 공유 링크를 만들어서 전달했다.

모든 작업에는 마감시간이 중요한 법이다.

언제 끝나냐고 물어보니 몇 분 정도 걸린단다.

그래... 300쪽이나 되고 숫자도 엄청 많으니 그럴 수도 있지.

다음날 점심 먹고 나서도 소식이 없어서 다시 문의해 봤다.

못하면 못한다고 할 것이지 질질 끌면서 대답만 한다.

러다이트 운동 맛 좀 볼래?

일해라 기계

 

그래 사람도 읽기 힘든 건데

태어난 지 1년도 안된 애한테 분석까지 요구하는 건 너무한 일이었지.

보고서 분석은 포기하고,

엑셀의 함수 짜는 건 프로그래밍과 비슷하니까 그쪽으로 작업을 시켜보자.

혹시 모르니 검증을 위해 이미 결과가 나온 매출 성장률의 기하평균을 구하라고 시켜봤다.

계산식은 맞는 거 같은데...

연평균 12.27%가 나왔다.

내가 계산했을 때는 10.99%였는데?

 

거꾸로 검산을 해보면 알겠지

1079.48의 근사치도 나오지 않는다.

이번에는 내가 계산했던 10.99%의 연평균성장률을 챗봇에게 주고 9년 뒤의 금액을 계산시켰다.

뭔가 이상하다. 

내가 식을 잘못 세웠나?

이 표에서 최초의 금액인 422.18억에 내가 계산한 10.99%를 9번 곱하는 걸로 검산을 돌려봤다.

엑셀에다 챗봇이 세운 식을 계산해 보니 1079.08이 뜬다. 실제값인 1079.48에 근사치가 떴다.

(정확하게 안 맞는 것은 소수점 두 자리 이하에서 반올림해서 표기한 탓일 것이다.)

계산기로도 해봤다.

식을 세우는 법을 몰라 422.18에 1.1099를 9번 곱해줬다.

1079.0767... 이 뜬다. 소수점 두 자리에서 반올림하니 1079.08 엑셀의 결과와 같다.

 

 

식이 좀 복잡하긴 하지만 산수를 틀리다니...

AI의 신뢰도가 박살 나려 하고 있다.

 

아니야 AI가 복잡하긴 해도 산수를 틀릴 리가 없어.

원조 Chat GPT에게 같은 문제를 풀어보라고 하자!

아... 너마저...

AI에게 실무를 맡기는 건 어려울 듯하다.

계산식 자체는 제대로 세우는데 계산 방식에 오류가 있는지 전혀 다른 답이 나온다.

 

반응형