chatGPT 소개 + 공부 방법 예시
게시글 주소: https://m.orbi.kr/00062417862
오늘 아침 chatGPT (GPT-3.5)의 최신형 모델인 GPT-4.0이 출시했다.
GPT-4.0 개발사인 OpenAI 블로그 포스트를 살펴보면,
https://openai.com/product/gpt-4
GPT-4.0은 단순히 성능이 나아진 것뿐만 아니라,
이제는 이미지를 인식하고 입력할 수 있을 뿐더러
사이트에 대한 링크를 제공하면 웹사이트의 내용을 요약할 수 있다.
위 두가지 task는 기존 NLP (자연어처리 – 인공지능의 한 분야)로
얼마든지 할 수 있었던 작업이긴 하지만,
chatGPT라는 아주 무거운 모델에 메모리 부하 없이 해당 기능을 추가했다는 점에서
아직 인공지능이라는 방대한 영역에 한 발자국 담근 학부생 입장에서
이러한 혁신을 일궈낸 openAI 개발자들이 정말 대단하다고 생각한다.
이번 글에서는 chatGPT에 대해서 간단하게 설명하고
chatGPT를 활용해 공부에 도움받는 방법을 소개하고자 한다
직접 해보면 어떻게 쓰는지 빠르게 감을 잡을 수 있으니까
웹사이트에 들어가서 일단 시도해보자.
기존 chatGPT 모델 (gpt-3.5)는 무료고
성능이 좋은 GPT-4.0 은 한달에 20달러다.
처음부터 인공지능이 이렇게 똑똑한 건 아니었다
인공지능 기준으로 18년도는 아주 오래 전이지만
불과 5년 전만해도 AI는 우가우가 침팬지만도 못한 성능을 보였다
수능은 5지선다고 하나의 숫자로 답을 밀기만 해도 최소 20점은 확보하니까
4번으로 답을 몰아 쓴 침팬지만도 못한 것이 자연어처리 AI의 현실이었다.
사실 chatGPT의 근간이 되는 기술은 이 때 수능을 푸는 AI와 거의 동일하다.
하지만 어느 점을 보완했기에 이렇게 엄청난 발전을 이룰 수 있었을까?
그 원인은 바로 이 멍청한 학생에게 아주 뛰어난 과외 선생님을 붙여줬기 때문이다.
알파고의 학습방법이기도 한 강화학습 (Reinforecement Learning)은
우리 침팬지가 오답을 내더라도, 답변에 대한 보상 (Reward)을 정의하고
이 보상을 최대화하는 방향으로 수백 번 모델을 훈련시켜서
각 훈련마다 조금씩 정답에 가까워지도록 공부시키는 AI계의 일타강사라고 할 수 있다.
chatGPT도 이와 같이 매 판마다 오차를 줄이고 정확도를 높여가면서
결국에는 이렇게 뛰어난 학습모델이 된 것이다.
그러면 우리는 이 프로그램을 사용해서 어떻게 공부에 도움을 받을 수 있을까?
대학생들은 이미 과제를 푸는 데에 있어 많이 사용하고 있을 거라 생각해서
수능 영어문제 풀이를 예시를 들어 설명하겠다.
이 문제는 작년 2023년 수능 영어 32번 문제다.
정말 당연한 듯이 정답을 맞추었지만, 이 해설을 가지고 공부하기에는 답변이 많이 빈약하다.
그래서 우리가 진짜 원하는 답변을 받으려면
선생님 혹은 과외선생님한테 질문하는 것처럼 조금 더 자세한 해설을 요구해야 한다.
설명을 요구하니까 조리 있게 잘 설명한 것 같긴 하다.
하지만 나는 영어 문단을 처음부터 독해하는 것부터 막히는 실력이라,
문단 내용을 잘 모르기 때문에 이 설명도 잘 이해가 되지 않아서 처음부터 독해하는 해설이 필요하다.
그래서 문장 단위로 해석하라고 지시해서 나온 내용이다.
그런데 영어 문단 해석에서 문법이 중요한 역할을 하는데, 문법 분석이 빠진게 약간 아쉽다.
그래서 문장 단위로 문법을 설명하라고 지시하면 얘가 알아서 출력해준다.
디테일에서 조금 빈약한 점이 느껴져서 이 부분은 다음에 더 개선된 모델을 기다리거나
내가 질문을 조금 더 자세히 입력해야 한다.
가끔가다 출력이 5000자를 넘기면 답변이 끊기는 일이 발생하는데,
이 때 이어서 출력하라는 명령을 하면 그대로 이어서 출력해준다.
내가 공부하고 있는 해설지에서는 이러한 공부방법을 제시했는데,
이 수능 문제에 해당 공부방법을 적용하고 싶어 생각이 들면
그대로 해주라고 지시하면 바로 결과가 나온다.
이렇게 chatGPT를 활용해서 실제 과외선생님에게 질문하는 것처럼
자신이 막히는 문제에 대한 해설을 요구할 수 있다.
하지만, 앞선 예시와 같이 자신이 알기를 원하는 내용을 상세히 적어야 원하는 답을 얻을 수 있다.
자신이 부족한 점이 무엇인지 인식하고,
이에 대한 해답을 chatGPT에 넣어서 해설을 보고 공부함으로 복습한다면,
정말 괜찮은 공부 방법이 될 수 있을 거라고 생각한다.
위의 문제는 2023년 국어 10번 문제인데, 너무 뻔뻔스럽게 정답을 맞혀버렸다.
이렇게 국어 등 다른 과목도 영어 때의 접근방식과 비슷하게 풀이를 불러올 수 있다.
0 XDK (+0)
유익한 글을 읽었다면 작성자에게 XDK를 선물하세요.
-
암환자 브이로그보는데 ㅈㄴ무섭네.. 가족력중에 암없긴한데 암정복 언제쯤될라나
-
비판갤 뭐에요? 1
ㅈㄱㄴ
-
비갤망했네ㅋㅋ 8
-
귀야움
-
정신차리라고 한마디씩만 해주새요 진짜개좃됏는데 공부를안처함
-
수1,확통 편식 0
수2만 재밌어서 수2만 함 수 1, 확통 유기 그만해야 하는데
-
사랑하는 오르비 수험생 여러분:) D-200 입니다 시간 너무 많이 남았습니다...
-
홍대 가봤는데 1
성대 아싸따리는 적응 못하겠더라 사람이...
-
한명이서 지울수있는 글 수가 제한돼있나봄 갤 폐쇄용 파딱 계속 아무나 모집하던데...
-
이전 글 가능한지좀..
-
요새 코를 많이 풀어서 그런가..
-
. 0
뭔가 좀 피곤하도다 지쳤구먼 코 자야겠당 굿나잇 뽀뽀 쪽
-
급수 내신문젠데 0
아무리 다시풀어봐도 안풀리네요ㅠㅠ 풀어주실분 계신가요ㅜㅠ
-
두두수구
-
.엄
-
교육과정에 매우 충실하다는 극찬을
-
시대컨 플로우 풀만한가요? 아님 모티프부터 풀어도 충분할까요 다른 n제도...
-
걍 대충 열카나 트위터처럼 쓰는데 존댓말만 붙이고 잇긴 한데 혹시 여기 분위기랑 안맞으면 알려주새용
-
진짜 가지가지한다 ㅋㅋㅋ 일뽕은 좀 있고 중뽕만 찾으면되겠다
-
수학실력은 조금 못한다고 생각하고 투표해주시기바랍니다.
-
엄청존예지만 무뚝뚝한 애랑 예쁘장하고 반응해주는 애랑 사귈기회가 생기면 후자 버릴거임?
-
빛의 속도는 못 넘으니까 우주여행 할 거의 유일한 방법인듯 아직 공간 접는게 안...
-
소금빵 ㅈㄴ 맛있음
-
오랜만에 수능 디데이 안 챙기고(?) 사니까 기분이 묘하다.. 다들 화이팅입니다
-
안 되는건 아는데 암튼 되게 하셈
-
공부할때는 생각을 덜하니까
-
일하면서 공부하시는 분들 존경합니다...
-
누구한테 호감이감
-
이공계 출신 특허법원 머 이런 감성
-
ㅋㅋㅋㅋㅋ
-
완전 통암기 할 건 아니고 서술형 쓸 정도로만 외울것임 학교 그냥 평반여고고 시험도...
-
TEAM 02 없냐? 11
손좀들어봐
-
몰라몰라 히히
-
전 4수 이때부터는 돌이킬 수 없는 강을 건넜다고 해야하나..
-
의 쟤를 맡고 있습니다 죄송합니다 오늘 새벽 5시까지 공부ㄱㄱ함
-
설대가 뭔가요 2
서울대인가요?
-
야식 ㅇㅈ 8
sec x
-
시즌 2부터 듣는데, 시즌 1교재도 살 수 있대서 사려고 하는데요 더 브로커는 그냥...
-
오투랑 하이탑 문제집이 있긴한데 그냥 살까요?
-
인증메타 ㄱㄱ 3
제발
-
화개장터
-
너와 걷던 그 길을
-
사흘간 배운 점 7
하이브라는 이름의 아이돌 소속사가 있다
-
1루만에 1등급 받는 기적 보여드림 지난주에 생명 벼락치기 성공햇으니가 할수잇다.. 응원좀해주새요
-
이 애니보다 ost를 잘 사용한 애니가 있을까 항상 생각함 이번이 8번째쯤...
-
새로운공간에서 보통존예존잘보면 님들은 어떻게 생각함 말걸고 싶어서 다가가고싶고그럼?
-
ㄹㅇ 미쳤다
-
또 이쁨
안녕하세요. 글의 내용에 약간 오류가 있는 거 같아 댓글 남깁니다~ chatGPT 아키텍처는 강화학습 모델이 적용되지 않았습니다. 자연어 처리 분야에서의 획기적인 성능 향상은 Encoder-Decoder에 Attention 노드를 도입한 Transformer 아키텍처의 개발 덕입니다. 사진에서 첨부한 2018년 즈음이면, attention node의 연구가 막 이루어지던 시점인 것으로 생각됩니다. 아마 사용된 모델의 아키텍처도 Transformer가 아닌 LSTM이나 GRU 계층에 의존하는 Rnnlm이었을 걸로 예상됩니다. 이 아키텍처를 개선한 Transformer모델이 성능 향상의 핵심이었지 강화학습이 자연어 처리에 적용됐다는 건 정확하지 않습니다. 강화학습은 자연어 처리보다는 다른 영역에서 더 적합한 기술이기 때문입니다. 예를 들어 말씀해주신 알파고 같은 경우가 그렇습니다. 하지만 자연어 처리 영역은 많이 다르다는 것이죠.
또한, chatGPT는 비지도 학습 또한 적용되어 학습되었기 때문에 보상을 늘리는 방식의 학습이 애플리케이션 성능을 향상시켰다는 것은 적절치 않습니다.
이 외의 chat GPT를 공부에 활용하는 방법은 참 좋은 거 같네요~ 저도 많이 배워갑니다~
즐거운 하루되세요 ^^
무슨 틀린 얘기를 이리도 길게... ㅋㅋㅋ chatgpt는 논문이 따로 없는데 instructgpt를 그대로 사용했습니다. 그러니 해당 논문을 참고해보면 RLHF를 사용했다는걸 알 수 있어요.
gpt3의 결과를 랭킹한다음 그걸로 학습한 모델을 일종의 리워드 함수로 사용한거죠..
사실 검색만 해봐도 나오는 사실을 이제막 ai배우시는분인 것 같은데...
알파고같은데만 쓰이는게 아니라 최적화와 관련된 모든 분야에 강화학습을 사용할 수 있어요.
예를들어 퓨샷같은 메타러닝에도요.. 찾아보면 in context learning을 더 잘하기 위해 퓨샷 전용 강화학습 적용하는 경우도 있어요
강화학습이 쓰이지 않았다니 ㅋㅋㅋ 당장 유저 인풋을 반영해서 새로운 보상을 제시한다고 밝힌 내용인데 chatgpt는 절대 순수 generative model로는 만들 수 없는 모델이에요 그리고 gpt모델의 베이스 모델인 transformer가 쓰이지 않았다는거는 무슨 말씀이신가요? Gru는 디퓨전 모델이나 GAN에 자주 쓰이지 gpt는 순서정보가 중요해서 트랜스포머가 우월전략이 확실합니더
트랜스포머가 아니라 rnnlm을 사용했다고 너무 당당하게 단언해버리시면 zzzzzz 설마 트랜스포머의 feed forward층에 있는 gru층을 rnn구조라고 생각하신건가요 ^^b
트랜스포머가 2018년의 혁신이긴 했지만 그로부터 gpt2까지 오면서 대중들에게 크게 와닿지 않았던 이유는 nlp모델로만 이루어진 모델은 성능에 한계점이 있었기 때문이에요 당장 gan만 봐도 아무리 비지도학습을 열심히 해도 모델 collapsing현상이 나오잖아요? 그래서 강화학습이 쓰인거고 그래서 빅테크랑 개인간의 간격이 벌어지느 거에요. 빅테크가 주도하는 사회변화는 이제 거부할 수 없을 겁니다