플레이어로 건너뛰기본문으로 건너뛰기푸터로 건너뛰기
  • 그저께

카테고리

📺
TV
트랜스크립트
00:00한글자막 by 한효정
00:30한글자막 by 한효정
01:00한글자막 by 한효정
01:02한글자막 by 한효정
01:04한글자막 by 한효정
01:06한글자막 by 한효정
01:08한글자막 by 한효정
01:10한글자막 by 한효정
01:12한글자막 by 한효정
01:14한글자막 by 한효정
01:16한글자막 by 한효정
01:18한글자막 by 한효정
01:20한글자막 by 한효정
01:22한글자막 by 한효정
01:24한글자막 by 한효정
01:26트롯 모델을 쓰는 프롬 엔지니어링
01:28방식은 이전 회차에서
01:30말씀드렸던 방식과는
01:32조금 달라요.
01:34어떻게 하면 잘 쓸 수 있는지에 대한
01:36기법들에 대해서 설명드리겠습니다.
01:38우선 트롯이라고 하면 영어로는
01:48리즈닝이 되는데
01:50리즈닝은 논쟁으로 번역하는 게
01:53조금 더 알맞을 것 같아요.
01:55이 트롯 모델에 있어서
01:57가장 중요한 어떤 핵심 단어는
02:00사고입니다.
02:01트롯 모델들은 언어 모델이
02:03사고한다, 사고를 할 수 있다
02:05라는 걸 전제로 하겠죠.
02:072002년에 노벨 경제학상을 수상한
02:11다니엘 카너먼의 책을 보면요.
02:13인간이 어떻게 사고하는지를
02:16두 가지를 나눠서 설명을 해요.
02:18인간의 사고 방식은 두 가지인데
02:20하나는 빠른 사고가 있고
02:22다른 하나는 느린 사고입니다.
02:24빠른 사고는 직관적이고
02:27즉흥적이고 어떤 감각에 의존하는
02:30그런 사고들이고
02:31느린 사고는 잠재식 속에서 생각해야 되고
02:35조금 더 추론을 거쳐서 나오는
02:38그런 사고인데
02:39현재 AI 모델들은
02:41이 빠른 사고에 굉장히 능숙하고
02:43느린 사고를 잘하지 못하죠.
02:45이 추론 모델들은요.
02:47지금까지 계속 보여드렸던 어떤
02:49예시에 사용했던 모델들이에요.
02:51뭔가 사용자가 프롬프트를 넣고
02:54모델이 답변을 하고
02:56또 넣고 답변을 하고
02:58이런 어떤 순차적인 방식이었다면
03:02추론 모델들은요.
03:04답변을 한 번에 주지 않고
03:06안에서 내재적으로 사고를 해요.
03:09근데 그 사고 과정이
03:10여러 턴에 나뉘어서 사고를 합니다.
03:13쉽게 말해서 어떤 프롬프트로
03:16오늘 주식 동향 어때? 라고 물어보면
03:19답을 바로 해주는 게 아니라
03:21그 답변을 한 번 더 검증을 해서
03:24두 번째 단계에서
03:26이게 진짜 사용자가 의도한 게 맞나?
03:29세 번째에서 한 번 더 검증을 해서
03:32사용자가 물어봤던 거에
03:34최적화된 결과를 줄 수 있도록
03:37턴을 여러 차례 시간에
03:39스텝 바이 스텝을 하면서
03:40시간 걸려서
03:41답변을 주고 있죠.
03:43안 되는 것들을 해결하다 보려고 하니까
03:46모델을 사고하게 했더니 잘 됐고
03:48그 방식에 있어서는
03:50답변을 여러 번 검증을 하는
03:52그런 과정들이 잘 됐고
03:53어떻게 하면 더 좋은 답변을 줄 수 있을까?
03:56더 어려운 문제를 풀 수 있을까?
03:58했더니
03:59모델이 생각하는 시간을 길게 가지면
04:01답변을 잘하네?
04:02이러다 보니
04:03출원 모델들이 많이 나오게 된 거죠.
04:05현재 2025년도 6월 기준으로요.
04:08어떤 모델들이 있는지
04:10한번 살펴볼게요.
04:12오픈 AI의 O3와 O4 미니가
04:14이제 출원 모델이라고 할 수 있죠.
04:172025년도에
04:19LLM에 있어서 지각 변동을 일으켰다라고
04:21표현할 수 있는 그 모델이
04:23딥식
04:24R1이라는 모델인데요.
04:26이 R1은
04:27굉장히 좋은 성능을
04:29타 모델과 견주어서
04:31같은 수준의 어떤 성능을 보여주고 있지만
04:34딥식이 화제가 됐던 이유 중에 하나는
04:37바로 아하 모먼트입니다.
04:39아하 모먼트가 뭐냐면
04:41어떤 수학을 풀게 함에 있어서
04:45이 모델이 처음으로 이 모델로부터 관찰된 현상인데요.
04:51어떤 수학 문제를 풀다가 기존의 모델들은
04:54수학을 푸는 방식이 잘못됐으면
04:56잘못을 바로잡지 못하고
04:58답은 맞았는데
04:59풀이 과정이 틀렸거나
05:01풀이 과정은 맞았는데
05:02답이 틀렸거나 하는 어떤 오류를 범했다면
05:04이 모델은 자기가 문제를 풀이하면서
05:09아하 여기가 내가 다시 한번 풀어봐야 될 구간이구나 하는
05:13내적 독백
05:14인간처럼 자기 성찰을 하는 그런 문장을
05:17말을 하고
05:18그 이어서 다시 그 문제 방식을
05:21고찰해서 푸는 방식을 보여주고 있어서
05:24화제가 됐거든요.
05:25모델이 중간 답변 과정에서
05:27초기 접근 방식을 재평가하고
05:30문제에 대해서 다양한 누트를 탐색하면서
05:33문제 해결을 하는 그런 전략입니다.
05:35그래서 제가 재밌는 실험을 해봤어요.
05:37이 모델을 가지고
05:38한국어의 딸기에
05:40그 자음 디귿이 몇 개가 있어라고 물어보면
05:43정답은 0개예요.
05:45왜냐하면 쌍디귿이기 때문에
05:47그런데 기존의 모델은 이거를 풀지 못하는데
05:50이 모델이 답변하는 걸 보시면요.
05:53제가 일부러 답을 맞췄는데도 틀렸다고 한번 해봤어요.
05:58다른 모델들 같으면
05:59사용자가 틀렸다고 하면 반박을 못하는데
06:02이 모델은 사용자가 틀렸어 다시 해봐라고 했네.
06:06잘못된 것 같아 다시 한번 탐색해 보면서
06:09사용자가 오히려 뭔가 혼동하고 있는 것 같다라고 하면서
06:13사용자의 문제를 바로 잡아줍니다.
06:15이게 바로 이 모델이 갖고 있는 특이점
06:18어떤 강점이었던 것 같아요.
06:20또 다른 회사인 엔트로픽의 클로우드 3.7 모델이 얼마 전에 공개가 됐는데
06:25이 모델 같은 경우는 이제 하이브리드 형이 나오기 시작합니다.
06:29비출원 모델이 대세였잖아요.
06:33이 3.7 클로우드 같은 경우는
06:35코드와 프로그래밍을 잘하는 모델로 알려져 있는데
06:38하이브리드로서 출원과 비출원은
06:41적재적소에 쓰자라는 그런 컨셉으로 나온 모델이에요.
06:46구글 같은 경우는 제미나의 여러 가지 출원 모델들이 있는데
06:50구글의 장점이라고 한다고 하면
06:52다른 모델 대비해서 한 번에 처리할 수 있는 텍스트의 양이 가장 깁니다.
06:57그리고 문제 풀 수 있어요의 수준이 점점 더 올라오고 있어요.
07:01초반만 하더라도 중학교 레벨의 수학 문제
07:04혹은 phd 레벨의 물리학의 정답을 어느 정도 맞췄어요.
07:08제미나의가 푸는 문제들은
07:10humans last exam
07:12인간의 마지막 시험 문제를 풀기 시작합니다.
07:14그래서 출원 성능이 굉장히 많이 올라왔다
07:18를 보여주는 어떤 소타가 되겠죠.
07:21이럴 정도로 지금은 출원 모델의 시대입니다.
07:24그래서 이 출원 모델을 잘 쓰려면
07:26어떻게 프롬프트를 써야 되는지
07:29또 프롬프트가 중요해지는데
07:31세날트머니 투잇에 엑스에 이런 얘기를 합니다.
07:34우리가 모델을 만들었지만
07:36이거를 사람들이 어떻게 사용하고 있는지를
07:40보는 것 자체가 학습이다 라는 말을 해요.
07:43모델을 사용하는 것은 결과적으로 사람에 달려있고
07:47사람이 모델을 사용을 하려면 자연어가 중심이 되겠죠.
07:51지금부터는 그럼 이 출원 모델들을
07:54이러한 특징이 있는데
07:56이 출원 모델들을 잘 이용하기 위해서
07:58프롬프트를 어떻게 써야 하는지를
08:00한번 살펴보겠습니다.
08:10오원이 이 출원 모델의 시발점이 됐던 모델이에요.
08:13그래서 오원을 기준으로 설명을 드리려고 합니다.
08:17아까 보여드린 것처럼 뭔가 물어보면요.
08:20한 번에 답변을 제공해 주지 않고 단계를 거치기 때문에
08:25모델이 출원하는 것을 방해하면 안 된다 라는 지침을 갖고 있어요.
08:29출원을 방해하지 않는다는 게 어떤 의미냐
08:32우선 동사가 중요하다고 말씀을 드렸던 것처럼
08:36동사 간결하게 쓰고
08:38그리고 명확하게 섹션을 만들어 주는 거예요.
08:41어차피 저희가 프롬프트를 넣으면
08:43뒷단에서 모델은 시스템적으로 여러 가지 스텝을 밟기 때문에
08:48이것과 충돌하지 않도록
08:50섹션을 만들어 줘서
08:52과제를 쪼개 주는 프롬프트를 써야 하고요.
08:55그 다음이 굉장히 중요한데
08:57불필요한 체인 오브 떫 피하기입니다.
09:00우리가 함께 이전 회차에서
09:02체인 오브 떫이 어떤 기법인지를 살펴봤었어요.
09:05리마인드를 하자면
09:07체인 오브 떫은 모델이 사고를 조금 더 잘할 수 있도록
09:11가이드하거나 천천히 생각해봐
09:14단계적으로 생각해봐
09:15논리적으로 생각해봐
09:17라는 그런 문장들이었잖아요.
09:19그런데 이런 문장을 쓰면 방해가 되니
09:23이거를 사용하지 않는 게
09:25이 출원 모델을 사용할 때의 프롬프트 엔지니어링 방식입니다.
09:29지금은 더 이상 그런 어떤 현상이 발생하지 않지만
09:33과거에 체인 오브 떫 방식을 쓰면 모델이 답변하기를 거부했어요.
09:38에러 메시지를 보내거나
09:40모델이 추론을 방해하지 말아주세요
09:43라는 월닝 메시지를 보냈거든요.
09:45추론을 방해하지 않는 게
09:47가장 중요한 원칙이라고 할 수 있습니다.
09:50그 다음은요.
09:52광범위한 예제를 사용하지 않는 거예요.
09:54왜냐하면 이 모델은 추론을 함으로써
09:56스스로가 찾아내는 소스와 예제들이 방대하기 때문에
10:00정말 중요한 예제만 넣어라 라는 그런 의미거든요.
10:04그래서 예제를 광범위하지 않고
10:07구체적인 예제 몇 개만 사용을 해라 라는 게 지침이 되고
10:10정리하면 간결해야 되고
10:13어떤 일을 처리해야 되는지를 정확하게
10:16섹션을 만들어 주고
10:18COT 기법을 피하고
10:21그다음에 예제를 많이 사용하지 않는
10:23그런 프롬프트 작성을 하셔야
10:25이 추론 모델에서 효용을 보실 수가 있습니다.
10:28실제적으로 모델사에서 언급한
10:32프롬프트 지침을 다시 한번 정리해 보면 좋을 것 같아요.
10:35말했던 거랑 거의 유사한데요.
10:38간결하고 심플한 프롬프트
10:41정확하게 지시문이 들어가 있고
10:43뭐를 해야 되는지에 대해서 집중한 프롬프트면 좋을 것 같고
10:46그 다음에 COT를 안 쓰는 것도 하나의 또 방법이 되겠고
10:51이전의 차에서 제가 기호 사용에 대해서 말씀을 드렸어요.
10:56섹션을 나눈다는 거는 기호를 정확하게 써서
10:59마침표도 찍고 점선도 찍고
11:02소제목 나눌 때 이런 꺽쇠 기호 쓰셔가지고
11:06그 내용과 제목은 다른 거야 라고 구분해서 쓰는 게
11:09추론 모델의 어떤 핵심이 될 수 있습니다.
11:12그래서 어떤 식으로 쓰시면 되냐 라고 한다고 하면
11:15제가 쓰는 추론 모델의 프롬프트 방식인데요.
11:19중요한 건 추론 모델에서는
11:22원래는 퀄리티 오버 퀀테리라고 생각을 해왔었다가
11:25요즘에 추론 모델들을 쓸 때
11:27퀀테리가 진짜 중요하구나 라고 생각하게 됐습니다.
11:30그 이유는 지금 맥락, 입력값, 해야 될 과제 이런 식으로
11:35세 가지 구조로 들어가는데
11:37맥락을 가장 앞에 넣은 이유가
11:39맥락을 조금만 주라는 지침에도 불구하고
11:42제가 실제로 해 보니까
11:44맥락을 엄청 많이 줘야지만
11:46쓸만한 결과가 나오는 거예요.
11:49그래서 맥락이 가장 앞으로 들어가 있고
11:51지금 맥락 꺽쇠 기호 표시 있고
11:53저런 기호를 쓰실 때 가장 중요한 점은
11:56열었으면 닫아 줘야 돼요.
11:58기호를 문법처럼 사용을 해야 됩니다.
12:01닫지 않으면 쓰셔도 효용이 없어요.
12:04그리고 입력값, 내가 어떤 데이터를 참고해야 되는지에 대한
12:08그 입력 데이터를 넣어 주시고
12:10그래서 해야 되는 과제는 맨 마지막으로 지시를 하는 건데
12:14다음에 것들을 따라주세요 라고 하면서
12:17섹션을 구분한다는 게 어떤 예시가 될 수 있겠어요.
12:21시청자 분들 중에서도
12:23오픈 AI의 고급 추론 모델을 쓰신다고 할 때는
12:27이 방식을 쓰셔서 모델을 더 생각하게 할수록
12:31답변의 시간을 길게 할수록 좋은 답변을 얻을 수가 있거든요.
12:35그래서 제가 한때 보고서를 쓰는 프롬프트를 쓴 적이 있는데
12:41두 시간 동안 답변을 하게 만들었어요.
12:43그랬더니 진짜로 너무나 정성적으로 정량적으로 만족할 만한
12:48휴먼 라이크한 결과가 나오더라고요.
12:51그렇게 할 수 있었던 까닭은 바로 이 기초적인 어떤 프롬프트의
12:55섹션을 나누고 추론을 하게 하는 문장이 단 하나 없잖아요.
12:59이렇게 쓰시면 될 것 같습니다.
13:01그리고 또 하나 소개해 드리고 싶은 것은
13:05모델의 지침사에서도 말한 것도 따르면 좋지만
13:08이렇게 썼더니 추론 모델 정말로
13:11페이를 할 만하더라 라고 했던 그런 방식을 하나 소개해 드리려고 가져왔습니다.
13:15이분이 강조하시는 건 바로
13:19저랑 좀 유사하기는 한데
13:21프롬프트의 구조를 잡는 거예요.
13:23모델이 처리를 해야 되는
13:25목표가 있고 답변 포맷이 있고
13:28그 다음에 경고 어떤 걸 하면 안 되는지
13:32이분은 경고를 주셨죠.
13:34그리고 마지막에 보시면
13:35톤 오브 컨텍스트를 넣었다고 해요.
13:38그래서 위에서 정확하게 뭐를 처리해야 되는지를 간결하게 처리했다면
13:42컨텍스트부터는 어떤 것들을 처리해야 되는지를
13:46자세히 말해주는 걸 그렇게 했을 때 좋은 답변을 얻을 수 있었다고 하죠.
13:52그래서 제가 말씀드리고 싶은 거는
13:54출원 모델을 잠깐 시연을 한번 하려고 하는데
13:57여기서 맥락을 이런 식으로 꼭 주셔야 되고
14:01그리고 과제 간단하게만 줘보겠어요?
14:10그리고 맥락에는
14:12나는 프롬프트 엔지니어로
14:18LLM 2025년도에 있어서
14:23가장 중요한 기술 논문을 알고 싶어
14:29검색해 주세요 라고 반말하고 존댓말 섞어서 해보고
14:33과제는 출처를 꼭 밝힐 것
14:38제목과 핵심 중심 내용 요약할 것
14:43여기에서 이제 출원 모델에서 한번 더 나아가면
14:46생각하는 방식 중에 오버 띵킹이 있고 언더 띵킹이 있어요
14:50그런데 출원 모델의 특징은
14:52한 가지 이러한 테스크에 있어서
14:54다양한 방면으로 방법을 탐색하기 때문에
14:58오버 띵킹하게 하면 더 잘하거든요
15:00오버 띵킹한다는 거는
15:02사고를 조금 더 광범위하게 한다는 뜻이에요
15:05오버 띵킹의 방식에 의해서
15:08답변해줘 라고 했을 때
15:11출원 모델이 가진 장점과 단점을 한 번에 볼 수 있는 좋은 일인 것 같아요
15:17제가 이제 논문 페이퍼를 찾아달라고 했잖아요
15:19독백 과정을 이제 보여주겠죠
15:21그러면
15:23여기에서
15:25사용자가 프롬프트 엔지니어
15:29가장 중요한 LLM의 논문을 찾아달라고 했다라고 하면서
15:32제 프롬프트를 한번 리프레이즈를 하죠
15:34테스크가 뭔지
15:35그런 다음에 뭐를 찾아야 했는지를
15:38퍼블리케이션 이어
15:39랑 함께 출처를 밝혀달라고 했으니까
15:41단계 단계별로 이렇게 가는데요
15:44저 같은 경우는 출원 모델을 이용할 때
15:46만약에 독백 과정이 잘못됐어요
15:48모델이 생각하는 과정이 잘못됐으면
15:50스탑시킨 다음에 다시 합니다
15:52왜냐하면 시간이 너무 오래 걸리기 때문에
15:55한 번 출원 시키면
15:57중간에 지시해서 내용을 수정하기 어렵다라는 게
16:00출원 모델이 가진 또 단점이에요
16:02그래서 결과를 보시면
16:04꽤나 자세하게 나오고 있죠
16:06왜냐하면 시킨 게 많기 때문에
16:08여섯 가지를 보여주고 있고
16:10출처와 함께 말해주고 있습니다
16:13이번에 차에서는 출원 모델들이 어떤 종류가 있는지 살펴봤었고요
16:17출원 모델을 잘 쓰기 위한 프롬프팅 방식에 대해서
16:21중요한 포인트들도 살펴봤습니다

추천

16:32
다음 순서