클래스 e 1.250714

ontvkorea

그저께

Transcript

00:00한글자막 by 한효정

00:30한글자막 by 한효정

01:00한글자막 by 한효정

01:02한글자막 by 한효정

01:04한글자막 by 한효정

01:06한글자막 by 한효정

01:08한글자막 by 한효정

01:10한글자막 by 한효정

01:12한글자막 by 한효정

01:14한글자막 by 한효정

01:16한글자막 by 한효정

01:18한글자막 by 한효정

01:20한글자막 by 한효정

01:22한글자막 by 한효정

01:24한글자막 by 한효정

01:26트롯 모델을 쓰는 프롬 엔지니어링

01:28방식은 이전 회차에서

01:30말씀드렸던 방식과는

01:32조금 달라요.

01:34어떻게 하면 잘 쓸 수 있는지에 대한

01:36기법들에 대해서 설명드리겠습니다.

01:38우선 트롯이라고 하면 영어로는

01:48리즈닝이 되는데

01:50리즈닝은 논쟁으로 번역하는 게

01:53조금 더 알맞을 것 같아요.

01:55이 트롯 모델에 있어서

01:57가장 중요한 어떤 핵심 단어는

02:00사고입니다.

02:01트롯 모델들은 언어 모델이

02:03사고한다, 사고를 할 수 있다

02:05라는 걸 전제로 하겠죠.

02:072002년에 노벨 경제학상을 수상한

02:11다니엘 카너먼의 책을 보면요.

02:13인간이 어떻게 사고하는지를

02:16두 가지를 나눠서 설명을 해요.

02:18인간의 사고 방식은 두 가지인데

02:20하나는 빠른 사고가 있고

02:22다른 하나는 느린 사고입니다.

02:24빠른 사고는 직관적이고

02:27즉흥적이고 어떤 감각에 의존하는

02:30그런 사고들이고

02:31느린 사고는 잠재식 속에서 생각해야 되고

02:35조금 더 추론을 거쳐서 나오는

02:38그런 사고인데

02:39현재 AI 모델들은

02:41이 빠른 사고에 굉장히 능숙하고

02:43느린 사고를 잘하지 못하죠.

02:45이 추론 모델들은요.

02:47지금까지 계속 보여드렸던 어떤

02:49예시에 사용했던 모델들이에요.

02:51뭔가 사용자가 프롬프트를 넣고

02:54모델이 답변을 하고

02:56또 넣고 답변을 하고

02:58이런 어떤 순차적인 방식이었다면

03:02추론 모델들은요.

03:04답변을 한 번에 주지 않고

03:06안에서 내재적으로 사고를 해요.

03:09근데 그 사고 과정이

03:10여러 턴에 나뉘어서 사고를 합니다.

03:13쉽게 말해서 어떤 프롬프트로

03:16오늘 주식 동향 어때? 라고 물어보면

03:19답을 바로 해주는 게 아니라

03:21그 답변을 한 번 더 검증을 해서

03:24두 번째 단계에서

03:26이게 진짜 사용자가 의도한 게 맞나?

03:29세 번째에서 한 번 더 검증을 해서

03:32사용자가 물어봤던 거에

03:34최적화된 결과를 줄 수 있도록

03:37턴을 여러 차례 시간에

03:39스텝 바이 스텝을 하면서

03:40시간 걸려서

03:41답변을 주고 있죠.

03:43안 되는 것들을 해결하다 보려고 하니까

03:46모델을 사고하게 했더니 잘 됐고

03:48그 방식에 있어서는

03:50답변을 여러 번 검증을 하는

03:52그런 과정들이 잘 됐고

03:53어떻게 하면 더 좋은 답변을 줄 수 있을까?

03:56더 어려운 문제를 풀 수 있을까?

03:58했더니

03:59모델이 생각하는 시간을 길게 가지면

04:01답변을 잘하네?

04:02이러다 보니

04:03출원 모델들이 많이 나오게 된 거죠.

04:05현재 2025년도 6월 기준으로요.

04:08어떤 모델들이 있는지

04:10한번 살펴볼게요.

04:12오픈 AI의 O3와 O4 미니가

04:14이제 출원 모델이라고 할 수 있죠.

04:172025년도에

04:19LLM에 있어서 지각 변동을 일으켰다라고

04:21표현할 수 있는 그 모델이

04:23딥식

04:24R1이라는 모델인데요.

04:26이 R1은

04:27굉장히 좋은 성능을

04:29타 모델과 견주어서

04:31같은 수준의 어떤 성능을 보여주고 있지만

04:34딥식이 화제가 됐던 이유 중에 하나는

04:37바로 아하 모먼트입니다.

04:39아하 모먼트가 뭐냐면

04:41어떤 수학을 풀게 함에 있어서

04:45이 모델이 처음으로 이 모델로부터 관찰된 현상인데요.

04:51어떤 수학 문제를 풀다가 기존의 모델들은

04:54수학을 푸는 방식이 잘못됐으면

04:56잘못을 바로잡지 못하고

04:58답은 맞았는데

04:59풀이 과정이 틀렸거나

05:01풀이 과정은 맞았는데

05:02답이 틀렸거나 하는 어떤 오류를 범했다면

05:04이 모델은 자기가 문제를 풀이하면서

05:09아하 여기가 내가 다시 한번 풀어봐야 될 구간이구나 하는

05:13내적 독백

05:14인간처럼 자기 성찰을 하는 그런 문장을

05:17말을 하고

05:18그 이어서 다시 그 문제 방식을

05:21고찰해서 푸는 방식을 보여주고 있어서

05:24화제가 됐거든요.

05:25모델이 중간 답변 과정에서

05:27초기 접근 방식을 재평가하고

05:30문제에 대해서 다양한 누트를 탐색하면서

05:33문제 해결을 하는 그런 전략입니다.

05:35그래서 제가 재밌는 실험을 해봤어요.

05:37이 모델을 가지고

05:38한국어의 딸기에

05:40그 자음 디귿이 몇 개가 있어라고 물어보면

05:43정답은 0개예요.

05:45왜냐하면 쌍디귿이기 때문에

05:47그런데 기존의 모델은 이거를 풀지 못하는데

05:50이 모델이 답변하는 걸 보시면요.

05:53제가 일부러 답을 맞췄는데도 틀렸다고 한번 해봤어요.

05:58다른 모델들 같으면

05:59사용자가 틀렸다고 하면 반박을 못하는데

06:02이 모델은 사용자가 틀렸어 다시 해봐라고 했네.

06:06잘못된 것 같아 다시 한번 탐색해 보면서

06:09사용자가 오히려 뭔가 혼동하고 있는 것 같다라고 하면서

06:13사용자의 문제를 바로 잡아줍니다.

06:15이게 바로 이 모델이 갖고 있는 특이점

06:18어떤 강점이었던 것 같아요.

06:20또 다른 회사인 엔트로픽의 클로우드 3.7 모델이 얼마 전에 공개가 됐는데

06:25이 모델 같은 경우는 이제 하이브리드 형이 나오기 시작합니다.

06:29비출원 모델이 대세였잖아요.

06:33이 3.7 클로우드 같은 경우는

06:35코드와 프로그래밍을 잘하는 모델로 알려져 있는데

06:38하이브리드로서 출원과 비출원은

06:41적재적소에 쓰자라는 그런 컨셉으로 나온 모델이에요.

06:46구글 같은 경우는 제미나의 여러 가지 출원 모델들이 있는데

06:50구글의 장점이라고 한다고 하면

06:52다른 모델 대비해서 한 번에 처리할 수 있는 텍스트의 양이 가장 깁니다.

06:57그리고 문제 풀 수 있어요의 수준이 점점 더 올라오고 있어요.

07:01초반만 하더라도 중학교 레벨의 수학 문제

07:04혹은 phd 레벨의 물리학의 정답을 어느 정도 맞췄어요.

07:08제미나의가 푸는 문제들은

07:10humans last exam

07:12인간의 마지막 시험 문제를 풀기 시작합니다.

07:14그래서 출원 성능이 굉장히 많이 올라왔다

07:18를 보여주는 어떤 소타가 되겠죠.

07:21이럴 정도로 지금은 출원 모델의 시대입니다.

07:24그래서 이 출원 모델을 잘 쓰려면

07:26어떻게 프롬프트를 써야 되는지

07:29또 프롬프트가 중요해지는데

07:31세날트머니 투잇에 엑스에 이런 얘기를 합니다.

07:34우리가 모델을 만들었지만

07:36이거를 사람들이 어떻게 사용하고 있는지를

07:40보는 것 자체가 학습이다 라는 말을 해요.

07:43모델을 사용하는 것은 결과적으로 사람에 달려있고

07:47사람이 모델을 사용을 하려면 자연어가 중심이 되겠죠.

07:51지금부터는 그럼 이 출원 모델들을

07:54이러한 특징이 있는데

07:56이 출원 모델들을 잘 이용하기 위해서

07:58프롬프트를 어떻게 써야 하는지를

08:00한번 살펴보겠습니다.

08:10오원이 이 출원 모델의 시발점이 됐던 모델이에요.

08:13그래서 오원을 기준으로 설명을 드리려고 합니다.

08:17아까 보여드린 것처럼 뭔가 물어보면요.

08:20한 번에 답변을 제공해 주지 않고 단계를 거치기 때문에

08:25모델이 출원하는 것을 방해하면 안 된다 라는 지침을 갖고 있어요.

08:29출원을 방해하지 않는다는 게 어떤 의미냐

08:32우선 동사가 중요하다고 말씀을 드렸던 것처럼

08:36동사 간결하게 쓰고

08:38그리고 명확하게 섹션을 만들어 주는 거예요.

08:41어차피 저희가 프롬프트를 넣으면

08:43뒷단에서 모델은 시스템적으로 여러 가지 스텝을 밟기 때문에

08:48이것과 충돌하지 않도록

08:50섹션을 만들어 줘서

08:52과제를 쪼개 주는 프롬프트를 써야 하고요.

08:55그 다음이 굉장히 중요한데

08:57불필요한 체인 오브 떫 피하기입니다.

09:00우리가 함께 이전 회차에서

09:02체인 오브 떫이 어떤 기법인지를 살펴봤었어요.

09:05리마인드를 하자면

09:07체인 오브 떫은 모델이 사고를 조금 더 잘할 수 있도록

09:11가이드하거나 천천히 생각해봐

09:14단계적으로 생각해봐

09:15논리적으로 생각해봐

09:17라는 그런 문장들이었잖아요.

09:19그런데 이런 문장을 쓰면 방해가 되니

09:23이거를 사용하지 않는 게

09:25이 출원 모델을 사용할 때의 프롬프트 엔지니어링 방식입니다.

09:29지금은 더 이상 그런 어떤 현상이 발생하지 않지만

09:33과거에 체인 오브 떫 방식을 쓰면 모델이 답변하기를 거부했어요.

09:38에러 메시지를 보내거나

09:40모델이 추론을 방해하지 말아주세요

09:43라는 월닝 메시지를 보냈거든요.

09:45추론을 방해하지 않는 게

09:47가장 중요한 원칙이라고 할 수 있습니다.

09:50그 다음은요.

09:52광범위한 예제를 사용하지 않는 거예요.

09:54왜냐하면 이 모델은 추론을 함으로써

09:56스스로가 찾아내는 소스와 예제들이 방대하기 때문에

10:00정말 중요한 예제만 넣어라 라는 그런 의미거든요.

10:04그래서 예제를 광범위하지 않고

10:07구체적인 예제 몇 개만 사용을 해라 라는 게 지침이 되고

10:10정리하면 간결해야 되고

10:13어떤 일을 처리해야 되는지를 정확하게

10:16섹션을 만들어 주고

10:18COT 기법을 피하고

10:21그다음에 예제를 많이 사용하지 않는

10:23그런 프롬프트 작성을 하셔야

10:25이 추론 모델에서 효용을 보실 수가 있습니다.

10:28실제적으로 모델사에서 언급한

10:32프롬프트 지침을 다시 한번 정리해 보면 좋을 것 같아요.

10:35말했던 거랑 거의 유사한데요.

10:38간결하고 심플한 프롬프트

10:41정확하게 지시문이 들어가 있고

10:43뭐를 해야 되는지에 대해서 집중한 프롬프트면 좋을 것 같고

10:46그 다음에 COT를 안 쓰는 것도 하나의 또 방법이 되겠고

10:51이전의 차에서 제가 기호 사용에 대해서 말씀을 드렸어요.

10:56섹션을 나눈다는 거는 기호를 정확하게 써서

10:59마침표도 찍고 점선도 찍고

11:02소제목 나눌 때 이런 꺽쇠 기호 쓰셔가지고

11:06그 내용과 제목은 다른 거야 라고 구분해서 쓰는 게

11:09추론 모델의 어떤 핵심이 될 수 있습니다.

11:12그래서 어떤 식으로 쓰시면 되냐 라고 한다고 하면

11:15제가 쓰는 추론 모델의 프롬프트 방식인데요.

11:19중요한 건 추론 모델에서는

11:22원래는 퀄리티 오버 퀀테리라고 생각을 해왔었다가

11:25요즘에 추론 모델들을 쓸 때

11:27퀀테리가 진짜 중요하구나 라고 생각하게 됐습니다.

11:30그 이유는 지금 맥락, 입력값, 해야 될 과제 이런 식으로

11:35세 가지 구조로 들어가는데

11:37맥락을 가장 앞에 넣은 이유가

11:39맥락을 조금만 주라는 지침에도 불구하고

11:42제가 실제로 해 보니까

11:44맥락을 엄청 많이 줘야지만

11:46쓸만한 결과가 나오는 거예요.

11:49그래서 맥락이 가장 앞으로 들어가 있고

11:51지금 맥락 꺽쇠 기호 표시 있고

11:53저런 기호를 쓰실 때 가장 중요한 점은

11:56열었으면 닫아 줘야 돼요.

11:58기호를 문법처럼 사용을 해야 됩니다.

12:01닫지 않으면 쓰셔도 효용이 없어요.

12:04그리고 입력값, 내가 어떤 데이터를 참고해야 되는지에 대한

12:08그 입력 데이터를 넣어 주시고

12:10그래서 해야 되는 과제는 맨 마지막으로 지시를 하는 건데

12:14다음에 것들을 따라주세요 라고 하면서

12:17섹션을 구분한다는 게 어떤 예시가 될 수 있겠어요.

12:21시청자 분들 중에서도

12:23오픈 AI의 고급 추론 모델을 쓰신다고 할 때는

12:27이 방식을 쓰셔서 모델을 더 생각하게 할수록

12:31답변의 시간을 길게 할수록 좋은 답변을 얻을 수가 있거든요.

12:35그래서 제가 한때 보고서를 쓰는 프롬프트를 쓴 적이 있는데

12:41두 시간 동안 답변을 하게 만들었어요.

12:43그랬더니 진짜로 너무나 정성적으로 정량적으로 만족할 만한

12:48휴먼 라이크한 결과가 나오더라고요.

12:51그렇게 할 수 있었던 까닭은 바로 이 기초적인 어떤 프롬프트의

12:55섹션을 나누고 추론을 하게 하는 문장이 단 하나 없잖아요.

12:59이렇게 쓰시면 될 것 같습니다.

13:01그리고 또 하나 소개해 드리고 싶은 것은

13:05모델의 지침사에서도 말한 것도 따르면 좋지만

13:08이렇게 썼더니 추론 모델 정말로

13:11페이를 할 만하더라 라고 했던 그런 방식을 하나 소개해 드리려고 가져왔습니다.

13:15이분이 강조하시는 건 바로

13:19저랑 좀 유사하기는 한데

13:21프롬프트의 구조를 잡는 거예요.

13:23모델이 처리를 해야 되는

13:25목표가 있고 답변 포맷이 있고

13:28그 다음에 경고 어떤 걸 하면 안 되는지

13:32이분은 경고를 주셨죠.

13:34그리고 마지막에 보시면

13:35톤 오브 컨텍스트를 넣었다고 해요.

13:38그래서 위에서 정확하게 뭐를 처리해야 되는지를 간결하게 처리했다면

13:42컨텍스트부터는 어떤 것들을 처리해야 되는지를

13:46자세히 말해주는 걸 그렇게 했을 때 좋은 답변을 얻을 수 있었다고 하죠.

13:52그래서 제가 말씀드리고 싶은 거는

13:54출원 모델을 잠깐 시연을 한번 하려고 하는데

13:57여기서 맥락을 이런 식으로 꼭 주셔야 되고

14:01그리고 과제 간단하게만 줘보겠어요?

14:10그리고 맥락에는

14:12나는 프롬프트 엔지니어로

14:18LLM 2025년도에 있어서

14:23가장 중요한 기술 논문을 알고 싶어

14:29검색해 주세요 라고 반말하고 존댓말 섞어서 해보고

14:33과제는 출처를 꼭 밝힐 것

14:38제목과 핵심 중심 내용 요약할 것

14:43여기에서 이제 출원 모델에서 한번 더 나아가면

14:46생각하는 방식 중에 오버 띵킹이 있고 언더 띵킹이 있어요

14:50그런데 출원 모델의 특징은

14:52한 가지 이러한 테스크에 있어서

14:54다양한 방면으로 방법을 탐색하기 때문에

14:58오버 띵킹하게 하면 더 잘하거든요

15:00오버 띵킹한다는 거는

15:02사고를 조금 더 광범위하게 한다는 뜻이에요

15:05오버 띵킹의 방식에 의해서

15:08답변해줘 라고 했을 때

15:11출원 모델이 가진 장점과 단점을 한 번에 볼 수 있는 좋은 일인 것 같아요

15:17제가 이제 논문 페이퍼를 찾아달라고 했잖아요

15:19독백 과정을 이제 보여주겠죠

15:21그러면

15:23여기에서

15:25사용자가 프롬프트 엔지니어

15:29가장 중요한 LLM의 논문을 찾아달라고 했다라고 하면서

15:32제 프롬프트를 한번 리프레이즈를 하죠

15:34테스크가 뭔지

15:35그런 다음에 뭐를 찾아야 했는지를

15:38퍼블리케이션 이어

15:39랑 함께 출처를 밝혀달라고 했으니까

15:41단계 단계별로 이렇게 가는데요

15:44저 같은 경우는 출원 모델을 이용할 때

15:46만약에 독백 과정이 잘못됐어요

15:48모델이 생각하는 과정이 잘못됐으면

15:50스탑시킨 다음에 다시 합니다

15:52왜냐하면 시간이 너무 오래 걸리기 때문에

15:55한 번 출원 시키면

15:57중간에 지시해서 내용을 수정하기 어렵다라는 게

16:00출원 모델이 가진 또 단점이에요

16:02그래서 결과를 보시면

16:04꽤나 자세하게 나오고 있죠

16:06왜냐하면 시킨 게 많기 때문에

16:08여섯 가지를 보여주고 있고

16:10출처와 함께 말해주고 있습니다

16:13이번에 차에서는 출원 모델들이 어떤 종류가 있는지 살펴봤었고요

16:17출원 모델을 잘 쓰기 위한 프롬프팅 방식에 대해서

16:21중요한 포인트들도 살펴봤습니다

카테고리

트랜스크립트

추천