AI가 기출문제 외웠는지, 추론했는지 안다… 평가 기술도 진화

인터넷 뉴스

지금 한국의 소식을 바로 확인해보세요.

AI가 기출문제 외웠는지, 추론했는지 안다… 평가 기술도 진화

KOR뉴스 사회#정치#경제 0 54 0 0 05.08 03:24

치열한 인공지능(AI) 모델 경쟁 한편에선 이들의 성능을 평가하는 방법(벤치마크)들도 속속 나오고 있다. AI 모델 수가 빠르게 늘다 보니 어떤 모델이 더 적합하고 좋은지 선택해야 하는 기업이나 개인 이용자들이 AI 벤치마크를 찾는다.

미국 기업 ‘스케일AI’ 연구진은 지난 3일 거대언어모델(LLM)의 수학적 능력을 평가하는 벤치마크를 공개했다. 이 회사는 초등학교 수준 수학 문제를 LLM에 풀게 했다. 이미 정답을 학습시킨 문제를 잘 푸는 LLM이 있는가 하면, 새로운 유형의 문제도 이미 학습한 문제로 추론해 정답을 내는 LLM도 있었다. 이 방식을 적용하자 오픈AI의 ‘GPT-4′와 구글의 ‘제미나이 프로’는 추론 능력이 뛰어났다. 반면 프랑스 인공지능(AI) 스타트업 미스트랄의 AI는 상대적으로 추론 능력이 떨어지는 것으로 나왔다.

0 Comments

로그인한 회원만 댓글 등록이 가능합니다.

인기 동영상

삭제 수정 목록보기

포토 제목 날짜 조회

[사회#정치#경제] 버닝썬 피해자의 눈물 “성폭행 후 무릎 꿇고 빌자 ‘웃…
25 41분전

00:07

25
[사회#정치#경제] 버닝썬 피해자의 눈물 “성폭행 후 무릎 꿇고 빌자 ‘웃…
26 41분전

00:07

26
[사회#정치#경제] 아이돌 앰버서더 없이 가장 잘 나가는 에르메스의 전략 …
25 43분전

00:05

25
[사회#정치#경제] 아이돌 앰버서더 없이 가장 잘 나가는 에르메스의 전략 …
25 43분전

00:05

25
[TV#오락] '미녀와 순정남' 지현우, ♥임수향 정체 알고 직진 플…
23 24분전

00:24

23
[TV#오락] '슈돌' 최민환, 母 황혼 육아에 감사 이벤트 [Oh!…
23 27분전

00:21

23
[TV#오락] 혜리, 이렇게 예쁜데 '54kg' 쇄골에 푹 빠지겠네!
23 33분전

00:15

23
[TV#오락] [종합]김호중, 사고 10일 만에 결국 음주운전 인정……
23 37분전

00:11

23
[TV#오락] '미녀와 순정남' 지현우, ♥임수향 정체 알고 직진 플…
23 24분전

00:24

23
[TV#오락] '슈돌' 최민환, 母 황혼 육아에 감사 이벤트 [Oh!…
24 27분전

00:21

24
[TV#오락] 혜리, 이렇게 예쁜데 '54kg' 쇄골에 푹 빠지겠네!
26 33분전

00:15

26
[TV#오락] [종합]김호중, 사고 10일 만에 결국 음주운전 인정……
25 37분전

00:11

25
[스포츠#게임] '드디어 해냈다!'손흥민, 통산 3번째 10-10달성.…
23 26분전

00:22

23
[스포츠#게임] '드디어 해냈다!'손흥민, 통산 3번째 10-10달성.…
20 26분전

00:22

20
[스포츠#게임] 'LCK의 호랑이 천하를 호령하다' 젠지 MSI 전승 …
20 27분전

00:21

20
[스포츠#게임] 'LCK의 호랑이 천하를 호령하다' 젠지 MSI 전승 …
19 27분전

00:21

19
[스포츠#게임] ‘2군은 좁다’ 김유성의 퓨처스 폭격, QS→KKKK …
19 38분전

00:10

19
[스포츠#게임] ‘2군은 좁다’ 김유성의 퓨처스 폭격, QS→KKKK …
19 38분전

00:10

19
[스포츠#게임] 유종의 미 노리는 SON, 도움 한개 추가하면 10-1…
17 47분전

00:01

17
[스포츠#게임] 유종의 미 노리는 SON, 도움 한개 추가하면 10-1…
18 47분전

00:01

18

정렬

검색

1
2
3
4
5