구글, 새로운 Gemini 모델
구글이 최근에 발표한 Gemini 모델이 LLM 리더보드인 Imarena Chatbot Arena 차트에서 GPT-4o를 제치고 1위를 차지했다.
Imarena Chatbot Arena(구 LMSys Arena): 이 플랫폼은 블라인드 테스트 방식을 사용해 사용자들의 투표로 순위를 정하는 방식이다.
새 모델은 수학, 시각적 이해, 추론 능력 성능이 크게 향상되었다고 한다. 현재는 API나 구글 AI Studio을 통해서 사용해 볼 수 있다. 아직 공식적인 발표는 없으나, 다음 달 출시 예정인 Gemini 2 초기버전일 거라 추측이 나오고 있다.
수학 벤치마크 FrontierMath
FrontierMath는 AI가 수학 문제를 해결하는 능력을 평가하기 위해 개발된 벤치마크이다. 기존 수학 벤치마크에 비해 연구 수준 수학 문제로 구성되어 있다고 한다. 현재 AI 시스템 (gpt, gemini 포함)이 해결하는 비율은 2%에 불과한다.
AI가 수학을 잘 못하는 이유?
자연어 처리나 이미지 인식과 달리, 수학은 종종 여러 단계를 거쳐야 한다. 수학 문제의 풀이나 증명에서는 각 단계가 이전 단계를 기반으로 이루어지기 때문에, 단 한 번의 실수로도 답이 틀릴 수 있다.
트럼프 & AI
2024년 대선에서 트럼프 대통령이 당선되면서 미국의 AI 정책에 큰 변화가 예상된다. 트럼프는 AI를 중국과의 기술 경쟁에서 중요한 도구로 보고 있으며, 바이든 행정부의 AI 행정명령을 폐지하겠다는 공약을 내세웠었다. 또한, AI 인프라 개발을 가속화하고, 중국의 반도체 접근을 제한하는 기존 조치를 유지할 가능성이 크다고 한다.
한편, 트럼프 본인도 딥페이크의 위협을 언급하며 AI 기술의 잠재적 위험성을 인정한 바 있다 (Logan 팟캐스트). 그의 최측근들, 예를 들어 일론 머스크;;처럼 AI의 위험성을 경고하는 목소리도 있어, 트럼프 이러한 우려를 무시하지는 않는 것으로 보인다. 그럼에도 불구하고, 트럼프에게 있어 가장 중요한 이슈는 여전히 중국과의 기술 경쟁인 듯하다.
정부 내에서도 AI를 둘러싼 입장이 엇갈리고 있어, 트럼프 행정부의 AI 정책 방향은 불확실한 상태라고 기사가 마무리된다.
출처: https://time.com/7174210/what-donald-trump-win-means-for-ai/
'ᐧ༚̮ᐧ Career Journal > TIL' 카테고리의 다른 글
[TIL #3 | 데이터 팟캐스트] 'Sky: 빛의 아이들' 게임 데이터 분석 (0) | 2024.11.26 |
---|---|
[TIL#2] 아직 배울게 너무 많은 데이터 과학자의 일주일 (4) | 2024.11.15 |
[일주일 TIL 모음집 #1] 데이터 과학자의 일주일 치 TMI 가득한 TIL ✏️ (1) | 2024.08.23 |