OpenAI O1 의 구조

BFACTORY 노정석 ([email protected] / http://bfactory.ai)

2024년 9월 O1-preview 발표

https://openai.com/index/learning-to-reason-with-llms/

Screenshot 2025-01-17 at 8.04.39 PM.png

Screenshot 2025-01-17 at 8.17.22 PM.png

이 그림 두개가 정말 중요함. 앞으로 이런 방향으로 모델이 발전하겠죠.

기존모델을 가지고 test-time compute 의 투입을 통해서 더 나은 Data (Synthetic Data)들을 만들어내고, 그 결과들을 기존모델에 재학습하기도 하지만, 그 데이터가 충분히 많아지면 더 큰 크기의 frontier model 들에 막대한 train-time compute 을 투입해서 학습이 되고, 그 frontier model 들의 성능은 또 압도적인 수준으로 뛰어오르고, 그 Frontier 모델은 그 크기는 작아지는 형태로 더더욱 효율화되면서도 성능을 유지하고, 그리고 또 인류는 도달하지 못했던 미지의 영역에 대한 Synthetic Data 를 생성하고, 그렇게 ASI 로 나아가는 것.

(우리가 많이 봐오던 진화알고리즘이죠. 몇개월에 한세대를 돌고 있는게 차이일뿐)

2024년 연말에 O1 정식판이 출시되고, O3에 대한 DEMO 가 소개되었음 ( 2025년 O3 와 GPT-5 출시 소식이 조금씩 나오고 있는 상황)

O3 는 매우 고수준의 추론을 필요로 하는 ARC problem 에서도 높은 성능을 보여서 사실상 AGI에 도달했다는 평가도 받음