Noam Brown, the head of AI reasoning research at OpenAI, has claimed that certain types of 'reasoning' AI models could have emerged 20 years ago. At Nvidia's GTC conference, he stated that if past researchers had known the right approach and algorithms, these models could have been developed much earlier. Brown emphasized the importance of how humans think deeply before acting in difficult situations, noting that this thought process could be valuable for AI as well. He mentioned the poker AI 'Pluribus' developed at Carnegie Mellon University, explaining that it was innovative in solving problems through 'reasoning' rather than simple calculation methods. The o1 model recently developed by OpenAI uses 'test-time inference' technology to 'think' before answering questions. This technique applies additional calculations to running models, providing more accurate and reliable results, particularly in mathematics and science fields. Brown argued that despite the lack of large-scale computing resources, academia can make significant contributions in areas such as model architecture design. He suggested that if academic research presents compelling logic, it could potentially be expanded into large-scale experiments. Furthermore, he stressed that current AI benchmarks are causing confusion due to their low correlation with actual usefulness, and urged academia to take an active role in improving them. Brown added that improving benchmarks is an area that doesn't require extensive computing resources.
오픈AI의 AI 추론 연구 책임자인 노암 브라운이 특정 형태의 '추론' AI 모델이 20년 전에도 등장할 수 있었을 것이라고 주장했다. 그는 엔비디아의 GTC 컨퍼런스에서 과거 연구자들이 올바른 접근법과 알고리즘을 알았다면 이러한 모델이 더 일찍 개발될 수 있었을 것이라고 밝혔다. 브라운은 인간이 어려운 상황에서 행동하기 전에 깊이 생각하는 점에 주목하며, 이 사고 과정이 AI에도 유용할 수 있다고 강조했다. 그는 카네기멜런대에서 개발한 포커 AI 'Pluribus'를 언급하며, 이 AI가 단순 계산 방식 대신 문제를 '추론'으로 해결한 점에서 독창적이었다고 설명했다. 오픈AI가 최근 개발한 o1 모델은 '테스트 타임 추론(test-time inference)' 기술을 활용해 질문에 답하기 전에 '생각'하는 과정을 거친다. 이 기술은 실행 중인 모델에 추가 계산을 적용해 더 정확하고 신뢰할 수 있는 결과를 제공하며, 특히 수학과 과학 분야에서 강점을 보인다. 브라운은 학계가 대규모 컴퓨팅 자원이 부족한 현실 속에서도 모델 아키텍처 설계와 같은 분야에서 중요한 기여를 할 수 있다고 주장했다. 그는 학계의 연구가 설득력 있는 논리를 제시하면 대규모 실험으로 확장될 가능성이 있다고 말했다. 또한 그는 현재 AI 벤치마크가 실제 유용성과 상관관계가 낮아 혼란을 초래하고 있다며, 이를 개선하는 데 학계가 적극적으로 나서야 한다고 강조했다. 브라운은 벤치마크 개선이 많은 컴퓨팅 자원을 필요로 하지 않는 분야라고 덧붙였다.
