To enhance its price competitiveness against rivals such as Google, OpenAI has introduced the 'Flex processing' option. Flex processing is an API option that halves AI model usage costs in exchange for slower response times and occasional resource unavailability. Currently available in beta, this feature applies to the o3 and o4-mini reasoning models and is suitable for lower-priority, non-production tasks such as model evaluations, data enrichment, and asynchronous workloads. With Flex processing, the o3 model costs $5 per million input tokens and $20 per million output tokens, exactly 50% lower than the standard rates. The o4-mini model is also reduced to $0.55 per million input tokens and $2.20 per million output tokens, half the usual price. This move comes as the cost of advanced AI technology continues to rise and competitors like Google are launching more affordable and efficient models. Alongside the introduction of Flex processing, OpenAI announced that developers with higher usage tiers must complete an identity verification process. This measure is intended to prevent misuse of the service and ensure compliance with usage policies.
OpenAI가 구글 등 경쟁사와의 가격 경쟁력을 높이기 위해 'Flex 프로세싱' 옵션을 도입했다. Flex 프로세싱은 응답 속도가 느려지고 간헐적으로 리소스가 제공되지 않을 수 있는 대신, AI 모델 사용 비용을 절반으로 낮추는 API 옵션이다. 현재 베타로 제공되는 이 기능은 o3와 o4-mini 추론 모델에 적용되며, 모델 평가, 데이터 보강, 비동기 작업 등 우선순위가 낮은 비생산성 용도에 적합하다. Flex 프로세싱을 이용할 경우 o3 모델은 입력 토큰 100만 개당 5달러, 출력 토큰 100만 개당 20달러로, 기존 대비 정확히 50% 저렴하다. o4-mini 역시 입력 0.55달러, 출력 2.20달러로 가격이 절반으로 인하된다. 이 같은 조치는 첨단 AI 기술의 가격이 오르는 가운데, 구글 등 경쟁사가 저렴하고 효율적인 모델을 연이어 출시하는 상황에서 나왔다. OpenAI는 Flex 프로세싱 도입과 함께, 일정 사용량 이상의 개발자에게는 신원 인증 절차를 의무화한다고 밝혔다. 신원 인증은 서비스 악용 방지와 정책 준수를 위한 조치다.
