📅 2026년 6월 5일

Agent Mode on Arena

🏢 Arena

사이트 방문

Web

자동화/에이전트AI 에이전트

자율 AI 에이전트로 복잡한 실제 업무를 처리하고 싶다면, Agent Mode on Arena를 사용해 보세요. AI 모델의 실제 성능을 객관적으로 평가할 수 있습니다.

사이트 방문

1 / 9

Agent Mode on Arena란?

대부분의 AI 벤치마크는 통제된 환경에서 모델을 테스트합니다. 에이전트 모드는 복잡한 작업을 통해 더 많은 업무를 처리하도록 모델을 테스트합니다. 단일 프롬프트로 탐색, 연구, 코딩, 파일 사용 및 다단계 워크플로우를 완료하는 자율 에이전트를 실행하고, 각 워크플로우가 단계별로 진행되는 과정을 지켜볼 수 있습니다. 모든 실행은 실제 에이전트 성능으로 최신 모델의 순위를 매기는 에이전트 아레나 리더보드에 기여합니다.