·연속 추론 구조에 따른 비용 역설: 에이전트는 계획-실행-검증 루프를 반복하므로 사용자 증가가 마진 악화로 이어질 수 있어, 기능이 아닌 '작업 단위 원가' 관리가 필수적임.
·운영 아키텍처가 만드는 경쟁 우위: 모델 자체보다 요청 라우팅, 프롬프트 캐싱, 폴백 시스템 등 고도화된 운영 스택이 추론 비용 절감과 서비스 품질의 실질적 격차를 결정함.
·성공 지표의 전환: 정답률(Accuracy)이라는 기술적 지표에서 벗어나, 실제 업무가 완수되었는지를 나타내는 '작업 완료율(Task Completion Rate)'을 핵심 KPI로 관리해야 함.