·비용 효율의 핵심은 작업을 기본층, 작업층, 고비용층으로 분리하여 고난도 추론(High-cost) 호출 비중을 10% 이하로 유지하는 '작업 설계'에 있다.
·리서치 상한 설정, 결과 포맷 고정, 실패 시 '처음부터 재시작'이 아닌 '상태 유지 후 재실행'을 통해 불필요한 토큰 낭비를 원천 차단해야 한다.
·모든 요청에 '완료 조건(DoD)'을 명시하고 초안-교정-메타데이터로 이어지는 3단계 파이프라인을 구축하여 산출물의 품질과 운영 속도를 동시에 잡는다.