AI 뉴스
OpenClaw 업데이트를 실제로 테스트해보고 굴려본 뒤, 장점과 단점을 정리했습니다
3개월 만에 체감한 OpenClaw의 큰 변화 — 메모리 시스템 대수술, 4차원 지능 프레임워크, 스킬 자동 패치. 그리고 AI 마케팅 현장에서 쓰면서 마주한 명확한 한계 4가지까지.

"아직도 OpenClaw 쓰세요?"
지난주 어느 마케팅 팀장 미팅에서 들은 질문입니다. 대부분의 팀이 AI 도구를 "써본다"와 "운영 체계에 붙인다" 사이 어딘가에서 방황하는데, 그분은 OpenClaw가 이미 한물 간 선택이라고 생각하고 계셨습니다.
저는 정반대 입장에서 대답했습니다. "요즘 OpenClaw가 완전히 다른 도구가 됐습니다."
AIMTOP에서 OpenClaw를 운영 체계로 활용한지 3개월이 넘었습니다. 최근 업데이트를 실제 프로젝트에 테스트하면서 얻은, 거르지 않은 장단점을 정리합니다.
OpenClaw가 뭔지 다시 정리하면
OpenClaw는 "AI가 실제로 일을 한다(THE AI THAT ACTUALLY DOES THINGS)"를 표방하는 에이전트 플랫폼입니다. WhatsApp, Telegram 같은 채팅 앱에서 바로 명령을 내리면 메일을 정리하고, 캘린더를 관리하고, 항공편 체크인까지 처리합니다.
중요한 건 이게 단순 챗봇이 아니라 실제 실행 에이전트라는 점입니다. MCP(Model Context Protocol) 기반으로 도구를 확장할 수 있고, 로컬 / VPS에 셀프 호스팅 가능합니다. 기존 시중 AI 비서들과 다른 점은 "플랫폼에 갇히지 않고 내 환경에서 내 데이터로 돌아간다"는 것입니다.
그래서 우리 팀은 마케팅 운영 체계에 이걸 붙였습니다. 광고 성과 수집·리포트 초안·캠페인 아이디어 브리프·미팅 메모 정리까지, 담당자 한 명이 하던 일을 에이전트와 나눠서 돌립니다.
장점 1 — 메모리 시스템이 완전히 새로 태어났습니다
가장 큰 변화는 메모리입니다. 솔직히 기존 OpenClaw의 가장 약한 고리였습니다.
이전까지는 에이전트가 기억하는 게 거의 없었습니다. 195번의 세션을 돌려도 실제로 축적된 학습은 4건. 나머지는 그저 메시지 로그로 쌓여서 DB 크기만 불어나는 상태였습니다. "어제 얘기한 그거"를 기억 못 하는 에이전트를 운영 체계에 붙이는 건 괴로운 일이죠.
이번 업데이트 이후가 달라졌습니다. 3단계로 메모리가 재설계됐습니다.
1단계. 메모리 최적화
불필요한 도구 실행 결과(toolResult)를 자동으로 트리밍합니다. 우리 경우 DB 크기가 23MB에서 5.3MB로 줄었고, 본문 데이터는 86% 감소했습니다. 핵심 사실(memory_facts)은 오히려 선명해지고, 노이즈가 사라졌습니다.
2단계. 자동 학습 엔진 (session-digest)
세션이 끝날 때마다 키워드 기반으로 패턴을 추출합니다. "수정 지시 / 불만 / 선호 / 결정 / 에러 / 성공" 같은 카테고리로 자동 분류되고, learnings가 4건에서 119건으로 뛰었습니다. 중요한 건 이게 Claude CLI 없이 순수 텍스트 분석으로 돌아간다는 점입니다. 외부 API 비용이 0원입니다.
3단계. 학습→활용 루프 완성
가장 큰 변화는 여기입니다. state.db에 쌓인 학습이 매일 새벽 4시에 launchd cron으로 MEMORY.md / IDENTITY.md / BOOTSTRAP.md에 자동 동기화됩니다. 다음 세션이 시작되면 에이전트가 이 파일들을 읽고 어제까지의 학습 위에서 일을 시작합니다.
이게 되는 순간 에이전트가 "기억하는 팀원"이 됩니다. 우리 브랜드 톤, 자주 반려되는 표현, 선호하는 보고 형식이 세션을 거듭하며 자연스럽게 쌓입니다. 3주간 돌려보면서 가장 체감이 컸던 부분입니다.
장점 2 — 4차원 지능 프레임워크가 실제로 작동합니다
이름이 거창해서 마케팅 문구처럼 들릴 수 있는데, 실제로 써보면 에이전트의 판단 깊이가 달라졌다는 느낌이 확실합니다.
기존 에이전트는 "지시한 걸 해내는" 구조였습니다. 이제는 네 가지 축이 동시에 돌아갑니다.
- 추론 메모리 — 현재 세션 안에서의 컨텍스트
- 절차적 스킬 문서 — 복잡한 작업을 5회 이상 반복하면 SKILL.md가 자동 생성
- 컨텍스트 지속성 — 스킬 문서가 벡터로 인덱싱돼 다음 세션에서 검색 가능
- 사용자 모델링 — 사용자 심리·선호를 비동기로 추론
특히 세 번째, 네 번째가 실무에서 체감이 큽니다. "브랜드 톤을 짧게 끊어치는 문장으로 쓰는 걸 선호"라고 한 번만 말해두면, 그 뒤의 카피 초안이 전부 그 톤으로 나옵니다. 예전엔 매번 같은 지시를 반복해야 했습니다.
장점 3 — 스킬 자동 패치가 "학습하는 조직"을 만듭니다
AIMTOP 현장에서 가장 실용적이었던 부분입니다.
에이전트가 작업하다 실패하면 event_log.jsonl에 기록됩니다. 실패가 3번 반복되면 자동으로 auto_gotchas.md에 함정 패턴으로 등록되고, 성공 사례 5회가 쌓이면 best_practices.md에 모범 사례로 저장됩니다. 그리고 이게 관련 스킬의 SKILL.md 파일에 자동으로 패치됩니다.
다음 세션에서 에이전트가 같은 스킬을 쓸 때, 자동으로 이 gotcha / best practice를 참조해서 행동이 달라집니다. 에이전트가 같은 실수를 반복하지 않는 구조가 된 겁니다.
우리 팀에서 현재 등록된 패턴은 함정 4건, 성공 5건 수준이지만, 3주만에 쌓인 거라 앞으로 더 선명해질 거라고 봅니다.
장점 4 — 셀프 호스팅이라 데이터 주권이 온전히 남습니다
이건 장점으로 뽑지 않으면 안 되는 부분입니다.
대부분의 AI 비서 서비스는 "클라우드에 내 데이터를 보내고, 벤더의 서버에서 모델이 돌고, 결과가 돌아옵니다". 기업 입장에서 고객 정보·광고 성과·내부 전략 문서를 제3자 서버에 올리는 건 점점 부담이 커지는 선택입니다.
OpenClaw는 VPS에 셀프 호스팅합니다. 모델 호출 자체는 외부 API(Claude, GPT 등)를 쓰더라도, 메모리·로그·학습 데이터·대화 기록은 전부 내 서버에 쌓입니다. 마케팅 에이전시 관점에서 이건 단순히 "보안이 좋다" 수준이 아니라 영업 가능한 차별점입니다.
광고주와 계약서를 쓸 때 "모든 운영 데이터는 자체 인프라에 저장됩니다"라고 명시할 수 있느냐 없느냐는 생각보다 큰 차이입니다.
단점 1 — 초기 세팅의 허들이 여전히 높습니다
솔직히 이 부분이 가장 큰 장벽입니다.
VPS 배포, API 키 발급, Telegram 봇 연결, 보안 설정(방화벽·리버스 프록시·VPN), Google Workspace API 활성화(Gmail / Calendar / Drive / Forms 등을 일일이 활성화), OAuth 테스트 사용자 등록, client_secret.json 인식 문제 우회, 환경변수 방식 재인증. 이 모든 걸 통과해야 "첫 대화"가 됩니다.
우리 팀이 초기 세팅하는 데 꼬박 하루가 걸렸습니다. 기술 담당자 없이 마케팅 팀원만으로는 사실상 불가능한 수준입니다. "코딩 지식 없어도 됩니다"라고 소개되는데, 현실은 SSH 접속·DNS 설정·환경변수 디버깅 정도는 익숙해야 합니다.
OpenClaw가 일반 사용자에게 진짜 친화적이려면 이 부분이 더 자동화돼야 합니다. GitHub README만으로는 일반 마케터에게 권하기 어렵습니다.
단점 2 — 메모리 시스템이 강력해진 만큼, 관리 포인트도 늘었습니다
장점으로 뽑은 메모리 대수술의 이면입니다.
이제 관리해야 할 레이어가 여러 개입니다. messages / memory_facts / learnings / SKILL.md / MEMORY.md / IDENTITY.md / BOOTSTRAP.md / event_log.jsonl / auto_gotchas.md / best_practices.md. 각각이 어떤 역할을 하는지, 언제 동기화되는지, 어떤 파일이 "허용된 부트스트랩 파일명"인지(HONCHO.md는 invalid-bootstrap-filename으로 무시됩니다) 전부 알아야 디버깅이 가능합니다.
우리는 이걸 극복하려고 sync-memory-to-md.py, session-digest.py, memory-optimize.py 같은 스크립트를 직접 붙였는데, 결국 "메모리 시스템을 운영하려면 OpenClaw 운영자가 반쯤 개발자가 돼야 합니다".
에이전트가 똑똑해진 건 좋지만, 에이전트를 돌보는 비용이 올라갔습니다.
단점 3 — 셀프 호스팅 환경이 멈추면 모든 게 멈춥니다
"데이터 주권이 온전하다"의 다른 쪽 얼굴입니다.
VPS가 다운되면 전체 에이전트 운영이 멈춥니다. 메모리 시스템이 강력해질수록 여기 의존도가 올라가고, 에이전트가 쌓은 학습·선호·브랜드 톤·고객 컨텍스트가 전부 그 서버에 있습니다. 우리는 이걸 방어하려고 매일 새벽 4시에 자동 백업 cron을 하나 더 붙였습니다.
가용성을 내가 책임진다는 건 클라우드 SaaS가 주는 안심감의 반대편에 서는 선택입니다. 스타트업 대행사 규모에서 이걸 감당할 준비가 돼 있어야 합니다.
단점 4 — 비용 구조가 "예측 가능"과 거리가 멉니다
OpenClaw 자체는 오픈소스라 플랫폼 비용이 0원입니다. 하지만 뒤에 붙는 LLM API 비용은 사용량에 비례합니다. 그리고 에이전트가 똑똑해질수록 컨텍스트를 더 많이 쓰고, 서브 에이전트를 더 많이 스폰하고, 메모리를 더 자주 조회합니다.
우리 경우 3주 전 대비 API 호출 볼륨이 40% 이상 늘었습니다. 학습이 쌓여서 에이전트가 "더 많이 시도"하기 때문입니다. 성과는 더 좋아졌지만, 월말에 결제 알림을 받을 때 살짝 두근거립니다.
해법으로 스마트 모델 라우팅(비싸지 않은 작업은 저가 모델로, 복잡한 판단만 상위 모델로)과 무료 백업 LLM 설정이 있긴 한데, 이걸 세팅하는 것도 결국 단점 1번의 허들에 속합니다.
그래서, AIMTOP 관점에서의 결론
OpenClaw 업데이트는 "개인 사용자에게는 살짝 과합니다. 하지만 운영 체계로 AI 에이전트를 붙이려는 조직에는 지금이 가장 좋은 시점입니다".
추천하는 쪽
- 마케팅 / 콘텐츠 / 운영 팀을 구조적으로 바꾸고 싶은 중견·스타트업
- 데이터 주권이 영업상 중요한 B2B 에이전시
- AI 에이전트를 단순 도구가 아니라 학습하는 팀원으로 운영하고 싶은 조직
아직 추천하지 않는 쪽
- 기술 담당자 없이 마케터만 있는 팀
- 월 20만 원 이하 예산으로 "AI로 다 자동화"를 기대하는 케이스
- 빠른 A/B 테스트 용도로 가볍게 써보려는 상황 (ChatGPT 한 달 쓰는 게 나음)
AIMTOP이 집요하게 "AI 에이전트 운영 체계"라는 말을 쓰는 이유가 여기에 있습니다. 도구를 도입하는 것과, 그 도구 위에 사람과 에이전트가 함께 학습하는 시스템을 세우는 건 완전히 다른 일입니다. OpenClaw는 후자를 짓기 가장 좋은 재료 중 하나이지만, 재료 혼자서 집을 짓지는 못합니다.
우리 조직에 맞을지 30분 안에 확인하는 법
긴 이야기이지만, 판단은 단순합니다. 아래 세 가지 질문에 답해보시면 됩니다.
- 우리 팀에 SSH·환경변수·Linux 기본 명령에 익숙한 사람이 한 명이라도 있는가?
- 월 LLM API 비용으로 최소 30~50만 원을 안정적으로 쓸 수 있는가?
- 3개월 뒤에 "에이전트가 우리 브랜드 톤을 기억하고, 같은 실수를 반복하지 않는다"가 성립했을 때, 그게 우리 비즈니스에 구조적 이득이 되는가?
세 개 모두 예라면 지금 붙이시는 걸 추천합니다. 하나라도 아니오라면, 아직은 ChatGPT Team / Claude Teams 같은 SaaS로 운영하시다가 조건이 맞을 때 넘어오시는 게 맞습니다.
어느 쪽이든 AIMTOP의 무료 AI 마케팅 진단에서 현재 조직 상태에 어떤 선택이 맞는지 30분 안에 정리해드릴 수 있습니다. 진단 신청은 https://aimtop.ai/diagnosis 에서 바로 가능합니다.
자주 묻는 질문
- OpenClaw 업데이트로 가장 크게 달라진 점은 무엇인가요?
- 메모리 시스템이 완전히 새로 설계된 것이 가장 큰 변화입니다. 세션 다이제스트가 학습을 자동으로 추출하고, state.db가 MEMORY.md 파일로 매일 자동 동기화되면서 에이전트가 어제까지의 학습 위에서 다음 세션을 시작합니다. 학습률이 195세션 4건에서 119건으로 뛰었습니다.
- OpenClaw를 마케팅 운영에 붙이는 게 실제로 가치가 있나요?
- 조건부로 가치가 있습니다. 기술 담당자가 있고, 월 30~50만 원의 LLM API 비용을 감당할 수 있고, 에이전트가 브랜드 톤과 반복 작업을 학습해나가는 구조가 비즈니스에 구조적 이득이 되는 조직이라면 지금이 최적기입니다. 반대로 세 조건 중 하나라도 안 맞으면 SaaS(ChatGPT Team/Claude Teams)가 더 낫습니다.
- 셀프 호스팅 방식이라 데이터 주권이 좋다고 하는데 그게 왜 중요한가요?
- 마케팅 에이전시나 B2B 컨설팅처럼 광고주의 민감 데이터를 다루는 비즈니스에서는 영업 가능한 차별점이 됩니다. 계약서에 '모든 운영 데이터는 자체 인프라에 저장됩니다'라고 명시할 수 있느냐가 대기업 광고주 신뢰에 직접 영향을 줍니다. 반대로 VPS 가용성을 내가 책임져야 한다는 단점도 함께 있습니다.
- OpenClaw 대신 고려할 만한 대안은 무엇인가요?
- Hermes Agent(Nous Research)가 가장 가까운 경쟁자입니다. 5단계 메모리 시스템, 자동 스킬 생성, Honcho 사용자 모델링, Docker/Daytona/Modal 등 다양한 실행 환경 지원에서 Hermes가 앞섭니다. 반면 설치 단순성과 스킬 허브 성숙도에서는 OpenClaw가 앞섭니다. 둘 다 MIT 라이선스 셀프 호스팅입니다.
Subscribe