개인용 AI 에이전트 구축기: OpenClaw를 활용한 가족 비서 'Stella'와 구글 계정 정지 사건

7 hours ago 5

핵심 요약

OpenClaw 프레임워크를 사용하여 캘린더 관리, 이메일 모니터링, 스마트 홈 제어가 가능한 개인용 AI 에이전트 'Stella' 구축 사례입니다.
구글의 자동화된 어뷰징 방지 시스템이 AI 에이전트의 API 접근을 '비정상적 활동'으로 간주하여 계정을 정지시킨 기술적 충돌 문제를 다룹니다.
주요 스택: OpenClaw(Agent OS), Claude/Gemini(LLM), Mac Mini(Local Server), Home Assistant, Bland AI(전화 인터페이스).
교훈: AI 에이전트 시대를 위해 인간과 봇을 구분하는 새로운 '감독된 에이전트(Supervised Agent)' 인증 계층과 신원 증명 모델의 필요성을 강조합니다.

심층 분석 (Deep Dive)

1. 에이전트 설계 및 구현 원리

저자(Trond Wuellner)는 단순한 챗봇이 아닌, 가족의 삶에 깊숙이 관여하는 '디지털 크루'를 목표로 Stella를 구축했습니다. OpenClaw 프레임워크를 기반으로 하며, 다음과 같은 구조적 특징을 가집니다.

영속성 및 메모리: 단순 세션 기반 대화가 아닌, 가족의 생일, 선호도, 학교 일정 등을 구조화된 파일로 관리합니다. 매 세션 종료 시 요약 노트를 작성하고, 다음 실행 시 이를 읽어 들여 장기 기억을 유지합니다.
멀티 모달 인터페이스: 라즈베리 파이 기반의 'Stellascreen' 대시보드를 통해 정보를 시각화하고, Apple Neural Engine을 활용한 로컬 TTS/STT 시스템으로 지연 시간 1초 미만의 음성 상호작용을 구현했습니다.
동적 모델 라우팅: 운영 비용 최적화를 위해 이메일 확인 같은 단순 반복 작업(Heartbeat)은 Gemini Flash Lite에, 복잡한 추론이 필요한 작업은 Gemini 1.5 Pro나 Claude에 할당하는 라우팅 시스템을 직접 구현했습니다.

2. 구글 계정 정지 사건과 인프라의 한계

프로젝트 진행 10일 만에 구글은 Stella의 계정을 정지시켰습니다. 이는 현대 웹 인프라가 '자율적인 AI 에이전트'를 상정하지 않고 설계되었음을 보여주는 사례입니다.

OAuth의 설계 결함: 현재의 OAuth 흐름은 브라우저 앞에 사람이 앉아 있음을 전제합니다. AI가 프로그래밍 방식으로 API를 호출하고 데이터를 처리하는 행위는 구글의 스팸/봇넷 탐지 시스템에 의해 '계정 탈취'로 오인됩니다.
신뢰 모델의 부재: 서비스 계정(Service Accounts)은 서버 간 통신용이며, 일반 사용자 기능을 수행하는 AI 에이전트를 위한 별도의 '신뢰 등급'이나 '감독된 권한' 설정이 존재하지 않습니다.
해결책: 저자는 구글 계정 대신 AI 에이전트 전용 이메일 서비스인 AgentMail로 전환하고, OAuth 대신 iCal URL을 사용하는 등 취약한 인증 구조를 우회하는 방식으로 시스템을 재구축했습니다.

3. 구축 과정에서의 기술적 난관

음성 파이프라인의 복잡성: 웨이크 워드 감지(OpenWakeWord), 음성 인식(Whisper), LLM 처리, 음성 합성(TTS)으로 이어지는 12단계 이상의 오디오 라우팅 디버깅 과정이 필요했습니다.
상태 동기화 문제: Home Assistant를 통한 스마트 홈 제어 시 기기 오프라인 상태나 데이터 타입 오류(NaN 등)에 대한 예외 처리가 필수적입니다.
지연 시간(Latency): 클라우드 API 의존도를 낮추기 위해 로컬 맥 미니의 Neural Engine을 최대한 활용하여 반응성을 확보했습니다.

Read Entire Article