헤르메스 에이전트 비개발자 설치 분투기 (feat. 가성비 버전)
집이나 사무실 책상 위에서 묵묵히 자리만 차지하고 있는 데스크톱, 그냥 유튜브 보고 문서 작업할 때만 쓰고 계신가요? 헤르메스 에이전트를 연결하면 이 데스크톱이 내가 잠든 사이에도 유튜브 대본을 쓰고, 자료를 수집하며, 텔레그램 메시지 한마디에 파일을 정리해 주는 ‘지능형 비서’가 됩니다.
검은색 터미널 화면만 봐도 머리가 아픈 비개발자인 저도 해냈습니다. 수많은 시행착오(일명 삽질) 끝에, 돈 한 푼 안 들이고 나만의 AI 집사를 만든 눈물겨운 과정을 공유합니다.
- 헤르메스 에이전트는 ChatGPT·Claude 등 200개 이상의 AI 모델을 자유롭게 연결하는 오픈소스 자율 에이전트입니다.
- 구글 제미나이(Gemini) 무료 API를 연결하면 비용 0원으로 AI 비서를 구동할 수 있습니다.
- 설치 오류의 핵심 해결책: 모델명을 models/gemini-flash-lite-latest로 입력해야 합니다.
- 텔레그램 봇 연동 시 외출 중에도 스마트폰으로 데스크톱 AI에게 업무를 지시할 수 있습니다.
- 데스크톱이 ‘절전 모드’에 들어가지 않도록 시스템 설정을 바꿔야 24시간 운영됩니다.
헤르메스 에이전트(Hermes Agent)가 대체 뭐길래?
헤르메스 에이전트는 한마디로 ‘내 데스크톱 본체’와 ‘AI의 두뇌’를 연결해 주는 가교입니다.
이 프로그램의 가장 큰 매력은 ‘AI 모델의 다양성’에 있습니다. 헤르메스는 일종의 ‘빈 사무실’과 같아서, 사용자가 원하는 능력치를 가진 AI를 마음대로 골라 앉힐 수 있거든요.
- OpenAI의 GPT: 가장 많이 사용하고 똑똑한 유료 모델
- Anthropic의 Claude: 글쓰기 실력이 뛰어난 모델
- Google의 Gemini: 구글 생태계의 강력한 무료/유료 모델
내 데스크톱에 어떤 ‘뇌’를 심어줄지 내 마음대로 결정할 수 있다는 게 바로 헤르메스의 핵심입니다.
도구보다 중요한 건 ‘생각하는 방식’이었습니다
저는 그동안 정말 많은 AI 도구들을 사용해 왔습니다. 처음엔 그저 가장 똑똑한 모델만 찾으면 모든 게 해결될 줄 알았죠. 하지만 직접 써보니 깨달은 점이 하나 있었습니다. 결과물의 품질을 결정하는 건 모델의 이름값이 아니라, AI가 그 일을 ‘어떻게 처리하느냐’ 즉, 인풋과 과정의 차이였다는 점입니다.
여기서 제가 헤르메스 에이전트에 정착하게 된 결정적인 개념인 에이전틱 워크플로우(Agentic Workflow)가 등장합니다.
최고의 모델보다 무서운 ‘중간 모델의 반복 숙고’
최근 AI 학계와 전문가들 사이에서 정설로 받아들여지는 문장이 있습니다.
“천재 모델의 한 번 대답보다, 보통 모델의 여러 번 고민(루프)이 훨씬 낫다.”
우리가 흔히 쓰는 일반적인 챗봇은 질문을 받자마자 즉시 답을 뱉어냅니다. 마치 생각나는 대로 바로 말하는 것과 같죠. 반면, 헤르메스 에이전트는 질문을 받으면 다음과 같은 ‘워크플로우’를 스스로 가동합니다.
- 계획 수립: “주인님이 이걸 시켰으니, 먼저 A를 하고 그다음에 B를 해야겠군.”
- 자료 조사: “필요한 정보를 내 컴퓨터와 인터넷에서 찾아보자.”
- 초안 작성: “조사한 내용을 바탕으로 일단 뼈대를 잡아볼까?”
- 자가 검토: “잠깐, 이 부분은 논리가 좀 안 맞는데? 다시 수정하자.”
- 최종 결과: “자, 주인님! 여러 번 검토해서 완성한 결과물입니다.”
이런 생각의 루프를 거치면, 고성능 모델이 대충 뱉은 한마디보다 훨씬 완성도 높은 결과물이 나옵니다. 제가 수많은 도구를 뒤로하고 헤르메스를 선택한 이유도 바로 이 제대로 일하는 방식 때문이었습니다.
왜 ‘오픈클로’ 대신 ‘헤르메스 에이전트’였나?
얼마 전까지 AI 커뮤니티는 오픈클로 이슈로 정말 시끄러웠습니다. 클로드 모델을 비공식적인 방법으로 연결해 쓰려다 계정이 정지되거나, 서비스가 갑자기 막히는 등 유저들의 피해와 혼란이 가득했죠.
저 역시 편리함 때문에 오픈클로를 기웃거렸지만, 언제 터질지 모르는 시한폭탄을 내 데스크톱에 심어둘 수는 없었습니다. 그래서 찾은 대안이 바로 헤르메스 에이전트(Hermes Agent)였습니다.
헤르메스를 선택한 결정적 이유:
- 안전성: 비공식 우회로가 아니라, 구글이나 OpenAI가 정식으로 발급해 준 API 키(통행증)를 사용합니다. 계정 정지 걱정 없이 당당하게 비서를 부릴 수 있죠.
- 확장성: 오픈클로처럼 특정 모델에 목매지 않습니다. 제미니가 지겨워지면 GPT로, 다시 클로드로… 언제든 비서의 ‘뇌’를 갈아 끼울 수 있는 자유가 있습니다.
가성비의 끝판왕: 무료 제미니와 10달러의 마법
헤르메스라는 튼튼한 사무실을 구했다면, 이제 그 안에 앉힐 직원을 뽑아야 합니다. 여기서 저는 두 가지 전략을 세웠습니다.
① 일단은 무료로! (Google Gemini)
저 같은 입문자에게 가장 큰 장벽은 비용입니다. 구글 AI 스튜디오의 제미니(Gemini) 무료 등급을 쓰면 돈 한 푼 안 들이고 데스크톱에 AI를 이식할 수 있습니다. “무료 등급” 표시만 확인하면 요금 폭탄 걱정 없이 마음껏 제 AI 비서와 대화할 수 있죠.
② 10달러로 즐기는 ‘무제한 지능’
만약 비서에게 더 어려운 일을 시키고 싶다면? 커피 두 잔 값인 10달러(약 1.5만 원) 정도만 API 예산으로 충전해 보세요. 월 구독료 방식이 아니라 내가 ‘쓴 만큼만 나가는’ 방식이라, 10달러만 넣어둬도 저 같은 일반 유저에게는 몇 달치 업무를 수행하기에 충분한 거금이 됩니다. 이 10달러면 GPT나 Claude같은 유료 모델들도 비서의 뇌로 마음껏 갈아 끼우며 쓸 수 있습니다.
저는 구글의 제미니(Gemini)를 선택했습니다. 제가 제미니를 선택한 이유는 ‘가성비’ 때문이었습니다. GPT같은 모델은 매달 결제하거나 쓸 때마다 비용이 나가는데, 저 같은 가성비 마니아에게는 그게 참 부담스럽더라고요.
구글 AI 스튜디오에서 제공하는 API는 ‘무료 등급(Free Tier)’이 아주 강력하거든요. 돈 한 푼 안 들이고 내 데스크톱에 최고 수준의 AI를 이식하고 싶었던 저에게 제미니는 최고의 선택지였습니다.
준비물: 비서의 ‘집’과 ‘통행증’ 만들기
설치를 시작하기 전, 딱 두 가지만 미리 준비하세요.
① 텔레그램 봇 만들기
텔레그램에서 @BotFather를 검색해 대화를 시작하세요. /newbot을 입력하고 이름과 아이디를 정하면 ‘API Token’이라는 긴 영문+숫자 조합을 줍니다. 이게 바로 비서의 호출 번호입니다.
② 구글 제미니 API 키 발급
비서의 ‘뇌’ 역할을 할 API 키가 필요합니다. Google AI Studio에서 무료 API 키를 발급받으세요. 이 키는 절대 남에게 알려주면 안 되는 비밀 마스터키입니다.
비서의 무전기 만들기: 텔레그램 봇 생성
헤르메스 에이전트를 설치하기 전, 데스크톱에 있는 AI 비서와 대화할 ‘무전기’가 필요합니다. 바로 텔레그램 봇이죠. 아래 사진들을 보며 차근차근 따라 해보세요.
‘진짜’ 봇파더(BotFather) 찾기

텔레그램 검색창에 @botfather를 입력합니다. 여기서 주의할 점! 사진처럼 유사한 가짜 봇들이 정말 많습니다. 반드시 이름 옆에 파란색 체크 표시(공식 인증 마크)가 붙어 있는 봇을 선택하세요. 비서의 탄생을 도와줄 유일한 ‘대부(Godfather)’입니다.
비서의 탄생 신고 (/newbot)


봇파더를 클릭하고 하단의 [시작] 버튼을 누르면 대화가 시작됩니다. 봇파더가 할 수 있는 일들이 영어로 쭉 나오는데 당황하지 마세요.
채팅창에 /newbot이라고 입력하고 전송합니다. 이제 봇파더가 두 가지를 물어볼 거예요.
- 이름(Name): 내 비서의 별명입니다. 저는 ‘루다’라고 지어줬어요. (한글 가능)
- 아이디(Username): 텔레그램에서 검색할 때 쓰는 고유 아이디입니다. 반드시 끝이
_bot으로 끝나야 해요.
비밀 통행증, ‘API Token’ 보관 (중요!)
이름과 아이디를 다 정하면 봇파더가 ‘API Token‘이라는 아주 긴 문자열을 보냅니다.
⚠️ 주의: 이 토큰은 비서실의 마스터키와 같습니다. 외부에 공유되지 않게 주의하셔야 합니다.
설치와 설정: 터미널과 친해지는 짧은 순간
이제 데스크톱의 ‘터미널'(윈도우는 CMD나 PowerShell) 앱을 엽니다. 무섭게 생겼지만, 아래 순서대로만 따라 하시면 됩니다.

- 게이트웨이 설정: `hermes setup gateway` 입력
- 텔레그램 선택: 화살표로 텔레그램을 고르고 스페이스바를 눌러 체크한 뒤 엔터!
- 정보 입력: 아까 받은 텔레그램 토큰과 본인의 숫자 ID를 입력합니다.
- 모델 설정: `hermes model`을 입력해 비서가 사용할 AI 모델을 정합니다.
분노의 ‘404 에러’ 탈출기
설정 중 저를 가장 괴롭혔던 건 ‘404 Not Found’ 에러였습니다. 주소를 맞게 넣은 것 같은데 제 비서가 계속 길을 잃더라고요. 비개발자인 제가 수십 번의 시도 끝에 찾아낸 필살 해결책을 공개합니다.
핵심은 모델명: `gemini-flash-lite-latest`
보통 `gemini-1.5-flash`를 쓰라고들 하지만, 저는 계속 에러가 났습니다. 그런데 모델 이름을 `gemini-flash-lite-latest`로 바꾸자마자 바로 연결에 성공했습니다.
꿀팁 하나: 제미니 모델 선택 후 주소 입력창에서
https://generativelanguage.googleapis.com/v1beta/openai/를 넣는 것이 더 잘 작동할 때가 있습니다.
꿀팁 둘: 설정을 바꾼 뒤에는 반드시 `hermes gateway restart` 명령어를 쳐야 새 설정이 적용됩니다.
데스크톱이 잠들면 비서도 퇴근한다? (운영 팁)
비서가 제대로 깨어났다면, 이제 주인님이 자리를 비워도 일할 환경을 만들어줘야 합니다.
- 데스크톱 잠자기 방지: 데스크톱이 ‘절전 모드’에 들어가면 비서도 같이 잠듭니다. 24시간 부려먹고(?) 싶다면 시스템 설정에서 ‘화면은 꺼지되 절전 모드는 안 함’으로 설정해 주세요.
- 터미널은 닫아도 됩니다: 설정이 끝났다면 터미널 창은 닫으셔도 됩니다. 이 AI 비서는 이미 컴퓨터 시스템 백그라운드에서 묵묵히 당신의 메시지를 기다리고 있을 겁니다.
- 무료 등급 확인: 구글 AI 스튜디오 설정에서 ‘무료 등급(Free Tier)’ 표시를 확인했다면, 이제 요금 폭탄 걱정 없이 마음껏 명령을 내리시면 됩니다.
여러분의 데스크톱에 생명을 불어넣으세요
비개발자로서 헤르메스 에이전트를 설치하는 과정은 분명 ‘삽질’의 연속이었습니다. 하지만 지금은 밖에서도 스마트폰 하나로 집에 있는 데스크톱에 업무를 시킵니다.
“나는 코딩 모르는데…”라고 겁먹지 마세요. 가난한 유저도, 비개발자도 의지만 있다면 제미니를 연결해 강력한 AI 집사를 가질 수 있습니다. 여러분도 오늘부터 책상 위 데스크톱을 방치된 기계가 아닌, 든든한 파트너로 만들어보세요!
