자연어로 구축하고 운영하는 AI 네이티브 시대의 첫 인프라 실습서!
자연어로 구축하고 운영하는 AI 네이티브 시대의 첫 인프라 실습서!
가상의 스타트업 Notiflex가 창업하는 순간부터 엔터프라이즈 규모까지 성장하는 여정을 따라 클로드 코드로 직접 구현해보면서 학습한다!
바이브 코딩이 ‘자연어로 코드를 만드는’ 흐름을 열었다면, 이 책은 '자연어로 인프라를 구축하고 운영하는 방법'을 소개한다. 자연어로 내린 지시가 깃에 선언으로 기록되고, 그 선언이 실제 인프라에 반영되도록 하여 '말이 곧 인프라가 되는 시대'의 새로운 업무 방식인 GitAIOps를 경험할 수 있다. 클로드 코드를 활용해 클라우드 네이티브 환경에서 인프라를 설계하고 구축하며, 배포하고 운영하는 전 과정을 실습 중심으로 다룬다. 가상의 스타트업 Notiflex가 성장하는 여정을 따라가며, 이 과정에서 다양한 핵심 기술을 자연스럽게 익힐 수 있다. 또한 AI를 단순한 자동화 도구가 아닌 학습 파트너로 활용해 문제를 탐색하고, 비교하고, 검증하는 새로운 학습 방식을 제시한다. 인프라를 완벽히 알고 시작할 필요 없이 직접 배포하고 질문하며 답을 확인하는 과정을 통해 실무 감각을 익힐 수 있도록 설계했다. 기술 자체보다는 AI 시대에 필요한 ‘일하는 감각'과 '질문하는 감각’을 키우도록 돕는 것이 이 책의 목표이다. AI 시대에 경쟁력을 갖춘 개발자와 인프라 엔지니어로 성장하고 싶은 분들에게 든든한 길잡이가 되어줄 것이다.
• 완성된 플랫폼 보기: https://github.com/sysnet4admin/notiflex-platform
1장. AI 시대, 개발자의 인프라
1.1 개발자에게 인프라가 다가온 시대
__1.1.1 DevOps 문화의 확산
__1.1.2 클라우드 네이티브 전환
__1.1.3 풀스택의 범위 확장
1.2 쿠버네티스, 클라우드 인프라의 공통 언어
__1.2.1 왜 쿠버네티스인가
__1.2.2 가파른 학습 곡선
__1.2.3 AI라는 새로운 동료
1.3 GitOps에서 GitAIOps로
__1.3.1 GitOps: 선언적 관리의 시작
__1.3.2 GitOps만으로는 부족한 이유
__1.3.3 AI가 채우는 빈자리
__1.3.4 GitAIOps: Git + AI + Ops
1.4 이 책의 구성과 실습 흐름
__1.4.1 이 책의 흐름
__1.4.2 실습 환경
__1.4.3 이 책의 저장소
1.5 Notiflex 스타트업 시나리오 소개
__1.5.1 Notiflex란?
__1.5.2 성장 타임라인
__1.5.3 여러분의 역할
1.6 가드레일: 클로드 코드가 정확하게 동작하는 이유
__1.6.1 CLAUDE.md와 가드레일
__1.6.2 3단계 흐름: 탐색 → 비교 → 실행
__1.6.3 왜 가드레일이 필요한가
2장. 환경 구성
2.1 GCP 계정 생성과 무료 크레딧 활용 전략
__2.1.1 계정 생성
2.2 클로드 코드 설치
__2.2.1 클로드 코드 요금제
__2.2.2 클로드 코드 설치
__2.2.3 클로드 코드 첫 실행과 인사
__2.2.4 statusline 설정하기
2.3 gcloud CLI 설치
__2.3.1 gcloud CLI 설치와 인증
__2.3.2 GCP 인증
__2.3.3 프로젝트 및 리전 설정
__2.3.4 Artifact Registry 인증 설정
2.4 깃허브 저장소 구성
2.5 GKE 클러스터 생성
__2.5.1 클러스터 생성
__2.5.2 kubeconfig 설정
__2.5.3 클러스터 상태 확인
2.6 Notiflex 앱 빌드와 배포
__2.6.1 Go API 서버 작성
__2.6.2 Dockerfile 작성
__2.6.3 빌드와 푸시
__2.6.4 쿠버네티스 매니페스트 생성
__2.6.5 배포와 동작 확인
2.7 깃허브에 첫 커밋
__2.7.1 JOURNEY.md 생성
__2.7.2 커밋과 푸시
2.8 마무리: /update-docs 스킬 만들기
2.9 2장 가드레일 살펴보기
3장. 첫 번째 배포 파이프라인
3.1 푸시 기반 배포의 한계
__3.1.1 클러스터에 무엇이 있는지 확신할 수 있는가
__3.1.2 명령형 vs 선언형: 사고 방식이 다르다
3.2 ArgoCD 설치 및 GitOps 연결
__3.2.1 클로드 코드에게 배포 자동화 도구 물어보기
__3.2.2 다른 도구는 없는지 비교해보기
__3.2.3 ArgoCD 설치하기
__3.2.4 깃 저장소 연결하기
3.3 ArgoCD로 롤링 업데이트: 깃 푸시만으로 배포
__3.3.1 새 기능 추가 및 배포
__3.3.2 롤백 테스트
3.4 깃허브 액션 CI: 빌드 자동화
__3.4.1 아직 남은 수동 작업
__3.4.2 깃허브 액션 CI 만들기
3.5 CI + ArgoCD 연결: 빌드부터 배포까지
__3.5.1 마지막 빠진 조각
__3.5.2 연결하기
__3.5.3 전체 파이프라인 테스트
3.6 마무리: CLAUDE.md에 행동 규칙 추가하기
3.7 3장 가드레일 살펴보기
4장. 관측 가능성 한 번에 구축하기
4.1 관측 가능성이란
4.2 메트릭 모니터링: 프로메테우스 + 그라파나
__4.2.1 클로드 코드에게 메트릭 수집과 시각화 도구 물어보기
__4.2.2 다른 도구는 없는지 비교해보기
__4.2.3 프로메테우스 + 그라파나 설치하기
__4.2.4 그라파나에 접속하기
__4.2.5 프로메테우스 메트릭 확인하기
4.3 로그 수집: Loki + Fluent Bit
__4.3.1 클로드 코드에게 로그 수집 도구 물어보기
__4.3.2 다른 도구는 없는지 비교해보기
__4.3.3 Loki + Fluent Bit 설치하기
__4.3.4 그라파나에서 로그 확인하기
4.4 알림 설정: PrometheusRule
__4.4.1 클로드 코드에게 알림 도구 물어보기
__4.4.2 다른 방식은 없는지 비교해보기
__4.4.3 알림 규칙 만들기
__4.4.4 알림 규칙 확인하기
4.5 마무리: 메모리에 작업 컨텍스트 기록
4.6 4장 가드레일 살펴보기
5장. 무중단 배포
5.1 Rolling Update는 왜 서비스가 끊기는가
5.2 외부 트래픽 관리: Gateway API
__5.2.1 클로드 코드에게 트래픽 관리 도구 물어보기
__5.2.2 다른 도구는 없는지 비교해보기
__5.2.3 Gateway API 설정하기
5.3 무중단 전환: Blue/Green 배포
__5.3.1 클로드 코드에게 무중단 배포 도구 물어보기
__5.3.2 다른 도구는 없는지 비교해보기
__5.3.3 Blue/Green 배포 설정하기
__5.3.4 v0.2.0 배포하고 전환 과정 지켜보기
5.4 마무리: 아키텍처 결정 기록하기
5.5 5장 가드레일 살펴보기
6장. 엔터프라이즈를 위한 기반 정비
6.1 Pod 간 상태 공유: Valkey 캐시
__6.1.1 클로드 코드에게 캐시 도구 물어보기
__6.1.2 다른 도구는 없는지 비교해보기
__6.1.3 Valkey 설치하고 앱 연동하기
6.2 시크릿 관리: Google Secret Manager
__6.2.1 클로드 코드에게 시크릿 관리 방법 물어보기
__6.2.2 다른 도구는 없는지 비교해보기
__6.2.3 Secret Manager 설정하기
6.3 점진적 배포: Canary
__6.3.1 클로드 코드에게 더 안전한 배포 방법 물어보기
__6.3.2 다른 도구는 없는지 비교해보기
__6.3.3 Canary 배포 설정하기
6.4 마무리: claude-context/로 현재 아키텍처 정리하기
6.5 6장 가드레일 살펴보기
7장. 규모 확장
7.1 성장통: SMB 구조의 한계
7.2 워크로드별 노드 배치: 멀티 노드풀
__7.2.1 클로드 코드에게 노드 분리 방법 물어보기
__7.2.2 다른 도구는 없는지 비교해보기
__7.2.3 멀티 노드풀 생성하기
7.3 다수 앱 관리: App of Apps 패턴 + Sync Wave
__7.3.1 클로드 코드에게 여러 앱 관리 방법 물어보기
__7.3.2 다른 도구는 없는지 비교해보기
__7.3.3 App of Apps 패턴 적용하기
__7.3.4 Sync Wave로 설치 순서 정하기
7.4 멀티 테넌시: 네임스페이스 격리
__7.4.1 클로드 코드에게 멀티 테넌시 방법 물어보기
__7.4.2 다른 도구는 없는지 비교해보기
__7.4.3 멀티 테넌시 구성하기
7.5 마무리: settings.local.json으로 권한 분리 체험
__7.5.1 자연어 규칙의 한계
__7.5.2 settings.local.json 만들기
__7.5.3 차단(deny) 체험
__7.5.4 승인(ask) 체험
__7.5.5 CLAUDE.md에서 settings.local.json으로
__7.5.6 체험 정리
7.6 7장 가드레일 살펴보기
8장. 고도화
8.1 이벤트 드리븐: 카프카
__8.1.1 클로드 코드에게 메시지 큐 물어보기
__8.1.2 다른 도구는 없는지 비교해보기
__8.1.3 카프카를 설치하고 이벤트 드리븐 구성하기
8.2 분산 트레이싱: 템포
__8.2.1 클로드 코드에게 분산 트레이싱 도구 물어보기
__8.2.2 다른 도구는 없는지 비교해보기
__8.2.3 템포 설치하고 트레이싱 설정하기
8.3 배치 자동화: 크론잡
__8.3.1 클로드 코드에게 주기적 작업 방법 물어보기
__8.3.2 크론잡 생성하기
8.4 마무리: command-guardrails/로 위험 작업 절차 정리
__8.4.1 시스템이 복잡해지면
__8.4.2 command-guardrails/ 작성
__8.4.3 7장 settings.local.json 체험과의 비교
8.5 8장 가드레일 살펴보기
9장. GitAIOps, 살아있는 운영 표준의 탄생
9.1 AI에게 저장소 분석시키기
__9.1.1 저장소 구조 분석
__9.1.2 커밋 히스토리 분석
__9.1.3 클러스터 현재 상태
9.2 쌓인 것들을 돌아보기
__9.2.1 도구 선택 의사결정 종합
__9.2.2 자원 사용 현황과 의사결정 회고
9.3 기대하지 않았던 효과
__9.3.1 살아있는 문서
__9.3.2 사람이 보는 문서, AI가 읽는 문서
__9.3.3 이 구조가 만들어내는 것
9.4 GitAIOps의 출현
__9.4.1 Git + AI + Ops 연결 분석
__9.4.2 GitOps와의 차이
__9.4.3 작위적이지 않다
__9.4.4 진행 방향에 따라 달라지는 구조
9.5 마무리: 다음 단계
__9.5.1 프로덕션 전환 제안
__9.5.2 AI와 대화하는 습관
__9.5.3 다시 처음부터
9.6 9장 가드레일 살펴보기
부록 A. AI로 만든 온보딩 가이드
부록 B. AI와 함께 설계하는 대규모 프로젝트
B.1.1 전체 흐름
B.1.2 1단계: 사람이 읽는 계획서(work-plans)
B.1.3 2단계: AI가 읽을 수 있게 증류한다(claude-context)
B.1.4 3단계: 실행 절차를 고정한다
B.1.5 4~5단계: DEV에서 PROD로
B.1.6 조직 도입 로드맵
ㆍ지은이 조훈
저작권 안내
연관 프로그램
독자의견 남기기