OpenCSP/Index

OpenCSP 프로젝트 진행 현황 및 계획 정리 (2026-04-19 기준)

miiml 2026. 4. 19. 17:58

 

프로젝트를 진행하다보니까 신경써야할 범위들이 처음보다 훨씬 많아지기도 했고

진행상황에 대해서 어느 정도 내용 정리도 필요할 거 같아서 작성했다.

 

우선 전체 프로젝트의 진행은 아래처럼 생각하고 있고

1차적인 완성은 Basic 프로젝트 완료까지로 보고 있다.  (근데 가능할진 모르겠음)

 

Basic 프로젝트

1단계: MVP 개발

  • Core 구성 및 Console 프로토타입(API 연동 방식, MSA) 개발
  • 예상 RPS : 100 ~ 500 RPS (Maximum 3k RPS)
  • DoD(Definition of Done)
    • Core 연동 부분 
      • Provisioning Flow (FE -> BE -> Terraform -> Ansible)
      • PAM (Teleport) 인증 및 SSH 릴레이
      • IAM (Zitadel) 서비스 기반 중앙 인증 및 사용자 데이터 연동
      • Billing 파이프라인(Lago) 연동 및 메트릭 가시화 페이지 개발
    • Console UI/UX 및 백엔드 구조 부분
      • 싱글 테넌트 단위 UI 및 기능 개발 및 사용자 단위 리소스 격리 (2단계에서 고도화)
      • 직관적인 UI와 UX
        • 적은 레이턴시/화면 리프레시, 프로비저닝 진행 상황 모니터링, Dynamic Configuration(Integrations) 등
      • 각 영역의 다른 오픈소스 서비스 연동이 고려된 백엔드 구조 (파사드 패턴)
      • MSA 구조에서 데이터 안정성 및 백업/복구 정책 및 방법 구상
    • CI/CD 파이프라인 구성
      • github OCI로 helm chart와 버전별 컨테이너를 Core 인프라 내부에 배포
    • 도메인 구매 후 서비스 오픈

 

2단계: 고도화

  • 1단계 결과물(MVP)을 고도화함
  • 예상 RPS : 낮은 레이턴시로 10k ~ 30k 정도가 목표 (스파이크 방어)
  • DoD(Definition of Done)
    • 트렌젝션 통합 처리 시스템(Temporal) 구성 및 연동 (EDA)
    • 각 레이어의 마이크로 서비스 fallback 처리
    • 멀티 테넌트 적용
      • Core 내부의 각 오픈소스 서비스들이 멀티 테넌트를 지원하지 않을 때도 고려해서 로직 작성
    • 테넌트 단위 격리 (격리 레벨은 고민이 좀 필요)
      • 네트워크 레이어 격리: 테넌트 별 가상 네트워크로 격리 (Security Group/ Rule을 OVN ACL 등으로 구현)
      • 리소스 레이어 격리: 같은 테넌트 내부 사용자 단위에서의 리소스 격리
      • 데이터 레이어 격리: 테넌트별로 물리적인 레벨(DB자체)에서 분리할지, 스키마 레벨에서 분리할지, 아니면 쿼리 파라미터 등으로 논리 레벨에서 분리할지 고민
    • 네트워크 가상화
      • BE에 IPAM (IP Address Managements) 등 네트워크 관리 기능 개발
      • OVN, OVS 등을 인프라 노드(컨트롤 플레인, 컴퓨트 플레인 등)에 설치해서 AWS VPC 같은 테넌트별 가상 네트워크 서비스를 개발함 (대충 아래 아키텍쳐)

 

 

Enterprise 프로젝트

1단계: Observability Node 구성 및 연동

 위에 Basic 프로젝트에서 구현한 내용들이 클라우드 플랫폼이라고 한다면, 해당 클라우드 내부 생태계에서 무슨일이 있어나는지를 관측하고 특정 패턴들을 탐지하는 기능도 필요할 거 같았다.

 

우선은 아래처럼 아키텍쳐를 그려봤다.

물론 실제 구성에선 좀 달라질 수도 있겠지만 흐름을 보면 별도의 노드에 카프카를 중심으로 이벤트를 쌓고,

분석이 필요한 각 영역 (보안, 데이터, 모니터링 등)에서 해당 데이터를 전달받아 사용하는 느낌으로 

카프카가 pubsub 구조이고, 토픽 단위 분리가 가능하기 때문에 아래 그림이 좋을 거 같았음.

 

2단계: AI Node 구성 및 연동

 앞단이 데이터 파이프라인을 기반으로한 관측 노드였다면 이번엔 해당 데이터를 활용하는 내부 AI 서비스들을 올릴 GPU Node 들을 만들고 기존 시스템들과 연동하는 프로젝트임.

이걸 붙이면 내 클라우드에 특화된 AWS Bedrock, MS GraphRAG 같은 서비스들을 오픈소스들을 사용해서 구성할 수 있을 거 같았다. (물론 성능은 다르겠지만)