🌼

어쨌건간에 흘러가는 者

Who and Why am I here?

제 소개와 연락처입니다. 각 페이지 맨 아래에 또는 댓글 한마디 남겨주심 그저 좋아라~ 합니다.

•

Linkedin / Github

•

Youtube / Strava

•

anyflow@gmail·com

어쨌건간에

https://www.anyflow.net/introspective-life/anyway

Recent

Introduction

한참이나 그간 언급되었고 언급되고 있는 소위 AI engineering 시리즈에 대한 개념 정리 노트이다. 이들 거대 개념을 수박 겉햝기나마 한 이유는 AI agent 설계 시에 내가 지금 어디 있는지, 어디로 가는 것인지를 알기 위함이다.

따라서, 아래부터 이어질 단정적 표현은 'fact'가 아닌 내가 이해한 수준, 즉 '의견'으로 받아들여지면 좋을 듯(내가 이들 개념 정의자도 아니고). AI가 초안쓰고 내가 감수(?) 및 편집하고 딴 AI가 내용 검증했다.

내용 요약하자면,

•

prompt는 모델이 따를 말을 설계하고,

•

context는 모델이 볼 정보를 설계하며,

Prompt, Context, Harness Engineering 개념 정리

본 포스트에 대한 요약으로, 서비스 ownership 기반 multi-agent 아키텍처 및 release 방법을 축약한다.

Introduction

Note AI assisted

다수의 microservice로 이루어진 Kubernetes / Istio 환경의 인터넷 서비스에 대한 AI로의 서비스 운영 위임 방법에 대한 논의로, 이를 위한 아키텍처 제안과 함께 구현 방법으로서의 kagent(kagent.dev)를 설명한다.

핵심 아이디어는 단순하다. “기존 인간의 운영 구조를 그대로 agent 구조로 옮긴다”.

각 서비스는 팀 별로 ownership이 나뉘어 있고, 장애 시 담당 팀이 리드하며, 필요 시 타 팀에 위임하는 방식으로 운영은 돌아간다. 이 구조를 agent 레이어에 이식하면 조직 거버넌스, 권한 경계, 품질 책임이 자연스럽게 따라온다. 위임에 따른 부가적 비용이 최소화된다는 뜻이다. 그리고 이 구조는 충분히 효과, 효율적으로 동작 가능해보인다(실증 중이다).

Agent 기반 서비스 운영 아키텍처 via kagent

Introduction

엔터프라이즈/서버 환경에서의 AI Agent 운용은 local 환경 대비 하기 요구에 응할 수 있는 장점을 가진다.

•

접근성: 내부 서비스, Kubernetes 리소스 등의 엔터프라이즈 자원에 안정적으로 접근할 수 있어야 한다.

•

통제성: 엔터프라이즈 자원 접근으로 인해 자격 증명, 승인된 도구, 정책, 감사 로그가 요구된다.

•

지속성: 사용자 세션이나 노트북 상태와 무관하게 Agent가 계속 실행되어야 한다.

AI Agents Platform via kagent, agentgateway

Kubernetes Gateway API

mcp

A2A

2026/03/20

openapi-endpoint-filter 동작 구조. API 식별자(예: /users/{id})를 request header와 Istio metric label로 삽입한다.

Introduction

아래의 openapi-endpoint-filter 에 대한 간단한 소개와 README에서 다루지 못했던 제작 동기이다.

openapi-endpoint-filter

anyflow

일단 openapi-endpoint-filter 가 무엇인지는 아래의 README heading 문구가 잘 나타내는데, 부연하자면 Istio metric이 다루는 최소 단위는 workload(Deployment, StatefulSet 등) 또는 pod이기에, 실세계에서 유용한 API 단위의 metric 식별이 상당히 아쉽다. 이를 해결한다.

Rust 기반의 Proxy-Wasm 필터로, OpenAPI operation(예: GET /users/{id})을 request header에 삽입합니다. 이 header는 Istio  Telemetry API를 통해 Istio 메트릭 레이블 로 매핑될 수 있으므로, 결과적으로 카디널리티 폭발 없이 엔드포인트 수준의 관찰 가능성을 확보가 가능합니다.

API 식별 in Istio : openapi-endpoint-filter

as S/W 엔지니어

Istio

WASM

OpenAPI

metric

2026/01/07

Kubernetes 환경에서의 cgroup과 global OOM과 cgroup OOM. 단일 통합 root는 cgroup V2에서부터 도입되었다고(…cgroup v2 has only a single process hierarchy…)

Introduction

k8s workload의 안정성, 효율성 동시 확보에 관하여 1/2에서는 Pod 강제 종료 Overview와 Kubernetes에 의한 강제 종료인 pod eviction를 다뤘다. 여기서는 Linux에 의한 강제 종료인 OOMKilled 및 OOM Killer, 특히 cgroup OOM Killer를 다룬 이후, 안정성과 효율성 동시 확보를 위한 방안 제시로 전체를 정리한다.

전편과 마찬가지로, 아이디어 출처 대부분은 AI이지만 전부 직접 작성했다. 논리 구조 확인, AI 간 cross check 뿐 아니라 의심스럽다 싶은 부분은 죄다 공식 문서 참조 링크를 달았다. 그럼에도 간간히 공식 문서 뒷바침이 없는 부분이 있는데, 그건 지쳐서 그런 것이니…

틀린 부분이 보인다 → 코멘트를 남겨주시면 그저 감사할 뿐.

Summary

k8s workload의 안정성, 효율성 동시 확보에 관하여 2/2

as S/W 엔지니어

k8s

stability

efficiency

OOMKilled

Linux

cgroup

kubelet

eviction

2026/01/01

Pod 강제 종료 구조. 크게 Kubernetes에 의한 eviction과 Linux에 의한 OOMKiled로 나눌 수 있다.

Introduction

Kubernetes 운영 시 접하는 흔한 이슈 중 하나인 OOMKilled (Out Of Memory의 메모리 부족으로 인한 pod의 비정상 종료), 그리고 이를 포함한 pod 안정성과 효율성의 동시 처리에 관한 논의이다. OOMKilled 는 메모리를 과다하게 할당하면 해결은 되겠지만 돈이 남아나지 않고서야... 달리 말하자면 효율성에 문제가 발생한다. 결국 안정성과 효율성을 동시에 취하는 방법이 필요하다는 의미로, 이는 pod resource와 autoscaling을 어찌 설정할 것인가의 문제로 귀결된다.

참고로 CPU 역시 resources 의 설정 대상임에도 주로 memory만 논하는데, Linux에서 CPU는 memory와는 달리 선점 자원(preemtible resource), 즉 OS가 강제로 빼앗아 다른 작업에 재할당 가능하여 사용 중에도 중단, 전환이 가능하기에 프로세스 종료를 야기하지 않기 때문이다. 단지 느려질 뿐이지(throttling).

한방에 정리해서 끝내려했는데 왠걸, 파면 팔수록 산이라서 나눠서 간다(사실 좀 지쳤다). 종착역은 일반적 web service용 Kubernetes workload의 resources , PriorityClass, QoS, HPA 설정 전략이 될 것이다. 꽤나 Kubernetes 환경에 익숙하다 생각했는데, 익숙하기만 하지 상당히 어설펐다.

참고로, 아이디어 출처 대부분은 AI이다(그렇다고 AI가 쓴 글은 전혀 아니고). Hallucination이 찜찜해서 내 나름의 논리구조 확인은 물론이고 AI 간 cross check에, 나아가 중요하다 싶은 부분은 공식 문서까지 달아놨지만… 그래도 남은 찜찜함은 몰겠다. 뭐 논문 쓰는 것도 아니고.

k8s workload의 안정성, 효율성 동시 확보에 관하여 1/2

as S/W 엔지니어

k8s

stability

efficiency

OOMKilled

Linux

kubelet

kube-scheduler

cgroup

2025/12/29

NIST SP 800-207 Zero Trust Architecture과 Istio / OPA와의 관계

Introduction

사내 보안 전문가 과정 중 작성한 발표 자료의 일부로서, Zero Trust Architecture(ZTA) 및 Kubernetes 환경에서의 ZTA 관점에서 바라본 Istio에 관한 정리이다. 참고로 NIST SP 800-207은 미국 국립표준기술연구소가 작성한 Zero Trust Architecture의 공식 표준 문서로서, 이를 가장 많이 참조하였다. 에서 역시 ZTA를 언급함과 동시에 여기서 논하는 Istio 보안 features 상세를 다뤘다.

Zero Trust Architecture란

ZTA는 “절대 신뢰하지 않고, 항상 검증한다(Never trust, always verify)”는 원칙에 기반한 새로운 보안 패러다임이다. 방화벽, IDS/IPS, WAF를 필두로 하는 기존의 경계 기반(Perimeter based) 보안 모델이 내부 네트워크를 신뢰하는 것과 달리, ZTA는 위치에 관계없이 모든 사용자, 장치, 그리고 서비스와 트래픽을 잠재적 위협으로 간주하고, 매 순간 인증 및 권한 확인 절차를 거치도록 요구한다. 경계 보안 모델이 침입을 막는 것'에 집중했다면, ZTA는 침입을 가정하고 확산을 막는 것'에 집중한다. 아래는 간단한 경계 기반 보안 모델과 ZTA 간 비교이다.

Zero Trust Architecture via Istio

as S/W 엔지니어

ZTA

Zero Trust Architecture

OpenTelemetry eBPF Instrumentation / Beyla 동작 구조. Uprobes의 hooking 메커니즘으로 L7 계층을, Kprobes으로 L4 이하 계층을 처리한다. 자세한 내용은 참조. 출처: https://opentelemetry.io/docs/zero-code/obi/

Introduction

Kuberetes / Istio 환경에서 traffic metrics와 distributed tracing을 가장 효과, 효율적으로 취하기 방법에 대한 사전 조사이다. 결론부터 말하자면, traffic metrics로는 Istio가 생성하는 metric을, distributed tracing으로는 OpenTelemetry eBPF Instrumentation(OBI) 또는 Grafana Beyla가 생성하는 trace를 사용하는 것이 좋다.

Summary

•

Istio와 OpenTelemetry는 MLT(Metric, Log, Trace) 모두에 대해 자체적인 프로토콜과 측정 runtime을 갖는다. 이는 역할 상 중복으로 결국 하나를 선택해야 하며, Istio의 trace에는 제약이 있다.

•

Otel(OpenTelemetry)의 Distribute tracing 솔루션으로는 eBPF 기반 Zero-code Instrumentation을 선택한다. 이 솔루션에는 OpenTelemetry eBPF Instrumentation(OBI), Beyla가 있지만 양자 모두 사실 상 동일 솔루션이기에 무엇을 쓰건 별 차이가 없다.

Metric, Trace. Istio vs OpenTelemetry?

OpenTelemetry eBPF Instrumentation

프라이베르크 도시 및 광산 박물관 정면에 위치한 프라이베르크 대성당(Dom St. Marien)을 뒤로하고 한 컷. 박문호 박사님과 라이프치히에서의 술 멤버 및 버스와 식사 시간에 이 탐사와 과학 관련 여러 의견을 나누었던 일행 분과 함께. 검정 옷 입길 잘했다. 똥배가 안보인다. 박사님의 사모님 작품.

북유럽 여행기(a.k.a. 학습탐사): 독일 라이브치히(Leipzig) 에서 이어집니다.

독일 프라이베르크(Freiberg)

5일차(2025.09.03) 오전

여느 때와 마찬가지로 호텔에서의 새벽 강의로 하루를 시작. 강의 잘 듣지도 않는데 피곤해서 걍 재낄려했더니만 나만큼이나 강의에 진심이 없는 룸메이트 형님은 가겠단다. 한번 빠지기 시작하면 계속 빠지게 된다고. 그 말을 듣고보니 뭔가 나두 잘못하는거 싶어 따라 나섰다.

룸메이트 형님은 여행 내내 아침마다 내가 불러재끼는 케데헌의 Golden을 감당해야 했는데, 단순히 듣는거 뿐 아니라 노랫 가사의 ‘up, up, up’이 나올 때 마다 ‘손들고 위로 푸시’ 율동(?)을 따라하는 수고까지 감내해야만 했다. 부디 하루를 힘차게 열자는 뜻으로 그랬던거니 동생님의 이런 기특한 맘을 해아렸기를…(끝까지 따라하신거 보면 그런거 같다 )

북유럽 여행기(a.k.a. 학습탐사): 독일 프라이베르크(Freiberg), 포츠담(Potsdam)

프로젝트s

박문호

북유럽 여행

프라이베르크

포츠담

아우구스트

광산 박물관

아인슈타인 타워

상수시 궁전

2025/10/12

라이프치히 성 토마스 교회에 위치한 존 세바스찬 바흐(Johann Sebastian Bach) 동상 앞에서. 이 감격스러운 포인트에서 의도하지 않게 함께 찍힌 여자 아이는 뱅크시(Banksy)의 ‘풍선을 든 소녀’를 연상케한다. 이쁘기두 해라

북유럽 여행기(a.k.a. 학습탐사): 체코 프라하(Praha), 프리브람(Příbram) 에서 이어집니다.

독일 라이프치히(Leipzig)

체코 프리브람에서 독일 라이프치히(Leipzig)로 가는 와중, 이 도시 이름이 상당히 내게 익숙한데 정작 아는게 없단 생각이 들었다. 분명 라이프니츠(Leibniz)와 구분은 하는데 말야. 잠시 구글링을 해보니 당장 먼저 나오는게 바흐(Johann Sebastian Bach)이다. 이 땜시 그리 익숙했던 것이었으니… 어머, 여긴 가야해! 이 도파민 분출의 내 모습은 BTS를 고대하는 ARMY에 비견된다고나 할까.

라이프치히는 바흐가 주로 활동한 지역으로, 그는 아래 사진의 성 토마스 교회의 칸토르(음악 총괄)였다.