글
작성한 글 목록입니다.
작성한 글 목록입니다.
만들고 싶은 것을 한 줄로 적으면, 디렉터가 작업을 쪼개고, 전문 에이전트들을 소환하고, 서로 메시지를 주고받으며 일을 끝낸다. 그리고 우리는 그걸 **3D VTuber로 실시간 관전**한다.
매일 최신 논문을 수집하고 시맨틱 유사도·공저자 관계로 지식 그래프를 구축하는 도구 설계 및 구현 기록
Uncertainty-Aware Safe Escalation Framework for Medical LLM Agent
UASEF 구현기: 설계를 코드로 — 4가지 미해결 과제를 해결하며
Mamba-3는 기존 Mamba-2의 한계(상태 추적 취약, 하드웨어 비효율)를 복소수 SSM, 사다리꼴 이산화, MIMO 세 가지 개선으로 극복해 Transformer보다 빠르고 더 정확한 언어 모델을 구현한 논문입니다.
실행 중인 Docker 컨테이너(blog, api, self-healing-cicd)를 Grafana로 모니터링하는 스택을 처음부터 구축한 과정을 정리합니다. Linux 환경에서 host.docker.internal 이슈 등 삽질했던 부분도 함께 담았습니다.
Anthropic이 제안한 MCP의 구조와 작동 원리를 깊이 파헤칩니다. Host, Client, Server의 역할 분리부터 직접 MCP 서버를 만드는 실습 코드까지 한 번에 정리합니다.
LLM 추론의 핵심 병목인 KV Cache의 원리부터 최신 최적화 기법(MLA, GQA, Sliding Window, Prefix Caching)까지 한 번에 정리합니다. vLLM PagedAttention과도 연결해서 설명합니다.