본문 바로가기

MLops4

생성형 AI 모델 배포 최적화: 서버 역할 분리 아키텍처 개선 시작하며;최근 생성형 AI 워크플로우를 운영하면서 ComfyUI 기반 서버 구조를 개선하는 작업을 진행했다. 구조적으로는 프롬프트를 전달하는 Proxy 서버와 실제 모델을 실행하는 ComfyUI 서버로 분리되어 있다. 그러나 기존 AI/ML 엔지니어께서 구성한 배포 파이프라인에서는 ComfyUI 모델을 Proxy 서버에서 관리하고 있었고, 이는 역할 분리 관점에서 불필요한 결합이라고 판단했다. 일정 내 마무리를 위해 직접 뛰어들어 구조를 단순화하고 배포 효율을 높이는 개선 작업을 마무리했다.기존 구조의 문제;Proxy 서버는 원래 요청을 받아 ComfyUI 서버로 전달하는 역할만 담당한다.기존 배포 프로세스는 Proxy 가 모델 다운로드와 관리까지 수행했다.Proxy 와 ComfyUI 는 본질적으로 역할.. 2025. 8. 24.
딥러닝 이미지 분류: 클래스 세분화의 함정 시작하며;초기에는 초음파 영상이 입체인지 아닌지를 구분하는 것이 핵심 과제였다. 하지만 새로운 서비스 준비와 함께, 이미지 분류 기준을 보다 정교하게 세분화할 필요성이 생겼고, 이는 애초에 내가 지향했던 방향이기도 하다. 단순히 입체 여부를 판단하는 것을 넘어, 영상에 어떤 성장 지표가 (예: AC, BPD, FL) 포함되어 있는지를 구체적으로 분류하고 싶었다. 수많은 시행착오 끝에 구조가 또렷이 보이는 이미지는 ac, bpd, fl 등 긍정 클래스로, 구조 식별이 어려운 이미지는 부정 클래스로 나눠 학습시켰다. 여기서 핵심 기준은 영상 내 십자가 모양의 마커와 (marker) 어노테이션의 (annotation) 존재 여부다.마커와 어노테이션 모두 있는 경우 → 긍정 클래스로 분류 (ac, bpd, fl.. 2025. 7. 2.
AI 모델 학습부터 MLOps 운영까지: 직접 개발한 프로젝트 회고 시작하며;감회가 좀 새롭다. 관련 글을 쓸때마다 "언젠가 실 서비스에 적용해보면 재밌겠다..!" 로 마무리했는데, 그 날이 진짜 왔다. 아니 해냈다. 2025년 4월 14일 오전, 그동안 학습하고 실험해온 AI 기반 프로토타입을 실제 운영 중인 서비스 환경에 성공적으로 적용했다. 단순한 모델 개발에 그치지 않고, 의료 데이터를 입력으로 받아 AI 가 자동으로 분석한 결과를 실시간으로 제공하는 End-To-End 파이프라인을 직접 설계하고 구축했다. AI 추론은 GPU 없이 CPU 만을 활용하는 AWS ECS 환경에서 수행되며, 결과는 API 형태로 앱 서비스에 전달된다. ECS 기반의 인프라를 선택했다. 이유는 안정적인 확장성과 배포 용이성을 제공하며, 서비스 운영에 필요한 빠른 응답 속도와 효율적인 리.. 2025. 5. 25.
ResNet18 로 초음파 영상 똑똑하게 분석하기 시작하며;초음파 영상에서 두정골 직경 (Biparietal Diameter, 이하 BPD)을 측정하기 위해 이미지 분석을 진행했다. 하지만 그 이전 단계에서, 먼저 영상을 프레임 단위로 나누는 과정이 필요했다. 영상은 짧게는 3~10분, 길게는 30분 이상까지 존재하는데, 단순히 프레임을 모두 추출하면 30분 영상의 경우 6만 장이 넘는 이미지가 생성된다. 이렇게 많은 이미지에서 BPD 를 측정하기 위해 스케일 바를 탐색하고 ROI(관심 영역)를 찾는 과정은 비효율적일 것 같았다. 그래서 프레임 추출 단계에서 이미지 전처리를 최대한 진행하면 불필요한 데이터를 줄이고 분석 효율을 높일 수 있을 거라고 판단했다. 이를 위해 특정 기준을 설정해 프레임을 선별하는 방식을 시도했다. 예를 들어, 영상 내에서 십자.. 2025. 2. 6.