S

Hero Image Placeholder

SSAFY AI Challenge - Korean VQA

VLM 기반 4지선다 VQA

2026.02 - 2026.03SSAFY전체

프로젝트 개요

한국어 이미지 기반 4지선다 VQA 챌린지. 5가지 실험 전략으로 VLM 파인튜닝 및 앙상블 라우팅 구현.

주요 성과

  • Qwen2.5-VL-3B LoRA Fine-tuning (4-bit 양자화)
  • BLIP-2 LoRA (Answer-only loss, Early Stopping)
  • GPT-4o-mini API (JSON structured output)
  • Qwen3-VL + InternVL2 Routing Ensemble
  • 한→영 번역 파이프라인 (OPUS-MT)

본인 담당 업무

  • 전체 역할 수행