SSAFY AI Challenge - Korean VQA
VLM 기반 4지선다 VQA
2026.02 - 2026.03SSAFY전체
프로젝트 개요
한국어 이미지 기반 4지선다 VQA 챌린지. 5가지 실험 전략으로 VLM 파인튜닝 및 앙상블 라우팅 구현.
주요 성과
- Qwen2.5-VL-3B LoRA Fine-tuning (4-bit 양자화)
- BLIP-2 LoRA (Answer-only loss, Early Stopping)
- GPT-4o-mini API (JSON structured output)
- Qwen3-VL + InternVL2 Routing Ensemble
- 한→영 번역 파이프라인 (OPUS-MT)
본인 담당 업무
- 전체 역할 수행