과제 수행 기간
2026.04.01-2028.12.31 (2년 9개월)
과제 목표
본 과제는 한국문화예술의 의미와 맥락을 이해하고 설명할 수 있는 크라우드소싱 기반 해설·대화형 인공지능 플랫폼 개발을 목표로 함.
한국문화예술 분야의 지식 구조를 지속적으로 확장·정제하기 위해 온톨로지 기반 지식체계와 생성형 AI를 결합하고, 전문가와 사용자가 참여하는 크라우드소싱 검수 체계를 구축함.
또한 RLHF 기반 학습 루프를 통해 문화적 적합성, 정서 일관성, 설명가능성, 안전성을 지속적으로 개선하며, 공연·전시·OTT·관광·교육 등 다양한 분야에서 활용 가능한 AI 해설·설명 서비스 API 및 SDK로 확장하고자 함.
단계별 계획
1단계 1차년도: 크라우드소싱 기반 RLHF 학습 및 검증 체계 구축
- PPO/DPO 기반 RLHF 학습 파이프라인과 관리 콘솔의 프로토타입을 개발함.
- 메타스키마와 문화예술 온톨로지를 연계한 데이터 구조를 확립하고, 한국문화예술 지식의 구조화 및 확장 기반을 구축함.
- Annotator–Reviewer–Curator 구조의 크라우드소싱 참여 체계를 설계하고, 인증·보상체계를 시범 운영함.
- MQM·Empathy·Safety 기반 품질평가 기준을 수립하고, 내부 품질 벤치마크와 자동 품질검증 모듈의 초기 버전을 개발함.
- KR–EN 병렬데이터와 문화대화 데이터셋을 구축하고, 수동 환류 기반 실험 및 보상모델 학습을 수행함.
- Drift 감지 및 A/B 실험 기반 지속학습 루프를 시범 적용하고, MLOps 기반 자동화 환경을 초기 구축함.
1단계 2차년도: RLHF–RAG 융합형 생성AI 프로토타입 고도화
- MLOps 기반 자동 학습·서빙 파이프라인을 구축하고, Drift 감지 기반 재학습 트리거링을 자동화함.
- 품질가중 샘플링과 Online Re-learning 루프를 정립하여 지속적인 모델 개선 체계를 고도화함.
- RLHF–RAG 통합형 생성모델과 시맨틱 검색 기능을 강화하고, 지식증강형 문화해석 AI 프로토타입을 개발함.
- KR–JP·ZH 다언어 병렬데이터를 추가 구축하여 다국어 문화해석 모델의 적용 범위를 확대함.
- MQM·Empathy·Safety 복합평가 루프를 통합하고, 정성평가 기준과 품질관리 체계를 고도화함.
- 데이터카드·모델카드 자동화, 버전관리, SHACL 정합성 검증, API 서비스 품질관리 체계를 구축함.
2단계 : 지식증강형 생성AI 플랫폼 고도화 및 장르별 실증
- 문화예술 온톨로지 기반 질의응답·설명형 엔진을 완성하고, 실시간 API·SDK 성능을 최적화함.
- 공연·전시·OTT 등 외부 실증기관과 연계하여 문화예술 해설 서비스의 현장 적용 가능성을 검증함.
- 실증 로그 환류 자동화와 품질진단 루프를 완성하고, 공개용 데이터·모델 카드 및 API 문서화를 확장함.
- B2B API와 Python/JavaScript SDK를 배포하고, 개발자 테스트 및 외부기관 실증을 추진함.
- FAIR, ISO/IEC 25012, ISO/IEC 20000 기반 품질 검증을 수행하고, 외부 기관 품질 평가 및 인증 보고서를 발간함.
참여범위
ISDS는 한국문화예술 맥락을 반영하는 온톨로지 및 메타스키마 설계, 문화대화 데이터 구축, 크라우드소싱 기반 품질평가 체계 개발, RLHF 학습용 피드백 데이터 설계 및 문화해석 AI 평가 벤치마크 구축을 담당함.
또한 문화적 적합성, 설명가능성, 안전성, 다국어 정합성을 평가하기 위한 자동·수동 평가 기준을 개발하고, AI 해설·대화 시스템의 품질 개선 루프와 데이터 거버넌스 체계 고도화에 참여함.
연구 내용
1. 크라우드소싱 기반 RLHF 학습 및 검증 체계 구축
- PPO/DPO 기반 선호학습 및 보상모델 설계
- Annotator–Reviewer–Curator 구조의 참여자 역할·등급·보상체계 구축
- IAA·신뢰점수·골드셋 기반 품질관리 체계 구축
- MQM·Empathy·Safety 기반 문화해석 품질평가 기준 수립
- 전문가 피드백 기반 RLHF 학습 데이터 구축 및 모델 개선 루프 설계
2. 온톨로지 기반 생성형 AI 플랫폼 개발
- LLM+KG 하이브리드 아키텍처 설계
- GraphQL·MCP 기반 문화예술 지식 API 연계 구조 개발
- 문화예술 도메인 다국어 Q&A·추천·해설 시스템 구축
- RLHF–RAG 통합형 생성모델 및 시맨틱 검색 기술 고도화
- 문화예술 온톨로지 기반 설명형 대화 엔진 개발
3. 문화예술 데이터 및 거버넌스 체계 구축
- FRBRoo–SKOS 기반 Meta-Schema 설계
- Emotion–Role–State–Action 프레임 기반 문화맥락 데이터 구조화
- KR–EN, KR–JP, KR–ZH 등 다국어 병렬데이터 구축
- 웹툰·영상 등 현대 한국 대중예술 장르 데이터 확장
- FAIR, ISO/IEC 25012, SHACL 기반 데이터 품질관리 체계 수립
- 데이터카드·모델카드·API 문서화 및 공개형 리포지터리 확장
4. 문화해석 AI 평가 및 실증
- MQM·XAI·Safety·SHACL·DQI 기반 통합 평가체계 구축
- BLEURT·COMET·CAS·SHACL 기반 자동검증 기술 적용
- 문화적 적합성, 설명가능성, 정서 일관성, 안전성 평가 기준 개발
- 공연·전시·OTT·관광 분야 실증 시나리오 설계
- B2B API 및 SDK 기반 외부기관 실증 지원

'Projects > Current' 카테고리의 다른 글
| [국가대표 K-AI] 글로벌 프런티어 파운데이션 모델 개발 및 국내 AI 혁신 생태계 조성 프로젝트 (0) | 2026.01.13 |
|---|---|
| [생성AI 선도인재양성사업] 멀티모달 AI 에이전트 시대에 적합한 실무형 AI인재 육성 프로그램 (0) | 2026.01.13 |
| "사회적, 윤리적 학습을 위한 데이터 특성 및 생성 AI 모델의 윤리성 향상 연구" 국책과제 (1) | 2026.01.13 |
| 멀티 에이전트에 기반한 농작물 멀티모달 질의응답 시스템 개발 (0) | 2026.01.13 |
| 대화 기반 설명가능성을 멀티모달로 제공하는 인공지능 기술 개발 (0) | 2023.01.30 |