시간 | 주제 / 강사 / 내용 | 좌장 |
---|---|---|
13:00 ~ 13:10 ( 장소: 동국대학교 원흥관 3층, i.스페이스) | 개회 | |
13:10 ~ 15:10 ( 장소: 동국대학교 원흥관 3층, i.스페이스) | 대규모 비전-언어 모델(VLM)연구 동향 및 활용 방법 | () |
대규모 비전-언어 모델 (VLM) 연구 동향 및 활용 방법
임성훈 교수 (DGIST)
최근 대규모 시각-언어 사전 훈련의 성공을 기반으로 '비전-언어 모델 (Vision-Language Model)'에 대한 관심이 증가하고 있다. 이 모델은 이미지 수준, 픽셀 수준에서 비디오 수준까지 다양한 작업에 적용할 수 있어서 다양한 산업군에 활용되고 있다. 이번 세미나에서는 이러한 VLM모델에 대한 최신 연구 추세와 활용 방법을 소개하고자 한다.
|
||
15:10 ~ 15:30 ( 장소: 동국대학교 원흥관 3층, i.스페이스) | Coffee Break | |
15:30 ~ 17:30 ( 장소: 동국대학교 원흥관 3층, i.스페이스) | 멀티모달 기술을 활용한 챗봇 서비스의 최신 동향과 실사례 적용 방법 | () |
멀티모달 기술을 활용한 챗봇 서비스의 최신 동향과 실사례 적용 방법
이재훈 실장 ((주)스캐터랩)
Character AI나 Talkie 처럼 LLM을 활용하는 챗봇 서비스가 최근 들어 주목을 받고 있고 단순한 텍스트 대화를 넘어 이미지와 음성 등 다양한 멀티모달을 활용한 기능들이 쏟아져 나오고 있습니다. 이번 강연에서는 챗봇 서비스들에 있어 멀티모달 기술들이 어떻게 적용되고 있는지를 살펴보며 저희가 운영하고 있는 서비스인 ZETA에서는 어떻게 멀티모달 기술을 연구하고 적용시켜 서비스를 하고있는지 소개합니다
|
||
17:30 ~ 17:30 ( 장소: 동국대학교 원흥관 3층, i.스페이스) | 폐회 |