홈
태그
방명록

분류 전체보기 (47)

인기포스트

ABOUT ME

notou10@yonsei.ac.kr

트위터
인스타그램

Today

Yesterday

Total

notou10 notou10

컨텐츠 검색 블로그 내 검색

LANIT

카테고리 없음 2023. 1. 30. 21:41

Vision, Language encoder : CLIP꺼 fix.
Style, Mapping(style이미지에서 style하나씩 추출 인듯), content Encoder , prompt : 학습

STEP
1. 정해준 text candidate과 style간의 similarity 순으로 top k개만 multi-hot style domain label 만듬
2. style encoder에서 각 style 추출
3. 1, 2 representation을 aggregate
4. 3과 content image 로 output 만듦

(step1 에서 prompt learning이 일어남)

내 생각
~~class supervision이 없으면 prompt learning을 할 수가 없겠음~~
-> 할 수 있음. domain consistency or adversarial loss 로 학습. lsun car 도 yellow car 이런식으로 어거지 text candidate 만들고 prompt learning 함

하지만 unseen class 첨 들어오는 AED의 경우 training phase가 없음. prompt learning 이 불가능해서 CoOp 못씀

인기포스트

ABOUT ME

notou10@yonsei.ac.kr

LINK

ADMIN

admin 글쓰기

Designed by Tistory.

티스토리툴바

단축키

내 블로그

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

블로그 게시글

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

모든 영역

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.