[My IT : Codes] 이미지 생성 실험 : FashionMNIST 데이터셋(2) : Diffusion Model(LDM) 설계/구현
·
My IT/Codes
FashionMNIST 데이터셋(2) - Diffusion Model(LDM) 구현이전 코드 / 데이터셋 설명 :https://uj07096.tistory.com/69 [My IT : Codes] 이미지 생성 실험 : FashionMNIST 데이터셋(1) : cDCGAN 모델 조건 추가 방식 비교FashionMNIST 데이터셋 이미지 생성 실험 들어가며 목표 - 모델을 활용하여 FashionMNIST 데이터셋의 각 패션 아이템(예: 티셔츠, 바지, 스니커즈 등)을 조건부로 생성하는 작업을 수행 - 각 클래스에 해uj07096.tistory.com 5. Diffusion Model(LDM)5-1. VAE 구현LDM 모델을 생성하기 위해, 사전학습된 VAE 모델을 가져오려 했지만, 28 x 28사이즈에 맞는..
[My IT : Codes] 이미지 생성 실험 : FashionMNIST 데이터셋(1) : cDCGAN 모델 조건 추가 방식 비교
·
My IT/Codes
FashionMNIST 데이터셋 이미지 생성 실험 들어가며 목표 - 모델을 활용하여 FashionMNIST 데이터셋의 각 패션 아이템(예: 티셔츠, 바지, 스니커즈 등)을 조건부로 생성하는 작업을 수행 - 각 클래스에 해당하는 이미지를 생성하는 cGAN (Conditional GAN) 모델을 직접 설계, 학습 사용 데이터셋 : 28 x 28의 이미지의 10개의 클래스를 가지고 있는 FashionMNIST 데이터셋클래스 목록 : - T-shirt/top- Trouser- Pullover- Dress- Coat- Sandal- Shirt- Sneaker- Bag- Ankle boot사용 모델 비교 목표- One-Hot Encoding과 Embedding방식의 성능 차이 비교 - GAN과 LDM의 생성 이미..
[My IT : Article] 이미지 생성 모델 : GAN, VAE, Diffusion, Autoregressive
·
My IT/Article
1. AI가 그림을 그린다?최근에 이미지 생성 AI가 떠오름에 따라, 'AI가 그림을 그린다'라는 말이 떠올랐다. AI가 그림을 그린다는 말, 반은 맞고 반은 틀리다. AI는 그림을 그리는게 아니라 데이터로부터 이미지를 생성하는 것이다. 이 차이를 이해하는 것이 이미지 생성 모델을 이해하는 첫번째 키인데, AI는 수억장의 이미지를 학습해 '고양이는 이렇게 생겼다.', '하늘은 이런 색이다'라는 패턴을 통계적으로 학습한다. 그리고 우리가 텍스트를 입력하는 순간, 이미지 생성모델은 그 패턴을 조합해서 존재하지 않았던 이미지를 만들어내곤 한다. 따라서 확률로 그려낸 이미지라는 뜻이다. 그렇다면 이미지 생성 모델은 어떤 것들이 있을까? 2. 이미지 생성 모델1) GAN(Generative Adversarial ..
[My IT : Codes] U-Net 활용 Sementic Segmentation : Football Dataset(2) (하이퍼파라미터 튜닝 ~ 결론)
·
My IT/Codes
이전 코드 : https://uj07096.tistory.com/65 [My IT : Codes] U-Net 활용 Sementic Segmentation : Football Dataset(1) (시작~ 모델링)목표: U-Net을 이용해 축구 경기 영상 내의 다양한 객체(예: 골대, 심판, 선수, 관중 등)를 픽셀 단위로 분할하는 Semantic Segmentation 작업을 수행 파이프라인1. 데이터 불러오기 2. 데이터 EDA 3. 데이터uj07096.tistory.com 5. 하이퍼파라미터 튜닝모든 모델에 대해 하이퍼파라미터 튜닝을 진행하면 좋겠지만, 시간 효율성상 가장 빠르게 구동이 가능한 Custom U-Net으로 하이퍼파라미터 튜닝을 진행 후, 같은 하이퍼 파라미터로 다른 모델들의 학습도 진행하..
[My IT : Codes] U-Net 활용 Sementic Segmentation : Football Dataset(1) (시작~ 모델링)
·
My IT/Codes
목표: U-Net을 이용해 축구 경기 영상 내의 다양한 객체(예: 골대, 심판, 선수, 관중 등)를 픽셀 단위로 분할하는 Semantic Segmentation 작업을 수행 활용 데이터셋 Kaggle의 FootBall(Sementic Segmentation) 데이터셋 Football (Semantic Segmentation)100 frames of pixel-perfect semantic segmentation with 11 classes.www.kaggle.com 파이프라인1. 데이터 불러오기 2. 데이터 EDA 3. 데이터셋 생성 4. 모델링 5. 모델 하이퍼파라미터 튜닝 6. 모델 학습 / 시각화 7. 성능지표 비교 / 결론1. 데이터 불러오기Imports!pip install optuna!pip..
[My IT : Codes] 객체 인식 : 강아지/고양이 Detection(Faster R-CNN, SSD, YOLO)(2) 모델 학습 ~ 성능 지표 비교
·
My IT/Codes
시작 ~ 데이터셋 생성 : https://uj07096.tistory.com/52 [My IT] 객체 인식 : 강아지/고양이 Detection(Faster R-CNN, SSD, YOLO)(1) (목표 ~ 데이터셋 생성)목표 : SSD모델을 활용하여 강아지와 고양이의 얼굴을 감지하는 Detection 작업 수행활용 데이터셋 : Kaggle의 The Oxford-IIIT Pet Dataset The Oxford-IIIT Pet DatasetDataset of 37 categories of dogs and catswww.kaggle.com 사용uj07096.tistory.com 3. 모델 학습 / 예측 0) 모델 비교최대한 비슷한 조건에서 예측하기 위해서 파라미터 수가 비슷한 모델들을 불러왔다.사용할 모델 ..