[프로젝트 회고]스마트폰으로 알약 인식 앱 만들기(어플 이게머약)
·
My Projects
프로젝트 개요● 4인 팀을 구성해 약 2주간 진행한 팀 프로젝트다. 주제는 알약 이미지 객체 탐지 — 스마트폰으로 알약을 촬영하면 YOLO 모델이 약을 인식하고, 식약처 API를 통해 효능·복용법·주의사항을 보여주는 앱을 만드는 것이었다. ● 단순히 모델 학습으로 끝내는 게 아니라, 실제로 사용자가 쓸 수 있는 앱까지 완성하는 것을 목표로 잡았다. 결과적으로 mAP@0.5 0.9914, F1 Score 0.9948의 모델을 학습시키고, FastAPI 서버와 Flutter 앱을 연결해 실제로 동작하는 서비스를 완성했다. GitHub Link 시연영상 - Youtube Link 내 역할 : PM도 하고 개발도 하고● 프로젝트에서 PM을 맡았다. 처음엔 일정 관리와 업무 분배에 집중했지만, 실제론 매일 직접 ..
[My IT : Codes] 이미지 생성 실험 : FashionMNIST 데이터셋(1) : cDCGAN 모델 조건 추가 방식 비교
·
My IT/Codes
FashionMNIST 데이터셋 이미지 생성 실험 들어가며 목표 - 모델을 활용하여 FashionMNIST 데이터셋의 각 패션 아이템(예: 티셔츠, 바지, 스니커즈 등)을 조건부로 생성하는 작업을 수행 - 각 클래스에 해당하는 이미지를 생성하는 cGAN (Conditional GAN) 모델을 직접 설계, 학습 사용 데이터셋 : 28 x 28의 이미지의 10개의 클래스를 가지고 있는 FashionMNIST 데이터셋클래스 목록 : - T-shirt/top- Trouser- Pullover- Dress- Coat- Sandal- Shirt- Sneaker- Bag- Ankle boot사용 모델 비교 목표- One-Hot Encoding과 Embedding방식의 성능 차이 비교 - GAN과 LDM의 생성 이미..
[My IT : Article] 이미지 생성 모델 : GAN, VAE, Diffusion, Autoregressive
·
My IT/Article
1. AI가 그림을 그린다?최근에 이미지 생성 AI가 떠오름에 따라, 'AI가 그림을 그린다'라는 말이 떠올랐다. AI가 그림을 그린다는 말, 반은 맞고 반은 틀리다. AI는 그림을 그리는게 아니라 데이터로부터 이미지를 생성하는 것이다. 이 차이를 이해하는 것이 이미지 생성 모델을 이해하는 첫번째 키인데, AI는 수억장의 이미지를 학습해 '고양이는 이렇게 생겼다.', '하늘은 이런 색이다'라는 패턴을 통계적으로 학습한다. 그리고 우리가 텍스트를 입력하는 순간, 이미지 생성모델은 그 패턴을 조합해서 존재하지 않았던 이미지를 만들어내곤 한다. 따라서 확률로 그려낸 이미지라는 뜻이다. 그렇다면 이미지 생성 모델은 어떤 것들이 있을까? 2. 이미지 생성 모델1) GAN(Generative Adversarial ..
[My IT : Codes] U-Net 활용 Sementic Segmentation : Football Dataset(2) (하이퍼파라미터 튜닝 ~ 결론)
·
My IT/Codes
이전 코드 : https://uj07096.tistory.com/65 [My IT : Codes] U-Net 활용 Sementic Segmentation : Football Dataset(1) (시작~ 모델링)목표: U-Net을 이용해 축구 경기 영상 내의 다양한 객체(예: 골대, 심판, 선수, 관중 등)를 픽셀 단위로 분할하는 Semantic Segmentation 작업을 수행 파이프라인1. 데이터 불러오기 2. 데이터 EDA 3. 데이터uj07096.tistory.com 5. 하이퍼파라미터 튜닝모든 모델에 대해 하이퍼파라미터 튜닝을 진행하면 좋겠지만, 시간 효율성상 가장 빠르게 구동이 가능한 Custom U-Net으로 하이퍼파라미터 튜닝을 진행 후, 같은 하이퍼 파라미터로 다른 모델들의 학습도 진행하..
[My IT : Codes] U-Net 활용 Sementic Segmentation : Football Dataset(1) (시작~ 모델링)
·
My IT/Codes
목표: U-Net을 이용해 축구 경기 영상 내의 다양한 객체(예: 골대, 심판, 선수, 관중 등)를 픽셀 단위로 분할하는 Semantic Segmentation 작업을 수행 활용 데이터셋 Kaggle의 FootBall(Sementic Segmentation) 데이터셋 Football (Semantic Segmentation)100 frames of pixel-perfect semantic segmentation with 11 classes.www.kaggle.com 파이프라인1. 데이터 불러오기 2. 데이터 EDA 3. 데이터셋 생성 4. 모델링 5. 모델 하이퍼파라미터 튜닝 6. 모델 학습 / 시각화 7. 성능지표 비교 / 결론1. 데이터 불러오기Imports!pip install optuna!pip..
[My IT : Codes] 객체 인식 : 강아지/고양이 Detection(Faster R-CNN, SSD, YOLO)(2) 모델 학습 ~ 성능 지표 비교
·
My IT/Codes
시작 ~ 데이터셋 생성 : https://uj07096.tistory.com/52 [My IT] 객체 인식 : 강아지/고양이 Detection(Faster R-CNN, SSD, YOLO)(1) (목표 ~ 데이터셋 생성)목표 : SSD모델을 활용하여 강아지와 고양이의 얼굴을 감지하는 Detection 작업 수행활용 데이터셋 : Kaggle의 The Oxford-IIIT Pet Dataset The Oxford-IIIT Pet DatasetDataset of 37 categories of dogs and catswww.kaggle.com 사용uj07096.tistory.com 3. 모델 학습 / 예측 0) 모델 비교최대한 비슷한 조건에서 예측하기 위해서 파라미터 수가 비슷한 모델들을 불러왔다.사용할 모델 ..