[My IT : Codes] 객체 인식 : 강아지/고양이 Detection(Faster R-CNN, SSD, YOLO)(1) (목표 ~ 데이터셋 생성)
·
My IT/Codes
목표 : SSD모델을 활용하여 강아지와 고양이의 얼굴을 감지하는 Detection 작업 수행활용 데이터셋 : Kaggle의 The Oxford-IIIT Pet Dataset The Oxford-IIIT Pet DatasetDataset of 37 categories of dogs and catswww.kaggle.com 사용할 모델 리스트 : Faster R-CNN, SSD, YOLO위의 학습된 모델들을 불러와 데이터셋에 Full Fine-Tuning 하여 예측에 활용하기로 했다. ※모델별 특징 파이프라인 : 1. 데이터 EDA2. 데이터셋 생성3. 모델 학습/예측4. 모델 성능지표 비교 1. 데이터 EDA- pip/import!pip install xmltodict!pip install ultr..
[My IT : Codes]Bank-Marketing 데이터 분석(1) (데이터셋 설명 ~ 데이터 전처리)
·
My IT/Codes
분석 목표 분석 데이터셋(포르투갈 은행의 마케팅 데이터)를 분석하고, 분류 모델을 구축하여 마케팅 캠페인의 효율성을 높이는 전략을 도출한다. 분석 데이터셋2008~2010년까지의 포르투갈 은행 마케팅 캠페인 데이터(UC Irvine Machine Learning Repository 제공) 1. 데이터셋 살펴보기(EDA)a) 모듈 import!pip install shap #추후 SHAP Value 분석 예정import matplotlib.pyplot as pltimport matplotlib.font_manager as fmimport pandas as pdimport seaborn as snsimport numpy as npimport matplotlib.pyplot as pltfrom sklearn...
[My IT : Codes] Hotel Booking Demand Datasets 분석(1)(데이터셋 불러오기~ 이상치/결측치 처리)
·
My IT/Codes
목표 : 데이터 셋을 분석해 호텔 예약 취소에 영향을 주는 요인들에는 무엇이 있는지 찾아보기목차1. 데이터셋 설명2. 코드 & 설명데이터셋 불러오기이상치/결측치 처리특징에 따른 취소율 분석3. 결론 도출 Dataset 설명이 데이터는 Kaggle의 Hotel Booking Demand Datasets를 가져와 기본적으로 일부 수정을 가한 데이터로, 캐글에서 100% 동일하지는 않다. 2015.07.01 ~ 2017.08.31까지의 Resort Hotel과 City Hotel의 예약데이터를 포함하고 있다고 한다. 더 자세한 설명은 Dataset을 불러오면서 파악해보도록 하자. Import데이터 셋을 이용하기 위한 pandas, 시각화를 위한 matplotlib.pyplot과 seaborn을 import하였..
[My IT : Article] 선형대수학과 머신러닝, EDA, 데이터 전처리
·
My IT/Article
1. 선형대수학이란 어떤 학문이며, 왜 머신러닝에 필요할까?먼저 선형대수학의 사전적 정의에 대해 말해보자면 선형대수학은 벡터 공간, 벡터, 선형 변환, 행렬, 연립 선형 방정식 등을 연구하는 대수학의 한 분야로서, 현대 선형대수학에서는 주로 벡터 공간을 주 연구대상으로 삼는다고 한다. 내가 기억하기로는 고등학교 시절 기하와 벡터를 배우곤 했는데, 기하와 벡터 고등학교과정의 어려워진 학문이라고 생각하면 편할 듯 싶다. 선형대수학에서 쓰이는 기본적인 벡터와 벡터 공간만 알아보자면, 벡터스칼라 vs 벡터스칼라(속력) = 크기벡터(속도) = 크기 + 방향 기하학적으로 벡터를 말할때는 스칼라라는 것이 꼭 따라오곤 하는데, 위에 기술한 그대로 스칼라는 숫자 하나로 설명이 되는 양, 즉 예를 들면 무게(70kg), ..