※CSV 파일 read - seq 인자 ??
- 실습으로 csv파일을 받아서 읽었는데, data x features의 데이터셋이 있을 줄 알았는데, 첫 행에는 특징들이 쌍따옴표로 묶이고, 세미콜론으로 나누어진 하나의 행이 있었고, 밑의 행들에도 열이 나누어져 있는게 아니라 하나의 행에 세미콜론으로 맨 위의 행에 해당하는 특징들의 값이 세미콜론으로 나누어져 있어서 당황했다..

처음에는 df.iloc[0,0]이런 것들로 하나씩 split해서 dataframe을 새로 만들려고 기를쓰고 싸웠는데,, 알고보니 매우 쉽게 해결이 가능했다 ㅠ
해결
df = pd.read_csv('bank-additional-full.csv', sep = ';')
read_csv의 sep 인자를 쓰면 ; 기준으로 다 나눌 수 있었다 !!!!
-데이터의 EDA를 진행하고 있는데, 시각화를 하는 상황에서 어려움에 많이 부딪혔다.. AI의 도움을 조금 받아버렸는데 시각화에 대한 연습이 조금 더 많이 필요할 듯 싶다
※리스트 컴프리헨션.. 알아보자
-DataFrame에서 최대값이나 최소값을 볼드처리하고 싶어서 찾아봤는데, 리스트 컴프리헨션에서 막혔다.. 이를 활용 가능하면 훨씬 코드를 짧고 가독성도 높일 수 있겠단 생각이 들었다.
if highlight == 'max':
is_max = s == s.max()
return ['font-weight: bold' if v else '' for v in is_max]
이렇게 짧은 함수가 리스트 컴프리헨션을 사용하지 않는다면
if highlight == 'max':
max_value = s.max() # 시리즈의 최대값
for value in s:
if value == max_value:
styles.append('font-weight: bold') # 최대값일 경우 볼드 스타일 추가
else:
styles.append('') # 그렇지 않으면 빈 스타일 추가
이렇게 길어진다니
리스트 컴프리헨션 :
[<expression> for <element> in <iterable> if <condition>]

이해할때 까지 쳐다보기
'TIL' 카테고리의 다른 글
| [TIL] #6 2026-03-10 (0) | 2026.03.10 |
|---|---|
| [TIL] #5 2026-03-06 (1) | 2026.03.06 |
| [TIL] #3 2026-03-04 (1) | 2026.03.05 |
| [TIL] 2026-02-27 TIL#2 (1) | 2026.02.27 |
| [TIL] 2026-02-24 ~ 02-25 TIL#1 (0) | 2026.02.26 |
