[TIL] #4 2026-03-05

※CSV 파일 read - seq 인자 ??

- 실습으로 csv파일을 받아서 읽었는데, data x features의 데이터셋이 있을 줄 알았는데, 첫 행에는 특징들이 쌍따옴표로 묶이고, 세미콜론으로 나누어진 하나의 행이 있었고, 밑의 행들에도 열이 나누어져 있는게 아니라 하나의 행에 세미콜론으로 맨 위의 행에 해당하는 특징들의 값이 세미콜론으로 나누어져 있어서 당황했다..

처음에는 df.iloc[0,0]이런 것들로 하나씩 split해서 dataframe을 새로 만들려고 기를쓰고 싸웠는데,, 알고보니 매우 쉽게 해결이 가능했다 ㅠ

해결

df = pd.read_csv('bank-additional-full.csv', sep = ';')

read_csv의 sep 인자를 쓰면 ; 기준으로 다 나눌 수 있었다 !!!!

-데이터의 EDA를 진행하고 있는데, 시각화를 하는 상황에서 어려움에 많이 부딪혔다.. AI의 도움을 조금 받아버렸는데 시각화에 대한 연습이 조금 더 많이 필요할 듯 싶다

※리스트 컴프리헨션.. 알아보자

-DataFrame에서 최대값이나 최소값을 볼드처리하고 싶어서 찾아봤는데, 리스트 컴프리헨션에서 막혔다.. 이를 활용 가능하면 훨씬 코드를 짧고 가독성도 높일 수 있겠단 생각이 들었다.

if highlight == 'max':
        is_max = s == s.max()
        return ['font-weight: bold' if v else '' for v in is_max]

이렇게 짧은 함수가 리스트 컴프리헨션을 사용하지 않는다면

if highlight == 'max':
        max_value = s.max()  # 시리즈의 최대값
        for value in s:
            if value == max_value:
                styles.append('font-weight: bold')  # 최대값일 경우 볼드 스타일 추가
            else:
                styles.append('')  # 그렇지 않으면 빈 스타일 추가

이렇게 길어진다니

리스트 컴프리헨션 :

[<expression> for <element> in <iterable> if <condition>]

이해할때 까지 쳐다보기

'TIL' 카테고리의 다른 글

[TIL] #6 2026-03-10 (0)	2026.03.10
[TIL] #5 2026-03-06 (1)	2026.03.06
[TIL] #3 2026-03-04 (1)	2026.03.05
[TIL] 2026-02-27 TIL#2 (1)	2026.02.27
[TIL] 2026-02-24 ~ 02-25 TIL#1 (0)	2026.02.26

※CSV 파일 read - seq 인자 ??

※리스트 컴프리헨션.. 알아보자

'TIL' 카테고리의 다른 글

티스토리툴바