일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- Chat GPT
- nft
- 머신러닝
- 이더리움
- GPT
- 데이터분석
- 이더
- ptyhon
- 비지도학습
- 영지식롤업
- 모듈러블록체인
- 옵티미스틱롤업
- 파이썬
- eda
- 레이어2솔루션
- K-Means
- 데이터전처리
- Clustering
- 블록체인트릴레마
- 결측치처리
- l2솔루션
- 비탈릭부테린
- 블록체인
- 결측치
- 확장성문제
- 데이터과학을위한통계
- 군집화
- 결측치제거
- Today
- Total
목록eda (2)
min
본 글은 https://wooono.tistory.com/103 / https://wikidocs.net/153202 의 내용을 참고하고 정리한 글입니다.결측치의 종류 random : 패턴 xno random: 패턴 o결측치 확인하기 df["col"].isnull() : 결측치 여부 확인df["col"].isnull().value_counts() : 결측치 개수 확인결측치 처리 방법 제거(deletion) dropna() : pandas에서 제공하는 결측치 제거 함수df.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False) axis: {0: index / 1: columns} 결측치 제거를 진행 할 레이블 thresh : 결측값 아닌 값이..
1.1 정형화된 데이터의 요소 수치형 데이터 (numeric) 💡 숫자를 이용해 표현할 수 있는 데이터 연속형 데이터 (continuous) : 일정 범위 안에서 어떤 값이든 취할 수 있는 데이터 이산 데이터 (discrete) : 횟수와 같은 정수 값만 취할 수 있는 데이터 범주형 데이터 (categorical) 💡 가능한 범주 안의 값만을 취하는 데이터 이진 데이터 (binary) : 두 개의 값 (0/1 or 참/거짓 만을 갖는 범주형 데이터의 특수한 경우) 순서형 데이터 (ordinal) : 값들 사이에 분명한 순위가 있는 범주형 데이터 1.2 테이블 데이터 💡 각 레코드(사건) 나타내는 행, 피쳐(변수)를 나타내는 열로 이루어진 이차원 행렬 데이터 프레임 (dataframe) 피처 (featur..