10일차 - Matplotlib, Seaborn matplotlib 차트나(chart)나 플롯(plot)로 데이터 시각화 - 라인 플롯(line plot) - 스캐터 플롯(scatter plot) - 컨투어 플롯(contour plot) - 서피스 플롯(surface plot) - 바 차트(bar chart) - 히스토그램(histogram) - 박스 플롯(box plot) import matplotlib as mpl import matplotlib.pyplot as plt %matplotlib inline 라인 플롯 그래프 그래프 스타일 지정 그래프를 여러 스타일로 지정할 수 있음. 그래프의 색 데이터의 위치를 표시하는 기호 선 스타일 ... 색 색 이름 기호 blue b green g red r cyan c magenta m yellow y bla.. 9일차 - Pandas 2 데이터 프레임의 데이터 조작 데이터 세기 ( count, value_counts ) count ( ) : 데이터 개수 세기. value_counts ( ) : 각 종류별로 몇 개의 데이터가 있는지 세어주는 것. df.value_counts(subset = None, normalize = False, sort=True, ascending=False, dropna=True) 속성 내용 subset 기준으로 삼을 열 입니다. list형태로도 입력이 가능.. normalize 갯수가 아니라 비율로 출력. sort 빈도 순서로 정렬할지 여부.기본값은 True입니다. ascending 오름차순으로 정렬할지 여부. dropna 결측치를 제외할지 여부. 데이터프레임 정렬 sort_index ( ) 인덱스를 기준으로 레.. 8일차 - Pandas 1 Pandas 표 형식의 데이터나 다양한 형태의 데이터를 다룸 시리즈(Series) 클래스와 데이터프레임(DataFrame) 클래스를 제공 Series 일련의 객체를 담을 수 있는 1차원 배열 같은 자료구조. 1치원 배열과 달리 값뿐만 아니라 각 값에 연결된 인덱스 값도 동시에 저장. 시리즈 객체는 라벨 값에 의해 인덱싱 가능하므로 인덱스 라벨 값을 키로 갖는 딕셔너리 자료형과 같다고 볼 수 있음.(in, items, key와 value 접근) pandas.Series( data, index, dtype, copy) data series를 구성할 데이터 index index 지정. dtype 각 항목에 적용될 타입. Series.values : Series 값 추출. Series.index : index .. 7일차 - Numpy 2 팬시 인덱싱 (Fancy indexing) 정수 배열 인덱스 리스트나 ndarray로 인덱스 집합을 지정하면 해당 위치의 인덱스에 해당하는 ndarray를 반환. 정수나 불린(Boolean) 값을 가지는 다른 Numpy 배열로 배열을 인덱싱할 수 있는 기능을 의미. Boolean 값을 가진 배열을 사용하여 직관적으로 인덱싱 가능 [ ] : 대괄호 사용 → [ [ ] , ] : 대괄호 안에 넣으면 반환 값이 ndarray가 됨. [ , ] : 대괄호 안에 , 사용 [ , ] , [ , ] : (0, 0) (1, 1)의 값이 들어가있는 ndarray를 반환. 슬라이싱을 할 때는 큰 범위로 붙어있는 값만 추출할 수 있지만 팬시 인덱싱은 원하는 요소만 추출할 수 있음. 배열 크기 변환 reshpae(차원) 배열.. 6일차 - Numpy 1 아나콘다 설치하기 https://www.anaconda.com/ 주피터 노트북 실행하기 셀 사이에 주석 대신 텍스트로 입력 가능. Cell → Cell Type → Markdown NumPy(Numerical Python) 제공 빠르고 효율적인 다차원 배열 객체 ndarray 배열 원소를 다루거나 배열 간의 수학 계산을 수행하는 함수 디스크로부터 배열 기반의 데이터를 읽거나 쓸 수 있는 도구 선형대수 계산, 푸리에 변환, 난수 생성기 파이썬 확장과 C, C++ 코드에서 NumPy 의 자료 구조에 접근할 수 있음 대용량 데이터 배열을 효율적으로 다룰 수 있음. 내부적으로 데이터를 다른 내장 파이썬 객체와 분리된 연속된 메모리 블록에 저장 내장 파이썬의 연속된 자료형들보다 더 적은 메모리 사용 파이썬 반복문.. 이전 1 다음