import pandas as pd
df = pd.read_csv('score.csv')
df


df.groupby('학교')


df.groupby('학교').get_group('북산고')


df.groupby('학교').get_group('능남고')


df.groupby('학교').mean() #계산 가능한 데이터들의 평균값


df.groupby('학교').size() #학교 별로 그룹핑된 것들이 몇개나 있는지 확인

학교
능남고    3
북산고    5
dtype: int64


df.groupby('학교').size()['능남고'] #학교로 그룹화를 한 뒤에 능남고에 해당하는 데이터의 수

3


df.groupby('학교')['키'].mean() #학교로 그룹화를 한 뒤에 키의 평균 데이터

학교
능남고    193.333333
북산고    184.800000
Name: 키, dtype: float64


df.groupby('학교')[['국어','영어','수학']].mean() #학교로 그룹화를 한 뒤에 국,영,수 평균데이터 확인


df['학년'] = [3,3,2,1,1,3,2,2] #학년 컬럼을 추가
df


df.groupby(['학교','학년']).mean()# 학교별 학년별 평균 데이터


df.groupby('학년').mean() #학년별 평균 데이터


df.groupby('학년').mean().sort_values('키')#학년별 키 오름차순 정렬


df.groupby('학년').mean().sort_values('키', ascending = False) #학년별 키 내림차순 정렬


df.groupby(['학교','학년']).sum()


#학교별로 sw특기 개수 확인
df.groupby('학교')['SW특기'].count()

학교
능남고    3
북산고    3
Name: SW특기, dtype: int64


#학교별로 이름, sw특기 개수 확인
df.groupby('학교')[['이름','SW특기']].count()


school = df.groupby('학교')
school['학년'].value_counts() #학교로 그룹핑을 한 뒤에 학년별 학생 수를 가져옴

학교   학년
능남고  2     2
     3     1
북산고  1     2
     3     2
     2     1
Name: 학년, dtype: int64


school['학년'].value_counts().loc['북산고']#학교로 그룹화 한뒤 북산고에 대해서 학년별 학생 수를 가져옴

학년
1    2
3    2
2    1
Name: 학년, dtype: int64


school['학년'].value_counts().loc['능남고']

학년
2    2
3    1
Name: 학년, dtype: int64


school['학년'].value_counts(normalize=True).loc['북산고'] #학생들의 수 데이터를 퍼센트로 비교해 가져옴

학년
1    0.4
3    0.4
2    0.2
Name: 학년, dtype: float64

15. 그룹화¶