{
"cells": [
{
"cell_type": "markdown",
"metadata": {},
"source": [
"# 学業成績の分析"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"
\n",
" in English or the language of your choice.\n",
"
"
]
},
{
"cell_type": "code",
"execution_count": 1,
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"Intel MKL WARNING: Support of Intel(R) Streaming SIMD Extensions 4.2 (Intel(R) SSE4.2) enabled only processors has been deprecated. Intel oneAPI Math Kernel Library 2025.0 will require Intel(R) Advanced Vector Extensions (Intel(R) AVX) instructions.\n",
"Intel MKL WARNING: Support of Intel(R) Streaming SIMD Extensions 4.2 (Intel(R) SSE4.2) enabled only processors has been deprecated. Intel oneAPI Math Kernel Library 2025.0 will require Intel(R) Advanced Vector Extensions (Intel(R) AVX) instructions.\n"
]
}
],
"source": [
"import pandas as pd\n",
"import matplotlib.pyplot as plt\n",
"\n",
"# 警告メッセージを非表示\n",
"import warnings\n",
"warnings.filterwarnings(\"ignore\")"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"授業の成績(優秀良可不可)とGP(Grade Point)を使った成績の分析を行う。成績表のコピーは神戸大学の「うりぼーネット」を用いる例を考えるが、Web上で成績表が表示されるのであればコードを少し修正するだけで分析が行えるであろう。"
]
},
{
"cell_type": "markdown",
"metadata": {
"heading_collapsed": true
},
"source": [
"## データの読み込み"
]
},
{
"cell_type": "markdown",
"metadata": {
"heading_collapsed": true,
"hidden": true
},
"source": [
"### 学生"
]
},
{
"cell_type": "markdown",
"metadata": {
"hidden": true
},
"source": [
"「うりぼー」→ 成績修得情報 → 成績表を選択しコピー"
]
},
{
"cell_type": "code",
"execution_count": 2,
"metadata": {
"hidden": true
},
"outputs": [],
"source": [
"#ーーーーー dfに成績表を割り当てる ーーーーー\n",
"\n",
"# df = pd.read_clipboard()\n",
"# df.head()"
]
},
{
"cell_type": "code",
"execution_count": 3,
"metadata": {
"hidden": true
},
"outputs": [],
"source": [
"#ーーーーー csvに保存 ーーーーー\n",
"\n",
"# df.to_csv('成績表20200708.csv')"
]
},
{
"cell_type": "code",
"execution_count": 4,
"metadata": {
"hidden": true
},
"outputs": [],
"source": [
"#ーーーーー 保存先のフォルダの確認 ーーーーー\n",
"\n",
"# %pwd"
]
},
{
"cell_type": "markdown",
"metadata": {
"heading_collapsed": true,
"hidden": true
},
"source": [
"### 例"
]
},
{
"cell_type": "markdown",
"metadata": {
"hidden": true
},
"source": [
"例のファイルを使う場合。"
]
},
{
"cell_type": "code",
"execution_count": 5,
"metadata": {
"hidden": true,
"tags": [
"output_scroll"
]
},
"outputs": [
{
"data": {
"text/html": [
"\n",
"\n",
"
\n",
" \n",
" \n",
" | \n",
" No. | \n",
" 区分 | \n",
" 科目大区分 | \n",
" 科目中区分 | \n",
" 科目ナンバー | \n",
" 科目 | \n",
" 単位数 | \n",
" 修得年度 | \n",
" 修得学期 | \n",
" 評語 | \n",
" 科目GP | \n",
" 合否 | \n",
"
\n",
" \n",
" \n",
" \n",
" 0 | \n",
" 1 | \n",
" 全学共通授業科目 | \n",
" 基礎教養科目 | \n",
" NaN | \n",
" U1AA100 | \n",
" XX学 | \n",
" 1 | \n",
" 2020 | \n",
" 前期 | \n",
" 合格 | \n",
" - | \n",
" 合 | \n",
"
\n",
" \n",
" 1 | \n",
" 2 | \n",
" 全学共通授業科目 | \n",
" 基礎教養科目 | \n",
" NaN | \n",
" U1AA100 | \n",
" XX学 | \n",
" 1 | \n",
" 2020 | \n",
" 前期 | \n",
" 合格 | \n",
" - | \n",
" 合 | \n",
"
\n",
" \n",
" 2 | \n",
" 3 | \n",
" 全学共通授業科目 | \n",
" 基礎教養科目 | \n",
" NaN | \n",
" U1AA100 | \n",
" XX学 | \n",
" 1 | \n",
" 2020 | \n",
" 前期 | \n",
" 可 | \n",
" 2 | \n",
" 合 | \n",
"
\n",
" \n",
" 3 | \n",
" 4 | \n",
" 全学共通授業科目 | \n",
" 基礎教養科目 | \n",
" NaN | \n",
" U1AB100 | \n",
" XX学A | \n",
" 1 | \n",
" 2020 | \n",
" 後期 | \n",
" 秀 | \n",
" 4.3 | \n",
" 合 | \n",
"
\n",
" \n",
" 4 | \n",
" 5 | \n",
" 全学共通授業科目 | \n",
" 基礎教養科目 | \n",
" NaN | \n",
" U1AB100 | \n",
" XX学B | \n",
" 1 | \n",
" 2019 | \n",
" 後期 | \n",
" 可 | \n",
" 2 | \n",
" 合 | \n",
"
\n",
" \n",
" 5 | \n",
" 6 | \n",
" 全学共通授業科目 | \n",
" 基礎教養科目 | \n",
" NaN | \n",
" U1AD100 | \n",
" X学A | \n",
" 1 | \n",
" 2019 | \n",
" 後期 | \n",
" 優 | \n",
" 4 | \n",
" 合 | \n",
"
\n",
" \n",
" 6 | \n",
" 7 | \n",
" 全学共通授業科目 | \n",
" 基礎教養科目 | \n",
" NaN | \n",
" U1AD100 | \n",
" X学B | \n",
" 1 | \n",
" 2019 | \n",
" 前期 | \n",
" 秀 | \n",
" 4.3 | \n",
" 合 | \n",
"
\n",
" \n",
" 7 | \n",
" 8 | \n",
" 全学共通授業科目 | \n",
" 基礎教養科目 | \n",
" NaN | \n",
" U1AA100 | \n",
" X学 | \n",
" 1 | \n",
" 2018 | \n",
" 前期 | \n",
" 可 | \n",
" 2 | \n",
" 合 | \n",
"
\n",
" \n",
" 8 | \n",
" 9 | \n",
" 全学共通授業科目 | \n",
" 基礎教養科目 | \n",
" NaN | \n",
" U1AB100 | \n",
" X学A | \n",
" 1 | \n",
" 2018 | \n",
" 後期 | \n",
" 秀 | \n",
" 4.3 | \n",
" 合 | \n",
"
\n",
" \n",
" 9 | \n",
" 10 | \n",
" 全学共通授業科目 | \n",
" 基礎教養科目 | \n",
" NaN | \n",
" U1AB100 | \n",
" X学B | \n",
" 1 | \n",
" 2018 | \n",
" 後期 | \n",
" 可 | \n",
" 2 | \n",
" 合 | \n",
"
\n",
" \n",
" 10 | \n",
" 11 | \n",
" 全学共通授業科目 | \n",
" 基礎教養科目 | \n",
" NaN | \n",
" U1AD100 | \n",
" X学A | \n",
" 1 | \n",
" 2018 | \n",
" 後期 | \n",
" 優 | \n",
" 4 | \n",
" 合 | \n",
"
\n",
" \n",
" 11 | \n",
" 12 | \n",
" 全学共通授業科目 | \n",
" 基礎教養科目 | \n",
" NaN | \n",
" U1AD100 | \n",
" X学B | \n",
" 1 | \n",
" 2019 | \n",
" 前期 | \n",
" 秀 | \n",
" 4.3 | \n",
" 合 | \n",
"
\n",
" \n",
" 12 | \n",
" 13 | \n",
" 高度教養科目 | \n",
" 高度教養科目 | \n",
" NaN | \n",
" U1AA100 | \n",
" X学 | \n",
" 1 | \n",
" 2019 | \n",
" 前期 | \n",
" 可 | \n",
" 2 | \n",
" 合 | \n",
"
\n",
" \n",
" 13 | \n",
" 14 | \n",
" 高度教養科目 | \n",
" 高度教養科目 | \n",
" NaN | \n",
" U1AA100 | \n",
" X学 | \n",
" 1 | \n",
" 2019 | \n",
" 前期 | \n",
" 可 | \n",
" 2 | \n",
" 合 | \n",
"
\n",
" \n",
" 14 | \n",
" 15 | \n",
" 高度教養科目 | \n",
" 高度教養科目 | \n",
" NaN | \n",
" U1AA100 | \n",
" X学 | \n",
" 1 | \n",
" 2020 | \n",
" 前期 | \n",
" 優 | \n",
" 4 | \n",
" 合 | \n",
"
\n",
" \n",
" 15 | \n",
" 16 | \n",
" 専門科目 | \n",
" 専門科目 | \n",
" NaN | \n",
" U1AA100 | \n",
" XX学 | \n",
" 2 | \n",
" 2020 | \n",
" 前期 | \n",
" 可 | \n",
" 2 | \n",
" 合 | \n",
"
\n",
" \n",
" 16 | \n",
" 17 | \n",
" 専門科目 | \n",
" 専門科目 | \n",
" NaN | \n",
" U1AB100 | \n",
" XX学A | \n",
" 1 | \n",
" 2020 | \n",
" 後期 | \n",
" 秀 | \n",
" 4.3 | \n",
" 合 | \n",
"
\n",
" \n",
" 17 | \n",
" 18 | \n",
" 専門科目 | \n",
" 専門科目 | \n",
" NaN | \n",
" U1AB100 | \n",
" XX学B | \n",
" 4 | \n",
" 2020 | \n",
" 後期 | \n",
" 可 | \n",
" 2 | \n",
" 合 | \n",
"
\n",
" \n",
" 18 | \n",
" 19 | \n",
" 専門科目 | \n",
" 専門科目 | \n",
" NaN | \n",
" U1AD100 | \n",
" X学A | \n",
" 1 | \n",
" 2019 | \n",
" 後期 | \n",
" 優 | \n",
" 4 | \n",
" 合 | \n",
"
\n",
" \n",
" 19 | \n",
" 20 | \n",
" 専門科目 | \n",
" 専門科目 | \n",
" NaN | \n",
" U1AD100 | \n",
" X学B | \n",
" 1 | \n",
" 2019 | \n",
" 前期 | \n",
" 秀 | \n",
" 4.3 | \n",
" 合 | \n",
"
\n",
" \n",
" 20 | \n",
" 21 | \n",
" 専門科目 | \n",
" 専門科目 | \n",
" NaN | \n",
" U1AA100 | \n",
" X学 | \n",
" 1 | \n",
" 2019 | \n",
" 前期 | \n",
" 可 | \n",
" 2 | \n",
" 合 | \n",
"
\n",
" \n",
" 21 | \n",
" 22 | \n",
" 専門科目 | \n",
" 専門科目 | \n",
" NaN | \n",
" U1AB100 | \n",
" X学A | \n",
" 2 | \n",
" 2019 | \n",
" 後期 | \n",
" 秀 | \n",
" 4.3 | \n",
" 合 | \n",
"
\n",
" \n",
" 22 | \n",
" 23 | \n",
" 専門科目 | \n",
" 専門科目 | \n",
" NaN | \n",
" U1AB100 | \n",
" X学B | \n",
" 2 | \n",
" 2018 | \n",
" 後期 | \n",
" 可 | \n",
" 2 | \n",
" 合 | \n",
"
\n",
" \n",
" 23 | \n",
" 24 | \n",
" 専門科目 | \n",
" 専門科目 | \n",
" NaN | \n",
" U1AD100 | \n",
" X学A | \n",
" 2 | \n",
" 2018 | \n",
" 後期 | \n",
" 優 | \n",
" 4 | \n",
" 合 | \n",
"
\n",
" \n",
" 24 | \n",
" 25 | \n",
" 専門科目 | \n",
" 専門科目 | \n",
" NaN | \n",
" U1AD100 | \n",
" X学A | \n",
" 2 | \n",
" 2018 | \n",
" 後期 | \n",
" 良 | \n",
" 3 | \n",
" 合 | \n",
"
\n",
" \n",
" 25 | \n",
" 26 | \n",
" 専門科目 | \n",
" 専門科目 | \n",
" NaN | \n",
" U1AD100 | \n",
" X学B | \n",
" 1 | \n",
" 2018 | \n",
" 前期 | \n",
" 取消 | \n",
" - | \n",
" NaN | \n",
"
\n",
" \n",
" 26 | \n",
" 27 | \n",
" 専門科目 | \n",
" 専門科目 | \n",
" NaN | \n",
" U1AD100 | \n",
" X学B | \n",
" 1 | \n",
" 2018 | \n",
" 前期 | \n",
" 不可 | \n",
" 0 | \n",
" NaN | \n",
"
\n",
" \n",
" 27 | \n",
" 28 | \n",
" 専門科目 | \n",
" 専門科目 | \n",
" NaN | \n",
" U1AD100 | \n",
" X学B | \n",
" 1 | \n",
" 2018 | \n",
" 前期 | \n",
" 不可 | \n",
" * | \n",
" 否 | \n",
"
\n",
" \n",
" 28 | \n",
" 29 | \n",
" 専門科目 | \n",
" 専門科目 | \n",
" NaN | \n",
" U1AD100 | \n",
" X学B | \n",
" 1 | \n",
" 2018 | \n",
" 前期 | \n",
" 取消 | \n",
" - | \n",
" NaN | \n",
"
\n",
" \n",
" 29 | \n",
" 30 | \n",
" 専門科目 | \n",
" 専門科目 | \n",
" NaN | \n",
" U1AD100 | \n",
" X学B | \n",
" 1 | \n",
" 2018 | \n",
" 前期 | \n",
" 認定 | \n",
" - | \n",
" 合 | \n",
"
\n",
" \n",
"
\n",
"
"
],
"text/plain": [
" No. 区分 科目大区分 科目中区分 科目ナンバー 科目 単位数 修得年度 修得学期 評語 科目GP 合否\n",
"0 1 全学共通授業科目 基礎教養科目 NaN U1AA100 XX学 1 2020 前期 合格 - 合\n",
"1 2 全学共通授業科目 基礎教養科目 NaN U1AA100 XX学 1 2020 前期 合格 - 合\n",
"2 3 全学共通授業科目 基礎教養科目 NaN U1AA100 XX学 1 2020 前期 可 2 合\n",
"3 4 全学共通授業科目 基礎教養科目 NaN U1AB100 XX学A 1 2020 後期 秀 4.3 合\n",
"4 5 全学共通授業科目 基礎教養科目 NaN U1AB100 XX学B 1 2019 後期 可 2 合\n",
"5 6 全学共通授業科目 基礎教養科目 NaN U1AD100 X学A 1 2019 後期 優 4 合\n",
"6 7 全学共通授業科目 基礎教養科目 NaN U1AD100 X学B 1 2019 前期 秀 4.3 合\n",
"7 8 全学共通授業科目 基礎教養科目 NaN U1AA100 X学 1 2018 前期 可 2 合\n",
"8 9 全学共通授業科目 基礎教養科目 NaN U1AB100 X学A 1 2018 後期 秀 4.3 合\n",
"9 10 全学共通授業科目 基礎教養科目 NaN U1AB100 X学B 1 2018 後期 可 2 合\n",
"10 11 全学共通授業科目 基礎教養科目 NaN U1AD100 X学A 1 2018 後期 優 4 合\n",
"11 12 全学共通授業科目 基礎教養科目 NaN U1AD100 X学B 1 2019 前期 秀 4.3 合\n",
"12 13 高度教養科目 高度教養科目 NaN U1AA100 X学 1 2019 前期 可 2 合\n",
"13 14 高度教養科目 高度教養科目 NaN U1AA100 X学 1 2019 前期 可 2 合\n",
"14 15 高度教養科目 高度教養科目 NaN U1AA100 X学 1 2020 前期 優 4 合\n",
"15 16 専門科目 専門科目 NaN U1AA100 XX学 2 2020 前期 可 2 合\n",
"16 17 専門科目 専門科目 NaN U1AB100 XX学A 1 2020 後期 秀 4.3 合\n",
"17 18 専門科目 専門科目 NaN U1AB100 XX学B 4 2020 後期 可 2 合\n",
"18 19 専門科目 専門科目 NaN U1AD100 X学A 1 2019 後期 優 4 合\n",
"19 20 専門科目 専門科目 NaN U1AD100 X学B 1 2019 前期 秀 4.3 合\n",
"20 21 専門科目 専門科目 NaN U1AA100 X学 1 2019 前期 可 2 合\n",
"21 22 専門科目 専門科目 NaN U1AB100 X学A 2 2019 後期 秀 4.3 合\n",
"22 23 専門科目 専門科目 NaN U1AB100 X学B 2 2018 後期 可 2 合\n",
"23 24 専門科目 専門科目 NaN U1AD100 X学A 2 2018 後期 優 4 合\n",
"24 25 専門科目 専門科目 NaN U1AD100 X学A 2 2018 後期 良 3 合\n",
"25 26 専門科目 専門科目 NaN U1AD100 X学B 1 2018 前期 取消 - NaN\n",
"26 27 専門科目 専門科目 NaN U1AD100 X学B 1 2018 前期 不可 0 NaN\n",
"27 28 専門科目 専門科目 NaN U1AD100 X学B 1 2018 前期 不可 * 否\n",
"28 29 専門科目 専門科目 NaN U1AD100 X学B 1 2018 前期 取消 - NaN\n",
"29 30 専門科目 専門科目 NaN U1AD100 X学B 1 2018 前期 認定 - 合"
]
},
"execution_count": 5,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"df = pd.read_csv('https://raw.githubusercontent.com/Haruyama-KobeU/Py4Basics/master/data/data_for_mark.csv')\n",
"df"
]
},
{
"cell_type": "markdown",
"metadata": {
"heading_collapsed": true
},
"source": [
"## 列の内容の確認"
]
},
{
"cell_type": "markdown",
"metadata": {
"hidden": true
},
"source": [
"ステップ1:列のラベルの表示"
]
},
{
"cell_type": "code",
"execution_count": 6,
"metadata": {
"hidden": true
},
"outputs": [
{
"data": {
"text/plain": [
"Index(['No.', '区分', '科目大区分', '科目中区分', '科目ナンバー', '科目', '単位数', '修得年度', '修得学期',\n",
" '評語', '科目GP', '合否'],\n",
" dtype='object')"
]
},
"execution_count": 6,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"col = df.columns\n",
"col"
]
},
{
"cell_type": "code",
"execution_count": 7,
"metadata": {
"hidden": true
},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"No.\n",
"区分\n",
"科目大区分\n",
"科目中区分\n",
"科目ナンバー\n",
"科目\n",
"単位数\n",
"修得年度\n",
"修得学期\n",
"評語\n",
"科目GP\n",
"合否\n"
]
}
],
"source": [
"for c in col:\n",
" print(c)"
]
},
{
"cell_type": "markdown",
"metadata": {
"hidden": true
},
"source": [
"ステップ2:それぞれの列の要素の種類を表示方法"
]
},
{
"cell_type": "code",
"execution_count": 8,
"metadata": {
"hidden": true
},
"outputs": [
{
"data": {
"text/plain": [
"array(['全学共通授業科目', '高度教養科目', '専門科目'], dtype=object)"
]
},
"execution_count": 8,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"df['区分'].unique()"
]
},
{
"cell_type": "markdown",
"metadata": {
"hidden": true
},
"source": [
"スッテプ3:スッテプ1と2を同時に"
]
},
{
"cell_type": "code",
"execution_count": 9,
"metadata": {
"hidden": true
},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"区分 ['全学共通授業科目' '高度教養科目' '専門科目']\n",
"科目大区分 ['基礎教養科目' '高度教養科目' '専門科目']\n",
"科目中区分 [nan]\n",
"科目ナンバー ['U1AA100' 'U1AB100' 'U1AD100']\n",
"科目 ['XX学' 'XX学A' 'XX学B' 'X学A' 'X学B' 'X学']\n",
"単位数 [1 2 4]\n",
"修得年度 [2020 2019 2018]\n",
"修得学期 ['前期' '後期']\n",
"評語 ['合格' '可' '秀' '優' '良' '取消' '不可' '認定']\n",
"科目GP ['-' '2' '4.3' '4' '3' '0' '*']\n",
"合否 ['合' nan '否']\n"
]
}
],
"source": [
"for c in col[1:]: # Noの列を除外\n",
" x = df[c].unique()\n",
" print(c, x)"
]
},
{
"cell_type": "markdown",
"metadata": {
"heading_collapsed": true
},
"source": [
"## `DataFrame`の作成"
]
},
{
"cell_type": "code",
"execution_count": 10,
"metadata": {
"hidden": true
},
"outputs": [],
"source": [
"cond1 = ( df['区分']=='全学共通授業科目' )\n",
"cond2 = ( df['区分']=='高度教養科目' )\n",
"cond1or2 = ( cond1 | cond2)\n",
"cond3 = ( df['区分']=='専門科目' )\n",
"\n",
"df_other = df.loc[cond1or2,:]\n",
"df_econ = df.loc[cond3,:]"
]
},
{
"cell_type": "code",
"execution_count": 11,
"metadata": {
"hidden": true
},
"outputs": [
{
"data": {
"text/plain": [
"(30, 15, 15)"
]
},
"execution_count": 11,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"len(df),len(df_other),len(df_econ)"
]
},
{
"cell_type": "markdown",
"metadata": {
"hidden": true
},
"source": [
"全角文字を使わない方法"
]
},
{
"cell_type": "code",
"execution_count": 12,
"metadata": {
"hidden": true
},
"outputs": [
{
"data": {
"text/plain": [
"array(['全学共通授業科目', '高度教養科目', '専門科目'], dtype=object)"
]
},
"execution_count": 12,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"kubun = df.loc[:,col[1]]\n",
"\n",
"kubun_arr = kubun.unique()\n",
"kubun_arr"
]
},
{
"cell_type": "code",
"execution_count": 13,
"metadata": {
"hidden": true
},
"outputs": [],
"source": [
"cond1 = ( kubun==kubun_arr[0] )\n",
"cond2 = ( kubun==kubun_arr[1] )\n",
"cond1or2 = ( cond1 | cond2)\n",
"cond3 = ( kubun==kubun_arr[2] )\n",
"\n",
"df_other = df.loc[cond1or2,:]\n",
"df_econ = df.loc[cond3,:]"
]
},
{
"cell_type": "code",
"execution_count": 14,
"metadata": {
"hidden": true
},
"outputs": [
{
"data": {
"text/plain": [
"(30, 15, 15)"
]
},
"execution_count": 14,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"len(df),len(df_other),len(df_econ)"
]
},
{
"cell_type": "markdown",
"metadata": {
"heading_collapsed": true
},
"source": [
"## 全科目"
]
},
{
"cell_type": "markdown",
"metadata": {
"heading_collapsed": true,
"hidden": true
},
"source": [
"### `f-string`"
]
},
{
"cell_type": "markdown",
"metadata": {
"hidden": true
},
"source": [
"`f-string`を使うと文字列の`{}`の中の変数を評価して表示することが可能となる。"
]
},
{
"cell_type": "code",
"execution_count": 15,
"metadata": {
"hidden": true
},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"私は春山ゼミに所属しています。\n"
]
}
],
"source": [
"x='春山'\n",
"print(f'私は{x}ゼミに所属しています。')"
]
},
{
"cell_type": "code",
"execution_count": 16,
"metadata": {
"hidden": true
},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"合計は6です。\n"
]
}
],
"source": [
"l = [1,2,3]\n",
"print(f'合計は{sum(l)}です。')"
]
},
{
"cell_type": "markdown",
"metadata": {
"hidden": true
},
"source": [
"### 優・秀・良・可・不可などの数"
]
},
{
"cell_type": "markdown",
"metadata": {
"heading_collapsed": true,
"hidden": true
},
"source": [
"#### 簡単な方法"
]
},
{
"cell_type": "markdown",
"metadata": {
"hidden": true
},
"source": [
"`value_counts()`を使うと簡単になる。"
]
},
{
"cell_type": "code",
"execution_count": 17,
"metadata": {
"hidden": true
},
"outputs": [
{
"data": {
"text/plain": [
"可 10\n",
"秀 7\n",
"優 5\n",
"合格 2\n",
"取消 2\n",
"不可 2\n",
"良 1\n",
"認定 1\n",
"Name: 評語, dtype: int64"
]
},
"execution_count": 17,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"df.loc[:,'評語'].value_counts()"
]
},
{
"cell_type": "markdown",
"metadata": {
"hidden": true
},
"source": [
"#### 表示を整理したい場合"
]
},
{
"cell_type": "markdown",
"metadata": {
"hidden": true
},
"source": [
"評語の種類"
]
},
{
"cell_type": "code",
"execution_count": 18,
"metadata": {
"hidden": true
},
"outputs": [
{
"data": {
"text/plain": [
"array(['合格', '可', '秀', '優', '良', '取消', '不可', '認定'], dtype=object)"
]
},
"execution_count": 18,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"m = df.loc[:,'評語'].unique()\n",
"m"
]
},
{
"cell_type": "code",
"execution_count": 19,
"metadata": {
"hidden": true
},
"outputs": [
{
"data": {
"text/plain": [
"['秀', '優', '良', '可', '合格', '認定', '不可', '取消']"
]
},
"execution_count": 19,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"mark = [m[2],m[3],m[4],m[1],m[0],m[-1],m[-2],m[-3]]\n",
"mark"
]
},
{
"cell_type": "code",
"execution_count": 20,
"metadata": {
"hidden": true
},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"秀\n",
"優\n",
"良\n",
"可\n",
"合格\n",
"認定\n",
"不可\n",
"取消\n",
"------- \n",
"合計\n"
]
}
],
"source": [
"for m in mark:\n",
" print(m)\n",
"\n",
"print('-'*7,'\\n合計')"
]
},
{
"cell_type": "code",
"execution_count": 21,
"metadata": {
"hidden": true
},
"outputs": [
{
"data": {
"text/plain": [
"[7, 5, 1, 10, 2, 1, 2, 2]"
]
},
"execution_count": 21,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"lst = []\n",
"\n",
"for m in mark:\n",
" \n",
" cond = ( df['評語']==m )\n",
" df0 = df.loc[cond,:]\n",
" no = len(df0)\n",
" lst.append(no)\n",
"\n",
"lst"
]
},
{
"cell_type": "code",
"execution_count": 22,
"metadata": {
"hidden": true
},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"秀 7\n",
"優 5\n",
"良 1\n",
"可 10\n",
"合格 2\n",
"認定 1\n",
"不可 2\n",
"取消 2\n",
"------- \n",
"合計 30\n"
]
}
],
"source": [
"lst = []\n",
"\n",
"for m in mark:\n",
" \n",
" cond = ( df['評語']==m )\n",
" df0 = df.loc[cond,:]\n",
" no = len(df0)\n",
" lst.append(no)\n",
" \n",
" print(m, no)\n",
"\n",
"print('-'*7,'\\n合計',sum(lst))"
]
},
{
"cell_type": "markdown",
"metadata": {
"heading_collapsed": true,
"hidden": true
},
"source": [
"### 優・秀・良・可・不可などの%"
]
},
{
"cell_type": "markdown",
"metadata": {
"hidden": true
},
"source": [
"#### 簡単な方法"
]
},
{
"cell_type": "code",
"execution_count": 23,
"metadata": {
"hidden": true
},
"outputs": [
{
"data": {
"text/plain": [
"可 33.3\n",
"秀 23.3\n",
"優 16.7\n",
"合格 6.7\n",
"取消 6.7\n",
"不可 6.7\n",
"良 3.3\n",
"認定 3.3\n",
"Name: 評語, dtype: float64"
]
},
"execution_count": 23,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"(\n",
" 100*df.loc[:,'評語'].value_counts(normalize=True)\n",
").round(1)"
]
},
{
"cell_type": "markdown",
"metadata": {
"heading_collapsed": true,
"hidden": true
},
"source": [
"#### 表示を整理したい場合"
]
},
{
"cell_type": "markdown",
"metadata": {
"hidden": true
},
"source": [
"%だけを表示する。"
]
},
{
"cell_type": "code",
"execution_count": 24,
"metadata": {
"hidden": true
},
"outputs": [
{
"data": {
"text/plain": [
"[23.333333333333332,\n",
" 16.666666666666668,\n",
" 3.3333333333333335,\n",
" 33.333333333333336,\n",
" 6.666666666666667,\n",
" 3.3333333333333335,\n",
" 6.666666666666667,\n",
" 6.666666666666667]"
]
},
"execution_count": 24,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"lst = []\n",
"\n",
"for m in mark:\n",
" \n",
" cond = ( df['評語']==m )\n",
" df0 = df.loc[cond,:]\n",
" percent = 100 * len(df0) / len(df)\n",
" lst.append(percent)\n",
"\n",
"lst"
]
},
{
"cell_type": "markdown",
"metadata": {
"hidden": true
},
"source": [
"%と評語も表示する。"
]
},
{
"cell_type": "code",
"execution_count": 25,
"metadata": {
"hidden": true
},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"秀: 23.333333333333332\n",
"優: 16.666666666666668\n",
"良: 3.3333333333333335\n",
"可: 33.333333333333336\n",
"合格: 6.666666666666667\n",
"認定: 3.3333333333333335\n",
"不可: 6.666666666666667\n",
"取消: 6.666666666666667\n",
"------------------------------ \n",
"合計: 100.00000000000001\n"
]
}
],
"source": [
"lst = []\n",
"\n",
"for m in mark:\n",
"\n",
" cond = ( df['評語']==m )\n",
" df0 = df.loc[cond,:]\n",
" percent = 100 * len(df0) / len(df)\n",
" lst.append(percent)\n",
" \n",
" print(f'{m}: {percent}')\n",
" \n",
"print('-'*30,f'\\n合計: {sum(lst)}')"
]
},
{
"cell_type": "markdown",
"metadata": {
"hidden": true
},
"source": [
"小数点の表示を調整する。"
]
},
{
"cell_type": "code",
"execution_count": 26,
"metadata": {
"hidden": true
},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"秀 23.3\n",
"優 16.7\n",
"良 3.3\n",
"可 33.3\n",
"合格 6.7\n",
"認定 3.3\n",
"不可 6.7\n",
"取消 6.7\n",
"---------- \n",
"合計: 100\n"
]
}
],
"source": [
"lst = []\n",
"\n",
"for m in mark:\n",
"\n",
" cond = ( df['評語']==m )\n",
" df0 = df.loc[cond,:]\n",
" percent = 100 * len(df0) / len(df)\n",
" lst.append(percent)\n",
"\n",
" print(f'{m} {percent:.1f}') # 小数点第ー位まで表示\n",
" \n",
"print('-'*10,f'\\n合計: {sum(lst):.0f}') # 小数点は表示しない"
]
},
{
"cell_type": "markdown",
"metadata": {
"hidden": true
},
"source": [
"`%`を追加し,表示も揃える。"
]
},
{
"cell_type": "code",
"execution_count": 27,
"metadata": {
"hidden": true
},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"秀 23.3\n",
"優 16.7\n",
"良 3.3\n",
"可 33.3\n",
"合格 6.7\n",
"認定 3.3\n",
"不可 6.7\n",
"取消 6.7\n",
"---------- \n",
"合計: 100\n"
]
}
],
"source": [
"lst = []\n",
"\n",
"for m in mark:\n",
"\n",
" cond = ( df['評語']==m )\n",
" df0 = df.loc[cond,:]\n",
" percent = 100 * len(df0) / len(df)\n",
" lst.append(percent)\n",
"\n",
" print(f'{m:\\u3000<2}{percent:>5.1f}') # ここを修正\n",
" \n",
"print('-'*10,f'\\n合計: {sum(lst):.0f}')"
]
},
{
"cell_type": "markdown",
"metadata": {
"hidden": true
},
"source": [
"ここで「秀」など全角を使っているので`\\u3000`が必要となる。"
]
},
{
"cell_type": "markdown",
"metadata": {
"heading_collapsed": true
},
"source": [
"## 全学共通授業科目"
]
},
{
"cell_type": "markdown",
"metadata": {
"heading_collapsed": true,
"hidden": true
},
"source": [
"### 数"
]
},
{
"cell_type": "code",
"execution_count": 28,
"metadata": {
"hidden": true
},
"outputs": [
{
"data": {
"text/plain": [
"可 6\n",
"秀 4\n",
"優 3\n",
"合格 2\n",
"Name: 評語, dtype: int64"
]
},
"execution_count": 28,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"df_other.loc[:,'評語'].value_counts()"
]
},
{
"cell_type": "code",
"execution_count": 29,
"metadata": {
"hidden": true
},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"秀 4\n",
"優 3\n",
"良 0\n",
"可 6\n",
"合格 2\n",
"認定 0\n",
"不可 0\n",
"取消 0\n",
"---------- \n",
"合計 15\n"
]
}
],
"source": [
"lst = []\n",
"\n",
"for m in mark:\n",
" \n",
" cond = ( df_other['評語']==m )\n",
" df0 = df_other.loc[cond,:]\n",
" no = len(df0)\n",
" lst.append(no)\n",
" \n",
" print(m,no)\n",
" \n",
"print('-'*10,f'\\n合計 {sum(lst)}')"
]
},
{
"cell_type": "markdown",
"metadata": {
"heading_collapsed": true,
"hidden": true
},
"source": [
"### 割合"
]
},
{
"cell_type": "code",
"execution_count": 30,
"metadata": {
"hidden": true
},
"outputs": [
{
"data": {
"text/plain": [
"可 40.0\n",
"秀 26.7\n",
"優 20.0\n",
"合格 13.3\n",
"Name: 評語, dtype: float64"
]
},
"execution_count": 30,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"(\n",
" 100 * df_other.loc[:,'評語'].value_counts(normalize=True)\n",
").round(1)"
]
},
{
"cell_type": "code",
"execution_count": 31,
"metadata": {
"hidden": true
},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"秀 26.7\n",
"優 20.0\n",
"良 0.0\n",
"可 40.0\n",
"合格 13.3\n",
"認定 0.0\n",
"不可 0.0\n",
"取消 0.0\n",
"---------- \n",
"合計 100\n"
]
}
],
"source": [
"lst = []\n",
"\n",
"for m in mark:\n",
" \n",
" cond = ( df_other['評語']==m )\n",
" df0 = df_other.loc[cond,:]\n",
" percent = 100 * len(df0) / len(df_other)\n",
" lst.append(percent)\n",
" \n",
" print(f'{m} {percent:.1f}')\n",
" \n",
"print('-'*10,f'\\n合計 {sum(lst):.0f}')"
]
},
{
"cell_type": "markdown",
"metadata": {
"heading_collapsed": true
},
"source": [
"## 専門科目"
]
},
{
"cell_type": "code",
"execution_count": 32,
"metadata": {
"hidden": true
},
"outputs": [
{
"data": {
"text/plain": [
"可 4\n",
"秀 3\n",
"優 2\n",
"取消 2\n",
"不可 2\n",
"良 1\n",
"認定 1\n",
"Name: 評語, dtype: int64"
]
},
"execution_count": 32,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"df_econ.loc[:,'評語'].value_counts()"
]
},
{
"cell_type": "code",
"execution_count": 33,
"metadata": {
"hidden": true
},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"秀 3\n",
"優 2\n",
"良 1\n",
"可 4\n",
"合格 0\n",
"認定 1\n",
"不可 2\n",
"取消 2\n",
"---------- \n",
"合計 15\n"
]
}
],
"source": [
"lst = []\n",
"\n",
"for m in mark:\n",
" \n",
" cond = ( df_econ['評語']==m )\n",
" df0 = df_econ.loc[cond,:]\n",
" no = len(df0)\n",
" lst.append(no)\n",
" \n",
" print(m,no)\n",
" \n",
"print('-'*10,f'\\n合計 {sum(lst)}')"
]
},
{
"cell_type": "code",
"execution_count": 34,
"metadata": {
"hidden": true
},
"outputs": [
{
"data": {
"text/plain": [
"可 26.7\n",
"秀 20.0\n",
"優 13.3\n",
"取消 13.3\n",
"不可 13.3\n",
"良 6.7\n",
"認定 6.7\n",
"Name: 評語, dtype: float64"
]
},
"execution_count": 34,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"(\n",
" 100 * df_econ.loc[:,'評語'].value_counts(normalize=True)\n",
").round(1)"
]
},
{
"cell_type": "code",
"execution_count": 35,
"metadata": {
"hidden": true
},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"秀 20.0\n",
"優 13.3\n",
"良 6.7\n",
"可 26.7\n",
"合格 0.0\n",
"認定 6.7\n",
"不可 13.3\n",
"取消 13.3\n",
"---------- \n",
"合計 100\n"
]
}
],
"source": [
"lst = []\n",
"\n",
"for m in mark:\n",
" \n",
" cond = ( df_econ['評語']==m )\n",
" df0 = df_econ.loc[cond,:]\n",
" percent = 100 * len(df0) / len(df_econ)\n",
" lst.append(percent)\n",
" \n",
" print(f'{m} {percent:.1f}')\n",
" \n",
"print('-'*10, f'\\n合計 {sum(lst):.0f}')"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"## GPAの推移"
]
},
{
"cell_type": "markdown",
"metadata": {
"heading_collapsed": true
},
"source": [
"### 「科目GP」で記号がある行の削除"
]
},
{
"cell_type": "markdown",
"metadata": {
"hidden": true
},
"source": [
"科目GPの要素の種類"
]
},
{
"cell_type": "code",
"execution_count": 36,
"metadata": {
"hidden": true
},
"outputs": [
{
"data": {
"text/plain": [
"array(['-', '2', '4.3', '4', '3', '0', '*'], dtype=object)"
]
},
"execution_count": 36,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"df.loc[:,'科目GP'].unique()"
]
},
{
"cell_type": "markdown",
"metadata": {
"hidden": true
},
"source": [
"全て文字列となっているので,`-`と`*`の記号が含まれない行だけから構成される`DataFrame`を作成する。\n",
"\n",
"後で「科目GP」のデータ型を変更する際に警告がでないようにメソッド`.copy()`を使い`DataFrame`のコピーを作成する。"
]
},
{
"cell_type": "code",
"execution_count": 37,
"metadata": {
"hidden": true,
"scrolled": true
},
"outputs": [
{
"data": {
"text/html": [
"\n",
"\n",
"
\n",
" \n",
" \n",
" | \n",
" No. | \n",
" 区分 | \n",
" 科目大区分 | \n",
" 科目中区分 | \n",
" 科目ナンバー | \n",
" 科目 | \n",
" 単位数 | \n",
" 修得年度 | \n",
" 修得学期 | \n",
" 評語 | \n",
" 科目GP | \n",
" 合否 | \n",
"
\n",
" \n",
" \n",
" \n",
" 2 | \n",
" 3 | \n",
" 全学共通授業科目 | \n",
" 基礎教養科目 | \n",
" NaN | \n",
" U1AA100 | \n",
" XX学 | \n",
" 1 | \n",
" 2020 | \n",
" 前期 | \n",
" 可 | \n",
" 2 | \n",
" 合 | \n",
"
\n",
" \n",
" 3 | \n",
" 4 | \n",
" 全学共通授業科目 | \n",
" 基礎教養科目 | \n",
" NaN | \n",
" U1AB100 | \n",
" XX学A | \n",
" 1 | \n",
" 2020 | \n",
" 後期 | \n",
" 秀 | \n",
" 4.3 | \n",
" 合 | \n",
"
\n",
" \n",
" 4 | \n",
" 5 | \n",
" 全学共通授業科目 | \n",
" 基礎教養科目 | \n",
" NaN | \n",
" U1AB100 | \n",
" XX学B | \n",
" 1 | \n",
" 2019 | \n",
" 後期 | \n",
" 可 | \n",
" 2 | \n",
" 合 | \n",
"
\n",
" \n",
" 5 | \n",
" 6 | \n",
" 全学共通授業科目 | \n",
" 基礎教養科目 | \n",
" NaN | \n",
" U1AD100 | \n",
" X学A | \n",
" 1 | \n",
" 2019 | \n",
" 後期 | \n",
" 優 | \n",
" 4 | \n",
" 合 | \n",
"
\n",
" \n",
" 6 | \n",
" 7 | \n",
" 全学共通授業科目 | \n",
" 基礎教養科目 | \n",
" NaN | \n",
" U1AD100 | \n",
" X学B | \n",
" 1 | \n",
" 2019 | \n",
" 前期 | \n",
" 秀 | \n",
" 4.3 | \n",
" 合 | \n",
"
\n",
" \n",
"
\n",
"
"
],
"text/plain": [
" No. 区分 科目大区分 科目中区分 科目ナンバー 科目 単位数 修得年度 修得学期 評語 科目GP 合否\n",
"2 3 全学共通授業科目 基礎教養科目 NaN U1AA100 XX学 1 2020 前期 可 2 合\n",
"3 4 全学共通授業科目 基礎教養科目 NaN U1AB100 XX学A 1 2020 後期 秀 4.3 合\n",
"4 5 全学共通授業科目 基礎教養科目 NaN U1AB100 XX学B 1 2019 後期 可 2 合\n",
"5 6 全学共通授業科目 基礎教養科目 NaN U1AD100 X学A 1 2019 後期 優 4 合\n",
"6 7 全学共通授業科目 基礎教養科目 NaN U1AD100 X学B 1 2019 前期 秀 4.3 合"
]
},
"execution_count": 37,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"gpa = df.query(\"科目GP not in ['-', '*']\").copy()\n",
"gpa.head()"
]
},
{
"cell_type": "code",
"execution_count": 38,
"metadata": {
"hidden": true
},
"outputs": [
{
"data": {
"text/plain": [
"array(['2', '4.3', '4', '3', '0'], dtype=object)"
]
},
"execution_count": 38,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"gpa['科目GP'].unique()"
]
},
{
"cell_type": "markdown",
"metadata": {
"hidden": true
},
"source": [
"データ型は`object`(文字列)のままである。\n",
"\n",
"属性`.dtypes`を使って確認することもできる。"
]
},
{
"cell_type": "code",
"execution_count": 39,
"metadata": {
"hidden": true
},
"outputs": [
{
"data": {
"text/plain": [
"dtype('O')"
]
},
"execution_count": 39,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"gpa['科目GP'].dtypes"
]
},
{
"cell_type": "markdown",
"metadata": {
"hidden": true
},
"source": [
"`O`は`object`。"
]
},
{
"cell_type": "markdown",
"metadata": {
"heading_collapsed": true
},
"source": [
"### 「科目GP」を浮動小数点に変更"
]
},
{
"cell_type": "markdown",
"metadata": {
"hidden": true
},
"source": [
"科目GPは`object`(文字列)となっているので,メソッド`astype()`を使って`float`に変換する。"
]
},
{
"cell_type": "code",
"execution_count": 40,
"metadata": {
"hidden": true
},
"outputs": [],
"source": [
"gpa['科目GP'] = gpa['科目GP'].astype(float)"
]
},
{
"cell_type": "code",
"execution_count": 41,
"metadata": {
"hidden": true,
"scrolled": true
},
"outputs": [
{
"data": {
"text/plain": [
"No. int64\n",
"区分 object\n",
"科目大区分 object\n",
"科目中区分 float64\n",
"科目ナンバー object\n",
"科目 object\n",
"単位数 int64\n",
"修得年度 int64\n",
"修得学期 object\n",
"評語 object\n",
"科目GP float64\n",
"合否 object\n",
"dtype: object"
]
},
"execution_count": 41,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"gpa.dtypes"
]
},
{
"cell_type": "markdown",
"metadata": {
"heading_collapsed": true
},
"source": [
"### 図示:毎年"
]
},
{
"cell_type": "markdown",
"metadata": {
"heading_collapsed": true,
"hidden": true
},
"source": [
"#### `groupby`"
]
},
{
"cell_type": "markdown",
"metadata": {
"hidden": true
},
"source": [
"`groupby`は`DataFrame`や`Series`をグループ化し,グループ内の計算を簡単に行うことができる便利なメソッドである。「修得年度」でグループ化し,平均を計算する。"
]
},
{
"cell_type": "code",
"execution_count": 42,
"metadata": {
"hidden": true
},
"outputs": [],
"source": [
"two_vars = ['単位数','科目GP']"
]
},
{
"cell_type": "code",
"execution_count": 43,
"metadata": {
"hidden": true
},
"outputs": [
{
"data": {
"text/html": [
"\n",
"\n",
"
\n",
" \n",
" \n",
" | \n",
" 単位数 | \n",
" 科目GP | \n",
"
\n",
" \n",
" 修得年度 | \n",
" | \n",
" | \n",
"
\n",
" \n",
" \n",
" \n",
" 2018 | \n",
" 1.375000 | \n",
" 2.6625 | \n",
"
\n",
" \n",
" 2019 | \n",
" 1.100000 | \n",
" 3.3200 | \n",
"
\n",
" \n",
" 2020 | \n",
" 1.666667 | \n",
" 3.1000 | \n",
"
\n",
" \n",
"
\n",
"
"
],
"text/plain": [
" 単位数 科目GP\n",
"修得年度 \n",
"2018 1.375000 2.6625\n",
"2019 1.100000 3.3200\n",
"2020 1.666667 3.1000"
]
},
"execution_count": 43,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"gpa_grouped = gpa.groupby('修得年度')\n",
"gpa_mean = gpa_grouped[two_vars].mean()\n",
"gpa_mean"
]
},
{
"cell_type": "markdown",
"metadata": {
"hidden": true
},
"source": [
"* `gpa_grouped`は`DetaFrame`ではないので注意しよう。\n",
"* `gpa_grouped`には`median()`,`std()`,`var()`,`min()`,`max()`などが使える。その他の属性・メソッドを確認。"
]
},
{
"cell_type": "markdown",
"metadata": {
"heading_collapsed": true,
"hidden": true
},
"source": [
"#### 図示"
]
},
{
"cell_type": "markdown",
"metadata": {
"hidden": true
},
"source": [
"方法1:横軸に文字列を使う"
]
},
{
"cell_type": "markdown",
"metadata": {
"hidden": true
},
"source": [
"`gpa_mean.index`を確認する。"
]
},
{
"cell_type": "code",
"execution_count": 44,
"metadata": {
"hidden": true
},
"outputs": [
{
"data": {
"text/plain": [
"Int64Index([2018, 2019, 2020], dtype='int64', name='修得年度')"
]
},
"execution_count": 44,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"gpa_mean.index"
]
},
{
"cell_type": "markdown",
"metadata": {
"hidden": true
},
"source": [
"これを使い横軸に使う文字列を作成する。"
]
},
{
"cell_type": "code",
"execution_count": 45,
"metadata": {
"hidden": true,
"scrolled": true
},
"outputs": [
{
"data": {
"text/plain": [
"['2018', '2019', '2020']"
]
},
"execution_count": 45,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"yr = [str(i) for i in gpa_mean.index]\n",
"yr"
]
},
{
"cell_type": "code",
"execution_count": 46,
"metadata": {
"hidden": true,
"scrolled": false
},
"outputs": [
{
"data": {
"image/png": "\n",
"text/plain": [
""
]
},
"metadata": {},
"output_type": "display_data"
}
],
"source": [
"plt.plot(yr,gpa_mean['科目GP'], 'o-')\n",
"pass"
]
},
{
"cell_type": "markdown",
"metadata": {
"hidden": true
},
"source": [
"方法2:`plt.xticks()`を使って"
]
},
{
"cell_type": "markdown",
"metadata": {
"hidden": true
},
"source": [
"横軸を調整するために,`gpa_mean`のインデックスを確認。"
]
},
{
"cell_type": "code",
"execution_count": 47,
"metadata": {
"hidden": true
},
"outputs": [
{
"data": {
"text/plain": [
"Int64Index([2018, 2019, 2020], dtype='int64', name='修得年度')"
]
},
"execution_count": 47,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"yr = gpa_mean.index\n",
"yr"
]
},
{
"cell_type": "markdown",
"metadata": {
"hidden": true
},
"source": [
"`xticks()`を使って横軸の表示を指定する。"
]
},
{
"cell_type": "code",
"execution_count": 48,
"metadata": {
"hidden": true
},
"outputs": [
{
"data": {
"image/png": "\n",
"text/plain": [
""
]
},
"metadata": {},
"output_type": "display_data"
}
],
"source": [
"plt.plot('科目GP', 'o-', data=gpa_mean)\n",
"plt.xticks(yr)\n",
"pass"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"### 図示:前期後期毎"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"#### 「修得学期」の英語化"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"「修得学期」の要素が日本語だと警告が出るため,メソッド`.replace()`を使って英語に変換する。`replace()`の引数は辞書で指定する。\n",
"* キー:変更する対象の数値や文字列\n",
"* 値:変更後の数値や文字列"
]
},
{
"cell_type": "code",
"execution_count": 49,
"metadata": {},
"outputs": [
{
"data": {
"text/html": [
"\n",
"\n",
"
\n",
" \n",
" \n",
" | \n",
" No. | \n",
" 区分 | \n",
" 科目大区分 | \n",
" 科目中区分 | \n",
" 科目ナンバー | \n",
" 科目 | \n",
" 単位数 | \n",
" 修得年度 | \n",
" 修得学期 | \n",
" 評語 | \n",
" 科目GP | \n",
" 合否 | \n",
"
\n",
" \n",
" \n",
" \n",
" 2 | \n",
" 3 | \n",
" 全学共通授業科目 | \n",
" 基礎教養科目 | \n",
" NaN | \n",
" U1AA100 | \n",
" XX学 | \n",
" 1 | \n",
" 2020 | \n",
" 1 | \n",
" 可 | \n",
" 2.0 | \n",
" 合 | \n",
"
\n",
" \n",
" 3 | \n",
" 4 | \n",
" 全学共通授業科目 | \n",
" 基礎教養科目 | \n",
" NaN | \n",
" U1AB100 | \n",
" XX学A | \n",
" 1 | \n",
" 2020 | \n",
" 2 | \n",
" 秀 | \n",
" 4.3 | \n",
" 合 | \n",
"
\n",
" \n",
" 4 | \n",
" 5 | \n",
" 全学共通授業科目 | \n",
" 基礎教養科目 | \n",
" NaN | \n",
" U1AB100 | \n",
" XX学B | \n",
" 1 | \n",
" 2019 | \n",
" 2 | \n",
" 可 | \n",
" 2.0 | \n",
" 合 | \n",
"
\n",
" \n",
" 5 | \n",
" 6 | \n",
" 全学共通授業科目 | \n",
" 基礎教養科目 | \n",
" NaN | \n",
" U1AD100 | \n",
" X学A | \n",
" 1 | \n",
" 2019 | \n",
" 2 | \n",
" 優 | \n",
" 4.0 | \n",
" 合 | \n",
"
\n",
" \n",
" 6 | \n",
" 7 | \n",
" 全学共通授業科目 | \n",
" 基礎教養科目 | \n",
" NaN | \n",
" U1AD100 | \n",
" X学B | \n",
" 1 | \n",
" 2019 | \n",
" 1 | \n",
" 秀 | \n",
" 4.3 | \n",
" 合 | \n",
"
\n",
" \n",
"
\n",
"
"
],
"text/plain": [
" No. 区分 科目大区分 科目中区分 科目ナンバー 科目 単位数 修得年度 修得学期 評語 科目GP 合否\n",
"2 3 全学共通授業科目 基礎教養科目 NaN U1AA100 XX学 1 2020 1 可 2.0 合\n",
"3 4 全学共通授業科目 基礎教養科目 NaN U1AB100 XX学A 1 2020 2 秀 4.3 合\n",
"4 5 全学共通授業科目 基礎教養科目 NaN U1AB100 XX学B 1 2019 2 可 2.0 合\n",
"5 6 全学共通授業科目 基礎教養科目 NaN U1AD100 X学A 1 2019 2 優 4.0 合\n",
"6 7 全学共通授業科目 基礎教養科目 NaN U1AD100 X学B 1 2019 1 秀 4.3 合"
]
},
"execution_count": 49,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"gpa['修得学期'] = gpa['修得学期'].replace({'前期':'1','後期':'2'})\n",
"gpa.head()"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"#### `groupby`"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"「修得年度」と「修得学期」でグループ化する。"
]
},
{
"cell_type": "code",
"execution_count": 50,
"metadata": {
"scrolled": true
},
"outputs": [
{
"data": {
"text/html": [
"\n",
"\n",
"
\n",
" \n",
" \n",
" | \n",
" | \n",
" 単位数 | \n",
" 科目GP | \n",
"
\n",
" \n",
" 修得年度 | \n",
" 修得学期 | \n",
" | \n",
" | \n",
"
\n",
" \n",
" \n",
" \n",
" 2018 | \n",
" 1 | \n",
" 1.000000 | \n",
" 1.000000 | \n",
"
\n",
" \n",
" 2 | \n",
" 1.500000 | \n",
" 3.216667 | \n",
"
\n",
" \n",
" 2019 | \n",
" 1 | \n",
" 1.000000 | \n",
" 3.150000 | \n",
"
\n",
" \n",
" 2 | \n",
" 1.250000 | \n",
" 3.575000 | \n",
"
\n",
" \n",
" 2020 | \n",
" 1 | \n",
" 1.333333 | \n",
" 2.666667 | \n",
"
\n",
" \n",
" 2 | \n",
" 2.000000 | \n",
" 3.533333 | \n",
"
\n",
" \n",
"
\n",
"
"
],
"text/plain": [
" 単位数 科目GP\n",
"修得年度 修得学期 \n",
"2018 1 1.000000 1.000000\n",
" 2 1.500000 3.216667\n",
"2019 1 1.000000 3.150000\n",
" 2 1.250000 3.575000\n",
"2020 1 1.333333 2.666667\n",
" 2 2.000000 3.533333"
]
},
"execution_count": 50,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"gpa_grouped = gpa.groupby(['修得年度','修得学期'])\n",
"gpa_mean = gpa_grouped[two_vars].mean()\n",
"gpa_mean"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"#### 図示"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"横軸に文字列を使う。まず`gpa_mean`のインデックスを確認する。"
]
},
{
"cell_type": "code",
"execution_count": 51,
"metadata": {},
"outputs": [
{
"data": {
"text/plain": [
"MultiIndex([(2018, '1'),\n",
" (2018, '2'),\n",
" (2019, '1'),\n",
" (2019, '2'),\n",
" (2020, '1'),\n",
" (2020, '2')],\n",
" names=['修得年度', '修得学期'])"
]
},
"execution_count": 51,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"gpa_mean.index"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"これを使い横軸に使う文字列を作成する。"
]
},
{
"cell_type": "code",
"execution_count": 52,
"metadata": {},
"outputs": [
{
"data": {
"text/plain": [
"['2018-1', '2018-2', '2019-1', '2019-2', '2020-1', '2020-2']"
]
},
"execution_count": 52,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"yr_half = [str(i[0])+'-'+str(i[1]) for i in gpa_mean.index]\n",
"yr_half"
]
},
{
"cell_type": "code",
"execution_count": 53,
"metadata": {},
"outputs": [
{
"data": {
"image/png": "\n",
"text/plain": [
""
]
},
"metadata": {},
"output_type": "display_data"
}
],
"source": [
"plt.plot(yr_half, gpa_mean['科目GP'], marker='o')\n",
"pass"
]
}
],
"metadata": {
"celltoolbar": "Tags",
"kernelspec": {
"display_name": "Python 3 (ipykernel)",
"language": "python",
"name": "python3"
},
"language_info": {
"codemirror_mode": {
"name": "ipython",
"version": 3
},
"file_extension": ".py",
"mimetype": "text/x-python",
"name": "python",
"nbconvert_exporter": "python",
"pygments_lexer": "ipython3",
"version": "3.11.5"
},
"toc": {
"base_numbering": 1,
"nav_menu": {},
"number_sections": true,
"sideBar": true,
"skip_h1_title": false,
"title_cell": "Table of Contents",
"title_sidebar": "Contents",
"toc_cell": false,
"toc_position": {},
"toc_section_display": true,
"toc_window_display": false
}
},
"nbformat": 4,
"nbformat_minor": 4
}