Matplotlib：図示

`Matplotlib`：図示#

in English or the language of your choice.

説明#

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

# 警告メッセージを非表示
import warnings
warnings.filterwarnings("ignore")

Matplotlib is building the font cache; this may take a moment.

Matplotlib（「マットプロットリブ」と読む）はプロットのための代表的なパッケージであり、ここではその使い方を解説する。プロットにはMatplotlibのモジュールであるpyplotを使うことになる。慣例に沿ってpltとしてインポートする。

pyplotモジュールを使ってプロットする場合、主に３つのコードの書き方がる。

書き方１：（オブジェクト指向）

fig = plt.figure()
ax = fig.add_subplot()
ax.plot(...)

書き方２：（オブジェクト指向）

fig, ax = plt.subplots()
ax.plot(...)

書き方３： Matlabという有料ソフトのコードに沿った書き方

plt.plot(...)

本サイトでは書き方２に沿ってMatplotlibの使い方を説明する。一方で，その裏にある考え方を理解するには、書き方１から始めた方が良いと思うので，書き方１の簡単な説明をすることにする。Fig. 1は，Matplotlibが描画する図の階層的な構造を示している。ここで重要なのは「キャンバス」と「軸」の違いである。

Matplotlibによるプロットは次の図のような構成となっている。

_images/figure_axes_mpl.png — Fig. 1 キャンバスと軸の関係#

キャンバスとは表示される領域であり，実際には表示されない透明のキャンバ」である。
- 書き方１と書き方２では変数figがキャンバスを表している。
- figureやfigなどの変数名や引数名があれば、キャンバスを指していると理解すれば良いだろう。
軸とは１つの図を表示する区域である。
- 書き方１と書き方２では変数axが軸を表している。
- axやaxesなどの変数名や引数名があれば、軸を表していると理解すれば良いだろう。
- キャンバス上に複数のグラフを表示する場合は複数の区域を設定する必要がある。

これを踏まえて，書き方１は次のような手順で描画していと解釈できる。

キャンバスを用意する。
- それを行なっているのが１行目である。右辺のplt.figure()でキャンバスを作成し、それを変数figに割り当てている。
キャンバスに軸を追加する。
- これをおこなっているのが２行目である。右辺では、キャンバスfigのメソッドadd_subplot()を使いキャンバスに軸を追加し、それを左辺の変数axに割り当てている。実際に、書き方１の２行のコードを実行すると透明のキャンバス上に軸が表示される。（試してみよう。）
- 作成された軸axにメソッドplot()などを使い直線・曲線・点など付け加えたり、タイトルなどの「飾り付け」をおこない作図することになる。
- １つのキャンバスに複数の軸を作成し，複数の図を表示することが可能となる。

この説明でわかることは、Matplotlibで表示される図は透明のキャンバス上に描かれ装飾された軸ということである。以下の説明では、「図」はキャンバス全体に表示されたものを指す場合もあれば，ある一つの軸に表示されたものを指す場合もああるので，文脈で判断してほしい。

さて書き方２に話を戻すと、既に察している読者もいるかも知れないが、１行目は書き方１の最初の２行を１行に省略したものである。右辺のplt.subplots()は透明のキャンバスと軸の２つをタプルとして返す。最初の要素がキャンバスでありそれを左辺のfigに、２つ目の要素が軸でありaxに割り当てている。実際、１行目だけを実行すると軸が表示される。後は書き方１同様、axのメソッドplot()などを使い軸を飾り付けして作図することになる。

ちなみに、書き方３は書き方２の３行を１行に省略した形と解釈して良いだろう。本来はMatlab（有料）ユーザーのPythonへの移行を促す為に用意された書き方である。

次にplot()のデータに関する引数について説明するが，主に２つの設定方法がある。

データの引数の書き方１：

plot(＜横軸のデータ＞, ＜縦軸のデータ＞)

データの引数の書き方２：変数のラベル名が使える場合（PandasのDataFrame）

plot(＜横軸の変数名＞, ＜縦軸の変数名＞, data=＜データ名＞)

この２つの書き方の簡略形として，横軸の変数を省略することもできる。

plot(＜縦軸のデータ＞)

plot(＜縦軸の変数名＞, data=＜データ名＞)

この場合，横軸には縦軸のデータのインデックス番号が使われることになる。手っ取り早く図示したい場合は良いかも知れない。

以下ではそれぞれの引数の書き方について解説する。

データの引数の書き方１#

`array`を使って#

プロットするデータを生成しよう。変数xに横軸に使うデータを次のように割り当てる。

x = np.linspace(-2, 2, 3)
x

array([-2.,  0.,  2.])

３つの要素からなるarrayである。縦軸のデータとしてy0を用意する。

y0 = x**2
y0

array([4., 0., 4.])

同じようにy0も３つの要素からなるarrayである。プロットしてみよう。

fig, ax = plt.subplots()
ax.plot(x, y0, marker='o')

[<matplotlib.lines.Line2D at 0x113f1b050>]

_images/5c08d5b5e840e805d4254bb3e94f66bf1d42759f1deaec6455083f636d73aeee.png

２行目にmarker='o'が追加されているが，「●」を表示するために使っている。このような引数の使い方は後で詳しく説明するので，ここでは気にしないで読み進めて欲しい。

「●」のマーカーがある点がxとy0のarray要素の組み合わせとして表示されている。plot()はデフォルトでそれらの点を直線で結んでいる。この場合，データの組み合わせが３点しかないため\(y=x^2\)の形を明確に表示できていない。言い換えると，データの組み合わせの数を増やすことにより\(y=x^2\)をより正確に表示されることになる。もう一度，xとy0のデータを生成しなおす。

x = np.linspace(-2, 2, 100)
y0 = x**2

xとy0にはそれぞれ100の要素があり，これらを使うことにより100のデータの組み合わせが成立することになる。プロットしてみよう。

fig, ax = plt.subplots()
ax.plot(x, y0, marker='o')

[<matplotlib.lines.Line2D at 0x1140e4bf0>]

_images/6aa4c4c1d7a1bcb6d0630d6161e40be3fc088adaa112ae87d18d534aa11e8358.png

より\(y=x^2\)の図に近づいたことがわかる。

（注意点）

上の２つの図の上に文字が表示されているが，表示したくない場合は最後に;を加えるか次の行にpassと書くと表示されなくなる。
xを省いてax.plot(y0)としても同じような図が表示されるが，横軸の値がデータの数に対応することになり，意図した図と異なることになる。

次に縦軸のデータとして，２つを用意する。

y1 = x+1
y2 = np.exp(x)

y0，y1，y2を同じ軸にプロットしてみよう。コードは簡単でax.plot()をリピートするだけである。

fig, ax = plt.subplots()
ax.plot(x, y0)           
ax.plot(x, y1)
ax.plot(x, y2)
pass

_images/05b49c2e8309ffe43a76b17e3ddd1033bc701ef319cf88ff2f24a81b3e8e4911.png

それぞれのax.plot()を「軸axにデータの組み合わせをプロットする」と読めば理解しやすいと思う。また同じようなコードが続いているので，次のようにforループを使うことより短いコードで同じ図を表示することができる。

fig, ax = plt.subplots()

for y in [y0, y1, y2]:
    ax.plot(x, y)           

pass

`DataFrame`を使って#

まずDataFrameを作成しよう。

dic = {'X':x, 'Y0':y0, 'Y1':y1, 'Y2':y2}  # 辞書の作成

df0 = pd.DataFrame(dic)      # DataFrameの作成

df0.head()

	X	Y0	Y1	Y2
0	-2.000000	4.000000	-1.000000	0.135335
1	-1.959596	3.840016	-0.959596	0.140915
2	-1.919192	3.683298	-0.919192	0.146725
3	-1.878788	3.529844	-0.878788	0.152775
4	-1.838384	3.379655	-0.838384	0.159074

横軸にX，縦軸にY0をプロットしてみる。

fig, ax = plt.subplots()
ax.plot(df0['X'],df0['Y0'])
pass

_images/b001e56fac1977b78c8cfe9fa74fee4948644545df73e8a45923e87843e8a9af.png

横軸にX，縦軸にY0，Y1，Y2をプロットしてみる。

fig, ax = plt.subplots()
ax.plot(df0['X'],df0['Y0'])
ax.plot(df0['X'],df0['Y1'])
ax.plot(df0['X'],df0['Y2'])
pass

引数の書き方１の簡略形として，横軸の変数を省略できることを紹介した。その場合はどうなるかを考えてみよう。

fig, ax = plt.subplots()
ax.plot(df0['Y0'])
pass

_images/0239549090a5e15a7fef35fb3c0669350587cafe197c8915c65578bf9f58e6bc.png

上の図との違いは横軸の値である。この場合，横軸にdf0の行インデックスが自動的に使われている。

データの引数の書き方２#

次に引数dataを使う書き方を考えてみる。

同じ`DataFrame`を使う#

横軸にX，縦軸にY0を指定してプロットしてみる。

fig, ax = plt.subplots()
ax.plot('X', 'Y0', data=df0)
pass

変数Y1とY2も同じ軸axにプロットしてみよう。

fig, ax = plt.subplots()
ax.plot('X', 'Y0', data=df0)
ax.plot('X', 'Y1', data=df0)
ax.plot('X', 'Y2', data=df0)
pass

Note

この場合，同じようなコードが続いているのでforループを使うと良いだろう。

fig, ax = plt.subplots()
for v in ['Y0','Y1','Y2']:
    ax.plot('X', v, data=df0)

横軸のXを指定せずにプロットしてみよう。

fig, ax = plt.subplots()
ax.plot('Y0', data=df0)
pass

行インデックスが横軸の値として使われている。

異なる`DataFrame`の変数を図示する#

別のDataFrameを作成する。

dic = {'X':x, 'Y3':-x-1, 'Y4':-x**2}
df1 = pd.DataFrame(dic)
df1.head()

	X	Y3	Y4
0	-2.000000	1.000000	-4.000000
1	-1.959596	0.959596	-3.840016
2	-1.919192	0.919192	-3.683298
3	-1.878788	0.878788	-3.529844
4	-1.838384	0.838384	-3.379655

Xを横軸としてdf0のY0，Y3を横軸としてdf1のY3を同じ図に表示してみよう。

fig, ax = plt.subplots()
ax.plot('X', 'Y0', data=df0)
ax.plot('Y3', 'Y4', data=df1)
pass

_images/af42e8d41fde9702caf445eb87617d291f4aaf97763534824987338ed8c7e800.png

その他の引数とメソッド#

上で説明したコードでは単純なプロットしかできない。一方で様々な引数やメソッドが用意されており，それらを駆使することにより様々な「飾り付け」をすることが可能となる。ここでは主なものを紹介するが，他にも数多く用意されているのでMatplotlibのサイトを参考にしてほしい。また，これらの引数・メソッドは，上述の「データの引数の書き方１」と「データの引数の書き方２」の両方に有効であることも覚えておこう。

引数・メソッドがもたらす違いを際立たせるために新たなDataFrameを使おう。

dic = {'X':[10, 20, 30],
       'Y':[5.0, 30.0, 15.0],
       'Z':[7.0, 2.0, 10.0]}
df2 = pd.DataFrame(dic)
df2.head()

	X	Y	Z
0	10	5.0	7.0
1	20	30.0	2.0
2	30	15.0	10.0

以下のプロットでは，横軸の変数を省略する簡略形を使うので，行インデックが横軸に使われるので注意しよう。

`subplots()`の引数#

subplots()はキャンバスと軸を設定するpltのメソッドとなるが、主に３つの引数を紹介する。

figsize：図の大きさ
- figsize=(キャンバスの横幅、キャンバスの縦の長さ)
nrows（デフォルトは1）：軸の数を指定するために使う引数（「図を並べる」のセクションで説明する）
ncols（デフォルトは1）：軸の数を指定するために使う引数（「図を並べる」のセクションで説明する）
sharex（デフォルトはFalse）：複数の軸がある場合に使う引数（「図を並べる」のセクションで説明する）
sharey（デフォルトはFalse）：複数の軸がある場合に使う引数（「図を並べる」のセクションで説明する）
constrained_layout（デフォルトはFalse）：複数の軸がある場合に使う引数であり，図の間隔を自動調整する（「図を並べる」のセクションで説明する）

fix, ax = plt.subplots(figsize=(8,4))
ax.plot('X', data=df2)
pass

_images/fbeff1acd550c23a7309f3f4aac55e13bb4ae33ae1aefe80f3fb673e33b9b0ad.png

`plot()`の基本的な引数#

plot()は軸axにデータを描くメソッドだが、引数を使うことによりデータの表示方法を指定できる。詳しくはこのリンクを参照することにして，ここでは基本的な引数だけを紹介する。

linestyle：線のスタイル（リストにして列の順番で指定する;-，--，-.，:などがある）
linewidth or lw：線の幅
color or c：色（参照サイト）
- rは赤
- kは黒
- gはグリーン
marker：観測値のマーカー（o，.，>，^などがある; 参照サイト）
markersize：マーカーの大きさ
label：以下で説明するax.legend()がある場合に有効となる

fix, ax = plt.subplots()
ax.plot('X'
           , data=df2
           , linestyle=':'
           , linewidth=2
           , color='red'
           , marker='o'
           , markersize=10
           , label='X series')
ax.plot('Y'
           , data=df2
           , linestyle='-'
           , linewidth=2
           , color='k'
           , marker='^'
           , markersize=10
           , label='X series')
pass

_images/821b826dc9764645d94c7ee4ab84da8ed3b0127fde8c8ef7e9f5688c006bc170.png

引数をいちいち書くのが面倒な場合、次の３つを簡略して一緒に指定できる。

linestyle
color
marker

例えば、

linestyle=':'
color='red'
marker='o'

の場合、:roと書くことができる。

fix, ax = plt.subplots()
ax.plot('Y', ':ro', data=df2)
pass

_images/fe4bc6f9bd0f1b3062896e3189cdced8237d372fa74df3baf1e5ea159e58c220.png

（注意点）

:roは文字列
:，r，oの順番を変えても良い。
:や:oのように１つもしくは２つだけを指定しても良い。
:roは=を使う引数の前に置く。

詳細は参考サイト（英語）を参照。

`ax`の基本的なメソッド#

axは透明なキャンバス上にある軸を指しているが、そのメソッドを使うことにより、軸周辺を「飾り付け」することができる。

.set_title()：タイトルを設定する。
- 文字列で指定し、大きさは引数sizeで指定する。
.set_xlabel()：横軸ラベル
- 文字列で指定し、大きさは引数sizeで指定する。
.set_ylabel()：縦軸ラベル
- 文字列で指定し、大きさは引数sizeで指定する。
.legend()：凡例を表示する。
- plot()の引数labelがなければ、データ・フレームの列ラベルが使われる。
- plot()の引数labelがあれば、それが使われる。
.grid()：グリッド線が表示される。

fig, ax = plt.subplots()
ax.plot('X', data=df2, label='X series')
ax.set_title('A Large Title', size= 30)     # タイトルの設定
ax.set_xlabel('Horizontal Axis', size=20)   # 横軸ラベルの設定
ax.set_ylabel('Vertical Axis', size=20)     # 縦軸ラベルの設定
ax.legend()
ax.grid()
pass

_images/587d81b8cc67cfbc37cab2c009d40021022eb747e533acb751f5f7a68c31160c.png

図を並べる#

複数の図を並べたいとしよう。考え方としては、透明のキャンバスに複数の軸を設定し、それぞれの軸を使って作図していけば良いのである。キャンバスは四角なので偶数個の軸が設定できる。例として、次のように軸を配置したいとしよう。

+---+---+---+
| 1 | 2 | 3 |
+---+---+---+
| 4 | 5 | 6 |
+---+---+---+

２行・３列の配置になっており、左上から軸の番号が振られている。このような場合、subplots()の２つの引数が必須であり、別の２つの引数が有用である。

subplots(行の数, 列の数, sharex=False, sharey=False, constrained_layout=False)

行の数（デフォルトは1）：上の例では2
列の数（デフォルトは1）：上の例では3
sharex（デフォルトはFalse）：Trueにすると、全ての図で横軸が同じになり、不要な横軸の数字などを非表示になる。
sharey（デフォルトはFalse）：Tureにすると、全ての図で縦軸が同じになり、不要な縦軸の数字などを非表示にする
constrained_layout（デフォルトはFalse）：Tureにすると、全ての図の間隔を調整して見やすくなる。

上の例を使うと次のようになる。

fig, ax = plt.subplots(2,3)

_images/1fe744ff02be07496c1853fa6cb614af6c821936cbb42796cdc0884327ba8879.png

６つの軸が表示されているが、それらはaxに割り当てられている。axを表示してみよう。

ax

array([[<Axes: >, <Axes: >, <Axes: >],
       [<Axes: >, <Axes: >, <Axes: >]], dtype=object)

<AxesSubplot:>が軸を示しており、それぞれの軸に対応している。

ax.shape

(2, 3)

軸は(2,3)のarrayに格納されているのが確認できる。従って、それぞれの軸はarrayの要素を抽出することによりアクセスできる。

ax[0,0]：軸１を抽出
ax[0,1]：軸２を抽出
ax[0,2]：軸３を抽出
ax[1,0]：軸４を抽出
ax[1,1]：軸５を抽出
ax[1,2]：軸６を抽出

これを使い次のように６つのを図示できる。

fig, ax = plt.subplots(2,3,figsize=(8,3))
ax[0,0].plot('X', data=df2)
ax[0,1].plot('Y', data=df2)
ax[0,2].plot('Z', data=df2)
ax[1,0].plot('X', data=df2)
ax[1,1].plot('Y', data=df2)
ax[1,2].plot('Z', data=df2)
pass

_images/1f4571ce43fdd628799152a237d591b4ee774f0da41babbb53015f5584d6fd27.png

横軸と縦軸を共有するには次のようにする。

fig, ax = plt.subplots(2,3,figsize=(8,3),sharex=True,sharey=True)
ax[0,0].plot('X', data=df2)
ax[0,1].plot('Y', data=df2)
ax[0,2].plot('Z', data=df2)
ax[1,0].plot('X', data=df2)
ax[1,1].plot('Y', data=df2)
ax[1,2].plot('Z', data=df2)
pass

_images/bfae64b52938611e360a07c88219eaac2a12a5c64fd694664705487d5a9eb374.png

axのメソッド（例えば、軸のタイトル）はそれぞれ設定することができる。

次に、キャンバス全体のタイトルを設定したいとしよう。キャンバスはfigに割り当てられているので、そのメソッドsuptitleを使い表示することができる。

fig, ax = plt.subplots(2, 3, figsize=(8,3),
                       sharex=True, sharey=True,
                       constrained_layout=True)
ax[0,0].plot('X', data=df2)
ax[0,0].set_title('ax[0,0]')

ax[0,1].plot('Y', data=df2)
ax[0,1].set_title('ax[0,1]')

ax[0,2].plot('Z', data=df2)
ax[0,2].set_title('ax[0,2]')

ax[1,0].plot('X', data=df2)
ax[1,0].set_title('ax[1,0]')

ax[1,1].plot('Y', data=df2)
ax[1,1].set_title('ax[1,1]')

ax[1,2].plot('Z', data=df2)
ax[1,2].set_title('ax[1,2]')

fig.suptitle("Grand Title", fontsize=20)
pass

_images/c07fa108be4c15573625acfae763258c09a6d41d8fa2be583f92f025eee2af88.png

２軸グラフ#

複数のデータを表示する際、右の縦軸を使いデータを表示したい場合がある。例を使って説明することにする。

fig, ax1 = plt.subplots()  # (1)

ax2 = ax1.twinx()          # (2)

ax1.plot('X', data=df2)    # (3)
ax2.plot('Z', data=df2)    # (4)
pass

_images/fea219e996b5bed41bdbe11d8570e7b45e22622d17979ccc81b8489996bf136e.png

コードの説明

キャンバスと軸を作成し、軸をax1に割り当てる。

ax1のメソッドtwinx()を使い、右の縦軸を準備しax2に割り当てる。

ax1にXをプロットする。

ax2にZをプロットする。

また上で説明した方法で様々な「飾り付け」をすることができる。ただ、凡例については少し追加的なコードが必要となるので、それについても簡単に以下で説明する。

fig, ax1 = plt.subplots()

ax2 = ax1.twinx()

ax1.plot('X', 'k-o', data=df2, label='X series')
ax2.plot('Z', 'r:', data=df2, label='Z series')

ax1.set_title('Title', size=20)    # (1)
ax1.set_ylabel('X data', size=15)  # (2)
ax2.set_ylabel('Z data', size=15)  # (3)

ax1.legend()                       # (4)
ax2.legend(loc=(0.015,0.81))        # (5)
pass

_images/abd5df933a5bcec790be2dba252155191d64cdc3ed60bf9ef2721c1dfeb0bcb9.png

コードの説明

軸ax1にタイトルを設定しているが、ax2でも同じ図となる。

軸ax1の縦軸（左）のラベルを設定する。

軸ax2の縦軸（右）のラベルを設定する。

軸ax1に描いたXの凡例を設定する。

legend()には引数がないのでMatplotlibが自動で凡例の位置を決める。この場合は図の左上に表示されている。

軸ax2に描いたZの凡例を設定する。

legend(loc=(0.015,0.8))には引数locがあり、凡例の位置を指定している。(0.015,0.8)の数字は図の原点を(0,0)とて左の数字はx軸、右の数字はy軸の位置を指定している。もし引数を設定しないと、Xの凡例を上書きすることになる。(0.015,0.8)のような指定方法だけではなく、他の方法もあるので参照サイトを参考にして欲しい。

日本語#

２つ方法を紹介するが、japanize_matplotlibを使う方法がより簡単であろう。

`japanize_matplotlib`#

使い方は到って簡単で、Pandasと同様にインポートするだけである。

import japanize_matplotlib

fix, ax = plt.subplots()
ax.plot('X', 'Y', 'r-o', data=df2)
ax.set_title('縦横タイトル', size= 30)
ax.set_xlabel('横軸', size=20)
ax.set_ylabel('縦軸', size=20)
ax.legend()
pass

_images/993817c0e2b262bf9a5e5e1be7ad28ab383bd57a757a7eec1f405ab5289bbb7c.png

フォントを指定する#

2つの方法：

フォントはインストールせず、PC内にあるフォントを指定する。
フォントをインストールする方法

方法１の場合、以下で説明に使う変数jfontにフォントを指定する。 * Macの場合、例えばAppleGothic * Windowsの場合、例えばYu Gothic * この方法では一部の日本語が文字化けする場合がある。

方法２の場合：

このサイトから次の内の１つをダウンロードする。
- 2書体パック(IPAex明朝(Ver.xxx)、IPAexゴシック(Ver.xxx))
- IPAex明朝 (Ver.xxx)
- IPAexゴシック(Ver.xxx)
このサイトに従ってインストールする。
次の両方もしくは１つがPCにインストールされる
- IPAexMincho（IPAex明朝）
- IPAexGothic（IPAexゴシック）

上の例を使い、設定方法の例を示す。

jfont = 'IPAexGothic'    # (1)

fix, ax = plt.subplots()
ax.plot('X', 'Y', 'ro-', data=df2)
ax.set_title('縦横タイトル', size= 30, fontname=jfont)   # (2)
ax.set_xlabel('横軸', size=20, fontname=jfont)          # (3)
ax.set_ylabel('縦軸', size=20, fontname=jfont)          # (4)
ax.legend(prop={'family':jfont, 'size':17})            # (5)
pass

_images/922165b5e1dd0bfa635f15f16cc59c99f1fb716d7625c7fea1b5ab2fd1e8f957.png

(1) 使用するフォントをjfontに割り当てる。

(2) 引数fontnameでjfontを指定する。タイトルのフォントが変更される。

(3) 引数fontnameでjfontを指定する。横軸名のフォントが変更される。

(4) 引数fontnameでjfontを指定する。縦軸名のフォントが変更される。

(5) legendは他と設定方法が異なる。 * propはフォントのプロパティを設定する引数であり、辞書で指定する。 * キーfamilyに値jfontを指定する。凡例のフォントが変更される。 * キーsizeに数値を設定してフォントの大きさが変更される。

この例では個別にフォントを設定したが、一括で全てのフォントを変更する方法もあるが説明は割愛する。

マクロ経済学の例#

投資関数#

実質利子率rによって投資がどのように変化するかを考えてみよう。まず投資関数を次のように仮定する。

def investment(y):
    return 100/(1+r)**50

100：実質利子率が0の場合の投資

実質利子率は次のリストで与えられるとする。

r_list = np.arange(0.01, 0.11, 0.01)
r_list

array([0.01, 0.02, 0.03, 0.04, 0.05, 0.06, 0.07, 0.08, 0.09, 0.1 ])

i_list = []   # 空のリスト

for r in r_list:
    inv = investment(r)   # 投資の計算
    i_list.append(inv)    # リストに追加

df_inv = pd.DataFrame({'investment':i_list,     # DataFrameの作成
                       'interest_rate':r_list})

最初の5行を表示する。

df_inv.head()

	investment	interest_rate
0	60.803882	0.01
1	37.152788	0.02
2	22.810708	0.03
3	14.071262	0.04
4	8.720373	0.05

プロットしてみよう。

fix, ax = plt.subplots()
ax.plot('interest_rate', 'investment', data=df_inv)
pass

_images/4e38d8e9573dccf79a1b37e7ca5d0ddbdff4ca8222a73187c366fc1f8155cfd2.png

この図に次の「飾り付け」をしてみよう。

タイトル投資関数を追加
横軸ラベル実質利子率を追加
縦軸ラベル投資を追加

将来価値#

x万円を実質年率r%の利息を得る金融商品に投資し，t年間の将来価値（期首の値）をリストで示す関数は以下で与えられた。

def calculate_futre_value(x, r, t):
    
    value_list = [x]           # 初期値が入ったリスト
    
    for year in range(1,t+1):  # 1からtまでの期間
        x = x*(1+r)            # 来期のxの値の計算
        value_list.append(x)   # リストに追加
    
    return value_list          # リストを返す

これを使い，

x=100
t=30

の下で実質利子率が次のリストで与えられる値を取る場合の将来価値を図示する。

r_list = [0.01, 0.03, 0.06]   # 実質利子率のリスト
dic = {}                      # 空の辞書

for r in r_list:
    dic['r='+str(r)] = calculate_futre_value(100, r, 30)  # 辞書に追加

df_future = pd.DataFrame(dic) # DataFrameの作成

dic['r='+str(r)]の説明：

str(r)：r_listの要素が割り当てられるrは浮動小数点型なので関数str()を使って文字列型に変換する。
'r='+str(r)：文字列型のr=と文字列型のstr(r)を+で結合する。
dic['r='+str(r)]：辞書dicにキー・値のペアを作成する。
- キー：'r='+str(r)（文字列）
- 値：calculate_futre_value(100, r, 30)の返り値

最初の5行を表示する。

df_future.head()

	r=0.01	r=0.03	r=0.06
0	100.000000	100.000000	100.000000
1	101.000000	103.000000	106.000000
2	102.010000	106.090000	112.360000
3	103.030100	109.272700	119.101600
4	104.060401	112.550881	126.247696

最後の5行を表示する。

df_future.tail()

	r=0.01	r=0.03	r=0.06
26	129.525631	215.659127	454.938296
27	130.820888	222.128901	482.234594
28	132.129097	228.792768	511.168670
29	133.450388	235.656551	541.838790
30	134.784892	242.726247	574.349117

fix, ax = plt.subplots()
ax.plot('r=0.01', data=df_future)
ax.plot('r=0.03', data=df_future)
ax.plot('r=0.06', data=df_future)
ax.legend()
pass

_images/356bdf9a517f0d7cd5c1c288e16dd6eabf72af13aa6bae7c2d37c038f662abd6.png

ax.plot()が続いているので、forループを使う事を推奨する。

fix, ax = plt.subplots()

for col in df_future.columns:     # (1)
    ax.plot(col, data=df_future)

ax.legend()
pass

（１）のdf_future.columnsについて説明すると、.columnsはデータ・フレームdf_futureの属性であり列ラベルを返す。

その他のプロット#

種類#

上で説明した図はライン・プロットと呼ばれる。Matplotlibにはその他にも様々なは種類の図を描くことができるが，以下ではライン・プロット以外に散布図とヒストグラムについて説明する。引数に関しては，上で説明したライン・プロットの引数と共通のものが多いので別に覚える必要はないが，それぞれ独自の引数もあるので基本的なものだけを取り上げることにする。

説明には次のコードで生成するDataFrameを使う。列XとYには標準正規分布（平均0，標準偏差1）から生成した100個のランダム変数が含まれている。Zには正規分布（平均2，標準偏差1）から抽出した100個のランダム変数が格納されている。

df3 = pd.DataFrame({'X':np.random.normal(size=100),
                    'Y':np.random.normal(size=100),
                    'Z':np.random.normal(loc=2, size=100)})

散布図#

基本的には次の構文となる。

fig, ax = plt.subplots()
ax.scatter(＜横軸のデータ＞, ＜縦軸のデータ＞)

DataFrameを使う場合は次のように書くことも可能である。

fig, ax = plt.subplots()
ax.scatter(＜横軸の列ラベル＞, ＜縦軸の列ラベル＞, data=＜DataFrame＞)

df1を使って列XとYを使ってプロットしてみよう。

fig, ax = plt.subplots()
ax.scatter('X', 'Y', data=df3)
pass

_images/9b24087cd808351fcd75dd55b0e29a9fcb2b62193b6e31420483565c7432f651.png

＜基本的な引数＞

様々な引数があり図に「飾り付け」をすることができるが，主な引数を紹介する。詳細はこのサイトを参照。

color：色（リストにして列の順番で指定する; 参照サイト）
- r又はred：赤
- k又はblack：黒
- g又はgreen：グリーン
marker：観測値のマーカー（o，.，>，^などがある; 参照サイト）
s：マーカーの大きさ（markersizeではない！）
fontsize：横軸・縦軸の数字のフォントサイズの設定
label：凡例の表現を指定
- ax.legend()が設定されている場合のみ有効

実際に引数を指定してみよう。

fig, ax = plt.subplots()
ax.scatter('X', 'Y', data=df3,
            color = 'black',
            marker = 'D',
            s = 20,
            label= 'Xの凡例')
ax.legend()
pass

_images/404196e9cc6955454c1715abb2cd5603706d922051fd32b5567bb9e77761d9e2.png

XとZの散布図を加えてタイトルなども付け加えてみよう。

fig, ax = plt.subplots()
ax.scatter('X', 'Y', data=df3,
            color = 'black',
            marker = 'D',
            s = 20,
            label= 'Xの凡例')
ax.scatter('X', 'Z', data=df3,
            color = 'red',
            marker = '1',
            s = 80,
            label= 'Xの凡例')
ax.legend()
ax.set_title('散布図', size=20)
ax.set_xlabel('Xの値', size=15)
ax.set_ylabel('YとZの値', size=15)
pass

_images/ea48c303b20a92d6d1ad46194ea5b36e6cf855d533a932969ed2c60a6b59cf64.png

ヒストグラム#

基本的には次の構文となる。

fig, ax = plt.subplots()
ax.hist(＜データ＞)

DataFrameを使う場合のように書くことも可能である。

fig, ax = plt.subplots()
ax.scatter(＜列ラベル＞, data=＜DataFrame＞)

df3の列Xを使ってプロットしてみよう。

fig, ax = plt.subplots()
ax.hist('X', data=df3)
pass

_images/4a67c853e29e3006a9238582eb3576ee05cbc84d1ea40051281e9a30f75c61fb.png

＜基本的な引数＞

様々な引数があり図に「飾り付け」をすることができる。詳しくはこのリンクを参照することにして，ここでは基本的な引数だけを紹介する。

bins：柱の数
linewidth又はlw：柱の間隔（デフォルトは1）
color：色（リストにして列の順番で指定する; 参照サイト）
- r又はred：赤
- k又はblack：黒
- g又はgreen：グリーン
edgecolor又はec：柱の境界線の色
alpha：透明度（0から1.0; デフォルトは1）
density：縦軸を相対度数にする（デフォルトはFalse）
- 全ての柱の面積の合計が1になるように縦軸が調整される。１つの柱の高さが1よりも大きくなる場合もある。
label：凡例の表現を指定
- ax.legend()が設定されている場合のみ有効

上のヒストグラムに引数をしてしてみよう。

fig, ax = plt.subplots()
ax.hist(df3['X'],
        color='green',
        bins = 20,
        ec='white',
        lw=3,
        density=True)
pass

_images/d22fe6676dd5035d04667804697a0b6091c0af02c1b175eefde66cf3dd5cbe88.png

次に複数のデータを並べてプロットする場合を考えよう。方法は簡単で，異なるデータをリストとして指定すれば良い。

fig, ax = plt.subplots()
ax.hist([df3['X'],df3['Z']],
        bins = 20,
        color = ['black','red'],
        ec='black',
        label=['Xの凡例','Yの凡例'])
ax.legend()
ax.set_title('ヒストグラム', size=20)
pass

_images/daa533a1d68002979fa8254c75cada11bc4313316e6fb912f55037af90d3b754.png

上のコードに引数stacked=Trueを加えると，柱を重ねて表示される。試してみよう。またax.hist()を２回使うと，２つのヒストグラムを重ねて表示することができる。この場合，引数alphaの値を調整すると良いだろう。

fig, ax = plt.subplots()
ax.hist(df3['X'],
        bins = 20,
        color = 'black',
        ec='black',
        alpha=0.5,
        label='Xの凡例')
ax.hist(df3['Z'],
        bins = 20,
        color = 'red',
        ec='black',
        alpha=0.5,
        label='Zの凡例')
ax.legend()
ax.set_title('ヒストグラム', size=20)
pass

_images/f36d18bc6f5ba25caa0ebb45225605142b66ddb755bc29dfa31dfb0be74d084f.png

濃い赤の部分が重なっている部分となる。

ヒストグラムは縦軸に度数，横軸に階級を取ったグラフだが，関連する手法にカーネル密度推定と呼ばれるものがある。考え方は簡単で，上のようなヒストグラムのデータに基づき面積が１になるようにスムーズな分布を推定する手法である。残念ながらMatplotlibにはカーネル密度推定プロットのメソッドは実装されていない。しかしDataFrameのメソッドplot()を使えば簡単に描くことが可能である。興味がある読者はこのセクションを参考にしてはどうだろう。

縦線・横線#

図に縦線や横線を追加したい場合がある。その場合は，他の図と同じように「軸」に追加していく事になる。次のような書き方となる。

縦線の場合
```
ax.axvline(＜横軸の値＞)
```
ここでaxvlineのaxはAXis，vはVertical，lineはLINEのことを表している。
横線の場合
```
ax.axhline(＜縦軸の値＞)
```
ここでaxhlineのaxはAXis，hはHorizontal，lineはLINEのことを表している。

ここでaxは.subplots()で返された「軸」のことである。

ヒストグラムを使ってプロットしてみよう。

fig, ax = plt.subplots()
ax.hist(df3['X'], alpha=0.2)
ax.axhline(10)
ax.axvline(0)
pass

_images/9c42ddf76d1226a055d9a7b410ea9baa25097cf8becb10ac310d04710ac5a376.png

＜基本的な引数＞

様々な引数があり図に「飾り付け」をすることができる。詳しくはこのリンクとこのリンクを参照することにして，ここでは基本的な引数だけを紹介する。

ymin：axvlineの縦軸における最小値（0~1の値; デフォルト0）
ymax：axvlineの縦軸における最大値（0~1の値; デフォルト1）
xmin：axhlineの横軸における最小値（0~1の値; デフォルト0）
xmax：axhlineの横軸における最大値（0~1の値; デフォルト1）
linestyle：線のスタイル（リストにして列の順番で指定する;-``--``-.``:）
linewidth or lw：線の幅
color：色（リストにして列の順番で指定する; 参照サイト）
- rは赤
- kは黒
- gはグリーン
alpha：透明度（0から1.0; デフォルトは1）

fig, ax = plt.subplots()
ax.hist(df3['X'], alpha=0.2)
ax.axvline(0,
           ymin=0.3,
           ymax=0.95,
           linestyle=':',
           linewidth=5,
           color='g',
           alpha=0.8)
ax.axhline(10,
           xmin=0.05,
           xmax=0.7,
           linestyle='-.',
           linewidth=3,
           color='k',
           alpha=0.5)
pass

_images/0b82ef47dc2f67d4d7c238d75ac586442872250a98284f8f3efd2f5f15529fbb.png

棒グラフ#

まず次のコードでデータを準備しよう。

df4 = pd.DataFrame({'country':['A','B','C'],
                    'gdp':[100,90,110],
                    'con':[50,60,55],
                    'inv':[15,10,20],
                    'gov':[10,5,30],
                    'netex':[25,15,5]})
df4

	country	gdp	con	inv	gov	netex
0	A	100	50	15	10	25
1	B	90	60	10	5	15
2	C	110	55	20	30	5

３国のGDPとその構成要素からなるDataFrameである。

country：国
gdp：GDP
con：消費
inv：投資
gov：政府支出
netex：純輸出

このDataFrameを使って棒グラフの作成方法を説明するが，次の構文となる。 fig, ax = plt.subplots() ax.scatter(＜横軸の列ラベル＞, ＜縦軸の列ラベル＞, data=＜DataFrame＞)

まずA国のgdpの棒グラフを表示してみよう。

fig, ax = plt.subplots()
ax.bar('country','gdp', data=df4)
pass

_images/06fc352cbde95d9734adbdcefe0e9bfec11eeb842e9dd96b8b379aa832555328.png

＜基本的な引数＞

詳しい引数についての説明はこのリンクを参照することにして，ここでは基本的な引数だけを紹介する。

width：棒の幅（デフォルトは0.8）
bottom：縦軸での棒の基点（デフォルトは0）
color：色（リストにして列の順番で指定する; 参照サイト）
- r又はred：赤
- k又はblack：黒
- g又はgreen：グリーン
edgecolor又はec：柱の境界線の色
linewidth又はlw：柱の境界線の幅
alpha：透明度（0から1.0; デフォルトは1）
label：凡例の表現を指定
- ax.legend()と一緒に使う。

これらの引数を使いプロットしてみよう。

fig, ax = plt.subplots()
ax.bar('country','gdp', data=df4,
       width=0.5,
       color='green',
       ec='black',
       linewidth=5,
       alpha=0.5,
       label='GDP')
ax.legend()
ax.tick_params(axis='both', labelsize=15)
pass

_images/b38f454a2757a9687ff37c7748d6281ed19e6d0fa5c5ae4528810e551b735ff6.png

ax.tick_params()は縦軸と横軸の文字の大きさを調節している。

次に複数の列データを表示する場合を考えてみよう。まず単に軸にデータを追加する場合を考えてみる。

fig, ax = plt.subplots()
ax.bar('country','con', data=df4, label='消費')
ax.bar('country','inv', data=df4, label='投資')
ax.legend()
pass

_images/be882a88ca90b5b03fdb7743b399c5f386abdaed13c5e716aaf6ca6962d6894f.png

縦軸を確認するとわかるが，まず消費（con）の棒がプロットされ，それに投資（ivn）の棒が重ねてプロットされている。これは引数base（縦軸における棒の基点）がデフォルトの0に設定されており，消費も投資も0から始まっているためである。この点を踏まえ，棒を積み上げる場合を考えよう。その場合，投資のbaseは消費の高さになる必要がある。また政府支出を積み上げる場合は，積み上がった消費の高さが政府支出の基点になる必要がある。純輸出を積み上げる場合も同様に考える必要がある。この点に注意して棒を積み上げるには次のようなコードとなる。

base = df4.iloc[:,2:].cumsum(axis='columns') # (1)
base = base - df4.iloc[:,2:]                 # (2)

var_list = df4.columns[2:]                   # (3)
leg_list = ['消費','投資','政府支出','純輸出']    # (4)

fig, ax = plt.subplots()

for v, l in zip(var_list, leg_list):
    ax.bar('country', v, data=df4,
           label=l,
           bottom=base.loc[:,v])            # (5)

ax.plot('gdp', data=df4,                    # (6)
        color='black', 
        marker='o',
        label='GDP')
ax.legend()
pass

_images/123a2b0458207ae484dfd261ef11c1f31724f5e810f8b51f4c83194821e996e1.png

(1)〜(2)で棒の基点となる値をDataFrameとして計算し，それを(5)で使っている。(3)〜(4)行目はforループに使うイタラブルを作成している。また(6)では列gdpのライン・プロットを追加している。コードを見るとわかるように，少々複雑である。よりシンプルなコードで同じ図を描きたい場合は，ここで説明しているDataFrameのメソッドplot()を参考にすると良いだろう。その方法では(1)〜(2)を自動計算するため引数baseの値を考える必要がない。

次に，複数の棒（データ）を横に並べたい場合を考えてみよう。主に次の２つの点でコードが少々複雑になってしまう。

引数widthを使い，棒の横の位置を調整する必要がある。
国名A，B，Cの位置を調整する必要がある。

この２点を考慮すると次のコードとなる。

idx = df4.index                 # (1)
wd = 1/5                        # (2)
x_ticks = df4.loc[:,'country']  # (3)

fig, ax = plt.subplots(figsize=(8,4))

for i, (v, l) in enumerate(zip(var_list, leg_list)):
    ax.bar(idx+wd*(i+1),        # (4)
           v,
           data=df4,
           label=l,
           width=wd)            # (5)
    
ax.legend()
ax.set_xticks(idx+wd*2.5,       # (6)
              x_ticks,          # (7)
              fontsize=15)      # (8)
pass

_images/0ca47560b2d0dfe90bf1385cca731f11711ca515d821569a0209e13c116b3248.png

簡単にコードを説明する。

(1) df4の行インデック（番号）をidxに割り当てる。これを図の横軸に使う。そのままでは国名が表示されないので，(7)で設定することになる。
(2) 棒の幅を1/5としてwdに割り当てる。
(3) 国名をx_ticksに割り当てる。(7)で使うことになる。
(4) 棒の横軸の位置を指定する。ループが実行されるごとに表示される棒はwdだけ右にシフトすることになる。
(5) 棒の幅をwdにする。
(6) 横軸の目盛の位置を指定する。
(7) 横軸の目盛ラベルを国名x_ticksとする。
(8) 目盛ラベルのフォントの大きさを指定する。

よりシンプルなコードで同じ図を書きたい場合は，ここで説明しているDataFrameのメソッドplot()を使う方法を利用しても良いだろう。

Matplotlib：図示

Contents

Matplotlib：図示#

説明#

データの引数の書き方１#

arrayを使って#

DataFrameを使って#

データの引数の書き方２#

同じDataFrameを使う#

異なるDataFrameの変数を図示する#

その他の引数とメソッド#

subplots()の引数#

plot()の基本的な引数#

axの基本的なメソッド#

図を並べる#

２軸グラフ#

日本語#

japanize_matplotlib#

フォントを指定する#

マクロ経済学の例#

投資関数#

将来価値#

その他のプロット#

種類#

散布図#

ヒストグラム#

縦線・横線#

棒グラフ#

`Matplotlib`：図示#

`array`を使って#

`DataFrame`を使って#

同じ`DataFrame`を使う#

異なる`DataFrame`の変数を図示する#

`subplots()`の引数#

`plot()`の基本的な引数#

`ax`の基本的なメソッド#

`japanize_matplotlib`#