2章：パーセプトロン【ゼロつく1のノート(実装)】

はじめに

　「プログラミング」初学者のための『ゼロから作るDeep Learning』攻略ノートです。『ゼロつくシリーズ』学習の補助となるように適宜解説を加えています。本と一緒に読んでください。

　関数やクラスとして実装される処理の塊を細かく分解して、1つずつ実行結果を見ながら処理の意図を確認していきます。

　この記事は、2章「パーセプトロン」の内容です。パーセプトロンをPythonで実装します。

【前節の内容】

www.anarchive-beta.com

【他の節の内容】

www.anarchive-beta.com

【この節の内容】

はじめに
2章パーセプトロン
参考文献
おわりに

2章パーセプトロン

　2章では、4つの論理回路AND・NAND・OR・XORの実装を通じて、パーセプトロンのアルゴリズムを解説します。

　利用するライブラリを読み込みます。

# 2章で利用するライブラリ
import numpy as np

2.2 単純な論理回路

　パーセプトロンを用いた実装の前に、論理演算子を使って3つの論理回路AND・NAND・ORの出力を確認します。

・論理演算子

　まずは、論理演算子and・or・notの機能を確認しましょう。ちなみに、この本では終盤に(1・2回だけ)条件式(if文)の中で使われます。
　論理演算子は、bool型(ブーリアン,真偽値,論理値)や条件式に対して利用します。論理値は、真Trueと偽Falseの2つの値をとるデータ型です。また、Trueは1、Falseは0としても扱われます(論理値を使って計算もできます)。

　andは、論理積と呼ばれ、次の形式で使います。

論理値(条件式) and 論理値(条件式)

　2つの論理値がどちらもTrueのときTrueを、それ以外のときFalseとなります。

# 論理値を使った例
print(True and True)
print(True and False)
print(False and True)
print(False and False)

True
False
False
False

　条件式でも同じ結果になります。

# 条件式を使った例
print(10 == 10 and 10 < 11)
print(True and 10 > 11)

True
False

　10 == 10と10 < 11はTrue、10 > 11はFalseとして処理されています。

　orは、論理和と呼ばれ、次の形式で使います。

論理値(条件式) or 論理値(条件式)

　2つの論理値が1つでもTrueのときTrueを、どちらもFalseのときFalseとなります。

# 論理値を使った例
print(True or True)
print(True or False)
print(False or True)
print(False or False)

True
True
True
False

　条件式でも同様です。

# 条件式を使った例
print(10 == 10 or 10 < 11)
print(True or 10 > 11)

True
True

　notは、否定と呼ばれ、次の形式で使います。

not 論理値(条件式)

　論理値がTrueのときFalseを、FalseのときTrueとなります。つまり、渡された値と反対の値を返します。

# 論理値を使った例
print(not True)
print(not False)

False
True

　条件式でも同様です。

# 条件式を使った例
print(not 6 == 6)
print(not 11 > 13)

False
True

　論理演算子を確認できました。

・論理演算子を用いた論理回路

　続いて、論理演算子and・or・notを用いて、単純な論理回路AND・NAND・ORを再現していきます。

　ANDゲート(論理積)は、2つの入力がどちらも1のとき1を、それ以外のとき0を出力します。つまり、andをそのまま使って処理できます。

# ANDゲート
print(0 and 0)
print(1 and 0)
print(0 and 1)
print(1 and 1)

　NANDゲート(否定論理積)は、ANDゲートの出力を反転させたものです。2つの入力がどちらも1のとき0を、それ以外のとき1を出力します。andの出力をnotで処理します。

# NANDゲート
print(int(not (0 and 0)))
print(int(not (1 and 0)))
print(int(not (0 and 1)))
print(int(not (1 and 1)))

　int()を使って、論理値True, Falseから整数1, 0に変換しています。

# 論理値から整数に変換
print(int(True))
print(int(False))

1
0

　Trueは1、Falseは0に対応しています。

　文字列(str)型や浮動小数点(float)型からも整数(int)型に変換できます。

# 文字列から整数に変換
print(int('10'))

# 浮動小数点から整数に変換
print(int(10.0))
print(int(10.5))

10
10
10

　ただし、小数点以下は切り捨てられます。int()も終盤に、データ数や次元数など整数を扱う計算にて使われます。

　ORゲート(論理和)は、2つの入力が1つでも1のとき1を、どちらも0のとき0を出力します。これも、orをそのまま使って処理できます。

# ORゲート
print(0 or 0)
print(1 or 0)
print(0 or 1)
print(1 or 1)

　以上で、3つの単純な論理回路を確認できました。次からは、パーセプトロンを用いて論理回路を再現していきます。

2.3 パーセプトロンを用いた論理回路の実装

　パーセプトロンを用いて論理回路AND・NAND・ORを実装します。

2.3.1 簡単な実装

　まずは、ANDゲートを例として、パーセプトロンで行う処理を確認していきます。

　パーセプトロンは、次の式の計算(処理)を行います。

$$ y = \begin{cases} 0 \quad (w_1 x_1 + w_2 x_2 \leq \theta) \\ 1 \quad (w_1 x_1 + w_2 x_2 > \theta) \end{cases} \tag{2.1} $$

　この式は、「重み付き和$w_1 x_1 + w_2 x_2$」と「閾値$\theta$」を比較して、等しいまたは重み付き和が大きいとき出力$y$が1、重み付き和が小さいとき$y$が0であることを表しています。

・処理の確認

　パーセプトロンによるANDゲートで行う処理を確認します。

　2つの入力$x_1,\ x_2$をx1, x2として値を指定します(変数を作成します)。

# 仮の入力を指定
x1 = 0
x2 = 1
print(x1)
print(x2)

0
1

　次のようにして、1行で複数の変数を作成できます。

# 仮の入力を指定
x1, x2 = 0, 1
print(x1)
print(x2)

0
1

　これは実装に必要な処理を確認するのが目的なので、0と1の4パターンの組み合わせからどれか1つ指定します。

　同様に、重み$w_1,\ w_2$をw1, w2、閾値$\theta$をthetaとして値を指定します。

# 重みと閾値を設定
w1, w2, theta = 0.5, 0.5, 0.7
print(w1)
print(w2)
print(theta)

0.5
0.5
0.7

　この例では、$w_1 = 0.5,\ w_2 = 0.5,\ \theta = 0.7$とします。

　これで必要な変数(オブジェクト)を作成できました。続いて、出力に関する処理を行います。

　$w_1 x_1 + w_2 x_2$を計算して、結果をtmpに代入します。この計算結果は、thetaとの大小関係を調べるために利用する一時的なデータなので、変数名をtmp (temporary:一時的)とします(よく使われる表現です)。

# 重み付き和を計算
tmp = x1 * w1 + x2 * w2
print(tmp)

0.5

　入力ごとに対応する重みを掛けた総和を重み付き和と呼びます。

　重み付き和tmpが、閾値theta以下であれば0、thetaより大きければ1を出力します。条件によって異なる処理をする場合(条件分岐)にはif文を使います。

# 条件に従って値を出力
if tmp <= theta: # 閾値以下の場合
    # 0を出力
    print(0)
elif tmp > theta: # 閾値より大きい場合
    # 1を出力
    print(1)

　重み付き和0.5が閾値0.7より小さいので、0が出力されました。

　以上がパーセプトロンを用いたANDゲートで行う処理です。

・実装

　処理の確認ができたので、ANDゲートを関数として実装します。

　入力x1, x2はこの時点では何か分からない(関数を使うときに渡す)値なので、引数として受け取れるように実装します。重みと閾値は固定の値なので、関数内で指定します。

# ANDゲートの実装
def AND(x1, x2):
    # 重みと閾値を設定
    w1, w2, theta = 0.5, 0.5, 0.7
    
    # 重み付き和を計算
    tmp = x1 * w1 + x2 * w2
    
    # 条件に従って値を出力
    if tmp <= theta: # 閾値以下の場合
        return 0
    elif tmp > theta: # 閾値より大きい場合
        return 1

　関数を定義できたので、全ての入力パターンで確認してみましょう。

# ANDゲートの処理を確認
print(AND(0, 0))
print(AND(1, 0))
print(AND(0, 1))
print(AND(1, 1))

　正しく出力されました！

　さて、目的通りの出力が得られましたが、もっと効率的な実装方法もあります。次は、他の論理回路も含めて効率化した処理で実装していきます。

2.3.2 重みとバイアスの導入

　2.3.1項では、閾値が出力に影響しました。以降は、閾値の代わりにバイアスを用います。

・数式の確認

　まずは、数式からパーセプトロンを確認します。

　これまでのパーセプトロンでは、次の計算を行っていました。

$$ y = \begin{cases} 0 \quad (w_1 x_1 + w_2 x_2 \leq \theta) \\ 1 \quad (w_1 x_1 + w_2 x_2 > \theta) \end{cases} \tag{2.1} $$

　この式は、「重み付き和$w_1 x_1 + w_2 x_2$」と「閾値$\theta$」を比較して、出力が$y = 1$または$y = 0$に決まることを表しているのでした。
　式(2.1)の$\theta$を左辺に移項します(両辺から$\theta$を引きます)。

$$ y = \begin{cases} 0 \quad (w_1 x_1 + w_2 x_2 - \theta \leq 0) \\ 1 \quad (w_1 x_1 + w_2 x_2 - \theta > 0) \end{cases} \tag{2.1'} $$

　この式変形によって、「左辺」が「0以下か0より大きいか」で出力$y$の値が決まるようになりました。勿論、式(2.1)と式(2.1')とで結果は変わりません。
　さらに、この式(2.1')を$b = - \theta$で置き換えます($- \theta$を$b$に置き換えます)。

$$ y = \begin{cases} 0 \quad (w_1 x_1 + w_2 x_2 + b \leq 0) \\ 1 \quad (w_1 x_1 + w_2 x_2 + b > 0) \end{cases} \tag{2.2} $$

　$b$をバイアスと呼びます。つまり、「重み付き和にバイアスを加えた値」が「0以下か0より大きいか」で出力$y$が決まります。勿論、式(2.1)と計算結果は変わりません。

　$w_1 x_1 + w_2 x_2 + b$の計算は、この本を通して最も基本的なそして重要な計算です。以降はこれを「重み付き入力とバイアスの和」または単に「重み付き和」と呼びます。

　また、この本では登場しない表現(なので読み飛ばして問題ないの)ですが、次のように重みとバイアスをまとめて表記することもあります。

・むしろややこしくなるので省略(クリックで展開)

　バイアス$b$を0番目の重み$w_0$とみなして、重みを$\mathbf{w} = (w_0, w_1, w_2)$とします。また、$w_0$に対応する入力を$x_0 = 1$として(0番目の入力を1で固定して)、入力を$\boldsymbol{\mathrm{x}} = (x_0, x_1, x_2) = (1, x_1, x_2)$とします。
　これによって、重み付き入力とバイアスの和を、入力$\mathbf{x}$と重み$\mathbf{w}$の内積$\mathbf{x} \mathbf{w}$で表現できます。

$$ \begin{aligned} w_1 x_1 + w_2 x_2 + b &= \mathbf{x} \mathbf{w} \\ &= \sum_{i=0}^2 w_i x_i \\ &= w_0 x_0 + w_1 x_1 + w_2 x_2 \\ &= w_0 + w_1 x_1 + w_2 x_2 \\ \end{aligned} $$

　ベクトルや内積については次章で説明します。また、今後登場する$x_0$や$w_0$は、ここで登場したものとは別のものです。

・処理の確認

　次は、効率化したパーセプトロンによるANDゲートで行う処理(式(2.2)の計算)を確認します。

　先ほどは、$x_1,\ x_2$に対応する2つの変数(オブジェクト)x1, x2を用意しました。ここでは、1つのNumPy配列を用いて$\boldsymbol{\mathrm{x}} = (x_1, x_2)$の形式で扱います。

# 仮の入力を指定
x = np.array([0, 1])

　$x_1$がx[0]、$x_2$がx[1]に対応します。

　同様に、重み$\mathbf{w} = (w_1, w_2)$とバイアス$b$の値を指定します。

# 重みを設定
w = np.array([0.5, 0.5])

# バイアスを設定
b = -0.7

　$w_1$がw[0]、$w_2$がw[1]です。

　これで必要な変数(オブジェクト)を作成できました。続いて、出力に関する処理を行います。

　入力と対応する重みの積は、配列同士の掛け算で行えます。

# 入力を重み付け
print(x * w)

[0.  0.5]

　1つ目の要素同士、2つ目の要素同士で計算されているのを確認できます。

　対応する要素同士の掛け算の結果をnp.sum()で合計します。

# 重み付き和を計算
print(np.sum(x * w))

0.5

　NumPy配列として扱うことで、NumPyの関数を利用しやすくなります。

　さらに、バイアスを加えた値をtmpとします。

# 重み付き和とバイアスの和
tmp = np.sum(x * w) + b
print(tmp)

-0.19999999999999996

　重み付き和が求まりました。-0.2にならないのはコンピュータ上で数値を扱う際に生じる誤差です。この実装では問題にならないのでこのまま進めます。

　複数の入力を配列として扱うことで、今後入力の要素数が増えて$\mathbf{x} = (x_1, x_2, \cdots, x_n)$となっても、データ数に関わらず同じ処理を行えます。x1 * w1 + x2 * w2 + ・・・とは書きたくないですよね。

　重み付き和tmpの値が、0以下であれば0を、0より大きければ1を出力します。
　先ほどの実装例では、ifとelifを使いました。しかし、0以下でない場合は0より大きい値なので、2つ目の条件を調べる必要はありません。よって、ifとelseを使います。

# 条件に従って値を出力
if tmp <= 0: # 0以下の場合
    # 0を出力
    print(0)
else: # 0より大きい場合
    # 1を出力
    print(1)

　目的通りの出力が得られました。

　以上がパーセプトロンを用いたANDゲートで行う(効率化した)処理です。

・実装

　処理の確認ができたので、3つの論理回路AND・NAND・ORを関数として実装します。

　ANDゲートを実装します。引数として与えられる2つの値を、NumPy配列のxに変換する処理を加えます。

# ANDゲートの実装
def AND(x1, x2):
    # 入力をNumPy配列にまとめる
    x = np.array([x1, x2])
    
    # 重みとバイアスを設定
    w = np.array([0.5, 0.5])
    b = -0.7
    
    # 重み付き和を計算
    tmp = np.sum(x * w) + b
    
    # 条件に従って値を出力
    if tmp <= 0: # 0以下の場合
        # 0を出力
        return 0
    else: # 0より大きい場合
        # 1を出力
        return 1

　実装した関数を試してみましょう。

# ANDゲートの処理を確認
print(AND(0, 0))
print(AND(1, 0))
print(AND(0, 1))
print(AND(1, 1))

　問題ないですね！

　このように、様々な方法で目的の処理や計算を行えます。時間やマシンスペックといった制限の中で、効率的な実装を考えることも重要になってきます(追々ね)。

　同様に、NANDゲートも実装します。AND()のパラメータの値を変更するだけで実装できます。

# NANDゲートの実装
def NAND(x1, x2):
    # 入力をNumPy配列にまとめる
    x = np.array([x1, x2])
    
    # 重みとバイアスを設定
    w = np.array([-0.5, -0.5])
    b = 0.7
    
    # 重み付き和を計算
    tmp = np.sum(x * w) + b
    
    # 条件に従って値を出力
    if tmp <= 0: # 0以下の場合
        return 0
    else: # 0より大きい場合
        return 1

# NANDゲートの処理を確認
print(NAND(0, 0))
print(NAND(1, 0))
print(NAND(0, 1))
print(NAND(1, 1))

　ORゲートもパラメータの値を変更するだけで実装できます。

# ORゲートの実装
def OR(x1, x2):
    # 入力をNumPy配列にまとめる
    x = np.array([x1, x2])
    
    # 重みとバイアスを設定
    w = np.array([0.5, 0.5])
    b = -0.2
    
    # 重み付き和を計算
    tmp = np.sum(x * w) + b
    
    # 条件に従って値を出力
    if tmp <= 0: # 0以下の場合
        return 0
    else: # 0より大きい場合
        return 1

# ORゲートの処理を確認
print(OR(0, 0))
print(OR(1, 0))
print(OR(0, 1))
print(OR(1, 1))

　単純な論理回路を実装できました。次は、同じ方法では実装できない論理回路を実装します。

2.5 多層パーセプトロン

　パラメータの調整だけでは対応できない場合は、層を重ねる(処理を組み合わせる)ことで出力を調整できます。

　これまでに実装したAND()・NAND()・OR()を2層に組み合わせてXORゲート(排他的論理和)を実装します。

　まずは、図2-11を参考にして処理を確認します。

　これまでのように、入力$x_1,\ x_2$を作成します。

# 仮の入力を指定(第0層)
x1, x2 = 1, 1

　4つのパターンから1つの組み合わせを指定します。

　第1層の計算を行います。NAND()の出力をs1、OR()の出力をs2とします。

# 第1層の演算
s1 = NAND(x1, x2)
s2 = OR(x1, x2)
print(s1)
print(s2)

0
1

　s1, s2が第1層の出力であり、第2層の入力でもあります。

　第1層の出力s1, s2を次の層AND()に入力します。

# 第2層の演算
y = AND(s1, s2)
print(y)

　全体の出力yが得られました。

　処理の確認ができたので、XORゲートを関数として実装します。

# XORゲートの実装
def XOR(x1, x2):
    # 第1層の演算
    s1 = NAND(x1, x2)
    s2 = OR(x1, x2)
    
    # 第2層の演算
    y = AND(s1, s2)
    
    # 結果を出力
    return y

　実装した関数を試してみましょう。

# XORゲートの処理を確認
print(XOR(0, 0))
print(XOR(1, 0))
print(XOR(0, 1))
print(XOR(1, 1))

　AND()・NAND()・OR()のそれぞれが1層のパーセプトロンです。パーセプトロンを2層にすることでXORを実装できました。

・重みの役割

　最後におまけとして、少し違う視点から重みの役割を見てみます(おまけなので飛ばしても問題ないです)。

・話がそれるので省略(クリックで展開)

　2つの入力を$x_1 = 10,\ x_2 = 5$とします。これを$\boldsymbol{\mathrm{x}} = (10, 5)$と書くことにします。また、2つの重みを$w_1 = 0.1,\ w_2 = 0.9$とします。こちらも$\boldsymbol{\mathrm{w}} = (0.1, 0.9)$と書きます。

# 入力を指定
x = np.array([10, 5])

# 重みを指定
w = np.array([0.1, 0.9])

　入力をそれぞれ重み付けしてみましょう。

# 各入力を重み付け
print(x * w)

[1.  4.5]

　1つ目の値は10から1に、2つ目の値は5から4.5になりました。重みによって大小関係が入れ替わっていますね。出力に用いる入力の情報を重みによって調整したと言えます。

　入力と重みと出力の関係は、例えば「マンガの魅力」として「キャラクター」と「ストーリー」のどちらを重視するのかというイメージです。重視する方の重みが大きくなります。
　キャラ点を$x_{\mathrm{chara}}$、ストーリー点を$x_{\mathrm{story}}$で表すことにします。同様に、キャラとストーリーの重み(重要度)をそれぞれ$w_{\mathrm{chara}},\ w_{\mathrm{story}}$で表すことにします。
　ある作品の点が$\mathbf{x} = (x_{\mathrm{chara}}, x_{\mathrm{story}}) = (40, 60)$だったとします。この作品を、キャラとストーリーのどちらも重視する人$\mathbf{w} = (w_{\mathrm{chara}}, w_{\mathrm{story}}) = (0.5, 0.5)$が評価すると、魅力度は次のようになります。

# 入力を指定
x = np.array([40, 60])

# 重みを指定
w = np.array([0.5, 0.5])

# 重み付き和(魅力)を計算
print(np.sum(x * w))

50.0

　マンガの魅力は50となりました。

　また、ストーリー重視の人$\mathbf{w} = (0.3, 0.7)$にとっては次にようになります。

# 重みを指定
w = np.array([0.3, 0.7])

# 重み付き和(魅力)を計算
np.sum(x * w)

54.0

　先ほどの人よりも高く評価(出力)されました。重視している(重みが大きい)「ストーリー」の点が高いからですね。

　さらに、バイアスも加えて考えてみましょう。
　例えば、$b = -50$とすれば、魅力とバイアスの和が0を越えれば買う($y = 1$)、0以下だと買わない($y = 0$)となります。閾値$\theta = -b = 50$でいうと、魅力が50を超えると買う、50以下だと買わないということですね。
　別の例として、好きな雑誌によって加点するイメージです。ジャンプマンガであればキャラとストーリーとは別に10点加算($b = 10$)する働きをします。

　パラメータ(重みとバイアス)をイメージできたでしょうか。

　以上で、2章の内容は完了です。2章では、パーセプトロンを用いて目的の値を出力(論理回路を実装)しました。また、「パラメータを調整する」ことと「層を重ねる」ことで出力を調整できることが分かりました。
　3章では、より多様な出力を表現できるようにパーセプトロンを発展させた「ニューラルネットワーク」について解説します。このニューラルネットワークが深層学習の肝になります。また、ニューラルネットワークの層を深く重ねることを深層と表現しています。
　4章では、機械的にパラメータを調整することを意味する「学習」について解説します。

参考文献

斎藤康毅『ゼロから作るDeep Learning』オライリー・ジャパン,2016年.
サポートページ：2章のコード(https://github.com/oreilly-japan/deep-learning-from-scratch/tree/master/ch02)

おわりに

　順調です！

2021.07.23：加筆修正しました。

　パーセプトロンと論理回路の関係、パーセプトロンとニューラルネットワークの関係を整理できた。そして文字数が倍に増えてしまった。

【次節の内容】

からっぽのしょこ

読んだら書く！書いたら読む！同じ事は二度調べ(たく)ない

2章：パーセプトロン【ゼロつく1のノート(実装)】

はじめに

2章パーセプトロン

2.2 単純な論理回路

・論理演算子

・論理演算子を用いた論理回路

2.3 パーセプトロンを用いた論理回路の実装

2.3.1 簡単な実装

・処理の確認

・実装

2.3.2 重みとバイアスの導入

・数式の確認

・処理の確認

・実装

2.5 多層パーセプトロン

・重みの役割

参考文献

おわりに

はじめに

2章 パーセプトロン

2.2 単純な論理回路

・論理演算子

・論理演算子を用いた論理回路

2.3 パーセプトロンを用いた論理回路の実装

2.3.1 簡単な実装

・処理の確認

・実装

2.3.2 重みとバイアスの導入

・数式の確認

・処理の確認

・実装

2.5 多層パーセプトロン

・重みの役割

参考文献

おわりに

2章パーセプトロン