Pythonでベイズ最適化を使ってハイパーパラメータを探索するライブラリ実装のメモ

テクノロジー

ベイズ最適化(参考:ベイズ最適化入門, 機械学習のためのベイズ最適化入門)を使うと、機械学習の時の各種Try&Errorで決めざるを得ないようなハイパーパラメータの探索を効率よく実施できる可能性があります。

今回使っている各種Version

コード


bayesian_optimizer.py
from itertools import product

from sklearn.gaussian_process import GaussianProcess
# The MIT License (C) 2016 mokemokechicken


class BayesianOptimizer:

x_list = None

y_list = None

yielding_index = None

k_band = 5

verbose = False


def __init__(self, params):

self.params = params

self.keys = []

self.values = []

for k, v in sorted(self.params.items()):

self.keys.append(k)

self.values.append(v)


@property

def n_pattern(self):

return len(list(product(*self.values)))


def output(self, *args, **kwargs):

if self.verbose:

print(*args, **kwargs)


def supply_next_param(self, max_iter=None):

self.x_list = []

self.y_list = []

all_parameters = list(product(*self.values)) # [(0.01, [0, 0], 0, [10, 10]), (0.01, [0, 0], 0, [15, 15]), ...

index_space = [list(range(len(v))) for v in self.values] #

all_index_list = list(product(*index_space)) # [(0, 0, 0, 0), (0, 0, 0, 1), ...


# examine 2 random points initially

idx = list(range(len(all_index_list)))

np.random.shuffle(idx)

searched_index_list = []

for index in idx[:2]:

param = self.to_param(all_parameters[index])

self.yielding_index = all_index_list[index]

searched_index_list.append(index)

yield param


# Bayesian Optimization

max_iter = int(min(max_iter or max(np.sqrt(self.n_pattern)*4, 20), self.n_pattern)) # 最大探索回数を適当に計算。

for iteration in range(max_iter):

k = 1 + np.exp(-iteration / max_iter * 3) * self.k_band # kの値を徐々に減らして 探索重視 → 活用重視 にしてみる

gp = self.create_gp_and_fit(np.array(self.x_list), np.array(self.y_list))


mean_array, mse_array = gp.predict(all_index_list, eval_MSE=True)

next_index, acq_array = self.acquisition(mean_array, mse_array, k, excludes=searched_index_list)


self.output("--- Most Expected Predictions")

for acq, ps in sorted(zip(acq_array, all_parameters), reverse=True)[:3]:

self.output("%.2f: %s" % (acq, list(zip(self.keys, ps))))

self.output("--- Past Best Results")

for acq, vs, ps in self.best_results(3):

self.output("%.2f: %s" % (acq, list(zip(self.keys, vs))))


if next_index in searched_index_list:

break

searched_index_list.append(next_index)

self.yielding_index = all_index_list[next_index]

yield self.to_param(all_parameters[next_index])


@staticmethod

def create_gp_and_fit(x, y, max_try=100):

# この辺怪しい

theta0 = 0.1

for i in range(max_try+1):

try:

gp = GaussianProcess(theta0=theta0)

gp.fit(x, y)

return gp

except Exception as e:

theta0 *= 10

if i == max_try:

print(theta0)

raise e


def to_param(self, row):

return dict(zip(self.keys, row))


def report(self, score):

self.x_list.append(self.yielding_index)

self.y_list.append(score)


def best_results(self, n=5):

index_list = []

param_list = []

for xs in self.x_list:

values = [self.values[i][x] for i, x in enumerate(xs)]

index_list.append(values)

param_list.append(self.to_param(values))

return sorted(zip(self.y_list, index_list, param_list), reverse=True)[:n]


@staticmethod

def acquisition(mean_array, mse_array, k, excludes=None):

excludes = excludes or []

values = mean_array + np.sqrt(mse_array) * k

for_argmax = np.copy(values)

for ex in excludes:

for_argmax[ex] = -np.Inf

return np.argmax(for_argmax), values

使い方


基本的な使い方は以下のようになります。

params = {

"parameter1": [10, 20, 25, 50],

"parameter2": ['p1', 'p2'],

...

}
bo = BayesianOptimizer(params) # パラメータの組み合わせを辞書で渡す


for param in bo.supply_next_param(): # 次調べたほうが良いparamをdictで渡される

y = unknown_score_function(param) # なんらかの方法でその param を評価する

bo.report(y) # 評価値を教えてあげる


print(bo.best_results()) # 一応一番良いScoreの値やparamは覚えてくれている

2次元空間でのデモ


ちゃんと動くか Jupyter notebook上で試したものを以下に置いてます。
https://gist.github.com/mokemokechicken/7f3cf33c71d33bf0ec242c37cb3f2a75

探索空間


以下の様な 50 x 50 平面に sin, cos で起伏を複数作った後、ノイズを乗っけてちょっと凸凹した2次元空間を用意します。

画像:デモ実行画面最初。最も値の大きい右上に赤い点が1つ

赤い点がある (row=3, col=29) の部分が最も値の大きい地点です。

探索


こんな感じで進んでいきます。
探索回数は200回です。

序盤
まずは全体的に空間を調べています。少し囲碁っぽいw。
画像:デモ実行の序盤画面。赤い点が全体に散らばりだす

序盤2
運良く、真ん中上にある本命の近くを何度か調べたようです。
画像:デモ実行の序盤2画面。赤い点が本命近くにやや集中している

中盤
本命の地点は結構調査済みになりました。
画像:デモ実行の中盤画面。赤い点が右上の本命地点に集まり、調査済みに

中盤2
もう一つの良さそうな左下の山も丹念にチェック。真ん中上の本命周辺も結構網羅。

画像:デモ実行中盤2の画面。左下あたりにも赤い点が集中してきた

終盤


他に良さそうなところがないか空白地点をチェック。

画像: デモ実行終盤の画面。他に良さそうなところがないか空白地点をチェック

最終状態
他に特に良さそうなところも無く終了。まあ、人間がやってもこんな感じになりそうです。
画像: デモ実行完了後の画面。他に特に良さそうなところも無く終了

所感

さいごに


作ってみると、結構色々なシーンで使えそうな感じです。
人生もこんな感じだよなぁ。

サービス資料ダウンロード

Sprocketの特徴、MA・CDP・BIの機能、コンサルティングサービス、事例などをご紹介します。

資料ダウンロード

導入検討の相談・見積もり

新規導入、乗り換えのご相談、MA・CDP・BIの各ツールの比較などお気軽にお問い合わせください。

お問い合わせ

03-6420-0079(受付:平日10:00~18:00)