2016年2月20日土曜日

TensorFlowで学習プログラム

TensorFlowで学習するプログラムを作ってみました。
一番単純な、2入力1出力です。(論理積を学習させます)
以前、chainerとかのサンプルも探しましたがどれも学習結果を使う所が見つかりませんでした。TensorFlowだとダイレクトにプログラムしないといけないので、その辺りは楽にできました。

とりあえず、サンプルです。


  1. # -*- coding: utf-8 -*-
  2.  
  3. import tensorflow as tf
  4. import numpy as np
  5.  
  6. # 入力データの定義 4行2列(データの定義方法がchainerとは違うようです)
  7. # x_data = [
  8. # np.array([0., 0.]),
  9. # np.array([0., 1.]),
  10. # np.array([1., 0.]),
  11. # np.array([1., 1.])
  12. # ]
  13. x_data = np.array([
  14. [0., 0.],
  15. [0., 1.],
  16. [1., 0.],
  17. [1., 1.]
  18. ])
  19.  
  20. # 結果データの定義(4行1列)
  21. # y_data = [
  22. # np.array([0.]),
  23. # np.array([0.]),
  24. # np.array([0.]),
  25. # np.array([1.])
  26. # ]
  27. y_data = np.array([
  28. [0.],
  29. [0.],
  30. [0.],
  31. [1.]
  32. ])
  33.  
  34.  
  35. # 機械学習で最適化するWとbを設定する。Wは4行2列のテンソル。bは4行1列のテンソル。
  36. W = tf.Variable(tf.random_uniform([4, 2], -1.0, 1.0))
  37. b = tf.Variable(tf.zeros([4, 1]))
  38. y = W * x_data + b
  39.  
  40. loss = tf.reduce_mean(tf.square(y_data - y))
  41. optimizer = tf.train.GradientDescentOptimizer(0.5)
  42. train = optimizer.minimize(loss)
  43.  
  44. # 学習を始める前にこのプログラムで使っている変数を全てリセットして空っぽにする
  45. init = tf.initialize_all_variables()
  46.  
  47. # Launch the graph.(おきまりの文句)
  48. sess = tf.Session()
  49. sess.run(init)
  50.  
  51. # 学習を1000回行い、100回目ごとに画面に学習回数とWとbのその時点の値を表示する
  52. for step in xrange(1001):
  53. sess.run(train)
  54. if step % 100 == 0:
  55. print step, sess.run(W), sess.run(b)
  56.  
  57. # 学習結果を確認
  58. x_input = np.array([
  59. [0., 0.],
  60. [0., 1.],
  61. [1., 0.],
  62. [1., 1.]
  63. ])
  64.  
  65. y_res = tf.Variable(tf.zeros([4, 1]))
  66. y_res = W * x_input + b
  67. print sess.run(y_res)
  68. # 4行1列の結果を期待しているのだが、4行2列になってしまう?
  69. # 学習が十分進めば、どちらの列も同じような結果になるからいいか。
  70. print sess.run(b)

最後に、学習結果を確認しています。結果はこうなります。(一応、期待通りの結果になりました)
  1. [[ 0.00000000e+00 0.00000000e+00]
  2. [ -2.62142518e-23 1.62012971e-23]
  3. [ 7.70256410e-23 -1.24630115e-22]
  4. [ 9.99999881e-01 1.00000012e+00]]
  5. [[ 0.00000000e+00]
  6. [ -2.62142518e-23]
  7. [ -1.24630115e-22]
  8. [ 6.69862151e-01]]
最後の、変数y_resとbの出力だけを貼り付けました。 どうしてもまだ理解できないのが、y_resの計算結果は4行1列になるはずなんですが、4行2列になってしまいます。(代入する直前でy_resを4行1列で定義しても上書きされてしまいます。bは4行2列でも、4行1列でも構わないようです)ただ結果をみると各行の値はどちらの列をとっても同じような値なのでよさそうです。 まだ深層学習の理論的な本を買って読み始めた所でよくわかっていませんが、TensrFlowの方がPrimitiveにプログラムしなければいけない分、直感的にわかります。(でもなんとなく、chainerの方がこの後進めていくのによさげな気もしますので、しばらく悩みます)

0 件のコメント:

コメントを投稿