反面教師にしたい論文ー人工知能初期の2008年論文
原文 Prediction of the intern parameters tomato greenhouse in a semi-arid area using a time-series model of artificial neural networks
訳【人工ニューラルネットワークの時系列モデルを用いた半乾燥地域におけるトマト温室内の内部パラメータの予測】
時系列の現実データをどのように扱っていったのかをメインにまとめたいと思ったのですが、読み進めていくと、”人工知能”の初期の論文であったためか、まとめ方が非常にラフで参考になりませんでした。
こういう論文書いてはいけないなと思ったので反面教師として途中まで読んだ分のメモです。
論文の狙い
論文の書かれた2008年当時に流行り初めていた”人工知能”を使って、外気象のデータを使って、ハウス内の温度と湿度が予測できることを示しています。
いわゆる「やってみた」系であると思います。
収集データ
外環境は、ハウスの2m上に設置されたセンサーによって以下の項目を収集
- 温度Tと周囲の空気の水分M
- 温室内の外気の速度Vと風向Dw
- 温室外の全放射量Rt
- 温室外の地面の温度
ハウス内では
-温度
-湿度
が計測された
前処理(pre-treatment)
次の式で0.1-0.9の間で正規化を行った。
よくある"min-max normalization"ではβの後ろの部分のみを用いますが、αとβを設定することで敢えて0.1-0.9の間に値が収まるようにしたようです。この意図は私の知識不足でわかりません・・。誰かわかりましたら教えてください。
モデルの選択
3月25日から31日までのデータをテストモデル用に、3月3日から24日までの残りのデータを残りの3月3日から3月24日までのデータはトレーニングモデルに使用し,MRW, MAE, SE, MQE, R^2が小さくなるようなモデルを選択したとのことで、詳細は語られていません。。
結果
学習データの集計単位についても明らかにされていないのですが、1時点先の予測をしたところ、R^2=0.991の予測が得られたということで、かなり直近の予測をしていたのではないかと思います。
論文を書く際の反面教師としての学び
あまり良論文ではありませんでした。反面教師ですね。。。
・まず、論文としての意義や目的があいまいでした。何に課題を感じているのか?何を解決しようとしているのか読者にわかるようにする。
・なぜ、そのような処理や方法をとることにしたのか、独自性はどんなところなのか、わかるようにする。
・データをどんな単位で記録し、集計したのかわかるようにする。
・モデル選定に関しては適当にやってみたで選択するのではなく、理論ベースで展開する。