先行研究にて,リザパーコンピューティングの代表的なモデルであるecho state network(ESN)の学習則としてreward-modulated Hebbian learning(RMHL)を用いて,非線形性やワーキングメモリを必要とするタスクが遂行できることが確かめられている.また,ESNより生物学的妥当性の高い,スパイキングニューラルネットワーク(SNN)を用いたリザバーコンピューティングの代表的なモデルであるliquid state machine(LSM)を,強化学習に使った研究はあるが,RMHLに類似したSNNの学習則であるreward-modulated STDP(RM-STDP)が学習則として用いられたことはなかった.本発表では,リザバーにSNNを用い,RM-STDPによって学習するリザバーコンピューティングを,線形分離不可能なXOR問題に適用した実験について発表する.
展开▼