進化するガラクタ

Evolving always!

トピックスプログラム、シミュレーション

冒険も必要

投稿日：2019年11月19日

昨日の「Ｑ学習」の続きです。資料ご覧ください。

資料　→　Ｑ学習その２

p.1　昨日の復習です。

p.2　昨日のQ値はフェロモンやクッキーの可能性が高いと大きな数値になりますが、これを頼りに進むと迷路にはまったり、同じところをぐるぐる回って目的地にたどり着けないことが起きます。そこで「修正ε-greedy法」という方法を適用させます。修正というのは、εをエピソードに応じて変化させることを意味します。εは冒険度です。１に近いほど冒険する率が高く、０に近いほど冒険をせずにQ値に従って進みます。　エピソードの最初は冒険をして、段々目的地にたどり着く可能性が高くなると冒険せず堅実に進みます。その方が成功率が高いようです。

最初は当たり付けをして、様子がわかってきたら精度を上げていくのと同じ考え方ですね。

-トピックス, プログラム、シミュレーション

関連記事

: 危険は知識だけでは防げない

「化学実習」シリーズの最後は、「試薬の安全性」です。　大学２年か３年頃の化学実験の際に、白衣を着て実験していました。　数日後、白衣の腰の辺りが黒く焦げたようになっていました。実験ノートにも黒いしみがつ ...

: 今日は何の日？

かたい話が続いたので、一休みです。最近読んだ「プーと大人になった僕」（著者：エリザベス・ルドニック　発行所：講談社）を紹介します。クリストファー・ロビンが大人になってからの話です。少年時代にくまのプー ...

: 毎年同じことできる幸せ

昨日網目の話をしましたが、今日は更に小さな孔（あな）を有するろ過フィルターについて話をします。水を浄化したり医薬品を製造する際には、異物除去の他に微生物を除去する必要があります。ろ過する対象に応じて孔 ...

: どこまで耐えられるか？

プラスチックの特性に及ぼす短期的あるいは長期的な影響についてまとめています。資料はこちら　→　プラスチック基礎その5 p.1　短期的に、温度が及ぼす影響の傾向を表にまとめています。 p.2　時間に対 ...

: よく考えて計画して

「フィッシャーの３原則」について説明します。実験計画を立てる際のポイントです。資料をご覧ください　→　フィッシャーの３原則 p.1　「反復」「無作為」「局所管理」が３原則です。１つ１つ説明します。反 ...

PREV: 試行錯誤して信頼度が上がっていく
NEXT: Excel関数、こんな使い方も

アーカイブ

カテゴリー

固定ページ

: 2025/07/08

鳥、虫、魚そして神の目

昨日の「感性を鍛える」コーナーでは「視点を変える」について話をしました。本ブログでも何回か取り上げてきましたので、その一部をまとめ直した資料を作成しましたので、ご覧ください。資料はこちら　→　視点を ...

: 2025/07/06

「。」が気になる？

「若者はLINEに「。」をつけない」（著者：高橋暁子　発行所：講談社）を紹介します。前から気になっていたタイトルの本で、図書館の新刊本コーナーにありましたので、借りてきました。「マルハラ」という言葉知 ...

: 2025/07/05

どれが対抗できる？

「どんな色・形になるかな？」で、我家の菜園の土壌造りに用いている微生物資材の培養結果を示しました。本日は、うどんこ病がカボチャの葉で大発生しているので、この菌に対抗できる菌を確認する実験を実施してみま ...

: 2025/07/04

粘って考えるか、寝かしてから考える

本日の研修の「感性を鍛える」コーナーは、「頭を柔軟に！！」と題して、以下の資料で説明しました。資料はこちら　→　トポロジー p.1　「頭を柔軟に！！」に関連するブログ内のアドレスをリストアップし ...

: 2025/07/03

検証不足でした

本日の研修の「感性を鍛える」コーナーは、「不可能物体にチャレンジ」と題して、以下の資料で説明しました。この資料のp.6のイラスト通りに実施するとできないことが、講義の直前に発覚しました。　正解の絵は、 ...

最近の投稿

Copyright© 進化するガラクタ , 2025 All Rights Reserved Powered by STINGER.