大家好,欢迎来到IT知识分享网。
金融界2024年11月22日消息,国家知识产权局信息显示,成都雅典那科技有限公司申请一项名为“一种基于自监督预测的探索策略”的专利,公开号CN A,申请日期为2024年7月。
专利摘要显示,本发明公开了一种基于自监督预测的探索策略,构建一个IME模型,IME模型包括正演模型和反演模型,正演模型用于对智能体的状态‑动作对数据进行压缩,反演模型用于从压缩的信息中恢复对应的状态‑动作对数据;正演模型包含三层全连接神经网络,激活函数为ReLU;反演模型包含三层全连接神经网络,激活函数为ReLU。本发明在压缩和还原信息的过程中既能保证准确性又能保持潜在空间的良好结构,能够使用最少得信息量表达原始数据中的数据量,有利于提取到最佳的内在探索回报,推动智能体去探索更多的环境数据,增加智能体的性能。
本文源自金融界
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://haidsoft.com/145995.html