Skip to content

Latest commit

 

History

History
8 lines (5 loc) · 572 Bytes

README.md

File metadata and controls

8 lines (5 loc) · 572 Bytes

kaggle 的通用人工智能比赛代码

https://www.kaggle.com/c/abstraction-and-reasoning-challenge/leaderboard

通过观察训练集上的图案转换规则,推导测试集上的图案该如何变化。每个用例只有几个训练案例,是典型的小样本问题。

目前已经将环境集成到gym中,尝试了dqn,不收敛, ac算法有时候不收敛,有时候直接退化,目前发现只有最简单的policy grident策略才能缓慢收敛,可以在多任务上收敛,但是测试集上无法泛化。 原因调查中。