Moje zabawy z programowaniem trafią na GitHub pod adres https://github.com/majchernet/ .
Na początek do repozytorium – https://github.com/majchernet/RL_CartPole – wrzuciłem próbę zmierzenia się z reinforcement learning i rozwiązanie problemu CartPole z OpenAI Gym (https://gym.openai.com/envs/CartPole-v0/) Na chwilę obecną algorytm daję radę osiągnąć zadany cel co kilka prób ale to dopiero pierwsza jego iteracja. W rozwiązaniu wykonałem dyskretyzację ciągłej przestrzeni stanów oraz przyjmując założenie, że sztuka balansowania kijem na palcu jest niezależna od miejsca, pozbyłem się zmiennej opisującej położenie kijka. W planie jest użycie googlowego tensorFlow i sieci neuronowej do gromadzenia wiedzy, nie wiem czy los będzie miał na uwadze moje plany i podaruje mi trochę wolnego czasu. Zobaczymy.