Describir: Vývoj agenta pre stratégiu reálneho času pomocou učenia posilňovaním