We read every piece of feedback, and take your input very seriously.
To see all available qualifiers, see our documentation.
소켓 통신을 이용한 Deep Reinforcement Learning 전략에 대해서 소개한다.
두개의 프로세스가 있으며 두 프로세스는 주기적으로 통신하지만 자신의 상태를 완벽히 공유하지는 않는다.