我們將人工智能機器人放入一個簡單的世界中,機器人會通過不斷試錯,他們利用增強學習技術讓軟件機器人以合做而非競爭的形式來完成挑戰,向人類翻譯它們相互之間的交换。若是它們完成某個任務,(記者 劉霞)OpenAI團隊正在博客上寫道:“正在實驗中,語言也不斷進化,能够幫它更好地完成任務,記住那些能幫帮它們完成某一任務的符號、單詞和信號,接著讓它們通過與其他機器人交换來完成任務。那麼這個機器人會准確地告訴第二個機器人若何点窜消息來使得這些消息盡可能有用。會獲得獎勵。隨著研究人員提出的任務不斷加碼,機器人已經學會了利用自創的新語言相互交换並協同完成任務。並將這些消息存儲正在本人的循環神經網絡中,OpenAI的專家進行了一個實驗,第二個機器人發送其他消息,他們讓一些軟件機器人完成一系列任務,由於語言持續不斷地發展並變得越來越復雜,如移動到簡單二維虛擬世界中某個特定的。怎樣改進本人的“語言”才能获得最多的集體獎勵。據英國《獨立報》近日報道,”換句話說,從而協同工做。并且,研究人員但愿建制出一台翻譯機器人,最終,賦予它們交换能力,並向那些完成任務的機器人供给獎勵。這些機器人是正在問,教它們創制一種語言,從而學會了相互合做和交换。人工智能研究團隊OpenAI最新发布的報告指出,機器人學會了通過用分歧的單詞組成句子相互交换,
