一種基于深度強(qiáng)化學(xué)習(xí)的TCP網(wǎng)絡(luò)擁塞控制協(xié)議
計(jì)算機(jī)應(yīng)用與軟件
頁數(shù): 9 2023-03-12
摘要: 在面對(duì)網(wǎng)絡(luò)變化時(shí),傳統(tǒng)的TCP擁塞控制協(xié)議因其固有的規(guī)則機(jī)制只能做出固定的動(dòng)作,既未充分利用鏈路帶寬,也未從歷史經(jīng)驗(yàn)中學(xué)習(xí),并且在發(fā)生擁塞時(shí)帶寬恢復(fù)所用時(shí)間較長。近年來基于強(qiáng)化學(xué)習(xí)的擁塞控制協(xié)議(Reinforcement Learning Congestion Control, RL-CC)雖然可以有效地從歷史經(jīng)驗(yàn)中學(xué)習(xí),但是它沒有考慮歷史經(jīng)驗(yàn)在時(shí)序上存在的因果關(guān)系。對(duì)這種因...