中時訊申請基於強化學習策略的智能體優化方法及系統專利,能有效提高學習的穩定性

金融界2025年1月18日消息,國家知識產權局信息顯示,中時訊通信建設有限公司申請一項名爲“一種基於強化學習策略的智能體優化方法及系統”的專利,公開號CN 119312870 A,申請日期爲2024年10月。

專利摘要顯示,本發明公開了一種基於強化學習策略的智能體優化方法及系統,通過近端策略限制策略更新的步長,能有效提高學習的穩定性,減少因策略更新過大而導致的訓練不穩定或性能下降問題,深度神經網絡結合強化學習算法能夠提高智能體的泛化能力和應對複雜環境的能力,通過採用MADDPG算法考慮其他智能體的行爲來優化自身的策略,這種協同機制使得智能體在共享環境中能夠實現全局最優或更優的協同效果,通過模擬環境能夠減少了對真實世界交互的依賴,同時,半監督學習方法利用少量標註數據和大量未標註的模擬數據,使得智能體能夠在學習過程中不斷地自我改進和優化,不僅提高了智能體的環境適應性,還降低了對大量標註數據的依賴,降低了數據收集和處理的成本。

天眼查資料顯示,中時訊通信建設有限公司,成立於2012年,位於廣州市,是一家以從事計算機、通信和其他電子設備製造業爲主的企業。企業註冊資本20000萬人民幣,實繳資本20000萬人民幣。通過天眼查大數據分析,中時訊通信建設有限公司參與招投標項目5000次,專利信息84條,此外企業還擁有行政許可59個。

本文源自:金融界

作者:情報員