月之暗面推出的端到端强化学习智能体Kimi-ResearcherAI公司“月之暗面”正式发布了其最新研究成果——Kimi-Researcher,一款基于端到端强化学习(Reinforcement Learning, RL)训练的自主智能体系统。该系统展现出强大的多...早报# Kimi-Researcher# 强化学习智能体# 月之暗面6个月前01730