归档: 2023/1 | Lowin Li

Never really desperate, only the lost of the soul.

大浪淘沙，风起帆扬

2023

通篇翻译自Rajani et al., “What Makes a Dialog Agent Useful?”, Hugging Face Blog, 2023. ChatGPT背后的技术：RLHF、IFT、CoT、Red teaming

2023-01-29 技术

RLHF ChatGPT AI

人工反馈的强化学习翻译自Huggingface博客近几年，通过人工prompt提示，语言模型可以出色的生成多样的或限定的文本。但是，如何界定“好”的生成文本是很难的，因为它很主观，同时需要考虑上下文的。例如有很多应用，比如写故事，是希

2023-01-02 技术

NLP transformers RLHF 强化学习