English
全部
搜索
图片
视频
短视频
地图
资讯
更多
购物
航班
旅游
笔记本
报告不当内容
请选择下列任一选项。
无关
低俗内容
成人
儿童性侵犯
时长
全部
短(小于 5 分钟)
中(5-20 分钟)
长(大于 20 分钟)
日期
全部
过去 24 小时
过去一周
过去一个月
去年
清晰度
全部
低于 360p
360p 或更高
480p 或更高
720p 或更高
1080p 或更高
源
全部
Dailymotion
Vimeo
Metacafe
Hulu
VEVO
Myspace
MTV
CBS
Fox
CNN
MSN
价格
全部
免费
付费
清除筛选条件
安全搜索:
中等
严格
中等(默认)
关闭
筛选器
2:44
What is Reinforcement Learning from Human Feedback (RLHF)? |
…
2023年4月20日
techtarget.com
3:27
1.1K views · 101 reactions | A new short course on Reinforcement...
已浏览 1147 次
1 个月前
Facebook
DeepLearning.AI
6:25
Reinforcement Learning from Human Feedback (RLHF) - Beginn
…
已浏览 1972 次
2024年7月13日
YouTube
AI Foundation Learning
59:17
RLHF: How to Learn from Human Feedback with Reinforcement Lea
…
已浏览 8579 次
2024年1月8日
YouTube
Cooperative AI Foundation
5:07
What Is RLHF? Simple Guide (2025)
已浏览 7 次
4 个月之前
YouTube
Allow AI
1:01:01
Mastering RLHF with AWS: A Hands-on Workshop on Reinforce
…
已浏览 2.5万 次
2023年8月3日
YouTube
DeepLearningAI
0:57
How RLHF Creates Human-Like AI
已浏览 2221 次
2025年2月7日
YouTube
SCALER
59:15
Reinforcement Learning with Human Feedback (RLHF)
已浏览 2511 次
2024年1月31日
YouTube
AI Makerspace
4:06
Reinforcement Learning with Human Feedback (RLHF) in 4 minutes
已浏览 1.2万 次
2025年2月8日
YouTube
Sebastian Raschka
36:14
How to Code RLHF on LLama2 w/ LoRA, 4-bit, TRL, DPO
已浏览 1.7万 次
2023年8月31日
YouTube
Discover AI
9:44
RLAIF Reinforcement Learning with AI Feedback or Aligning Large La
…
已浏览 1411 次
2023年9月6日
YouTube
AI WITH Rithesh
8:21
RLHF: The Secret Sauce of AI
已浏览 2 次
5 个月之前
YouTube
ShorbornoLABS
11:29
Reinforcement Learning from Human Feedback (RLHF) Explained
已浏览 7.7万 次
2024年8月7日
YouTube
IBM Technology
1:07:12
AI Trends 2023: Reinforcement Learning - RLHF, Robotic Pre-Trai
…
已浏览 9715 次
2023年1月16日
YouTube
The TWIML AI Podcast with Sam Charrington
Understanding RLHF From Scratch
已浏览 2 次
5 个月之前
substack.com
Reinforcement Learning from Human Feedback From Zero to Ch
…
已浏览 2.2万 次
2022年12月13日
YouTube
HuggingFace
1:18:00
RLHF Explained & Coded (feat. PPO)
已浏览 230 次
6 个月之前
YouTube
AIArchives
12:07
吴恩达 RLHF(Reinforcement Learning from Feedback) 002 - H
…
已浏览 140 次
2024年1月6日
bilibili
女王の专属领地
1:00:38
Reinforcement Learning from Human Feedback: From Zero to c
…
已浏览 18.6万 次
2022年12月13日
YouTube
HuggingFace
[Interesting content] InstructGPT, RLHF and SFT
已浏览 1 次
2023年1月24日
substack.com
9:08
Reinforcement Learning from Human Feedback Explained (and
…
已浏览 4779 次
2023年12月13日
YouTube
What's AI by Louis-François Bouchard
45:51
RLHF Visualizer | Hands-on Reinforcement Learning
已浏览 3048 次
4 个月之前
YouTube
Vizuara
0:58
Exploring how RLHF improves AI systems beyond alignment – creat
…
已浏览 98 次
4 个月之前
YouTube
Doom Machine
19:39
Reinforcement Learning, RLHF, & DPO Explained
已浏览 1.6万 次
2024年6月12日
YouTube
Mark Hennings
53:07
Reinforced Self-Training (ReST) for Language Modeling (Paper Explai
…
已浏览 3.4万 次
2023年9月3日
YouTube
Yannic Kilcher
6:18
What is LLM RLHF ?
已浏览 371 次
5 个月之前
YouTube
New Machina
3:14:37
RLHF from scratch, step-by-step, in code
已浏览 2335 次
8 个月之前
YouTube
Ashwani Kumar
9:10
Direct Preference Optimization: Forget RLHF (PPO)
已浏览 1.6万 次
2023年6月6日
YouTube
Discover AI
1:41
RLHF Explained | Artificial Intelligence Interview Questions
…
已浏览 2185 次
2023年12月15日
YouTube
Analytics Vidhya
28:51
Reinforcement Learning with Human Feedback
已浏览 276 次
2024年11月14日
YouTube
Open Data Science
观看更多视频
更多类似内容
反馈