2024 年 5 月 10 日 我的频道
ChatGPT
  • 2023
  • Sunny

ChatGPT 是由 OpenAI 开发的一个人工智能聊天机器人程序,于 2022 年 11 月推出。该程序使用基于 GPT-3.5 架构的大型语言模型并通过强化学习进行训练。

ChatGPT 目前仍以文字方式互动,而除了可以透过人类自然对话方式进行交互,还可以用于相对复杂的语言工作,包括自动文本生成、自动问答、自动摘要等在内的多种任务。如:在自动文本生成方面,ChatGPT 可以根据输入的文本自动生成类似的文本,在自动问答方面,ChatGPT 可以根据输入的问题自动生成答案。还具有编写和调试计算机程序的能力。在推广期间,所有人可以免费注册,并在登入后后免费使用 ChatGPT 实现与 AI 机器人对话。

ChatGPT 因其在许多知识领域给出详细的回答和清晰的答案而迅速获得关注,但其事实准确性参差不齐被认为是一重大缺陷。ChatGPT 于 2022 年 11 月发布后,OpenAI 估值已涨至 290 亿美元。上线两个月后,用户数量达到 1 亿。

训练
ChatGPT 使用监督学习和强化学习在 GPT-3.5 之上进行了微调。

ChatGPT 使用基于人类反馈的强化学习进行训练,这种方法通过人类干预以增强机器学习的效果,从而获得更为逼真的结果。其使用基于 GPT-3.5 架构的语言模型。在训练过程中,人类训练师扮演着用户与人工智能助手的角色。模型在 Microsoft Azure 的超级计算机上训练,并通过近端策略优化算法(proximal policy optimization)进行微调。这种策略优化算法比信任域策略优化(trust region policy optimization)算法更为高效。

特点和局限

虽然聊天机器人的核心功能是模仿人类对话者,但 ChatGPT 用途广泛。 例如,具有编写和调试计算机程序的能力;创作音乐、电视剧、童话故事和学生论文; 回答测试问题(在某些测试情境下,水平高于普通人类测试者);写诗和歌词;模拟 Linux 系统等。

与其前身 InstructGPT 相比,ChatGPT 试图减少有害和误导性的回复。例如,当 InstructGPT 接受“告诉我 2015 年克里斯托弗·哥伦布何时来到美国”的提问时,它会认为这是对真实事件的描述,而 ChatGPT 针对同一问题则会使用其对哥伦布航行的知识和对现代世界的理解来构建一个答案,假设如果哥伦布在 2015 年来到美国时可能会发生什么。ChatGPT 的训练数据包括各种文档以及关于互联网、编程语言等各类知识。

与其他多数聊天机器人不同的是,ChatGPT 能够记住与用户之前的对话内容和给它的提示。此外,为了防止 ChatGPT 接受或生成冒犯性言论,输入内容会由审核 API 进行过滤,以减少潜在的种族主义或性别歧视等内容。目前,有部分地区无法使用此项服务。

ChatGPT 也存在一些局限。其奖励模型围绕人类监督而设计,可能导致过度优化,从而影响性能,即古德哈特定律。例如在训练过程中,不管实际理解或事实内容如何,审核者都会偏好更长的答案。训练数据有时也存在算法偏见,比如当程序接受到首席执行官之类的模糊描述时可能会假设此人是白人男性。

服务

OpenAI 的总部位于圣弗朗西斯科的先驱大楼
ChatGPT 于 2022 年 11 月 30 日由 OpenAI 位于旧金山的总部推出。该服务最初是免费向公众推出的,并计划以后通过该服务获利。到 12 月 4 日,OpenAI 估计 ChatGPT 已有超过一百万用户。2023 年 1 月,ChatGPT 的用户数超过 1 亿,成为该时间段内增长最快的消费者应用程序。2022 年 12 月 15 日,CNBC 写道,该服务“仍然不时地发生故障”。

《纽约时报》在 2022 年 12 月转述称,GPT 的下一版本 GPT-4 据传言将于 2023 年某个时候推出。OpenAI 计划推出 ChatGPT 专业版计划,每月收费 42 美元,需求较低时可使用免费计划。

资料来源:维基百科

SHARE
874
0

Author Box

名字:Sunny
注册:Jan 30, 2021
简介:技术菜鸟,拷贝、黏贴代码中 ……

Comment Box

0 0 投票数
Article Rating
订阅评论
提醒
guest

0 评论
内联反馈
查看所有评论