ChatGTP

日期 版本 作者 说明
2022-12-08 V-1.0 孔留锋 文档新建。

注:该文档为技术分享。

背景

是什么

​ Generative Pre-Trained Transformer(GPT)是一系列基于Transformer 的深度学习语言模型。

​ ChatGPT由OpenAI开发,是一个基于大语言模型 GPT-3.5的聊天机器人。

​ 0penAl是一家位于旧金山的研究实验室,成立于2015年,由其首席执行官Sam Altman、Elon Musk以及风险投资家Peter Thiel等人共同出资10亿美元建立。

​ OpenAl的诞生旨在开发通用人工智能(AGI),并确保其成为一种高度自主、且在大多数具有经济价值的工作上超越人类的系统。而GPT正是OpenAl通过文字模态来探索通用人工智能的一种方式。

发展

  • 0penAl于2018年6月在题为《mprovingLanguage Understandingby GenerativePre-Training》的论文中提出了第一个 GPT模型 GPT-1。从这篇论文中得出的关键结论是,Transformer架构与无监督预训练的结合产生了可喜的结果。GPT-1以无监督预训练+有监督微调的方式–针对特定任务进行训练–以实现“强大的自然语言理解”。

  • 2019年2月,0penAI发表了第二篇论文“Language Modelsare Unsupervised MultitaskLearners”,其中介绍了由GPT-1演变的GPT-2。尽管 GPT-2大了一个数量级,但它们在其他方面非常相似。两者之间只有一个区别:GPT-2可以完成多任务处理。0penAl成功地证明了半监督语言模型可以在“无需特定任务训练”的情况下,在多项任务上表现出色。该模型在零样本任务转移设置中取得了显著效果。

  • 随后,2020年5月,0penAl发表《LanguageModelsareFew-ShotLearners》,呈现GPT-3。GPT-3 比GPT-2大 100倍,它拥有1750亿个参数。然而,它与其他GPT并没有本质不同,基本原则大体一致。尽管 GPT模型之间的相似性很高,但 GPT-3的性能仍超出了所有可能的预期。

  • 2022年11月,0penAl向公众开放了使用对话进行交互的ChatGPT,围绕ChatGPT机器人,0penAl进行了两次更新。11月29日,0penAl发布了一个命名为“text-(文本-达芬奇-003”)的新模式。在11月30日发布它的第二个新功能:“对话”模式。它以对话davinci-003”方式进行交互,既能够做到回答问题,也能承认错误、质疑不正确的前提以及拒绝不恰当的请求。

工作原理

概述

​ 使用机器学习算法来分析和理解文本输入的含义,然后根据该输入生成响应。该模型在大量文本数据上进行训练使其能够学习自然语言的模式和结构。

细节

​ ChatGPT模型使用一种称为人类反馈强化学习(RLHF)的机器学习进行训练,可以模拟对话、回答后续问题、承认错误、挑战不正确的前提并拒绝不适当的请求。为了创建强化学习的奖励模型,0penAl收集了比较数据,其中包含两个或多个按质量排序的响应模型。为了使生成的文本更容易被人理解,OpenAl招募了人类训练师,在训练过程中,人类训练师扮演了用户和人工智能助手的角色。模型在MicrosoftAzure的超算设施上进行训练。

​ ChatGPT模型的训练过程:

  • 1.使用有监督的微调训练初始模型:人类训练师之间提供对话,其中一个扮演用户,另一个扮演ChatGPT中的 AI助手。为了创建强化学习的奖励模型,需要收集比较数据,并使用收集到的数据调整 GPT-3.5模型;
  • 2.模型会根据提示生成多个输出,训练师将 ChatGPT编写的回复与人类的回答进行比较,并对它们的质量进行排名,以帮助强化机器的类人对话风格。奖励模型将自动执行最后一个训练阶段,使用排名后的数据训练;
  • 3.在最后一步使用近端策略优化进一步调整,这是OpenAl广泛使用的强化学习技术。

能做什么

文本生成

  • 类搜索引擎,根据已知知识(训练海量知识)搜索并总结相关内容
  • 回答,根据输入生成回答内容
  • 写作,根据输入生成想要内容

image-20221208183903946

image-20221208184014650

image-20221208184031029

代码生成

  • 技术学习(经测试,主流回答较好,能够快速入门,细节及真实性需要验证)
  • image-20221208101617106
  • 理解需求,生成相关代码(经测试,比较亮眼,简单需求能快速响应生成代码,扩展思路、提高效率,部分需求描述不清楚、模型理解问题,导致Bug率较高,需要根据经验进行修改)
  • image-20221208103735338

怎么使用

注意:

  • 官方使用注册账号比较麻烦,需要国外手机验证码,可用 https://sms-activate.org/ 平台。
  • 公司内部为付费AIP转发,模型版本GPT2.5

未来发展

​ 根据一段时间调研、使用,觉得未来不可预估。

​ 从GPT2.5 到 GPT-3模型的,官方发的数据来看,进步很快。可以确定,未来国外国内一定快速发展。

​ 目前使用,虽然存在瞎说乱答的幻觉,但一定层度已经能够解决问题,提高生成效率

​ 未来模型迭代肯定会加速,5-10年发展到什么程度,不敢现象,也许真能代替人类工作!!

建议

公司层面

  • 各个部门及业务全面向AI 大模型靠拢。

  • 发展策略:

    • 第一阶段:AI大模型集成,结合实际业务,利用openai提供的开放接口,挖掘AI 需求,如:AI简报、AI报告、智能客服等

    • 第二阶段:持续关注AI应用端发展趋势,逐步跟进,保证不掉队

    • 第三阶段:加大算法工程师队伍建设,根据业务,训练垂直领域大模型

      • 硬件成本太高,且没有大厂技术能力较强
      • 短期内不容易实现收支平衡,且可能出现情况:
        • 1.垂直领域数据不够,模型效果不理想,甚至表现低于通用大模型
        • 2.模型迭代成本较高,无法持续迭代
        • 3.模型同阶段高于通用大模型,因投入迭代问题,很快又被超越
    • 其他:

      • 公司层面采购或报销 ChatGPT 的费用
      • 部门之间定期举办ChatGPT使用交流会
      • 公司尝试举办:AI + 业务 会议,深入到实际公司业务中

个人层面

  • 拥抱ChatGPT,日常工作中尝试使用!
  • 关注大模型发展,并保持学习!
  • 做好个人职业生涯规划,在时代的浪潮中,争取不掉队!