目录章节:

一、什么是 GPT 3.5?什么是 GPT 4?

二、GPT3.5和GPT4.0的主要区别

二、GPT4.0的应用案例测试

四、如何区分GPT3.5和4.0?判定是不是真的4.0?

五、缺憾仍在

六、究竟该用3.5还是4.0?

图片

一、什么是 GPT 3.5?什么是 GPT 4?

什么是 GPT 3.5?

顾名思义,GPT 3.5 是 GPT-3 和 GPT-4 之间的一种桥梁。OpenAI 并没有真正公开说明是什么让 GPT 3.5 比 GPT 3 更好,但似乎主要目标是提高模型的速度,也许最重要的是降低运行它的成本。

有趣的是,OpenAI 向用户提供的并不是原始核心 GPT 3.5,而是几个专门的分支。例如,GPT 3.5 Turbo 是一个专门针对聊天目的进行微调的版本,尽管它通常仍然可以做 GPT 3.5 可以做的所有其他事情。

什么是 GPT 4?

OpenAI 的 GPT-4 已成为他们迄今为止最先进的语言模型,可提供更安全、更有效的响应。

这个尖端的多模式系统接受文本和图像输入并生成文本输出,在一系列专业和学术基准上展示人类水平的表现。

图片

比较 GPT-3 和 GPT-4 时,它们的功能差异非常明显。

GPT-4 具有增强的可靠性、创造力和协作性,以及处理更细微指令的更强能力。

这标志着对已经令人印象深刻的 GPT-3 有了重大改进,GPT-3 经常在更复杂的提示下出现逻辑和其他推理错误。

两种型号之间的另一个关键区别在于它们的尺寸。GPT-3 拥有惊人的 1750 亿个参数,而 GPT-4 更进一步(据传)有 1 万亿个参数。

二、GPT3.5和GPT4.0的主要区别

1、GPT3和GPT4的最大不同之处在于规模,GPT3拥有175B参数,而GPT4拥有3.3T参数,可以有效地解决复杂语言任务。

图片

2、GPT4使用了树型推理(Tree-Based Reasoning)来完成建模,这使得GPT4更加稳定、精确、高效。GPT4的模型可以有效地解决自然语言交互(NLU)和自然语言理解(NLU)等复杂NLP任务。

3、更创造性的写作能力,包括编歌曲、写剧本、学习用户写作风格

4、可以接受图片输入(暂不可用)、并生成字幕等

5、可以处理超过25000字长文本

6、智能程度大幅提升。以美国BAR律师执照统考为例:GPT3.5可以达到10%水平分,GPT4可以达到90%水平分。生物奥林匹克竞赛从GPT3.5的31%水平分,直接飙升到99%水平分,国际奥赛金奖水准。

一张图告诉大家

图片

二、GPT4.0的应用案例测试

据OpenAI自己称,GPT-4将是该公司里程碑式的模型。

在其概念视频中,OpenAI介绍新模型可以解决更复杂的问题、编写更大型的代码,并通过图片产生文字。此外,OpenAI还承诺GPT-4相比之前的模型,包括ChatGPT此前应用的GPT-3.5,将更加安全且具协调性。

用简单的话说,GPT-4模型改变了此前ChatGPT等历史人工智能的单一、文本短小等缺点,变身为一个能看图说话的高级“解语花”。

硅谷做题家

GPT-4现在最热门的话题莫过于它强大的应试能力。根据OpenAI的评估,GPT-4已经能轻松通过美国的律师考试,且考进了前10%的排名。相比之下,它的上一代模型GPT-3.5只能吊个车尾。

另一方面,已经升级为GPT-4模型的ChatGPT,现在已经可以通过用户的简单需求直接生成代码,甚至网站。即便用户只是在餐巾纸上画了个简单界面,GPT-4都能直接搞出一个可运行的网站。

图片

如此好用不废话的程序员,大概是每一个产品经理心中永远的神。

量子波动速读?

更让人嫉妒的是,曾经中国爆火的“量子波动速读”竟然也在GPT-4上获得了重现。这种被机构滥用的反人类教育噱头,在非人类的人工智能上却得到了完美的诠释。

有网友将一整篇论文上传给GPT-4,然后,GPT-4就在极短时间内完成了阅读,并给出清晰的总结摘要。

图片

与GPT-3.5相比,GPT-4将文字输入限制提升至2.5万字,这让其阅读体量大大增加,也让用户的文书处理工作变得更加简洁。

此外,强大的识图能力和显著提高的回答准确性,也保证了GPT-4在文字处理上的优越性,相较于GPT-3.5的答不上来就乱编,已经出现了长足的进步。

四、如何区分GPT3.5和4.0?判定是不是真的4.0?

目前市场上不少镜像站号称是基于GPT-4.0,但GPT-4的API价格相当昂贵,每回复1000个token(token简单理解为字数)需要0.12美元;

因而每次正常提问,价格都在1-2元左右。考虑到较高的成本,所以这些号称是GPT4的镜像产品,其实是值得怀疑的;

其实稍微有点技术基础,就明白了,这个是可以预置回答的——即对指定问题提供指定的答案。

因此,如果你想要知道号称是4.0的GPT是否是真4.0,需要提一些特别的问题。

那么提什么问题呢?

这要回到GPT4.0的特点,尤其是4.0相对于3.5的优点上来,最核心能力提升就是2点:

  • 推理能力加强;
  • 输出限制极大提升(从8000字,提高到了最大25000字)

我们可以对其问相同的问题,通过gpt的回答来区分。

举几个例子:

图片

问题:树上10支鸟,开枪打死一只,还剩几只?

GPT3.5回答:

图片GPT4.0回答:

图片

这几个问题,具有一个共同特点:

调用未言明的背景知识,进行推理分析,才能得到答案。

显然,chatGPT3.5在这个三个问题上,虽然调用了背景知识、尝试,但是没有结合问题进行推理分析。4.0的推理能力是显著更强的。

五、缺憾仍在

根据OpenAI的内部测试,GPT-4仍有GPT-3.5的老毛病,就是胡言乱语。专业地讲,GPT-4仍会产生幻觉,生产错误答案,并出现推理错误。

总的来说,GPT-4已经显著减轻了幻觉问题,在这一项上,GPT-4的分数比GPT-3.5要高出40%。但这可能也意味着GPT-4的乱讲话可能更隐蔽,更难以被用户察觉。

另一方面,GPT-4仍缺乏对数据截至日期后新进展的了解能力,即其无法在训练学习后,追踪新的信息来补足对某件事认知。此外,它也无法从经验中学习,并可能一直轻信人类。

在安全边界上面,GPT-4也得到了相应的加强,与GPT-3.5相比,它对违禁内容的回复率下降了82%,对敏感内容(如医疗建议)的响应率则提高了29%。

六、究竟改用3.5还是4.0?

如果你对数据实时性要求不高,适合偶尔需要的或者拿来玩一玩的人群,比如流程的梳理、思维的引导和非实时数据的查询需求的话,3.5就够用,无须升级4.0。

如果你经常查新闻及最新数据的、写代码的、讨厌频繁掉线的、需要高质量专业回答的、需要生成文字数量很长的、做api接口二次开发的、长期以文字工作谋生的,并且问题大部分需要强大的逻辑思考能力的需求的话,建议入手4.0。