AI如今出现在现代生活的每个角落,从音乐和媒体到商业和生产力,甚至约会。
由于我们每天都要面对大量内容,所以有必要了解AI最近的重大发展到、专业术语、以及相关公司的所有内容,以便在这个快速发展的领域保持最新状态。
首先,我们需要搞清楚究竟什么是人工智能?
人工智能,也称为机器学习,是一种基于神经网络的软件系统,这种技术实际上在几十年前就已被开创,但最近由于强大的新计算资源而蓬勃发展。人工智能实现了有效的语音和图像识别,以及生成合成图像和语音的能力。研究人员正在努力让人工智能能够浏览网络、订票、调整食谱等。
读完本文后,您将了解当今任何人都希望了解的最新情况。随着我们进一步进入人工智能时代,我们还将对其进行更新和扩展。
人工智能101
人工智能的一大奇特之处在于,尽管其核心概念可以追溯到 50 多年前,但在不久之前,即使是精通技术的人也很少熟悉其中的概念。因此,如果您感到迷茫,请不要担心——每个人都是如此。
我们想预先澄清一件事:虽然它被称为“人工智能”,但这个术语有点误导。对于智能没有一个统一的定义,但这些系统所做的事情肯定更接近于计算器而不是大脑。这个计算器的输入和输出更加灵活。你可能会认为人工智能就像人造椰子——它是模仿智能。
以下是您在人工智能讨论中会发现的基本术语。
神经网络
我们的大脑主要由称为神经元的互连细胞组成,这些细胞相互啮合形成执行任务和存储信息的复杂网络。自 20 世纪 60 年代以来,人们一直在尝试用软件重新创建这个令人惊叹的系统,但直到 15 至 20 年前,GPU 才让数字定义的神经网络蓬勃发展,所需的处理能力才得以广泛应用。
从本质上讲,它们只是大量的点和线:点是数据,线是这些值之间的统计关系。就像在大脑中一样,这可以创建一个多功能系统,可以快速获取输入,将其通过网络传递并产生输出。这个系统称为模型。模型
该模型是接受输入并返回输出的实际代码集合。术语与模拟复杂自然过程的统计模型或建模系统的相似性并非偶然。在人工智能中,模型可以指像ChatGPT这样的完整系统,或者几乎任何人工智能或机器学习结构,无论它做什么或产生什么。
模型有不同的大小,这意味着它们占用多少存储空间以及运行需要多少计算能力。而这些取决于模型的训练方式。训练
为了创建人工智能模型,构成系统基础的神经网络需要接触数据集或语料库中的大量信息。在此过程中,这些巨型网络创建了该数据的统计表示。这个训练过程是计算最密集的部分,这意味着在大量的高性能计算机上需要数周或数月的时间(你想花多久就花多久)。其原因是,不仅网络复杂,而且数据集可能非常大:必须分析数十亿个单词或图像,并在巨大的统计模型中给出表示。另一方面,一旦模型完成烹饪,它在使用时会变得更小并且要求更低,这个过程称为推论。推理
当模型实际完成其工作时,我们称之为推理,非常符合这个词的传统含义:通过推理现有证据来陈述结论。当然,它并不完全是“推理”,而是在统计上将其摄取的数据中的点连接起来,实际上是预测下一个点。例如,说“完成以下序列:红色,橙色,黄色……”它会发现这些单词对应于它所摄取的列表的开头,彩虹的颜色,并推断下一个项目,直到它产生了该列表的其余部分。推理的计算成本通常比训练低得多:可以把它想象成浏览卡片目录而不是组装它。大型模型仍然必须在超级计算机和 GPU 上运行,但较小的模型可以在智能手机或更简单的设备上运行。
生成式人工智能
每个人都在谈论生成式人工智能,这个广义术语仅指产生原始输出(例如图像或文本)的人工智能模型。有些人工智能进行总结,有些人工智能进行重组,有些人工智能进行识别,等等——但真正生成某些东西的人工智能(无论它是否“创造”是有争议的)现在特别受欢迎。请记住,仅仅因为人工智能生成了某些东西,并不意味着它是正确的,甚至它根本反映了现实!只是在你要求之前它并不存在,就像故事或绘画一样。
热门术语
除了基础知识之外,以下是 2023 年中期最相关的人工智能术语。大型语言模型(LLM)
大型语言模型是当今最有影响力和最通用的人工智能形式,它是在几乎所有构成网络的文本和大部分英语文学上进行训练的。吸收所有这些结果会产生一个巨大的基础模型(继续阅读)。LLM能够用自然语言交谈和回答问题,并模仿各种风格和类型的书面文档,ChatGPT、Claude 和 LLaMa 等人就证明了这一点。虽然这些模型无疑令人印象深刻,但必须记住,它们仍然是模式识别引擎,当它们回答时,它是在尝试完成它已识别的模式,无论该模式是否反映现实。
基础模型
在巨大的数据集上从头开始训练巨大的模型成本高昂且复杂,因此您不想做更多的事情。基础模型是从头开始的大型模型,需要超级计算机才能运行,但通常可以通过减少参数数量来修剪它们以适应更小的容器。您可以将这些视为模型必须处理的总点,如今它可以达到数百万、数十亿甚至数万亿。
微调
像GPT-4这样的基础模型很聪明,但它在设计上也是一个多面手——它吸收了从狄更斯到维特根斯坦再到《龙与地下城》规则的所有内容,但如果你想让它帮助你写求职信,那么这些都没有帮助为了你的简历。幸运的是,可以通过使用专门的数据集(例如恰好存在的几千份工作申请)对模型进行一些额外的训练来对模型进行微调。这使模型能够更好地了解如何在该领域为您提供帮助,而不会丢弃从其余训练数据中收集的一般知识。
基于人类反馈的强化学习(RLHF)是一种您会经常听到的特殊微调——它使用人类与LLM的数据来提高其沟通技巧。
扩散
图像生成可以通过多种方式完成,但迄今为止最成功的是扩散,这是稳定扩散、中途和其他流行的生成人工智能的核心技术。通过向扩散模型显示图像来进行训练,这些图像通过添加数字噪声而逐渐降级,直到原始图像消失殆尽。通过观察这一点,扩散模型也学会了反向执行该过程,逐渐向纯噪声添加细节,以形成任意定义的图像。我们已经开始在图像方面超越这一点,但该技术是可靠的并且相对容易理解,所以不要指望它会很快消失。幻觉
最初,这是训练中的某些图像滑入不相关输出的问题,例如由于训练集中的狗过多而导致建筑物似乎是由狗制成的。现在,人工智能被认为是产生了幻觉,因为它的训练集中的数据不足或相互矛盾,它只是编造了一些东西。
这可以是资产,也可以是负债;被要求创造原创甚至衍生艺术的人工智能正在产生幻觉;法学硕士可以被要求以 Yogi Berra 的风格写一首情诗,它会很乐意这样做——尽管这样的东西在其数据集中不存在。但当需要事实答案时,这可能是一个问题;模型将自信地呈现出一半真实、一半幻觉的反应。目前,除了亲自检查之外,没有简单的方法可以区分哪个是哪个,因为模型本身实际上并不知道什么是“真”或“假”,它只是试图尽可能地完成一个模式。AGI或强人工智能
通用人工智能,或者说强人工智能,并不是一个明确定义的概念,但最简单的解释是,它是一种强大的智能,不仅可以做人类所做的事情,而且可以像我们一样学习和改进自己。有些人担心,这种学习、整合这些想法、然后更快地学习和成长的循环将是一种自我延续的循环,导致一个无法约束或控制的超级智能系统。有些人甚至建议推迟或限制研究以防止这种可能性。
当然,这是一个可怕的想法,《黑客帝国》和《终结者》等电影已经探讨了如果人工智能失控并试图消灭或奴役人类可能会发生什么。但这些故事都没有现实依据。我们在 ChatGPT 等事物中看到的智能外观令人印象深刻,但与我们与“真实”智能相关的抽象推理和动态多领域活动几乎没有共同之处。虽然预测事情将如何进展几乎是不可能的,但将通用人工智能视为星际旅行之类的东西可能会有所帮助:我们都理解这个概念,并且似乎正在朝着它努力,但与此同时,我们距离实现这一目标还非常遥远。实现类似的目标。由于需要巨大的资源和基础科学进步,没有人会突然偶然地实现这一目标!
AGI 思考起来很有趣,但正如评论家指出的那样,尽管人工智能存在局限性,但实际上很大程度上是由于它的局限性,今天人工智能已经带来了真正的、重大的威胁,因此借麻烦是没有意义的。没有人想要天网,但你不需要配备核武器的超级智能来造成真正的伤害:今天人们正在失去工作并陷入骗局。如果我们不能解决这些问题,我们还有什么机会对抗T-1000呢?人工智能领域的顶级玩家
Open AI
如果人工智能领域有一个家喻户晓的名字,那就是这个了。
顾名思义,OpenAI 最初是一个旨在进行研究并或多或少公开地提供结果的组织。此后,它重组为一家更传统的营利性公司,通过 API 和应用程序提供 ChatGPT 等语言模型的先进技术。该组织的领导者是技术乌托邦亿万富翁萨姆·奥尔特曼(Sam Altman),尽管如此,他还是对人工智能可能带来的风险发出了警告。OpenAI 是法学硕士领域公认的领导者,但也在其他领域进行研究。微软
正如你所预料的那样,微软在人工智能研究方面做了相当多的工作,但与其他公司一样,或多或少未能将其实验转化为主要产品。它最明智的举措是尽早投资 OpenAI,这使其与该公司建立了独家长期合作伙伴关系,该公司现在为其 Bing 对话代理提供支持。尽管它自己的贡献较小且不太立即适用,但该公司确实拥有相当大的研究实力。
谷歌
谷歌以其登月计划而闻名,但不知何故错过了人工智能的机会,尽管它的研究人员实际上发明了直接导致当今人工智能**的技术:变压器。现在,它正在努力发展自己的法学硕士和其他代理,但在过去十年花费了大部分时间和金钱来推动过时的人工智能“虚拟助手”概念之后,显然正在追赶。首席执行官桑达尔·皮查伊(Sundar Pichai)多次表示,该公司正在坚定地支持搜索和生产力方面的人工智能。Anthropic
在 OpenAI 不再开放之后,Dario 和 Daniela Amodei 兄弟姐妹离开了OpenAI,创立了 Anthropic,打算扮演一个开放且考虑道德的 AI 研究组织的角色。凭借他们手头的现金数量,他们是 OpenAI 的有力竞争对手,即使他们的模型(如 Claude)还没有那么受欢迎或知名。
埃隆·马斯克
马斯克也不甘落后,他直言不讳地表达了他对人工智能失控的担忧,以及在他早期为 OpenAI 做出贡献,但 OpenAI朝他不喜欢的方向发展后,他也感到了一些酸葡萄心理。虽然马斯克不是这个话题的专家,但像往常一样,他的滑稽动作和评论确实引起了广泛的反响(他是上述“人工智能暂停”信件的签名者),并且他正试图建立一个自己的研究机构。