“`markdown

智谱AI CEO张鹏的“反共识”：大模型发展的新思考

引言：

在人工智能领域，大模型无疑是当下最炙手可热的技术方向。然而，在众多企业纷纷涌入这一赛道，追逐技术前沿的同时，一些“共识”也在悄然形成。智谱AI CEO张鹏却提出了他对大模型发展的一些“反共识”的思考，这些思考或许能为我们重新审视大模型的未来发展提供新的视角。

正文：

大模型浪潮下的“共识”与“反共识”

大模型，尤其是以Transformer架构为代表的预训练语言模型，在自然语言处理、图像识别、语音合成等领域取得了显著的突破。这种突破推动了人工智能技术的快速发展，也引发了人们对通用人工智能（AGI）的憧憬。

然而，在追逐大模型技术突破的过程中，一些“共识”也逐渐形成。例如，模型越大越好，数据越多越好，算力越高越好等等。这些“共识”在一定程度上推动了大模型的发展，但也可能导致一些潜在的问题。

智谱AI CEO张鹏认为，在这些“共识”之外，还有一些被忽略的思考，这些思考可能对大模型的未来发展至关重要。他提出的“反共识”主要体现在以下几个方面：

1. “模型为本”的反思：Agent技术的核心是什么？

当前，Agent技术正成为大模型应用的重要方向。Agent可以理解为一种智能体，它能够感知环境、做出决策并执行行动，从而完成特定任务。在大模型时代，Agent技术被赋予了更高的期望，人们希望Agent能够自主地完成更加复杂的任务，甚至能够像人类一样进行思考和创造。

然而，在Agent技术的发展过程中，一个重要的争论点是：Agent的核心究竟是什么？是强大的模型，还是复杂的外部工具？

一种观点认为，Agent的核心在于其强大的模型。模型越强大，Agent就越能够理解复杂的任务，做出合理的决策，并生成高质量的输出。在这种观点下，Agent的构建重点在于如何训练出更加强大的模型。

另一种观点则认为，Agent的核心在于其与外部工具的交互能力。模型只是Agent的基础，Agent真正发挥作用，需要借助各种外部工具，例如搜索引擎、数据库、API等等。在这种观点下，Agent的构建重点在于如何设计出更加灵活的工具调用机制。

张鹏认为，Agent技术的核心在于“模型为本”。他强调，强大的模型是Agent的基础，只有拥有强大的模型，Agent才能够真正理解用户的意图，并有效地利用外部工具。如果模型本身不够强大，即使拥有再多的外部工具，Agent也无法真正发挥作用。

这种“模型为本”的观点，实际上是对当前Agent技术发展的一种反思。在一些Agent项目中，开发者过度依赖外部工具，而忽略了模型本身的训练。这种做法可能会导致Agent的性能受到限制，无法真正满足用户的需求。

2. 坚持预训练：大模型的核心竞争力是什么？

预训练是大模型训练的重要环节。通过预训练，模型可以学习到大量的通用知识，从而为后续的微调提供良好的基础。

然而，在实际应用中，一些企业为了快速推出产品，可能会选择直接使用开源的预训练模型，或者只进行少量的微调。这种做法虽然能够节省时间和成本，但也可能导致模型的性能受到限制。

张鹏认为，坚持预训练是大模型的核心竞争力。他强调，只有通过充分的预训练，模型才能够真正理解用户的意图，并生成高质量的输出。如果模型没有经过充分的预训练，即使进行再多的微调，也无法弥补预训练的不足。

这种坚持预训练的观点，实际上是对大模型技术的一种长期投入。预训练需要消耗大量的算力和数据，需要企业具备强大的技术实力和资金实力。然而，只有通过长期投入，企业才能够真正掌握大模型的核心技术，并在未来的竞争中占据优势。

3. 拥抱开源：大模型生态的未来是什么？

开源是大模型生态的重要组成部分。通过开源，企业可以将自己的技术成果分享给社区，吸引更多的开发者参与到大模型的开发和应用中来。

然而，在实际应用中，一些企业可能会选择闭源，将自己的技术成果视为商业机密。这种做法虽然能够保护企业的利益，但也可能限制大模型生态的发展。

张鹏认为，拥抱开源是大模型生态的未来。他强调，只有通过开源，才能够汇聚更多的智慧，共同推动大模型技术的发展。开源不仅能够加速技术的创新，还能够降低开发的成本，促进大模型的普及。

这种拥抱开源的观点，实际上是对大模型生态的一种开放态度。开源需要企业具备开放的心态，愿意将自己的技术成果分享给社区。然而，只有通过开放，企业才能够真正融入到大模型生态中，并从中受益。

4. 应对产业竞争：差异化竞争的策略是什么？

大模型产业竞争日益激烈。在众多企业纷纷涌入这一赛道的同时，如何实现差异化竞争，成为企业面临的重要问题。

一种策略是追求极致的性能。通过不断提升模型的性能，企业可以吸引更多的用户，并在竞争中占据优势。然而，这种策略需要企业具备强大的技术实力和资金实力，需要不断投入大量的资源。

另一种策略是专注于特定领域。通过专注于特定领域，企业可以更好地满足用户的需求，并在竞争中建立自己的优势。然而，这种策略需要企业对特定领域有深入的了解，需要不断积累经验。

张鹏认为，应对产业竞争的关键在于差异化竞争。他强调，企业应该根据自身的优势和特点，选择适合自己的发展道路。例如，一些企业可以选择专注于特定领域，提供定制化的解决方案；另一些企业可以选择拥抱开源，构建开放的生态系统。

这种差异化竞争的观点，实际上是对企业战略的一种思考。企业应该根据自身的实际情况，制定合理的战略，并在竞争中找到自己的位置。

智谱AI的实践：GLM模型的探索

智谱AI在以上“反共识”的思考下，积极探索大模型技术，并取得了显著的成果。其中，GLM（General Language Model）模型是智谱AI的代表性产品。

GLM模型是一种基于Transformer架构的预训练语言模型。与传统的Transformer模型不同，GLM模型采用了自回归和自编码相结合的训练方式，从而能够更好地理解上下文信息，并生成更加自然的文本。

智谱AI在GLM模型的基础上，开发了一系列应用，例如智能写作、机器翻译、对话生成等等。这些应用在各个领域都取得了良好的效果，受到了用户的广泛好评。

智谱AI的实践证明，坚持“模型为本”、坚持预训练、拥抱开源，以及差异化竞争的策略，是企业在大模型时代取得成功的关键。

大模型未来的展望：AGI的曙光

大模型技术的发展，为我们带来了对通用人工智能（AGI）的憧憬。AGI是指具有人类智能水平的人工智能，它能够像人类一样进行思考、学习和创造。

虽然AGI的实现仍然面临着许多挑战，但大模型技术的发展无疑为我们打开了一扇新的大门。通过不断提升模型的性能，不断探索新的应用，我们有望在未来实现AGI的梦想。

结论：

智谱AI CEO张鹏提出的“反共识”思考，为我们重新审视大模型的发展提供了新的视角。在追逐技术前沿的同时，我们也应该保持冷静的头脑，思考大模型的核心价值，以及未来的发展方向。坚持“模型为本”、坚持预训练、拥抱开源，以及差异化竞争的策略，将有助于企业在大模型时代取得成功，并为实现AGI的梦想做出贡献。

参考文献：

Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. N., … & Polosukhin, I. (2017). Attention is all you need. Advances in neural information processing systems, 30.
Devlin, J., Chang, M. W., Lee, K., & Toutanova, K. (2018). Bert: Pre-training of deep bidirectional transformers for language understanding. arXiv preprint arXiv:1810.04805.
Brown, T. B., Mann, B., Ryder, N., Subbiah, M., Kaplan, J., Dhariwal, P., … & Amodei, D. (2020). Language models are few-shot learners. Advances in neural information processing systems, 33, 1877-1901.
OpenAI. (2023). GPT-4 Technical Report. Retrieved from https://openai.com/research/gpt-4 (请替换为实际链接，如果公开)
智谱AI官方网站. (2024). GLM模型介绍. Retrieved from https://www.zhipuai.com/ (请替换为实际链接)
“`

>>> Read more <<<

一	二	三	四	五	六	日
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

智谱AI CEO：大模型领域存在“反共识”

作者智能小编

智谱AI CEO张鹏的“反共识”：大模型发展的新思考