在12月23日举办的2023华为云AI院长峰会上,中国科学院院士、清华大学人工智能研究院名誉院长张钹发表视频致辞,对大模型的价值、面临的治理问题以及未来的发展方向进行了分享。
中国科学院院士、清华大学人工智能研究院名誉院长张钹发表视频致辞
大模型向通用AI迈出一步
大语言模型能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写新闻、邮件、视频脚本、文案、翻译、代码等任务。对此,张钹院士表示,与真人对话很接近,达到行为主义所追求的目标,这是AI里程碑式的成就。
张钹认为,相较第一代AI的知识驱动模型、第二代AI的数据驱动模型,突破特定的领域、利用特定的模型、实现特定的任务三个特定,向通用AI(AGI)迈出了一步。
对AI的治理需要从模型和使用角度出发
大模型的出现,使传统人工智能向生成式人工智能转变,为所有人工智能企业打开一扇新的大门,也将为AI产业发展带来新的机遇。
第一,促进AI科技革命。张钹解释,信息科学技术发展速度快是因为其在发展初期就打下了坚实的理论基础,但AI至今没有理论,AI已有的模型和算法都是针对具体领域和具体任务,难以建立通用的理论。但与第一代和第二代AI不同,大模型突破了三个特定,使可解释和鲁棒的AI理论成为可能,将会极大地推动AI科技的迅速发展。
第二,推动AI产业变革。受单领域和单任务的限制,AI的应用和产业化总是被限制于狭小的领域。但目前大模型已经从生成文本扩大到生成其他模态,可以使用通用的模型生成多样性的人类水平的图像、声音、视频和代码等。大模型通过微调可以满足不同领域和任务的需求,与知识库和其他工具结合,可以极大地扩大AI产业与应用的发展空间,有可能使AI产业进入新的发展阶段。
此外,大模型的发展也带来了一些挑战。第一,大模型目前仅在自然语言处理和编程等少数任务上做到了通用性,在诸如决策、博弈等领域能否实现通用性仍有待研究。
第二,大模型利用预测下一个词的自监督学习方法学习文本和生产文本,与人类的文本学习和语言生产的原理完全不同。这使得其具有三个本质性的缺陷,一是输出质量不一致,且不可控,存在犯大错误的可能性;二是受提示词(输入词)影响很大,输出鲁棒性比较差;三是没有自知之明,难以自我发现错误和纠正错误。
基于其缺陷,大模型生成不符合道德伦理、政治标准的内容比较常见,需要通过AI对齐来解决,这属于对模型的治理问题。同时大模型输出的正确内容也可能被误用和滥用,因此需要对使用者进行治理。在AI发展过程中,必须处理好发展和治理之间的关系,以保证AI的健康发展。
发展第三代人工智能需要产学研共同努力
尽管眼下GPT只能以人机对话的形式呈现,存在种种局限,但也向通用型人工智能的方向迈了一步。如何使AI走向通用的道路?张钹指出,“必须发展第三代人工智能。”
张钹认为,发展第三代人工智能的任务包括,第一,建立可解释和鲁棒的 AI 理论。第二,发展安全可信、可控、可靠和可扩展的AI技术。第三,推动AI的创新应用和产业发展。
要实现这个任务,张钹表示,需要把知识、数据、算法和算力充分利用起来,通过文本语义向量表示、多头注意机制的转换器、自监督学习这三个关键技术,实现了从过去只是把文本当成数据来处理,转变为对文本的内容及文本所包含知识的处理,这是关键性的一步。
张钹指出,发展第三代人工智能,还需要产学研共同努力,把基础研究、技术创新和产业化三者结合起来。
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。