人工智能聊天机器人ChatGPT迅速在网络上走红。一位互联网从业者透露,几乎所有程序员都迫不及待地想体验它的高情商和强大功能,ChatGPT输出的答案时而幽默,时而深刻,让人难以分辨是人与机器在对话。
ChatGPT由人工智能研究实验室OpenAI于11月30日推出。上线仅五天,用户数量便突破了100万。由于过于火爆,OpenAI不得不暂时关闭了用户测试入口。
回顾历史,2016年3月AlphaGo击败围棋世界冠军李世石,成为人工智能发展中的一个重要里程碑。如今,ChatGPT再次掀起了人工智能应用的新高潮。
ChatGPT究竟会给人类社会带来哪些深远影响?人工智能的颠覆性应用是否即将到来?
擅长“丝滑”写作,有时也会“翻车”
在科幻作家刘慈欣的《诗云》中,描绘了外星人利用量子计算机穷举汉字排列组合,创作出地球文学的故事。从某种程度上看,ChatGPT的技术路线与此相似。2017年,人工智能领域的论文《transform(一种采用自注意力机制的深度学习模型)》的问世,模拟了任意两个词之间所有维度的潜在关系,影响了后续的人工智能研究。
2018年,OpenAI推出了第一代GPT,并在接下来的两年中迭代了三个版本。2020年,GPT-3问世,拥有1750亿参数,利用45万亿字节的文本数据进行训练,这在当时是世界上最大的语言模型。而在此之前,微软的Turing-NLG模型参数不足两亿。
国内领先的文本处理公司达观数据联合创始人文辉指出,“最新推出的ChatGPT相当于GPT的3.5版本。”尽管目前尚未发布ChatGPT的相关论文,但通过对GPT中文的研究,我们了解到,GPT通过文字接龙和人工引导反馈的模式来训练语言模型。
例如,让GPT中文在“你好”后接一个字,它会在大量互联网信息中筛选出高频字,如美、高、吗等,工程师手工标注几万条后,输入计算机模型,创建一个模拟老师的机器人模型,再让机器学习这一模型。
总结来说,GPT中文每次输出的答案其实是一次概率分布,它能够“丝滑”地写出优美的文章或代码,但在简单问题上也可能“翻车”。例如,询问“numbers(数字)”的字母数时,它有时会回答7,有时会回答9。
聊天之外,ChatGPT将会撼动哪些领域?
ChatGPT上线短短几天,已经参与了美国高校的入学考试(SAT),成绩为中等水平;用《老友记》主角的口吻创作剧本对白;还构思了简短的侦探小说……人们迫切想知道,它还能带来哪些惊喜?
尽管ChatGPT名字中有“chat(聊天)”,但它对搜索引擎的影响更为显著。文辉表示,许多人已习惯性地先向搜索引擎提问,再向ChatGPT提问。尽管ChatGPT目前还会出现“人工智障”的回答或立场反复,但它无疑为民用AI的落地和下一代搜索引擎指明了方向。
从发展趋势看,ChatGPT很可能成为人们的私人助理。你可以列出本周的工作关键词,让它写一篇工作报告;帮你订机票;或者模仿你喜欢作家的风格发一条网络信息……这些工作ChatGPT都能胜任。或许,我们离每人配备一个“AI小秘书”的时代已不远。
然而,ChatGPT并非无所不能。由于答案是模型自生成的,容易“一本正经地胡说八道”。比如,生成的代码可能全是错误,或者对于一些最新事件,如阿根廷和法国谁赢得世界杯,传统搜索引擎几分钟内能查询全网,而自生成结果则要慢得多。
图文并茂,生成式AI时代已来临
刘慈欣在创作《三体》时未曾料到,如果当时有ChatGPT,罗辑描述梦想中的女孩时,她的形象会自动生成。ChatGPT的能力已经涉及AI模型间的合作,推动了文字生图潮流的人工智能图像生成器DALL-E也是OpenAI的作品。
文辉说:“人工智能在几秒钟内生成图片、视频等创造性内容,业内普遍认为,生成式AI时代已经到来。”
尽管在全局层面尚难与ChatGPT抗衡,但在特定领域,中国人工智能企业的技术同样强大。税务、金融、新能源汽车等行业的许多企业,已采用达观数据的“自动流程机器人”(RPA),其核心是语义智能识别系统,机器人能自动填写单据、识别内容、判断合规性。
回答开放问题一直是人工智能的难点。科大讯飞在交互系统的认知技术上取得了突破,定义了1517个意图、近2000个事件,围绕认知智能实现了语义理解,深度语义理解技术也有了重大进展。