从去年11月开始,一款名为“chatGPT”的聊天机器人程序在海外开始流行。今年2月,chatGPT几乎成为每日与“热门趋势”相关的热搜。热烈讨论中,不少人惊呼:《流浪地球2》中的“苔藓”,不断自我学习,最终发展出独立思考能力,或许离我们并不遥远。”
也有人认为,chatGPT和Siri,小爱之间,小度和其他众所周知的聪明助手没有根本区别,不值得太多关注,网友用它写诗、写小说、写工作简报、写文案的朋友,甚至用它写代码、写代码。文档… chatGPT 是一个什么样的产品?为什么突然爆了?它能做什么?会不会有人因为它“抢饭碗”?未来发展将走向何方?我们采访了业界专家和很多chatGPT用户尝试回答这些问题。
“这不是什么新鲜事”chatGPT,为什么这么受欢迎?
chatGPT,全称是“chat Generative Pre-trained Transformer”,直译为“用于聊天的生成式预训练变压器”,是美国OpenAI公司开发的一款聊天机器人程序,可用于问答、文本摘要、机器翻译、分类、代码生成和对话式AI。
到今年1月份,chatGPT在不到两个月的时间里就积累了超过1亿的用户,超过了Tik Tok之前9个月积累1亿用户的速度。
南开大学计算机学院、网络空间安全学院副院长刘晓光表示,虽然chatGPT进入公众视野的时间并不长,但OpenAI的GPT产品早在几年前就在专家中产生了巨大影响。从技术角度来看,chatGPT并不是一个新鲜事物。
“从2016年到2020年,OpenAI先后发布了GPT 1.0、2.0和3.0版本。去年11月底发布的ChatGPT可以认为是GPT-3.5。虽然大多数普通人最近才了解到使用“GPT”预训练大模型进行大数据,但早期的 GPT-3 已经对计算机科学和工业产生了很大的影响。国内的一些互联网公司早在这波疯狂之前就有了自己预训练的大型模型项目。”
刘晓光认为,chatGPT 突然火爆可能有几个原因:“首先,前几代 GPT 更多的是为商业界提供技术支持,而 chatGPT 则是直接面向公众,任何人都可以提问。 ,答案只需几秒钟,更多人简单直观地了解其功能;其次,它是在国外大学考试季发布的,很多学生用它来写论文、提交作业,而chatGPT可以给它提供相对完整的答案,解决学生的实际问题,这预示着用户的快速增长。一旦它变得有点流行,当然不排除科技巨头和科技媒体的过度关注和炒作。 ”
“非常好”? chatGPT 克服了哪些困难?
去年12月,埃隆·马斯克公开表示chatGPT“好得可怕”,并认为它太强大了,Dangerous AI离我们不远了。微软联合创始人比尔盖茨在接受媒体采访时表示:“chatGPT将改变我们的世界。”近日,京东集团副总裁何晓东在接受媒体采访时表示:“chatGPT是第一个真正原生的人工智能产品,就像第一部iPhone一样,它展现出高完整性、高体验和高平台性。一出来就出来了。”“
埃隆·马斯克称chatGPT“好得可怕”
chatGPT为何受到行业巨头如此推崇?许多人表示困惑。有网友在网上提问:“能和人说话的Siri、小爱,已经有很多像助手、小杜这样的聪明球员了。”说到AI技术,AlphaGo在几年前也引起了很多关注。 chatGPT 有什么特别之处? ”
刘晓光表示,在计算机领域很多人看来,chatGPT的出现对AI领域的影响甚至比七年前AlphaGo对阵世界围棋冠军、职业九段的比赛还要大。李世石,他赢得了人机围棋之战。
“从近30年前IBM开发的国际象棋计算机“深蓝”击败世界冠军卡斯帕罗夫,到AlphaGo击败人类围棋几年前的冠军,虽然算法和计算能力有巨大差异,但基本上还是没有跳出“让计算机在固定场景下做固定事情”的范畴,而这恰恰是刘晓光说:“chatGPT面临的是‘开放世界’——完全不可预测,亿万用户会问什么问题。”chatGPT要根据具体场景,给自己组织不同的答案。 AI开发的难度,chatGPT在很多情况下都表现良好。”
对于人工智能在“开放世界”场景下运行的难度,刘晓光做了一个简单的比喻:“当今的智能控制技术大多数仍然应用于矿山、港口、室内工厂等特定的封闭环境中。这种“近世界”我们不允许AI遇到过于复杂的问题。相比之下,公共道路上的智能驾驶实现难度要大得多。原因之一是,当人工智能面临开放且不可预测的环境时,其运行复杂度呈指数级增长。 ”
刘晓光认为,从基本概念来看,chatGPT 相对于 Siri、小爱同学、小度等智能助手来说,基本上还是一种语言模型,核心技术不具备颠覆性创新。不同的是, chatGPT模型足够大,有更多的数据可供训练,软硬件数据处理能力更强,但Siri、小爱同学等软件的学习能力和数据量却相差甚远,甚至可以说是质的区别。
”优点 ChatGPT的学习能力和数据处理能力极大地扩展了它能处理的问题的边界,甚至可以说是完全不同的产品。一些研究人员的观察和分析表明: chatGPT展现了一个受过大学教育的普通大学生的知识水平,这与以往的同类产品完全不同,也是震惊业界的地方。”
ChatGPT“调侃”狂欢:围观看着机器人“认真地胡说八道”
值得注意的是,chatGPT在中国互联网上走红后,迅速引发了一场意想不到的争议狂欢——网友纷纷对其进行“调侃”。
与苹果助手的智能语音不同,当你遇到复杂的问题时,Siri 经常会回复“对不起,我好像听不懂”,chatGPT 表现出了一种充分利用自己的逻辑来组织语言和内容的倾向。回答问题。它甚至回答了许多人们一开始取笑的问题。这种“严肃的回答”引起了用户的极大兴趣。
一些“强制回答”反映出chatGPT有时并不能完全理解它正在回答的问题。例如,对于“为什么房子建得不牢?”的问题。 chatGPT“不厌其烦”地从空气无法流通、缺乏通风系统等方面入手。讨论这样的房子有害健康,但似乎并没有“意识到”这样的房子不适合居住。
网友“调侃”chatGPT题(图片来源于网络)
涉及专家知识的问答也有问题,闹出了很多笑话。 B站历史区博主在chatGPT问了几个问题后得到的答案显示,chatGPT会将春秋战国七雄之一的魏国与曹魏混淆起来。三国时期和十六世纪的割据政权。北魏是郭朝时期鲜卑拓跋氏建立的。无独有偶,chatGPT也对“南宋”和“南宋”进行了比较。
chatGPT《认真地说废话》
(图片来源:站长b《少年魔术师》)
经常会出现随机答案。历史医生告诉记者,这些“一本正经的胡说八道”的答案让人啼笑皆非,但奇怪的是,它们的逻辑表达却很相似,不像是从网上随意抄袭的。 “我看到有人用chatGPT问一些学术问题,他给出的答案甚至包括文献引用、文献编号等细节。我查了一下,发现这些“链接”都是chatGPT自己编译的,这让我笑了。然后哭。我真的不知道。你是怎么想出这个答案的?”
“要讨论chatGPT“废话”的原因,就必须提到目前缺乏这样的产品,可解释性很差——预训练的大型模型在神经网络中,有数万层和AI通过深度学习自己构造出复杂的规则,人们看到的往往只是它作为问题答案给出的结果,因此,无论答案是对还是错,人们很难解释人工智能为什么会出现
不少使用过chatGPT的用户告诉记者,chatGPT的答案很少有表达不完美的情况,但时不时会出现逻辑和事实上的错误。越是冷门、具体的领域,这个错误比较明显的是。
这种现象的发生可能与使用chatGPT学习和训练的数据构成有关。“众所周知,一个产品使用的人越多,它就越容易使用。这是因为用户的使用行为本身就是一种反馈机制,可以帮助产品改进。 chatGPT在问题集中的地方也是如此,它有更多的样本可以学习、训练和自我纠正;在部分知识领域,chatGPT缺乏足够的深度学习数据,所以会‘胡说八道’。”刘晓光说,他最近在使用chatGPT。在chatGPT中,当你提出常见问题、新闻等时,往往可以得到更准确的答案。然而,一旦你要求一些相当非常规的知识,chatGPT 就开始明显地“放松”。
由此衍生出的另一个话题是chatGPT响应输出的可靠性——谁来判断它提供的结果是否正确?如果你无法评估,你就无法提供适当的反馈。众所周知,正确的反馈对于产品迭代非常重要。
另一方面,chatGPT 产生了大量“无意义”的垃圾邮件。经不起二次纠正的虚假、失信内容的广泛出现,会削弱整个内容平台的可信度,让人对chatGPT或类似内容产生怀疑。产品的可靠性受到质疑。
毕竟在当今信息丰富的社会,人们对“信息准确性”的渴望往往多于“信息密度”。
人们应该担心“他们的工作”吗?
chatGPT的出现引起的另一个争议相对更严重和现实:chatGPT会取代某人的工作吗?
自从AI技术诞生以来,类似的话题就层出不穷。然而,要回答这个问题,我们需要跳出对AI技术的盲目崇拜和戏谑的“逗比”心态,认真面对这样的问题:chatGPT现在能做什么或者未来能做什么?
针对这个问题,chatGPT本身提供了聊天机器人、自动文本生成、自动翻译、情感分析、内容摘要、数据分析、虚拟助手等具体应用场景。事实上,在这些领域,chatGPT已经证明了比以前的所有产品都要好,而且好得多。
刘晓光认为,从长远来看,技术进步会带来业务适应,这是必然结果。但一项新技术是否会对就业产生影响,以及具体产生的影响,最终取决于该技术落地的顺利程度。
“目前,chatGPT将对图像制作、文本生成、媒体内容制作、虚拟人类服务、报道、翻译、编程、搜索引擎等领域产生巨大影响。 2月7日,微软宣布推出chatGPT支持的最新版人工智能搜索引擎Bing和Edge浏览器,极大地改变了搜索引擎的竞争格局——毫无疑问,从“逐一浏览数据”到“直接向用户提供答案必须朝着更能响应用户需求的方向。可见新技术的变革正在如火如荼地进行,有时人们说巨大的变革即将来临,这并不夸张。”刘晓光说。
内嵌chatGPT的Bing搜索,
直接制定训练计划,这是面试官想要的
但刘晓光也表示,正如之前指出的,chatGPT仍然存在错误,其答案仍然时不时地不可靠:“以chatGPT呈现的文本表达为一个例子。将其应用到真实场景中,离不开人的指导、检查和验证。”
从社会分工的角度来看,chatGPT 面临着第一份工作涉及大量重复性工作且不需要太多创造力的冲击。创造力是人工智能无法轻易克服的差距,无论目前花费多少计算能力和财力。
“人为什么有创造力?连人类都无法解释这个问题,更不用说向机器传授创造力了。到目前为止,人工智能最擅长“按规则做事”。基本上,它无法超越互联网上的“创造力”水平,chatGPT 也不例外。刘晓光说:“如果有一天人工智能突破了创造力的层面,那么人们将不仅仅需要为某些行业的工作而烦恼——那么整个人类社会将面临翻天覆地的变化。 ”
预训练好的大模型,未来会走向何方?
早在 2015 年,它就由 Altman、Peter Thiel、Reid Hoffman 和 Elon Musk 等一批技术领袖创立。在 OpenAI 成立时,OpenAI 还是一家非营利性企业。公司创始人认为,为了防止人工智能技术垄断在少数巨头手中,需要通过开源来推动技术的开放。
但随着项目的进展,训练机器学习模型所需的资金不断增长且规模更大的OpenAI开始建立一个盈利的分支。 2019年,风险投资家微软也加入了这个游戏。如今,微软与 OpenAI 之间的财务财富和技术日益融合。今年1月,随着chatGPT的流行,微软又向OpenAI投资了100亿美元。
目前,chatGPT 仍处于免费试用状态,但不断有消息称其即将推出付费版本。同时,Bing搜索内置了chatGPT,甚至有报道称微软可能会将chatGPT内置到Office软件中,这将是办公生态系统的又一创新。
内置chatGPT的Bing搜索正在写诗
“预训练的大模型”类似的软件将走向何方?在业内人士看来,虽然chatGPT背后的理论并不新鲜,但开发类似产品所需的资金和人力在某种程度上代表了一个新领域。
“上一代的GPT,模型训练成本就已经是几千万甚至上亿美元,非常昂贵。OpenAI预计今年内发布GPT-4,这将是万众期待的下一个“升级。这也意味着,需要更多的数据和更高的计算能力,这将需要大量的资金和人力。因此,同类产品的开发门槛不断上升。”刘晓光表示
大趋势下,国内计算机行业面临哪些机遇和挑战?刘晓光认为,目前国内外企业在预训练大模型产品开发的基础理论方面差距还不算太大,但在在数据收集、分析和数据处理方面,“落后者”还需要奋起直追。”
“如果把机器训练和学习所依赖的数据比作食材的话,那么这种食材就需要被收集并处理后将其变成适合吸收的东西并不是一件容易的事,无论是文本、图像还是视频通常都需要人工标注。这不是短时间内投入大量资金就能立竿见影的事情,而是需要大量的人力和时间的积累。因此,有业内人士称,数据是互联网公司最重要的资产,甚至有人将数据比作公司的“护城河”。刘晓光说道。
“运动前大模型”软件未来会如何发展?刘晓光认为,这可以指向三个特点:一是数据量越来越大,计算能力越来越强、越来越复杂;二是进军专业领域,最大限度提高某一细分领域的信息准确性,如医疗、法律、体育、编程等垂直分类;第三,与具体应用场景深度结合,不仅仅是“聊天”,而是与虚拟人表演、电商营销、售后客服、陪伴老人和年轻人、文艺创作等场景相结合。 chatGPT的潜力表明它有能力在这些领域取得巨大成功。 “
原创文章,作者:jinny,如若转载,请注明出处:https://www.52foreigntrade.com/20231011180.html