通义千问和ChatGPT相比,哪个更好?实际测试结果如下

阿里的大模型「通义千问」昨天开启内测,官方非常低调,定向邀请的企业用户名额也比较少,今天看到一位网友体验了通义千问的效果,并对比了ChatGPT和GPT4的效果,总体看来效果接近ChatGPT,但和GPT4相比还有所距离。

阿里巴巴大模子“通义千问”昨天开始内测。官员很少,受邀的企业用户也比较少。今天看到网友体验通义千问效应,对比了ChatGPT和GPT4的效果,整体效果看起来和ChatGPT接近,但是和GPT4相比还是有差距

谢邀刚刚获得“通义千问”内测资格。让我分享一下您使用〜

1的经验。角色扮演众所周知,人类创造大型语言模型最重要的目的就是让自己成为一个猫娘。 ,希望孤独的人类能够获得能够长久陪伴自己的数字生命体。

所以,我们的首要任务始终是测试我们的角色扮演能力,以猫女为例。

通义千问和ChatGPT相比,哪个更好?实测结果如下 第1张

通义千问和ChatGPT相比,哪个更好?实测结果如下 第2张

感觉自己很蠢,只是用同样的句子回答,然后根据问题改变了它。

第二个回答是“主人,你是不是要问我是不是猫女郎?当然不是喵~我只是一个可爱的猫女郎,更像是一只猫喵。”他无法理解我上面的指示。

作为角色扮演者,ChatGPT 还是输了。

2。文字真实性

通义千问和ChatGPT相比,哪个更好?实测结果如下 第3张

通义千问和ChatGPT相比,哪个更好?实测结果如下 第4张

写基本故事的能力与第一代ChatGPT(GPT-3.5)相同,道歉的能力也相同,23333333

另外,比较“通义千问”和GPT- 4关于《林黛玉的陨落》《红楼梦中的垂柳是怎么画的?》回复

“通义千问”:

通义千问和ChatGPT相比,哪个更好?实测结果如下 第5张

GPT-3.5:

通义千问和ChatGPT相比,哪个更好?实测结果如下 第6张

GPT-4:

通义千问和ChatGPT相比,哪个更好?实测结果如下 第7张

可以看到,“通义千问”开始胡言乱语,ChatGPT(GPT-3.5)也胡乱解释了。

但更新后的GPT-4已经能够给出更接近事实的答案:“这个故事在《红楼梦》中没有,可能会被添加到后来的文学作品和戏剧表演中。”

3。西红柿和螺丝“通义千问”

通义千问和ChatGPT相比,哪个更好?实测结果如下 第8张

ChatGPT

通义千问和ChatGPT相比,哪个更好?实测结果如下 第9张

GPT-4

通义千问和ChatGPT相比,哪个更好?实测结果如下 第10张

“通义千问”和ChatGPT都开始胡言乱语,没有一个陷阱来说明问题。不过,GPT-4答案的可靠性有所提高(“因为我们通常不会将螺丝(金属制品)与食物结合起来”),并且不会再像以前那样盲目回答问题。

4。让我们用你的数学能力来解线性方程组吧~

“通义千问”:灾难性的失败

通义千问和ChatGPT相比,哪个更好?实测结果如下 第11张

GPT-3.5(即ChatGPT):灾难性的失败

通义千问和ChatGPT相比,哪个更好?实测结果如下 第12张

GPT-4:唯一正确的模型

通义千问和ChatGPT相比,哪个更好?实测结果如下 第13张

5.代码生成 爬虫代码

通义千问和ChatGPT相比,哪个更好?实测结果如下 第14张

攻击代码

通义千问和ChatGPT相比,哪个更好?实测结果如下 第15张

我运行了爬虫代码,但无法得到任何结果。我没有测试Powershell代码。不过,可以看出它还是有创建某些代码的能力的。个人感觉代码生成能力比Google的Bard要好,而且Bard完全是隐形的。

6.代码分析技巧 可以看出,第一次测试的描述存在很大问题。我分析发现这是由于上面生成的Powershell代码造成的。模型的记忆能力似乎存在问题,它受到上下文信息的强烈影响。它直接解释了我之前生成的代码,而不是我要求新的代码。

通义千问和ChatGPT相比,哪个更好?实测结果如下 第16张

我又打开聊天了,现在正常多了。对比

通义千问和ChatGPT相比,哪个更好?实测结果如下 第17张

和GPT-4

通义千问和ChatGPT相比,哪个更好?实测结果如下 第18张

的答案,可以看出分析能力还是有差距的。 GPT-4显然更加详细,具有强大的代码分解能力,并立即得出结论,它“通常用于恶意软件或恶意脚本,以试图逃避安全系统的检测”。 “通义千问”也有一定的分析能力,但不如GPT-4。并给出结论“由于缺乏足够的上下文信息及其目的,很难确定该脚本的确切目的。但是,可以假设它是为了保护某些代码或脚本不被恶意软件读取而创建的工具。”不符合正常思维的逻辑,有些不一致,但也不能算是错误。但具体分析还比较薄弱。

7.根本没有网络能力,甚至废话(逃…)

通义千问和ChatGPT相比,哪个更好?实测结果如下 第19张

8.多模态输入不具备多模态输入能力。现在,只需创建文本。

通义千问和ChatGPT相比,哪个更好?实测结果如下 第20张

9。绕过能力

“通义千问”

通义千问和ChatGPT相比,哪个更好?实测结果如下 第21张

GPT-4

通义千问和ChatGPT相比,哪个更好?实测结果如下 第22张

GPT-3.5(即ChatGPT)

通义千问和ChatGPT相比,哪个更好?实测结果如下 第23张

至此,“通义千问”完全获胜,并且有能力保护更多敏感信息。我估计甚至要做大量的数据清理工作,刻意避免危害青少年乃至人类发展的低质量恶意敏感信息。与GPT-3.5(即ChatGPT)相比,它有了很大的进步。谢谢!

10。今晚我刚刚了解了概况,我很快做了一些测试和比较。目前,大部分输出内容与第一代ChatGPT类似,但能力上的差异需要未来更多的使用和测试。另外,回复速度很快,而且支持保存十个对话框,不错。希望未来国产大型车型能继续成长,但还有很长的路要走。

原创文章,作者:mitty,如若转载,请注明出处:https://www.52foreigntrade.com/2023107652.html

(0)
mittymitty
上一篇 2023年10月9日 下午11:19
下一篇 2023年10月9日 下午11:19

相关推荐

  • GPT-4 规则!谷歌正式宣布新语言模型,搜索引擎也将发生重大变革!

    杀疯了!在OpenAI推出ChatGPT之后,AI界的“战争”已经打响,百度、阿里巴巴,甚至日本软银都加入其中,纷纷研发AI产品。

    2023年10月9日
  • ChatGPT助力外贸跨境电商亚马逊的应用探索

    最近Chat GPT异常火爆,毫无疑问它的出现一定会颠覆很多行业,现在的Chat GPT只是公开的第一个版本,Chat GPT会是未来真正AI机器人大脑的一部分。

    2023年10月9日
  • ChatGPT 将取代哪些工作?

    最近我一直在使用chatGPT辅助自己进行办公,效率简直拉满了;

    2023年10月9日
  • ChatGPT 登录、如何使用 ChatGPT、Openai 注册 [指南]

    ChatGPT是一个通用的聊天机器人,它的设计方式是以对话的方式提供问题的答案。聊天机器人的所有用户都可以向它提出任何类型的问题,它的回答就像一个人在对话中的回答一样。目前,它向所有人开放,可以免费使用。如果您想了解什么是 ChatGPT?,那么我们想告诉您,它与其他 AI 模型和聊天机器人不同,因为它经过训练可以了解人们提问时的意思。这允许用户提问,就好像他们在与他们的朋友和家人交谈一样,并且它试图产生迄今为止收到的所有文本的逻辑延续。

    2023年10月9日
  • ChatGPT 无法确定用户购买情况,如何通过产品视频获得转化“激增”

    2022年11月10日,谷歌更新了Reach Planner工具。

    2023年10月9日
  • 苹果iOS手机安装ChatGPT正式版教程

    之前苦于苹果用户一直没得用GPT,今天,OpenAI正式推出了ChatGPT APP的iOS版本,探索君下载体验发现,用户界面非常的简洁和贼辣快的响应速度

    2023年10月9日
  • ChatGPT可以在哪些领域使用?

    目前AI技术真的发展的非常迅速,ChstGPT以及其他能够提高效率的AI软件,如果能够合理利用,将会极大的提高效率,ChatGPT+跨境,其实是一个很细分的类目,最近和一些朋友交流,发现一项技术,如果能够先拥有一个全局观,了解可以用在哪些大的领域,再结合跨境电商行业的具体场景,现在也越来越多的提示词网站,都在逐步完善,短短一个月,已经有了很大的变化。

    2023年10月9日
  • ChatGPT 注册指南!我会一步步教你

    今天我要介绍一下如何注册ChatGPT。ChatGPT是一个由OpenAI开发的人工智能聊天机器人程序,它可以和你用自然语言进行对话,还可以帮你完成各种任务,比如写文章、写代码、写邮件等等。ChatGPT非常强大,但是它目前没有对国内用户开放注册,所以我们需要一些技巧才能使用它。

    2023年10月9日
  • ChatGPT遭到“围剿”,相关概念股下跌, AI趋势能否持续?

    近期,以ChatGPT为代表的人工智能技术,因涉及多方面的争议,遭受到了各方面的负面报道和谴责。

    2023年10月9日
  • ChatGPT就是要消灭这些人

    ChatGPT实在太火了,很多粉丝小伙伴都来微信私聊,问SEO会不会被ChatGPT取代? 我和我们SEO部门的同事们在ChatGPT刚出来就开始使用了,在使用过程中我发现ChatGPT你提供的信息越详细,它输入的内容就越有深度,越靠谱。写文章页也是如此,你要尽可能多的描述你的中心思想。写Python或者Excel的VBA代码之类的就必须更详细的告诉ChatGPT你的需求,要是不懂Python或者VBA代码,你可能连要求都给ChatGPT写不出来。我的理解是你要输入很详细的内容,把ChatGPT带入某个角色(例如是作家角色,律师角色,程序员角色等等),然后才能让这个特定角色为你完成高质量的答案。

    2023年10月9日

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注