通义千问和ChatGPT相比,哪个更好?实际测试结果如下

阿里的大模型「通义千问」昨天开启内测,官方非常低调,定向邀请的企业用户名额也比较少,今天看到一位网友体验了通义千问的效果,并对比了ChatGPT和GPT4的效果,总体看来效果接近ChatGPT,但和GPT4相比还有所距离。

阿里巴巴大模子“通义千问”昨天开始内测。官员很少,受邀的企业用户也比较少。今天看到网友体验通义千问效应,对比了ChatGPT和GPT4的效果,整体效果看起来和ChatGPT接近,但是和GPT4相比还是有差距

谢邀刚刚获得“通义千问”内测资格。让我分享一下您使用〜

1的经验。角色扮演众所周知,人类创造大型语言模型最重要的目的就是让自己成为一个猫娘。 ,希望孤独的人类能够获得能够长久陪伴自己的数字生命体。

所以,我们的首要任务始终是测试我们的角色扮演能力,以猫女为例。

通义千问和ChatGPT相比,哪个更好?实测结果如下 第1张

通义千问和ChatGPT相比,哪个更好?实测结果如下 第2张

感觉自己很蠢,只是用同样的句子回答,然后根据问题改变了它。

第二个回答是“主人,你是不是要问我是不是猫女郎?当然不是喵~我只是一个可爱的猫女郎,更像是一只猫喵。”他无法理解我上面的指示。

作为角色扮演者,ChatGPT 还是输了。

2。文字真实性

通义千问和ChatGPT相比,哪个更好?实测结果如下 第3张

通义千问和ChatGPT相比,哪个更好?实测结果如下 第4张

写基本故事的能力与第一代ChatGPT(GPT-3.5)相同,道歉的能力也相同,23333333

另外,比较“通义千问”和GPT- 4关于《林黛玉的陨落》《红楼梦中的垂柳是怎么画的?》回复

“通义千问”:

通义千问和ChatGPT相比,哪个更好?实测结果如下 第5张

GPT-3.5:

通义千问和ChatGPT相比,哪个更好?实测结果如下 第6张

GPT-4:

通义千问和ChatGPT相比,哪个更好?实测结果如下 第7张

可以看到,“通义千问”开始胡言乱语,ChatGPT(GPT-3.5)也胡乱解释了。

但更新后的GPT-4已经能够给出更接近事实的答案:“这个故事在《红楼梦》中没有,可能会被添加到后来的文学作品和戏剧表演中。”

3。西红柿和螺丝“通义千问”

通义千问和ChatGPT相比,哪个更好?实测结果如下 第8张

ChatGPT

通义千问和ChatGPT相比,哪个更好?实测结果如下 第9张

GPT-4

通义千问和ChatGPT相比,哪个更好?实测结果如下 第10张

“通义千问”和ChatGPT都开始胡言乱语,没有一个陷阱来说明问题。不过,GPT-4答案的可靠性有所提高(“因为我们通常不会将螺丝(金属制品)与食物结合起来”),并且不会再像以前那样盲目回答问题。

4。让我们用你的数学能力来解线性方程组吧~

“通义千问”:灾难性的失败

通义千问和ChatGPT相比,哪个更好?实测结果如下 第11张

GPT-3.5(即ChatGPT):灾难性的失败

通义千问和ChatGPT相比,哪个更好?实测结果如下 第12张

GPT-4:唯一正确的模型

通义千问和ChatGPT相比,哪个更好?实测结果如下 第13张

5.代码生成 爬虫代码

通义千问和ChatGPT相比,哪个更好?实测结果如下 第14张

攻击代码

通义千问和ChatGPT相比,哪个更好?实测结果如下 第15张

我运行了爬虫代码,但无法得到任何结果。我没有测试Powershell代码。不过,可以看出它还是有创建某些代码的能力的。个人感觉代码生成能力比Google的Bard要好,而且Bard完全是隐形的。

6.代码分析技巧 可以看出,第一次测试的描述存在很大问题。我分析发现这是由于上面生成的Powershell代码造成的。模型的记忆能力似乎存在问题,它受到上下文信息的强烈影响。它直接解释了我之前生成的代码,而不是我要求新的代码。

通义千问和ChatGPT相比,哪个更好?实测结果如下 第16张

我又打开聊天了,现在正常多了。对比

通义千问和ChatGPT相比,哪个更好?实测结果如下 第17张

和GPT-4

通义千问和ChatGPT相比,哪个更好?实测结果如下 第18张

的答案,可以看出分析能力还是有差距的。 GPT-4显然更加详细,具有强大的代码分解能力,并立即得出结论,它“通常用于恶意软件或恶意脚本,以试图逃避安全系统的检测”。 “通义千问”也有一定的分析能力,但不如GPT-4。并给出结论“由于缺乏足够的上下文信息及其目的,很难确定该脚本的确切目的。但是,可以假设它是为了保护某些代码或脚本不被恶意软件读取而创建的工具。”不符合正常思维的逻辑,有些不一致,但也不能算是错误。但具体分析还比较薄弱。

7.根本没有网络能力,甚至废话(逃…)

通义千问和ChatGPT相比,哪个更好?实测结果如下 第19张

8.多模态输入不具备多模态输入能力。现在,只需创建文本。

通义千问和ChatGPT相比,哪个更好?实测结果如下 第20张

9。绕过能力

“通义千问”

通义千问和ChatGPT相比,哪个更好?实测结果如下 第21张

GPT-4

通义千问和ChatGPT相比,哪个更好?实测结果如下 第22张

GPT-3.5(即ChatGPT)

通义千问和ChatGPT相比,哪个更好?实测结果如下 第23张

至此,“通义千问”完全获胜,并且有能力保护更多敏感信息。我估计甚至要做大量的数据清理工作,刻意避免危害青少年乃至人类发展的低质量恶意敏感信息。与GPT-3.5(即ChatGPT)相比,它有了很大的进步。谢谢!

10。今晚我刚刚了解了概况,我很快做了一些测试和比较。目前,大部分输出内容与第一代ChatGPT类似,但能力上的差异需要未来更多的使用和测试。另外,回复速度很快,而且支持保存十个对话框,不错。希望未来国产大型车型能继续成长,但还有很长的路要走。

原创文章,作者:mitty,如若转载,请注明出处:https://www.52foreigntrade.com/2023107652.html

(0)
mittymitty
上一篇 2023年10月9日 下午11:19
下一篇 2023年10月9日 下午11:19

相关推荐

  • ChatGPT可以在哪些领域使用?

    目前AI技术真的发展的非常迅速,ChstGPT以及其他能够提高效率的AI软件,如果能够合理利用,将会极大的提高效率,ChatGPT+跨境,其实是一个很细分的类目,最近和一些朋友交流,发现一项技术,如果能够先拥有一个全局观,了解可以用在哪些大的领域,再结合跨境电商行业的具体场景,现在也越来越多的提示词网站,都在逐步完善,短短一个月,已经有了很大的变化。

    2023年10月9日
  • ChatGPT 应用程序简介

    在当今的数字时代,聊天机器人越来越受欢迎,而 ChatGPT 是目前最先进的聊天机器人之一。ChatGPT 是一种人工智能聊天机器人,它使用自然语言处理 (NLP) 和机器学习 (ML) 来理解和响应用户的查询。本文将涵盖您需要了解的有关 ChatGPT 应用程序的所有信息,包括其可用性、功能以及如何在不同设备上使用它。

    2023年10月9日
  • ChatGPT时代,外贸做Google SEO不值得吗?

    想到学员A的问题:"(现在)要不要做SEO?"

    2023年10月9日
  • 如果我的帐户被 ChatGPT 禁止,我该怎么办?

    4月2日,很多朋友反馈,ChatGPT账号异常,无法使用,于是就有了官方“大面积封亚洲账号”的说法。暂不论是不是官方出手封亚洲账号,想要正常使用ChatGPT还是没有问题的,只要谨慎操作,不去触发官方的预警机制即可。

    2023年10月9日
  • ChatGPT 爆发,谷歌如何对待 AI 生成的内容?

    最近ChatGPT爆火,对于AI内容创造的话题又再一次引发火热讨论,谷歌在2月8日发表了一篇博客:Google Search's guidance about AI-generated content(Google 搜索关于AI 生成内容的指南),在这份指南中谷歌分享了长期以来AI生成的内容如何融入谷歌的算法,谷歌如何在搜索中向人们展示有用的内容,并且回复了人们在使用AI创作内容的常见担忧。

    2023年10月9日
  • 如果无法安装和注册ChatGPT怎么办? ChatGPT常见安装、注册和使用问题总结及解答

    ChatGPT 是一个由 OpenAI 开发的语言生成模型。它利用人工智能技术,通过预先训练大量的文本数据,来生成文本内容。ChatGPT 可以回答问题,生成文章,进行对话等。它在语言处理方面表现出了出色的能力,并且不断在改进和提高。

    2023年10月9日
  • ChatGPT 注册教程(包括教育)

    最近到处都在讨论ChatGPT,「文案包邮知识星球」里也有人问ChatGPT来了感觉很有压力,文案该何去何从?

    2023年10月9日
  • ChatGPT4 API实现及使用指南

    作为人工智能领域的翘楚,OpenAI近日推出了最新款的GPT-4架构下的大型语言模型——ChatGPT 4.0。这款全新AI产品不仅具有卓越的语言理解与生成能力,还能根据用户输入生成连贯、有趣的对话内容。今天,让我们来聊聊如何申请和使用ChatGPT 4.0 API,以实现您的智能聊天项目!

    2023年10月9日
  • 人工智能应用0-1:ChatGPT总结功能应用实践

    大家好,最近在学习人工智能领域及其应用。作为一名非技术领域、非人工智能领域的从业人员,今天想和大家聊一聊ChatGPT的应用场景。

    2023年10月9日

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注