Sonnet 会员开启赛博斗蛐蛐，7 家大模型横盘对比谁更强？

2024-09-13 网络整理佚名2010

核心提示：就这么几行代码，说出来的话怎么这么冰冷？,代码,翻译,疯狂,豆包,ai

_大声说出来不要轻易说分手_hr说面试结果还没出来

既然事已至此，不来一场经典的网络板球大战可就太不合理了。

为此，我们为 Sonnet 开通了专门的会员，还引入了邻国公司的 ChatGPT-4o，以及中国的统一、豆宝、元宝、文心易言、智普等，来对比它们的性能。大模型的表现如何？

为了公平起见，我们不采用上面说的Sonnet特别版法术，而是采用云中江疏影准备的国行版，对以上7家公司一视同仁，公平竞争，买了就别管了。

大声说出来不要轻易说分手_hr说面试结果还没出来_

我们将其命名为“疯狂星期四”，看看他们能想出什么。

最先出场的是主角索内特，果然顺利跑出来了，结果气势一如既往，说这只是一场消耗漩涡，让哥们儿们心生愧疚。

_大声说出来不要轻易说分手_hr说面试结果还没出来

紧接着是玩家ChatGPT-4o，相比之下声音要柔和许多，不过这个回答却和标题里的“疯狂”二字息息相关，总让人有些不知所措。

但他们毕竟不是本土球员，出战客场也是可以理解的。

hr说面试结果还没出来__大声说出来不要轻易说分手

接下来有本地嘉宾表演，首先请到的是杭州本地人、绝对主场童一倩文。

虽然三位选手提供了两份不同的日语翻译，但从文案上看，统一的翻译的确更让人暖心。

而且背景文的侧重点也和上面两位不一样，同益专注于周四，而两位外援则选择了疯狂。

hr说面试结果还没出来__大声说出来不要轻易说分手

说到斗宝，攻击性又提升了，文案内容类似十四行诗，经典的“唉，首都啊”。

不过对于日语，豆宝又有了自己的新译本，有谁知道能告诉我这些日语译本中哪一个最合适吗？

大声说出来不要轻易说分手_hr说面试结果还没出来_

而说到腾讯的元宝，他们又给出了另一个完全不同的日文翻译，其文案重心在于体验，而吃炸鸡会让钱包空空、身体疲惫。

不过兄弟，看你的名字，元宝，不是说你的身体会被v50掏空吗……

_hr说面试结果还没出来_大声说出来不要轻易说分手

虽然大家的翻译都不一样，但最后都出来了，而且咒语一模一样，比赛很公平。这确实说明国产AI在理解能力方面还是相当不错的，并不比Sonnet和GPT-4o差。

然而最后出现的温馨一言与志朴却出现了问题……

简单来说，智扑可以根据需求生成智能代理，但是代码好像有125行的限制，无法把所有的结果都跑出来。

至于《温馨一言4》，因为对话框字数限制，代码案例没能写完。。。

_hr说面试结果还没出来_大声说出来不要轻易说分手

最后，石超想说的是，其实这几年这样的AI小工具也不少，比如前段时间非常火的表情工具Glif，攻击性极强。

hr说面试结果还没出来_大声说出来不要轻易说分手_

做类似的事情其实并不是很难，本质上就是利用大模型的力量去完成一些以前需要编码技能才能完成的任务。

但世超认为，这次的小成功，很大程度上是因为李伟刚老师的提示写得好，让这套“汉语新解”的效果足够突出。

毕竟面对同一个大模型的时候，最重要的还是大家对提示词的掌握程度，因为就算不需要懂代码，但是写提示词还是有一定门槛的。

hr说面试结果还没出来__大声说出来不要轻易说分手

比如，本次新中文解释的提示词作者之前就提到过，各个大模型可能都有自己最喜欢、最能接受的提示词语法，比如 Claude 喜欢用 XML 框架描述，ChatGPT 在 XML 和 Markdown 方面也有明显差异，等等。

总之，写提示确实是一个技术活。

不过随着AI越来越强大，未来写提示词的门槛肯定会降低，到时候，哪怕是一个刚学会说话的小孩，都能让AI做自己想要的应用。

撰文：纳西

标签： 文本标签

举报收藏打赏 评论 0

更多>同类资讯

推荐图文

推荐资讯

点击排行