对于相对简单的问题,所有模型都在一两轮内猜出了正确答案,例如下面的房子:
还有非常简单的草原和海洋:
动物主题相对复杂,模型一般需要猜测4-5轮,比如大象问题:
游戏整体效果非常好,网友们也给予好评如潮:
你画,我猜这个项目的起源
模型绘画不是什么新鲜事,但是让你用一个大模型来绘画,我猜?这个天才的想法是如何产生的呢?
首先,我不得不提一下西蒙·威利森(Simon Willison)的一项测试。他要求所有模特在自行车上画出鹈鹕主题的图像,然后比较效果。
然后保罗·卡尔克拉夫特看到了这个测试,他想到了一个想法:这样的比较速度太慢,而且效果也不好。既然都画了同样的主题,为什么不让大模型玩一个你画我猜的游戏呢?
没想到,这个小家伙说到做到,一天后就发布了《你画我猜》0.0.1版本(这是令人羡慕的执行能力)。
游戏中,他设置答题模型每2秒猜测一次,答题速度较快的模型返回答案的速度也会更快。
网友评价褒贬不一
不少网友表示,之前《我的世界》的大型模型搭建比赛让人印象深刻,如果画出来的话,我猜可能会成为新的视觉标杆!
其他人则热情提出优化建议,比如以回答对方问题的速度作为评分标准,或者加入人工结果作为参考。
其他人建议将游戏转变为对抗性训练,这样大型模型就会进展得更快。
不过,尽管好玩,也有网友持负面看法,表示不明白这个项目的意义。
有网友调侃称,这款游戏的作用是成为未来AI考古的文物,帮助他们了解其起源。
嗯,我们的人工智能有自己的洞穴壁画(doge)。
然而,通过游戏学习实际上是教育理论和心理学中的一个重要术语。
不少网友表示,孩子们还通过玩游戏来提高智力、学习技能。也许这可以成为训练大型模型的新方法。
虽然本次比赛只有6轮,参赛车型也有限,但这确实是一次非常有趣的练习。
作者Paul Calcraft也表示会持续更新游戏,包括分数显示、更多游戏主题等,期待更多后续!
本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://mjgaz.cn/fenxiang/270774.html