蒙尘来自奥飞寺
量子比特 |公众号QbitAI
o1全健康版这次不再是灰度的。发布仅4小时,已推送给所有(付费)用户!
手快的网友们已经玩得不亦乐乎了~
不过,这次推出了更高级的Pro型号,每月200美元的价格着实让人望而却步。
o1 Pro模式和正式版有什么区别?近1500元的价格值得吗?
许多好心人出钱帮助大家接受检测。
如果你让它完成一个数独,它会花费你 5 分 30 秒的时间来思考。
人工智能在思考过程中仍然会犯很多错误,但这次不同的是,它具有自我纠正的能力,直到得出正确答案。
花了这么多钱,大家的期望值一定很高。有人走过来说:“请治愈癌症。”
AI也毫不客气,直接接手了思维链上“治癌”的任务。不管结果如何,只要努力,就值得赞扬。
26秒后,o1 pro给出了详细的答案:
正如奥特曼所强调的:Pro模式的优势在于它可以更加认真地思考最困难的问题。
o1 pro模式,1500值得吗?
再看另一个与生物医学相关的问题,o1 pro模式找到了同时满足6个复杂条件的特定蛋白质,耗时53秒。
当然,如果真的给了它一个超出其能力范围的问题,它经过深思熟虑后会适时放弃。
仅使用 HTML 代码即可重现经典游戏“Doom”。
o1专业模式:做不到。
o1是之前内部代号为“草莓”的车型。这次“草莓里有几个r”对它来说恐怕就不成问题了。
你甚至可以在诗歌中表达“草莓有三个r”的意思,而无需自始至终提及这个词。
我们尝试将这首诗输入到新的 o1 对话中,发现它也能理解这首诗想表达的意思,并给出了另一个合格的答案“Rasberry”(即树莓派中的树莓派)。 ),并将这首诗翻译成中文。
为什么没有想到草莓呢?展开思路链后,我发现它也考虑了草莓,但认为“无籽”这个描述更符合覆盆子。毕竟草莓的种子还是在表面的,而覆盆子的种子则较小,隐藏在里面。
另外,我们还发现将一首诗翻译成中文的命令不需要占用推理令牌,谜题完成后思考就结束了。
它非常强大,但也会出错,并且将 6 指手视为完全正常的。
考虑到AI绘图经常画六个手指,人类的手指对于AI来说有那么难吗?
那么最后,200美元值得吗?奥特曼也给出了官方回复:
免费版本或 20 美元版本对于大多数人来说已经足够了。 200 美元的版本只适合一小部分想要经常使用它并愿意支付更多费用来解决真正困难问题的人。
20美元版的o1也很强
如果你真的不想每月花200美元,20美元版本的o1就足够强大了。
现在它可以接受视觉输入并基于图像进行推理。
有人给它发了十年前的XKCD漫画。当时花了5年时间解决的代码是o1现场写的。
甲方:用户拍照时,APP需要判断是否在国家公园……
程序员:很简单,用地理信息查询,给我几个小时。
甲方:……我们还需要判断是否是鸟的照片。
程序员:那我需要一个研究团队和5年的时间。
在计算机科学中,很难解释容易和几乎不可能之间的区别。
我们来看看这个令人烦恼的问题:
命名一种特定的娱乐形式,该缩写词也可能代表一个访问过某个地区的团体的名称,该地区的未来领导人与意大利人结婚。
提问者表示,ChatGPT 4o、o1-mini、Claude 3.5 Sonnet 错了 3 次,而 o1 则答对了 3 次!
至于为什么《最终幻想》符合要求,o1也可以自己解释。
还有一件事
o1正式版和o1专业模式只是OpenAI为期12天的直播发布计划中的第一份礼物。
新品将于明天凌晨2点继续发布
由于o1正式版目前仅在ChatGPT应用上发布,API接口尚未开放。
并且有人在ChatGPT的前端代码中发现了GPT-4.5的存在。
很多人预测下一个版本将会是GPT-4.5以及相应的API,以与隔壁的克劳德竞争,抢占开发者市场。
参考链接:
[1]
[2]
[3]
[4]
本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://mjgaz.cn/fenxiang/273159.html