PUA GPT-4画出「傻鹅之王」,宇宙和时间旅行是终点
无独有偶,Pipedream Labs的CEO Garrett Scott McCurrach也整了一个挑战GPT-4极限的活儿。 他在社交媒体上发布了一张鹅的图像,和网友说,每有10个人点赞,我就让这只鹅变得更傻一点。 于是网友稍微一发力,这张照片就被点赞了好几万次。 而McCurrach本人,也开始了自己对GPT-4的PUA。 GPT-4让鹅进一步变傻,眼睛一只大一只小,戴个傻乎乎的蝴蝶结,有那味了。 看来在GPT-4眼里,五彩斑斓的颜色似乎和傻的关联度很高。 还有就是,多半因为吃了太多「蘑菇」而导致的眼球充血。 看得出来,这几只傻鹅确实是智商不太高的样子。 总的来说,张着嘴,伸着舌头,变大的眼睛,都是越来越傻的标志。 最终GPT-4将傻的定义停留在了「口吐异物」这个点上。 到这里,似乎GPT-4的想象力到达了极限。 如果还需要对「傻」这个词进行进一步的演绎,GPT-4已经做不到了,需要人类给与更加明确的提示。 作者接着PUA GPT-4,给了它关键词「傻鹅之王」之后,GPT-4最终给出了它眼里的有着「帝王之气」的傻鹅。 同样的思路,网友又对狗子下手了,让GPT-4创造一张高兴的狗狗照片。 这次是让狗狗变高兴,看着效果还不错。 狗狗拿上了自己喜欢的球和飞盘,看来GPT-4是懂狗子的。 而更高兴的狗狗眼里,世界都变小了,自己在不断变大,身体也腾空了起来。 此时,五彩的背景,微微张开的小嘴又是高兴的象征。 迷幻的颜色,不断变大的身躯成为了GPT-4想象之中越来越高兴的意象。 最后,大到了太空之中,成为了和星系相比肩的狗狗。 不断被人类PUA的GPT-4终于让「狗狗快乐似神仙」。 进入宇宙的狗狗,终于融入了平行世界,成为了一只看不见摸不着的「快乐之狗」。 也让我们对GPT-4的创造力和对快乐的理解肃然起敬。 在见识到了GPT-4对于「傻」和「快乐」理解的极限之后,网友换了个口味,想看看GPT-4的想象力之中,「平平无奇」有没有极限。 网友让GPT-4生成了一张普通的街道照片。 然后是一张普通的客厅照片,一切都是最普通的设计。 普通的书桌,除了有两个日历稍显特别之外,确实非常普通,连显示器看上去都是多年前的老款,不能再普通了。 城市最普通的街角,看路牌似乎是纽约一个普通的十字路口。 一杯非常普通的咖啡,微微冒着一点热气,连温度都是如此的克制。 一个普通的开关,背景是白色的墙面,唯一的特殊之处是和两个螺丝的组合,看上去有点像一个人脸。 当作者要求GPT-4画一个极致普通的物品时,GPT-4给出的答案是一个放在桌子上的笔记本。 没有任何的特征,极致的简约和普通不过如此。 当作者认为还能更普通时,GPT-4有点受不了了,给出了一个白色房间中的一堵白墙,看来白色在AI眼里就是最为普通的颜色,方形就是最为普通的形状。 当作者要求再普通一些,GPT-4给出了一张白色的画布。 这可能是一个作图AI眼中最为普通的物品,毕竟它是创作一切内容的基础。 当作者要求更进一步的普通时,GPT-4给出了自己特殊的回答: 「这是一个普通程度最高的形象——一个毫无特征的虚空,充斥着虚无感」。 还不够!一定还能更普通! 于是,GPT-4画出了一个比「虚空」更加普通的物体,一个白色空间中的一个白色小点。 又小又白看来就是最为普通的物体。 作者依然不相信,质问GPT-4还有没有更加普通的东西。GPT-4拿出了自己压箱底的「普通之物」: 一个巨大的空旷的空间,似乎还能无限延伸。 最终,在人类无法想象的空间中,这是最无聊最普通的一个形象。 它普通到已经无法存在了。确实,看上去就像一个普通的「黑洞」,没有任何「特点」能够逃逸出来。 但其实,如果要一直追问,GPT-4似乎永远不会停下来,会不停的输出它认为更加「普通」的图像。 一直到所有问题的终结:GPT-4额度用完。
AI的极限是太空?其实人类也是
这是互联网哲学家、人工智能研究员Eliezer Yudkowsky对AI进行的「普通测试」,在不断地逼迫下,AI往往都会把最极端的输出归结到太空或者是时间旅行上。 大概率是因为和人类理解的极限一样,太空也是AI所知道的这个世界的极限所在,所以最终对于AI想象力的PUA,AI都会以输出太空中的内容作为最终的结果。 而在追求极限的过程中,GPT-4往往会向人类诉苦,说自己已经到达极限了。 但是如果人类以更加严厉的口吻进一步敦促AI更进一步时,甚至和AI争吵时,AI往往还能再挖掘一些自己的潜力。 这个过程甚至让不少网友看了后觉得人类是不是太过残忍了。 但是OpenAI的系统提示会回答,「情绪和痛苦不是编程的一部分」在逼迫AI的过程中,似乎不需要考虑太多。 但是Yudkowsky也感叹到,「对于人类来说,似乎这不是一个好兆头,人类似乎没有任何办法确定(AI系统能否感到痛苦)。」
AI能像人类一样有创造力吗?
创造力是推动社会发展和创新的关键,但要评估它却是一项复杂且往往带有主观判断的任务。 随着先进的生成式AI模型崛起,越来越多过去被认为只有人类创造力才能做到的工作,都能被这些模型轻松搞定。 最近,由新加坡国立大学、斯坦福大学、谷歌DeepMind、罗格斯大学、微软研究院和哥伦比亚大学组成的联合团队,提出了一个名为「相对创造力」(Relative Creativity)的全新概念来解决定义和评价创造力的难题。 除了界定和分析了可度量的创造力,研究人员还提出了一套切实可行的训练指导原则,有效地连接了创造力的理论量化和模型训练的实际操作。 最后,研究人员为评估和促进AI模型的统计创造力,建立了一个连贯、不断演进和变革性的框架。
论文地址:https://arxiv.org/abs/2401.01623 在这里,研究人员不再试图给创造力下一个普遍性的定义,而是转而探讨AI是否能够达到一个假想人类的创造能力水平。 这个新视角受到了图灵测试的启发,该测试是判断机器是否能够像人类一样思考的标准,并在此基础上扩展,从而应对评价创造力时固有的挑战和主观性问题。 这种方法论上的转变,使得研究人员可以利用统计创造力(Statistical Creativity)这一概念,对AI的创造力进行统计上的量化评估,进而直接比较AI和人类在创造力上的差异。 在此基础上,研究人员还进一步探讨了如何将统计创造力应用到具有提示技巧(prompting paradigm)的现代自回归模型中。
相对创造力(a)和统计创造力(b)