新(xīn)浪科技讯 1月6日上午消息,据报道(dào),旧金山人工(gōng)智(zhì)能研究(jiū)公司OpenAI已(yǐ)经(jīng)开发了一(yī)种新(xīn)系统,能根据(jù)短文本来生成图像(xiàng)。
OpenAI在官方博客中表示,这个新系(xì)统名为DALL-E,名称来源(yuán)于艺术家萨尔瓦多(duō)·达利(Salvador Dali)和皮克斯的机器人(rén)英雄瓦力(WALL-E)的结合。新系统(tǒng)展示(shì)了“为一系列广(guǎng)泛的概念”创造图像的能力,创作的作品包括牛油果形状的扶手椅等。
通过神经网络去(qù)生成图像,这种技(jì)术(shù)并(bìng)不新颖。此前,生成对抗网络(GAN)已被广泛用于(yú)创建真实的人(rén)、宠物、租赁(lìn)房产和食物的照(zhào)片(piàn)。
不过,DALL-E的独特之处在于可(kě)以根据(jù)输(shū)入(rù)的文(wén)本来(lái)创作图(tú)像。该系统(tǒng)基于文字生成系统(tǒng)GPT-3的一个版本,该(gāi)系统此前被用于撰写诗歌和新(xīn)闻文章等。利(lì)用配对好的文本(běn)和图(tú)像数据集进行训(xùn)练,DALL-E可(kě)以根据(jù)新的文字提(tí)示生成图像,此外还展示了创造多种风(fēng)格图片的能力。
OpenAI还发布了图像(xiàng)识别系统Clip。Clip通用性比(bǐ)当前针对单个任务的系(xì)统更(gèng)好(hǎo),可以用网(wǎng)上公(gōng)开的文字图像配对数据集来训练。
DALL-E还需要继续优化。OpenAI指出,DALL-E目前的可(kě)靠性(xìng)还(hái)存在(zài)问题,对类(lèi)似“glass”等有多(duō)个含义(yì)的名词常常会混淆,文字中(zhōng)不同的语法也可能会造成不同的结果。
此外(wài)还有更深层次的问题需要解决。OpenAI表示:“我们注意到,涉及生成(chéng)模型(xíng)的工作可能会产生重大而广泛的社(shè)会影响。”未来(lái)可能的举措包括(kuò)研究对就业岗(gǎng)位的影(yǐng)响,生成结果的偏见,以及(jí)技(jì)术的长(zhǎng)期(qī)道德挑战。
长期以来,公众一直担心人工智(zhì)能生成的媒体内(nèi)容(róng)被滥用,例如(rú)神(shén)经网络被用来制造虚假的音视频(pín)和图像(xiàng),用(yòng)于不道德的目的,例如政(zhèng)治上的假信息和欺诈活动等。