1. 引言
近年来,生成式人工智能技术持续进步和迭代,有关人工智能技术引入设计领域的研究层出不穷。本文尝试将ChatGPT与AI绘画相结合,以期提升设计流程中的整体效率和成果质量。ChatGPT和AI绘画技术作为生成式人工智能的代表,具有自动化、高效性和创造性等优势。近年来对于这两者的研究纷繁复杂,但是缺乏在设计领域将两者相结合的应用研究。本文将二者纳入同一设计流程,探讨了一种新型的ChatGPT、AI绘画协同设计体系(以下简称“协同设计体系”),从ChatGPT和AI绘画技术在设计领域中的限制与挑战入手,摸索生成式人工智能革命下设计领域中的变革,分析“协同设计体系”的构建和应用,为设计领域中的生成式人工智能应用提供一定的理论和实践参考。
2. 历史与发展:生成式人工智能技术发展综述
生成式人工智能(Generative Artificial Intelligence),简称生成式AI是让机器能够像人类一样“创造性地”产生新的内容或行为的一种技术 [1] 。与传统的人工智能技术不同,生成式AI可1以生成包括图像、音频、视频在内的新数据 [2] 。生成式人工智能技术的发展历程可以追溯到上世纪50年代末的神经网络研究。1950年代末,神经网络研究开始探索生成式模型,1960年代基于贝叶斯网络的生成式模型不断演进。1970年代Hinton等人研究推出了训练受限玻尔兹曼机的算法。1980年代Hopfield网络和Boltzmann机的问世,拓宽了生成式模型的应用。1990年代隐马尔可夫模型和马尔可夫链蒙特卡罗方法被引入生成式模型中。2014年Goodfellow等人提出了生成式对抗网络,使得生成式模型在图像生成等领域得到了突破性进展,为后来的生成式对抗网络打下了基础。2016年WaveNet模型的提出,突破了音频生成的困境。2017年Google提出了PixelCNN++模型,使得图像生成的分辨率得到了显著提升。2020年OpenAI推出了GPT-3模型,将生成式模型的应用范围扩展到了自然语言生成领域,并在2023年开放了可以自我学习、自我改进的GPT API模型,加快了人工智能应用的步伐。同年3月,有更强的创作能力的GPT4.0发布,而其作品则更具备人类智慧文明的特征(图1)。
![](//html.hanspub.org/file/57-1180462x7_hanspub.png?20231208172627418)
Figure 1. Generative AI development timeline
图1. 生成式人工智能发展时间轴
3. 原理与架构:生成式人工智能技术概述
3.1. ChatGPT:基于模型架构自然语言生成技术的设计表达
ChatGPT是一种基于自然语言处理技术的生成式人工智能模型,全称为Generative Pre-trained Transformer。是由OpenAI推出的一种采用Transformer模型架构的深度学习自然语言处理技术,主要应用于聊天场景中。ChatGPT将用户输入的文本作为输入项,经过模型运算后生成相应的回复文本作为输出项,以达到人机交互、人机对话的效果 [3] 。
ChatGPT模型的训练需要大量的数据和计算资源(图2)。训练数据采用公开的自然语言处理数据集,如Wikipedia等。在训练过程中,模型会对下一个单词进行预测,以此来优化模型参数。预训练完成后,自然语言处理系统会进行微调,以适应不同的场物。ChatGPT技术基于大规模语言模型生成式人工智能技术,通过训练大规模的语言模型,可以实现自然语言生成和任务解析。
在设计领域中,ChatGPT技术可以应用于以下三个场景:第一,设计师与客户的交流。ChatGPT技术可以模拟人类的对话方式,设计师可以通过与ChatGPT对话来更好地理解客户的需求和意见。第二,设计理念和思路的表达。设计师可以利用ChatGPT技术将自己的设计理念和思路转化为自然语言文本,以更好地向团队成员或客户表达自己的想法 [4] 。第三,设计灵感的获取和扩展。ChatGPT技术可以生成大量的自然语言文本,设计师可以通过这些文本进行思维风暴来获取设计灵感,从而提高设计水平和效率 [5] 。
ChatGPT是一种开放源代码的技术,许多公司和组织都在设计工作中加以运用。Adobe Systems (创意软件公司)正研究如何将ChatGPT技术应用到其产品中。Adobe在其产品中使用了自然语言生成技术,使其更加智能化,提高用户体验。Figma (在线协作设计工具公司)使用了自然语言生成技术来提供更快速的设计灵感。用户可以输入一个或多个关键词,Figma会自动为他们生成一些与之匹配的设计元素。Canva (在线设计工具公司)使用自然语言生成技术来帮助用户快速创建自定义设计元素。例如,用户可以输入他们需要的图标、形状、颜色等信息,Canva将根据这些信息自动生成相应的设计元素。ChatGPT技术可以提高设计师与客户的沟通效率,促进设计团队之间的合作和交流,并为设计师提供更多的设计灵感和可能性。
3.2. AI绘画:基于计算机视觉技术自动绘画的设计表现
AI绘画技术是基于深度学习算法和计算机视觉技术的人工智能技术,通过大量的图像数据和模式识别技术,模拟出人类的绘画过程,实现自动绘画 [6] 。深度学习算法是AI绘画技术的核心,基于卷积神经网络(CNN)和生成对抗网络(GAN)等技术 [7] ,解析大量的图像数据,识别图像的特征结构(如图3)。
AI绘画技术需要对原始图像进行处理和解析,以提取出包括图像分割、图像分类、边缘检测和颜色分离等特征结构 [8] 。并基于深度学习算法、图像处理技术、生成模型和数据集等技术,使用包括手绘图像、自然图像、艺术作品等大量的图像数据,进行训练学习,能够模拟出人类的绘画过程,生成高质量的新图像。
AI绘画技术在设计中的应用广泛,可以应用于平面设计、广告设计、影视特效以及设计教育行业等。人工智能技术的应用可以提高平面设计的流畅度和风格化 [9] ,并为广告产业带来结构性变革。此外,人工智能技术在电影工业中的应用可以帮助完善中国电影工业体系 [10] 。最后,使用AI个性化绘画教学系统可以有效提高学习效率和艺术创作能力,增强用户对美术绘画的兴趣 [11] 。AI绘画技术在设计领域有着广泛的应用前景,可以为设计师和艺术家提供更高效、更便捷的工具和方法。
在设计领域,AI绘画具有以下三个应用场景:第一:创造艺术作品。人工智能创造各种类型的艺术作品,包括绘画和雕塑等。这些作品可以通过对大量现有作品进行学习和模拟来实现。第二:图像处理。AI绘画用来处理现有图像,例如通过自动化修复破损或损坏的图像、自动化图像增强等方式。第三:色彩搭配。在设计的过程中向设计师推荐不同颜色之间的组合,以及帮助设计师制定色彩方案。
AI绘画应用人工智能技术的数字艺术形式,能够生成艺术作品。DeepArt.io (瑞士)提供了一种名为“神经网络风格转换”的服务,能够将用户提供的照片或图像,通过与著名画家的作品相结合,生成一幅全新的艺术作品。Prisma (移动应用程序)可以将用户拍摄的照片转换成各种艺术风格的画作,如梵高、毕加索和卡拉瓦乔等。NVIDIA (芯片制造),利用人工智能技术开发了一款名为“GANbreeder”的软件。该软件能够生成独特的艺术作品,包括数字图像、游戏、3D模型和动画等。随着人工智能技术的不断发展,越来越多的公司开始尝试将其应用于艺术领域,产生了许多有趣的数字艺术作品。
4. 协同与碰撞:生成式人工智能技术在设计领域中应用的可能性
4.1. 壁垒与机遇:生成式人工智能技术在设计应用中的限制与挑战
生成式人工智能技术在设计领域中的应用具有优势,但也面临一些挑战。人工智能的最大缺陷之一是无法解释预测的依据,使得设计师难以理解技术背后的决策过程并进行调整和优化 [12] 。由于训练数据通常来自特定数据集和样本,因此输出结果可能存在一定的偏见 [13] 。同时,一些学者认为人工智能技术存在算法代替价值、算法偏见、版权问题、虚假信息、信息茧房、讯息内爆等问题 [14] 。此外,数字知识产权的法律保护不足也是人工智能时代需要面临的重要挑战之一 [15] 。
ChatGPT技术和AI绘画技术都面临着一些限制和挑战。在数据和模型方面,ChatGPT技术需要大量高质量数据进行训练,并且生成的设计作品缺乏独特性和个性化 [16] ;而AI绘画需要足够多且质量良好的数据进行训练,并且需要通过算法模拟人类艺术家的创造性和风格。同时,这两种技术也存在着可解释性和可控性问题,以及伦理和法律问题,如生成不合理、不合法的作品带来的法律风险和涉及版权、虚假信息、人工智能造假等的伦理和法律问题 [17] 。
总而言之,ChatGPT技术和AI绘画技术在前提条件、表现效果、灵活运用和社会道德方面都存在一定困难。
4.2. 语义绘图:AI绘画与ChatGPT技术的协同
ChatGPT技术和AI绘画技术的结合可以实现更高效、准确、真实、灵活的图像生成,但在社会道德方面也需要考虑相应的问题。
在前提条件方面,ChatGPT技术和AI绘画技术各自具备强大的技术基础和能力,两者结合可以实现自然语言输入自动生成图像的目标 [18] 。在表现效果方面,ChatGPT技术和AI绘画技术的结合可以产生更加真实、精细和丰富的图像生成,满足不同领域的需求 [19] 。在灵活运用方面,ChatGPT技术和AI绘画技术的结合可以实现更加灵活的应用方式,通过不断学习和优化调整参数,达到不同场景的需求。
在社会道德方面,ChatGPT技术和AI绘画技术需要考虑人工智能技术在社会中应用的合理性和安全性问题。ChatGPT技术可以通过增强机器人的人类化程度,使得生成的文本更符合人类的价值观和道德标准;而AI绘画技术则需要关注知识产权和艺术创造的保护。两者结合,可以在保护知识产权和维护社会道德的前提下,促进技术的进步和社会的发展。
5. ChatGPT和AI绘画协同设计体系的构建和应用
5.1. 辅助创新:ChatGPT与AI绘画协同设计体系的构建
ChatGPT和AI绘画协同设计体系是指将ChatGPT这一大型语言模型和AI绘画技术相结合,来实现更加高效的创作过程。具体来说,ChatGPT通过分析和理解用户的语言输入,生成与用户需求相符的文本描述。然后,通过AI绘画技术根据这些文本描述,自动生成符合用户需求的绘画作品。设计师通过ChatGPT输入自己的创意和想法,快速获得AI绘画技术生成的图像,从而快速地展现创意。在原理方面,ChatGPT技术和AI绘画技术分别通过对大量文本数据和图像数据的学习训练,实现对自然语言和图像语言的生成与优化。在实际应用中,ChatGPT和AI绘画技术的协同工作可以通过多种途径实现。例如,设计师可以通过ChatGPT输入需求,AI绘画技术会根据这些输入,自动生成符合要求的图像。或者,设计师可以通过ChatGPT输入创意,然后通过AI绘画技术对输入的文本进行分析和理解,生成与之相符的图像,然后再进行优化和修改,直到得到满意的作品(图4)。
ChatGPT和AI绘画协同设计体系使得设计师的工作效率和成果质量得到极大提升,帮助设计师更好地实现与展示创意和想法。
![](//html.hanspub.org/file/57-1180462x10_hanspub.png?20231208172627418)
Figure 4. ChatGPT and AI painting co-design system diagram
图4. ChatGPT和AI绘画协同设计体系图
5.2 高效提能:ChatGPT与AI绘画协同设计体系的应用
随着人工智能技术的飞速发展和不断应用,ChatGPT和AI绘画协同设计体系作为一种日益重要的技术工具,已经在产品设计、建筑和室内设计等领域中得到了运用。协同设计体系的应用带来许多优势,不仅能够节省设计师的时间、提高生产力和效率,还能创造出具有创新性与核心竞争力的产品和作品。
在产品设计领域(图5),ChatGPT和AI绘画协同设计体系在产品设计中可以提供更准确的设计方案。在建筑设计领域(图6),设计师可以利用协同设计体系,通过对于建筑材料、颜色和纹理的深度学习算法帮助生成建筑设计图纸、布局和渲染更真实、更全面的建筑模型,并由此设计出更加个性化的建筑风格。在室内设计领域(图7),协同设计体系可以通过结合设计师的输入,自动生成设计方案,帮助他们更好地定位和配置家具、窗帘、照明等设计要素。ChatGPT将能够理解需求并提供创新的设计方案。AI绘画工具可以自动生成模型和视觉效果。这意味着设计师将能够更快速地创建产品模型,并通过拖放、旋转和缩放等操作便捷地进行修改。
![](//html.hanspub.org/file/57-1180462x11_hanspub.png?20231208172627418)
Figure 5. ChatGPT and AI painting collaborative design system product design practice diagram
图5. ChatGPT和AI绘画协同设计体系产品设计实践图
![](//html.hanspub.org/file/57-1180462x12_hanspub.png?20231208172627418)
Figure 6. ChatGPT and AI painting collaborative design system architectural design practice diagram
图6. ChatGPT和AI绘画协同设计体系建筑设计实践图
![](//html.hanspub.org/file/57-1180462x13_hanspub.png?20231208172627418)
Figure 7. ChatGPT and AI painting collaborative design system interior design practice diagram
图7. ChatGPT和AI绘画协同设计体系室内设计实践图
综上所述,ChatGPT和AI绘画协同设计体系在不同领域的应用有着广泛的前景和潜力。通过结合人工智能技术和深度学习算法,这些设计工具能够为设计师提供更准确、更全面、更创新的设计方案,为产品、建筑和室内设计等领域带来更多的创新与变革。随着技术的不断发展和创新,这些工具将会在设计领域中扮演越来越重要的角色,帮助设计师更好地实现他们的创意和想象。
5.3. ChatGPT和AI绘画协同设计体系的展望
随着人工智能技术的发展,ChatGPT和AI绘画已成为设计师不可或缺的工具,对设计师的职业定位、技能升级和工作流程等方面都产生了影响和变革。设计师需要不断学习和更新自己的技能,以更好地应对日益复杂和高级的设计任务 [20] 。
ChatGPT和AI绘画协同设计体系可以为设计师提供更多的技术工具,以便更好地实现设计想法和艺术创作。同时,这也促使着设计师需要寻找新的职业定位和差异化方式。设计师需要了解如何使用ChatGPT和AI绘画工具,并在这些工具的帮助下进行艺术创作和设计。
未来,ChatGPT和AI绘画协同设计体系的发展方向包括应用领域的拓展以及协同效率的提高。主要目标之一是让人工智能能够更准确地理解设计师的意图并准确地呈现出来 [21] 。此外,AI技术相关的伦理体系也待完善。未来的发展还包括改善用户体验,优化用户界面和交互方式,使其更加易于使用和理解。ChatGPT和AI绘画协同设计体系的未来发展有望为人工智能技术的应用带来更多的机遇和挑战。
6. 结语
在生成式人工智能的浪潮下,ChatGPT与AI绘画协同设计体系已经成为一个新兴领域,其在智能交互、创意设计、艺术创作等方面展现出巨大的潜力。本文通过对该领域的探析,可以看到技术正朝着更加成熟和完善的方向发展。然而,这些技术也存在着一些问题和挑战。其中最大的问题就是数据的质量和可靠性。为了让ChatGPT和AI绘画协同设计体系发挥出最大的价值,需要大量高质量、多样化的数据进行训练和优化,这需要各个领域的专家和研究者进行共同努力。此外,人机交互和艺术创作也需要更加深入的理论和方法研究,以便更好地推动技术的发展和应用。另一方面,ChatGPT的出现为人机交互带来了更加自然、高效的方式。在各种应用场景中,ChatGPT的自然语言处理能力能够帮助用户更好地表达自己的需求,同时也能够给用户带来更加个性化、贴心的服务。而在AI绘画协同设计体系方面,其通过将人类的创意与机器的计算能力进行融合,极大提高了创作的效率和创意的质量。同时,这种方式也让艺术家有机会探索更加广阔的创意空间,挖掘更多的艺术可能性。随着ChatGPT和AI绘画技术的不断发展,设计行业也正在经历着前所未有的转型和变革,传统模式和工作流程正在被重新定义,更加凸显数字化、智能化和创新化。生成式人工智能革命下的ChatGPT和AI绘画协同设计体系无疑带来了更多机会和挑战。在未来,相信这些技术将继续得到推广和发展,并为生活和艺术创作带来更多惊喜和创新。期待更多的研究者、开发者和艺术家加入到这个领域中,共同推动技术的进步和创新的发展。
基金项目
浙江省哲学社会科学规划课题(22NDJC080YB);浙江省课程思政教学研究项目(kcsz20220206);浙江省教育科学规划课题(GG2023114)。
注释
文中所有图片均为作者自绘。