人工智能,如何妙笔“生”画******
核心阅读
输入一段话,“绘”出一幅画——人工智能的绘画本领,吸引众多职业画师和零基础用户尝鲜。人工智能绘画的本质是计算,接受“语言描述”指令后根据自身的理解还原出图像。未来,人工智能技术应用于艺术创作等领域,还要注意防范潜在风险,让技术进步更好地造福社会。
不用画笔、颜料,输入一段描述性文字,计算机就能自动解析,生成相应的画作。2022世界人工智能大会上,人工智能绘画的展示令观众惊叹。
一些过去专属于人类创作的领域,比如绘画、书法、写作、作曲,如今人工智能也已开始涉足。人工智能是如何绘画的?当前沿技术与艺术相遇,将碰撞出怎样的火花?在内容、版权等方面又是否存在问题?
从文本到图像,人工智能绘画本质是计算
人工智能绘画是一个从文本到图像的生成过程,输入一段话,生成一幅画,本质是计算。简要地说,计算机通过大量学习,能识别特定图片元素和文本之间的关联。同理,人工智能程序在收到“语言描述”指令后,可以根据自身的算法还原出图像。
设定计算机程序作画的想法由来已久。早在20世纪70年代,就有艺术家开发了操作机械臂的电脑程序,让机械臂按照指令在画纸上作画。近些年,人工智能技术日新月异,科研人员尝试设计自动作图的计算机程序。但过去很长一段时间,人工智能“画”出的作品普遍不够好,往往只是一些模糊的图像元素的组合,还称不上是完整的画。
今年以来,人工智能画技迅速“进化”。谈及技术突破原因,百度文心一格总架构师肖欣延认为,这是预训练大模型的兴起、大数据的训练和扩散模型的出现3方面共同作用的结果。
具体来说,预训练大模型增强了人工智能的通用性,成为人工智能技术及应用的新基座;大数据的训练中,通过在众多高性能GPU(图形处理器)算力资源中进行并行学习,计算机能够在短时间内完成大量的数据学习。近年来,几乎所有人工智能的技术发展都受益于这两方面的进展。而对人工智能绘画来说,扩散模型的出现至关重要。
扩散模型的原理是,通过人为逐步添加噪声,让图像逐渐变“模糊”,再不断学习去噪过程,如此人工智能就能从完全是噪声的图片中逐渐还原出清晰的图片,即“画”出图像。
“这一过程与人类学习相似。通常,人们学画从临摹开始,机器也是如此。它最初生成的图像可能很模糊,但计算机会不断修正,从而输出越来越清楚、层次越来越丰富的图像。”肖欣延说。
扩散模型让人工智能绘画技术实现跨越,不仅作画质量快速提升,生成时间也缩短到几秒钟。
众多用户尝鲜,大量应用加速“画技”进化
汤林杰是某互联网公司的运营人员。工作中,他需要借助一些图片来丰富文案,而网络上找到合适的配图并不容易。今年10月,了解人工智能绘画程序后,他尝试自己“画”图。现在,人工智能绘画工具已经是他工作的重要辅助。
随着算法模型对公众开放以及训练数据成本的下降,人工智能绘画门槛越来越低,一些简易化操作平台在国内外兴起。如今,不仅一些职业插画师尝试用人工智能绘画程序辅助作画、激发灵感,许多没有绘画基础的用户也开始尝鲜,并“晒”在社交平台上。
大量需求的涌现也加速了技术的更新迭代。“用人工智能绘画的人越多,算法就越能理解输入的描述文本,画作质量就越高。”肖欣延表示,当前人工智能绘画水平与今年初相比,已经有很大进步。
不过,目前的人工智能绘画技术并不完美。首先,可控性仍然不高,即计算机不能很好理解人类指令的含义,即便是输入“画两个苹果,左边红色,右边绿色”这样的简单描述,生成的图像也可能有很大偏差;其次,细节呈现能力还不够。比如,对空间、透视和光影的刻画就很不如意。不少人工智能渲染出的画作,初看上去惊艳,认真观察问题却不少。
但肖欣延认为,人工智能绘画在技法上的缺陷未来有望得到弥补。比如,基于跨模态大模型和强大的深度学习框架,百度开发的技术一定程度上已经缓解这些问题。此外,未来人工智能不仅能作画,还能根据文本描述生成视频,并直接配上解说文字,“可以把视频生成看作是维度更高的绘画,从技术层面看,这是可以实现的。”
防范潜在风险,守住法律和伦理底线
人工智能进入绘画领域,计算机会取代人类画师吗?
在肖欣延看来,好的绘画与构图、设计语言、视觉情绪息息相关,即使人人都可以用人工智能技术作画,但通常只有高水平的画师才能制作出优秀的人工智能绘画作品,“人工智能只是作画的辅助工具”。此外,虽然有的人工智能绘画语言娴熟,也包含细腻的情感,但并不意味着机器有意识、情感,它不过是学过类似的作品,又恰好呈现出来了。“优秀的艺术作品往往是人的思想的投射,目前机器并没有真正具备思考能力。”肖欣延说。
不少业内人士认为,不妨以开放的心态拥抱人工智能绘画,接受新事物。可以预想,将来绘画中一些繁琐、重复性的工作可能由计算机完成,创作者能腾出更多时间去构思想法与创意,调整构图、色彩、光影氛围等。
“人工智能可能会激发绘画创造的活力。”肖欣延表示,20世纪前后,照相技术让传统肖像画失去市场,促使一些画家向非写实方向创新。与人工智能技术融合,或许能激发画家创作出别开生面的作品。
不过,由于人工智能绘画发展刚刚起步,技术发展也引发关于版权、内容把控等问题的争议。比如,有人认为,未经授权人工智能画作模仿原画的内容、构图和风格等,侵犯了原作者的版权,有违法嫌疑。也有人认为,“机器学习”过程是一种类人化的创作行为,同样体现了创造者的思想和劳动,应当获得版权保护。此外,还有人担忧,人工智能绘画技术若被滥用,可能滋生暴力等令人不适的图像。面对新技术发展,有必要前瞻潜在的风险,只有守住法律和伦理底线,技术进步才能更好地造福社会。
不只是绘画,写作、作曲、生成短片,人工智能日益强大的深度学习能力,让它与不同艺术门类发生着奇妙的碰撞。展望未来,业界专家认为,人工智能与艺术融合,一方面会降低一些艺术门类的创造门槛,让更多人参与到当代的审美创造中来;另一方面新技术会带来新的审美风格,人们或许能从中扩展对自身和世界的认识。
记者 喻思南
盘点不同球类运动,谁是“球中之王”?******
近日,在世界杯比赛中
葡萄牙队3比2险胜加纳队
下半场,C罗通过点球
帮助葡萄牙队取得领先
图源:FIFA
被判点球后C罗亲吻足球
他闭上双眼,深呼吸
然后助跑、果断起脚
皮球势大力沉直窜对方球门
图源:新华社
C罗也成为历史首位
连续五届世界杯取得进球的球员
大家观看比赛时有没有想过
在如此多的球类运动中
足球的球速是最快吗?
哪种球飞得最远?
球速之“王”竟然是它?
所有球类运动无非是用手、脚、球棒或球拍击打球,球的尺寸、形状和重量差异使得它们具有不同的速度以及运动轨迹。
那么问题来了,在这些球类运动中,速度最快的是哪种球?是令人热血沸腾的足球,是挥汗如雨的网球,还是快得看不清轨迹的乒乓球?
图源:摄图网
答案其实是外形最不像球的羽毛球。
目前吉尼斯官方认可的最快的羽毛球记录来自丹麦选手科丁,2017年1月10日,在印度羽毛球超级联赛上,科丁在正式比赛中杀出一记速度高达426 公里/小时(约118 m/s)的杀球。这意味着什么?这个记录中羽毛球的最高速度,比“复兴号”动车组列车最高运行时速(400公里/小时)还要快。
图源:Physics of ball sports各种球类运动的最高运动速度
羽毛球为什么能飞得那么快?原因其实并不复杂,主要是因为羽毛球比较轻(重量只有5克),并且球拍足够长(不超过680mm)。
图源:Annu. Rev. Fluid Mech 各种球的尺寸、重量及速度等基本参数
球体在空中的运动往往只受到空气阻力和重力的作用,它的速度一般只会逐渐减小(篮球等例外)。想要获得最快的运动速度,球体需要在离开运动员接触的瞬间获得最大的加速度。相对于网球、足球和其它球体,羽毛球非常轻,因此同等大小的力在它身上则会产生更大的加速度。
图源:Physics of ball sports 高尔夫球和羽毛球的挥拍动作
最能“飞”的球——高尔夫球
高尔夫球是飞得最远的球,单次击球可以移动200米以上,标准高尔夫球场,一般布置18个球洞,总长度要控制在6002~6400米,球场面积50~75公顷(1公顷=10000平方米),实际大小要根据球场的地形来确定。
不仅如此,高尔夫还走出了地球,成为了首个星际间的球类运动项目。1971年2月6日,执行阿波罗14号任务的宇航员艾伦·谢帕德(Alan Shepard)挥动球杆在月球上打起了高尔夫球,从而使他成为有史以来第一位,也是目前唯一一位在月亮上打过高尔夫球的人。
图源:NASA 正在月球打高尔夫球的宇航员艾伦
高尔夫球有一个让人大跌眼镜的现象:越是光滑的高尔夫球,越是飞不远。
我们都认为,球形是最完美的形体,表面越是光滑,则在飞行的过程中,球面与大气的摩擦就越少,同等用力的情况下,理应飞得越远。但是,高尔夫球不是这样。
图源:《高尔夫50年》高尔夫球的变迁
毛根海教授所著《奇妙的流体运动科学》一书中,有这么一个数据:同等条件下,布满小酒窝的高尔夫球,它在飞行中所受到的阻力只有光滑球的一半,而飞行距离是光滑球的5倍。物体在流体中运动时,前后压力差所带来的阻力就叫做“形状阻力”。现代核潜艇使用“水滴型”外形就是为了减少形状阻力。
图源:科普中国
如上图,顶部的垂直竖版,其形体阻力最大,原因是其后方的“低压区”面积最大,第二个球体的低压区有所减少,直至底部的水滴型,其形状阻力最小。通过流体力学实验,人们发现,光滑的与布满小酒窝的球相比,后者产生的低压区面积更少。球上的无数小酒窝,它可以起到让空气紧贴球面的作用,这使得平滑的气流能顺着球体表面延伸到更靠后的位置时才产生分离。
图片来自航空航天工程师Jeffrey A. Scott
最受欢迎的球类运动——足球
无论是从影响力、参与人数还是赛事热度来看,足球都是当之无愧的世界第一运动。不过今天既然讲到球速和形体阻力的问题,那么我们也一起来看看足球缝线对足球轨迹的影响。
图源:百度百科
普天同庆足球是2010年南非世界杯决赛阶段设计的新款足球,也是最近几届世界杯中,最饱受批评的一个足球。在它还刚刚面世时,生产厂家就宣传说:这个球只用了8块表皮就将足球拼接完成,完美地包住了内胆,这是史上最圆的足球。
然而,这颗球却是守门员的“噩梦”。空气动力学家梅塔博士提出,“粗糙度的大小,决定了出现‘蝴蝶球效应’的最佳临界速度是多少。”
蝴蝶球轨迹蝴蝶球指的是球在空中飞行时几乎没有旋转,从而导致它的飞行轨迹不可预测,守门员很难判断。蝴蝶球的原理是球表面上有缝线,在飞行过程中,气流经过缝线时,会产生更多湍流,由于左右不对称,湍流增加了球侧面的偏转力。尾流左右摇摆,飞行飘忽不定,如飞舞蝴蝶。
图源:中国科普博览常规足球通常将32块球面通过缝线拼合而成,缝线的总长度以及缝线的深度决定了足球的光滑度,缝线越多越粗糙。常规足球一般在48公里每小时球速时才会产生最大化的“蝴蝶球效应”。
而普天同庆足球,由于其总缝线长度很短,导致其成为当时最光滑的足球,经过空气动力学试验,人们发现,在80~88公里每小时球速时,普天同庆才会产生最大化的蝴蝶球效应,而80公里左右时速恰恰是射门,以及任意球的典型球速。
END
资料来源:央视科教、科普中国、中国科普博览、知乎
整理:董小娴
(文图:赵筱尘 巫邓炎)