绿茶通用站群绿茶通用站群

魏承泽作品集 魏承泽一类的作者

魏承泽作品集 魏承泽一类的作者 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天机器人(rén)ChatGPT火爆以来,微软公司(sī)创始人比尔(ěr)·盖茨已多次公(gōng)开谈论人工智能话题(tí)。在最近的一次(cì)采访中(zhōng),他(tā)再次表(biǎo)示:“AI可能会让科(kē)技行业迎来一次剧烈的洗(xǐ)牌(pái)”。

这个结论是他在当地时间2月20日接受《In Good Company》节(jié)目专访时提出的(de)。

他预期,AI的(de)发展(zhǎn)可(kě)能会(huì)威胁到(dào)谷(gǔ)歌的市占率,因为微软在(zài)AI方面的行动相当迅速。而(ér)最终(zhōng)科(kē)技巨(jù)头(tóu)将把(bǎ)AI整合(hé)成(chéng)用户的(de)“全能(néng)助手(shǒu)”,包揽一(yī)切应用,与人们(men)进(jìn)行沟通并提供建(jiàn)议,可以(yǐ)取代亚马(mǎ)逊、Siri或Outlook等应用。

大佬口中全能助(zhù)手的(de)到来可能(néng)尚需时日,但由ControlNet引发的又一次AI绘画浪潮,让(ràng)AIGC在ChatGPT的(de)话(huà)题热点包围中(zhōng)杀出重围(wéi)。

ChatGPT之后又一(yī)应用杀疯了(le),AIGC或进入可(kě)控期,将洗(xǐ)牌(pái)科(kē)技行业?_黑料正(zhèng)能量

01

ControlNet颠覆(fù)AI绘画新玩法(fǎ)

AIGC向可控靠(kào)近

以AI绘画(huà)为代表的AIGC上一次爆火的时(shí)候,还是2022年(nián)8月,在美国科罗拉(lā)多州举办的新兴数字艺术(shù)家竞赛中,一幅名为《太空歌剧(jù)院》的作品获(huò)奖。

随(suí)后(hòu)各大厂商的AI绘画(huà)软(ruǎn)件被(bèi)广(guǎng)大网友熟(shú)知(zhī)并(bìng)体验,Stable Diffusion便是其(qí)中代(dài)表。

ChatGPT之后又(yòu)一应用(yòng)杀疯了,AIGC或进入可控期,将洗牌科技行业(yè)?_黑料正(zhèng)能量

用(yòng)户们可以在应(yīng)用中输入一(yī)组关键词或者一(yī)张照片,就(jiù)能获得(dé)一幅AI创(chuàng)作的(de)画作。

作画的关(guān)键就是所输入的(de)文(wén)本(běn)。同一组关(guān)键词(cí)也可以创作出很多(duō)张(zhāng)风格不一样的画作,这(zhè)让(ràng)创作的过程就像开(kāi)盲盒。

很(hěn)多(duō)用户很(hěn)喜欢这种不确定的惊(jīng)喜,他们会将生成的美图(tú)当做头像。而另一部(bù)分喜(xǐ)欢翻看(kàn)AI绘画的(de)“翻(fān)车”作品(pǐn)。在社交(jiāo)媒体上,许多用户分(fēn)享(xiǎng)AI“翻车(chē)现场(chǎng)”,例如,一位网友的小狗照片被AI画成了(le)“肌肉男”,还有网友的个人照片被AI识别成了建筑。

而如今随着ControlNet的出现与(yǔ)加持,以往AI绘画的填写关键词游(yóu)戏可(kě)能要被(bèi)颠(diān)覆了(le)。

ChatGPT之后(hòu)又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?_黑料正能量

ControlNet是一位正在斯坦福读博的中国人张吕敏创作的(de)一(yī)种基于控(kòng)制(zhì)点(diǎn)的图(tú)像变形算法(fǎ),主(zhǔ)要(yào)用于数字图像处理、计(jì)算机(jī)视觉和(hé)计算机图形学等领域。

其SD插件一经发(fā)布,在短短的(de)两天(tiān)内便成(chéng)为了AI绘画领域最新的热点。

在此之前(qián),大(dà)家用了很多方(fāng)法想让AI生成的(de)结果尽(jǐn)可能的符合(hé)要求,但是都不尽如(rú)人(rén)意(yì),它(tā)的出现代表着AI生(shēng)成开始进入真正的(de)可控时期。

因为(wèi)ControlNet可以直接(jiē)提取画面的(de)构图,人(rén)物的姿(zī)势和(hé)画面的(de)深度信息(xī)等。有了它的帮(bāng)助,就不用频(pín)繁的用提示词来碰运气,抽盲盒式的创作了(le)。

通(tōng)俗的说ControlNet相当于(yú)给AI绘画加了(le)“魔法”,不少博主的作(zuò)品已经获得了大量的(de)浏览量,“viggo”就是其中(zhōng)之一,他用朋友的(de)照片直接带她们走进动漫世界。

ChatGPT之后又(yòu)一应用杀疯(fēng)了,AIGC或进入可(kě)控期,将(jiāng)洗牌(pái)科(kē)技行(xíng)业(yè)?_黑料正能量

viggo先用(yòng)StableDiffusion图片转(zhuǎn)文字(zì)。

再用Text2Prompt插件拓展找到对(duì)应的关键词;最后用ControlNet插件绑(bǎng)定骨骼开始换关键(jiàn)词试效果。

ChatGPT之后又一应用杀疯了,AIGC或(huò)进入可控(kòng)期(qī),将洗(xǐ)牌(pái)科(kē)技(jì)行业(yè)?_黑料正能量

通过图片就可以看出来,效果十分惊艳。

ChatGPT之后又一应用杀疯了,AIGC或进入(rù)可(kě)控(kòng)期,将洗牌科技行业?_黑料正能量

ChatGPT之(zhī)后(hòu)又一应用杀疯了(le),AIGC或进入可(kě)控期,将洗(xǐ)牌科技行业?_黑(hēi)料正能量

更(gèng)厉害的是,除了真实的照(zhào)片(piàn),草图也(yě)可以加上“魔法”,知乎大牛“DevPoint”和“逗砂”介绍到(dào)ControlNet还能实现线稿转(zhuǎn)全彩图。大(dà)神张(zhāng)吕敏其本尊也亲(qīn)自回(huí)应。

ChatGPT之(zhī)后又(yòu)一应(yīng)用杀疯了(le),AIGC或进(jìn)入可控期,将洗牌科技行业(yè)?_黑料正能量

不得不(bù)说当下AIGC已经变(biàn)得越来越强大,甚至输出的作(zuò)品都已(yǐ)经能以假乱真了。

02

难辨虚实,AIGC技术力爆(bào)发

警惕(tì)安全问题

近(jìn)日,“苏州(zhōu)金鸡湖有游艇party”的消(xiāo)息火遍网络(luò),而经过警方辟谣这所(suǒ)谓的“party”可能是全(quán)国(guó)第一起AI绘图(tú)诈骗(piàn)。

由于这个活(huó)动(dòng)里面给(gěi)出的美女照(zhào)片都(dōu)是AI制作的真(zhēn)人照片绘图,因为太(tài)逼(bī)真,被大(dà)家当成(chéng)真事(shì)传(chuán)播了

ChatGPT之(zhī)后又一(yī)应用杀(shā)疯了,AIGC或进入(rù)可控期,将(jiāng)洗牌科技行业?_黑料正能量

不过仔细(xì)观察(chá)可以发现,活动发(f魏承泽作品集 魏承泽一类的作者ā)起者提(tí)供(gōng)的照片中有(yǒu)个很大(dà)的漏洞可以(yǐ)发现并非真人,而是AI绘图,那便是图片(piàn)中女性的手指部分有的存在异(yì)常。

ChatGPT之后又一应用杀(shā)疯了,AIGC或(huò)进入(rù)可控期,将洗牌科(kē)技行业?_黑料正(zhèng)能量

有行业人事表示:“现在因为(wèi)手指部(bù)分的绘画算法比较复杂,AI还(hái)不太会(huì)画人的手,但最新看(kàn)到(dào)的图(tú)片已经(jīng)有越来越完美的AI模型(xíng)出(chū)现,以后可能就(jiù)完全没有漏洞了。

类(lèi)似(shì)的AI作图(tú)诈骗在国外也已(yǐ)有发生。据英国广(guǎng)播公司(sī)报道,土耳(ěr)其地震期间(jiān),有Tiktok用户使用(yòng)AI合成(chéng)了(le)儿童(tóng)受(shòu)灾的假照片发布到网络,以此诱骗善良的人打赏“捐(juān)助”从而实施诈骗。

目前随(suí)着(zhe)技术(shù)发(fā)展,AIGC已经能做出真人(rén)照(zhào)片般(bān)的绘图效果,如果这样的图片(piàn)被用来诈骗,将非(fēi)常可(kě)怕。

此(cǐ)外AIGC还(hái)引(yǐn)发了很多担忧,一方(fāng)面(miàn),批判者认为(wèi)AI在“学习”了(le)大(dà)量前人的作品(pǐn)之后,其创作没有任何情绪和灵魂(hún),难以和人类的艺术创(chuàng)作(zuò)相提并论(lùn)。

另一方面,AIGC背后(hòu)的版权、目前都并没(méi)有得到有效(xiào)的(de)解决,还有AIGC会不(bù)会(huì)代替人类“至(zhì)高无上”的(de)创意(yì)。

马斯克也(yě)强调,人工智能的(de)安全问题(tí)需要得到(dào)重视,太(tài)晚就来不及了。

03

AIGC下一站除了视频,还有远(yuǎn)方

技(jì)术(shù)都(dōu)是有(yǒu)两(liǎng)面性的,潜在的危害并不能掩盖其光辉的贡献。现在看(kàn)来,人(rén)工智能技术将是第四次工业(yè)革命(mìng)的核心(xīn)驱(qū)动力量,将(jiāng)创造(zào)新(xīn)的增长奇迹。

过去(qù)一年,人工智能在(zài)技术和商业(yè)层面都有了巨大进(jìn)展,AI绘(huì)画就是人工智(zhì)能(néng)技术发生(shēng)方向性改变的一(yī)个代表。其下一站或许就(jiù)是视频。

此前,Meta和谷歌先(xiān)后发(fā)布了几条引爆科技圈的短视频。这(zhè)些视频引发(fā)关注(zhù)并非内(nèi)容做得多优秀,反(fǎn)而(ér)都非常简(jiǎn)单,比如(rú)一匹正(zhèng)在喝水的马(mǎ),一只画(huà)画的玩具熊,或者一段骑(qí)摩托车的第(dì)一视角录像,随便一个有手机的(de)人都可以(yǐ)随手录(lù)下一段(duàn)。

ChatGPT之后又一应用(yòng)杀疯(fēng)了,AIGC或进入可控期,将洗(xǐ)牌(pái)科技行业?_黑料正能量

但这些(xiē)短视频(pín)的(de)创作方式(shì)非常简单(dān),创作(zuò)者仅仅需要向AI输入一段话,甚至只是(shì)说一(yī)下要求,AI就可以根据需(xū)要生成一段视(shì)频。

谷(gǔ)歌发布的(de)两个AI生成(chéng)视频分别(bié)来自于Imagen Video和Phenaki,前者主要突出的是(shì)高清,与Meta的(de)Make-A-Video没有太多(duō)的差别。

在Make-A-Video公布了AI生成的视频(pín)后(hòu),AI圈就已经(jīng)玩了(le)一波梗(gěng),一个能够做(zuò)出更高清视频的AI还(hái)不足以在短时间内戳(chuō)中兴奋点。

Phenaki更加令人震惊的地方(fāng)在于(yú),它可以制(zhì)作(zuò)出超过2分钟(zhōng)的连贯的(de)也有确切内(nèi)容的视频,这才是(shì)真(zhēn)正(zhèng)让人们感(gǎn)到惊喜的地(dì)方。因(yīn)为无论AI生成的(de)视频多么高清(qīng),也只能是为内容生产者提供一个灵感,一个(gè)素材(cái),一个过场动画(huà)。

不(bù)过能(néng)够(gòu)制(zhì)作出有具体剧情内容的视频就意味着,一些视频(pín)创作由AI代(dài)替人工完(wán)成已经初步有了(le)可能。

当下AI的发(fā)展速(sù)度已(yǐ)经超过大部分人的想象。内容产业的本质(zhì)是供(gōng)给创(chuàng)造(zào)需求,AIGC作(zuò)为全(quán)新的(de)内容生产方式,可以为内容产业带来更新的内(nèi)容(róng)风格、更快的生产(chǎn)速度,更(gèng)低(dī)的生产成(chéng)本,这(zhè)无疑会(huì)驱动内容产业的(de)大爆发。

除了(le)AI绘图(tú)、视频,AIGC技术还能应用于音乐、代码、机器人动作等多种(zhǒng)内(nèi)容形式的生成。不难发(fā)现该项技术不仅(jǐn)在(zài)游戏(xì)等行业能得到有效应(yīng)用(yòng),对于下(xià)一代互(hù)联网各种元(yuán)素的构建亦(yì)有关键(jiàn)意义(yì)。

从(cóng)商业化的角度(dù)来看,文化(huà)娱乐、教育、传媒等诸多领域,本(běn)身就(jiù)对基于AI的(de)可视化内容(róng)有强(qiáng)烈(liè)需求。

因(yīn)此,AI绘画(huà)及视频(pín)或(huò)不是结(jié)果,而只(zhǐ)是AI进程中(zhōng)的一块重(zhòng)要拼图(tú),有(yǒu)望在技术更新(xīn)的加持下实现更大的应用价(jià)值(zhí)。

AI从理解内(nèi)容,走向了可以(yǐ)生(shēng)成内(nèi)容,甚至能够创造出(chū)独(dú)立(lì)价值和独(dú)立视角的内容(róng)。AIGC的再次出(chū)圈,更代(dài)表着未来的(de)先(xiān)进(jìn)生产力即(jí)将到来。

ChatGPT之后(hòu)又一应用(yòng)杀(shā)疯了,AIGC或进入(rù)可(kě)控期,将洗牌科技行(xíng)业?_黑(hēi)料(liào)正能量

04

紧抓大模(mó)型与算(suàn)力,牢固AIGC底座

从(cóng)技(jì)术(shù)的发展也可以看出(chū),在语言大模(mó)型、图像大模型之(zhī)后,多模态大模(mó)型已经成为了新的趋势。

大模型被誉(yù)为当前人工智能发展的智(zhì)能底座,是全(quán)球(qiú)竞争最激烈的研究(jiū)方向之一,包括谷歌(gē)、亚(yà)马逊(xùn)、百(bǎi)度、阿里、腾讯等众多头部企(qǐ)业都在竞(jìng)相发力(lì)。

不(bù)过训练大(dà)模型的确价格不菲(fēi),以国(guó)盛证券(quàn)发布(bù)的《ChatGPT需要多少算力》报(bào)告(gào)估算,GPT-3训练(liàn)一次的成本约为140万(wàn)美元。而(ér)对(duì)于(yú)一些更大的LLM(大型语言模(mó)型),训练成(chéng)本则介于200万美元至1200万美元高价之间。

以ChatGPT在2023年1月(yuè)的独立访客(kè)平均(jūn)数1300万计算(suàn),其对应芯(xīn)片(piàn)需求为3万(wàn)多(duō)片英伟达A100 GPU,初始投入成本约为(wèi)8亿(yì)美元(yuán),每(měi)日仅(jǐn)电(diàn)费就在5万美元左右。

ChatGPT之后又(yòu)一应用杀(shā)疯(fēng)了,AIGC或进入可(kě)控(kòng)期,将洗牌科技行业?_黑料正能(néng)量(liàng)

此外不论(lùn)是ChatGPT还(hái)是AIGC,都离不(bù)开(kāi)庞(páng)大算力支持。在关(guān)注各(gè)类大模型的发展同(tóng)时,更(gèng)应该关注算力网(wǎng)络的建(jiàn)设。<魏承泽作品集 魏承泽一类的作者/p>

算力网络正驱(qū)动AI产业发展进入(rù)史诗(shī)级加速进程,让AIGC及通用(yòng)AI这一人工(gōng)智能发展的终极(jí)目(mù)标(biāo)离得更近。

因为(wèi)算力(lì)可以对突破性技术创新提供大(dà)力的支持。这方(fāng)面,多模态(tài)大模型(xíng)是典型。作为面向未来强(qiáng)人工智能、通(tōng)用人工智能的重要技术创(chuàng)新,多模态大模型已(yǐ)经在人工智(zhì)能(néng)领域提(tí)出了很多年,业界也(yě)有不少(shǎo)技术突破,但是,多模态(tài)大模型进一步往下走(zǒu),算力需求呈几何式上升,一(yī)般的算(suàn)力基础设施很快(kuài)将(jiāng)难(nán)以胜任(rèn)。

从图像、文字、语音(yīn)单(dān)独一项的训练,到双模态、三模(mó)态的跃迁,让人工智能可(kě)以灵活应对不同模态的转化、像人(rén)与(yǔ)世(shì)界交互一(yī)样自然,这方(fāng)面,由算力网络来驱(qū)动将有明显优势(shì)。

ChatGPT之后又(yòu)一应用(yòng)杀(shā)疯了,AIGC或进入可控(kòng)期,将洗牌(pái)科(kē)技行业?_黑料(liào)正能量

此外,还有很多需要爆发式增长的算力来支撑的(de)技术创新,将在人(rén)工智能算力网络(luò)支(zhī)撑下快速推(tuī)进(jìn)。

AIGC已经露出曙光,期待(dài)在(zài)大模型和(hé)大算力的支持下AIGC能持续颠覆内容生产(chǎn)的方(fāng)式(shì),将创造的边际成本降低,让万众受益。

未经允许不得转载:绿茶通用站群 魏承泽作品集 魏承泽一类的作者

评论

5+2=