绿茶通用站群绿茶通用站群

可惜天空不作美的意思,天空不作美的意思下一句

可惜天空不作美的意思,天空不作美的意思下一句 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天(tiān)机器人ChatGPT火爆(bào)以来,微软公司(sī)创始(shǐ)人比尔·盖茨已多(duō)次(cì)公开谈(tán)论人工智能(néng)话题(tí)。在最近的一次采访(fǎng)中,他(tā)再次表示(shì):“AI可能会(huì)让科技行业(yè)迎来(lái)一次剧烈的(de)洗牌”。

这个结论是他(tā)在当地时间2月20日接(jiē)受《In Good Company》节(jié)目专访时提出的。

他预期,AI的发(fā)展可能会(huì)威胁到谷歌的市占率(lǜ),因(yīn)为微软在AI方面的行动相当迅速(sù)。而最终科技巨(jù)头将把AI整合(hé)成(chéng)用户的“全能助(zhù)手”,包揽一切(qiè)应用,与人们进(jìn)行沟通并提(tí)供建议,可以取(qǔ)代亚马逊、Siri或(huò)Outlook等应用。

大(dà)佬口中全能助手的到来(lái)可能尚需时日,但(dàn)由ControlNet引发的又(yòu)一次AI绘(huì)画浪潮,让AIGC在ChatGPT的话(huà)题热点包围中(zhōng)杀出重围。

ChatGPT之后又一(yī)应(yīng)用杀疯了,AIGC或进入(rù)可控期,将(jiāng)洗牌科技行业?_黑料正能量

01

ControlNet颠覆AI绘画新(xīn)玩法

AIGC向可控(kòng)靠近

以AI绘画为代表(biǎo)的AIGC上一次(cì)爆火的时候,还是2022年(nián)8月,在美国科罗(luó)拉多州(zhōu)举办的新兴数(shù)字艺术家竞赛中,一幅名为《太空歌剧院》的作品获奖(jiǎng)。

随后各大(dà)厂商(shāng)的AI绘(huì)画(huà)软(ruǎn)件被广大网友熟知并体验,Stable Diffusion便是其中代表。

ChatGPT之后又一(yī)应用杀疯了,AIGC或进入可控(kòng)期,将洗牌科技行业?_黑料正能量

用户(hù)们可以在应用中输(shū)入一组关键词或(huò)者一张照片,就能获(huò)得一幅AI创作(zuò)的画作。

作画的关(guān)键(jiàn)就是所输入的文本。同一组关键词也可以创作出很(hěn)多张风格不一样的画作,这让创(chuàng)作的过程就(jiù)像(xiàng)开盲盒。

很多(duō)用户很喜欢(huān)这种不(bù)确定的惊喜可惜天空不作美的意思,天空不作美的意思下一句,他(tā)们会将(jiāng)生成的(de)美图(tú)当做头像。而另一部分喜欢翻看AI绘画的(de)“翻车”作品。在社交媒体上,许多(duō)用户分享AI“翻车现场”,例如,一位(wèi)网友的小狗照(zhào)片被AI画(huà)成了“肌肉(ròu)男”,还有网友的个人照片(piàn)被AI识别成了建筑。

而(ér)如(rú)今随(suí)着ControlNet的出现与加持(chí),以往AI绘画的填写关键词游(yóu)戏可能要被颠覆了。

ChatGPT之后又一应(yīng)用(yòng)杀(shā)疯(fēng)了,AIGC或进(jìn)入可控期,将(jiāng)洗牌科技行业(yè)?_黑料(liào)正能量

ControlNet是(shì)一位正在斯坦福读博(bó)的(de)中国(guó)人张吕敏创作的一种基于控制点的图(tú)像变形算法,主要用于数(shù)字图像处(chù)理、计算机视觉和(hé)计算机图形学等领域。

其SD插件一经发布(bù),在短短的(de)两(liǎng)天内便成(chéng)为了AI绘画领域(yù)最新的热点(diǎn)。

在此(cǐ)之(zhī)前,大家(jiā)用了(le)很(hěn)多方法想(xiǎng)让AI生成的结果(guǒ)尽可(kě)能的符合要求,但(dàn)是都(dōu)不尽如人意,它的(de)出现代表着AI生成开始进(jìn)入真正的(de)可控时期。

因为ControlNet可以直接提取画面的构图,人物的姿势和(hé)画面(miàn)的深度信息等。有了它的帮助,就不用频繁的(de)用提示词来(lái)碰运气(qì),抽盲(máng)盒式的(de)创(chuàng)作了(le)。

通俗(sú)的说ControlNet相当于给AI绘画加了(le)“魔法”,不少博主的作品已经获得了大量的浏览量,“viggo”就是其(qí)中之一,他用(yòng)朋友的照片直接带她们走(zǒu)进动(dòng)漫世界(jiè)。

ChatGPT之(zhī)后又一应用杀疯了(le),AIGC或(huò)进入可(kě)控(kòng)期(qī),将洗(xǐ)牌科技行业?_黑料正能量

viggo先用StableDiffusion图片转文字。

再(zài)用Text2Prompt插件拓展找(zhǎo)到(dào)对应(yīng)的关(guān)键词(cí);最后(hòu)用ControlNet插(chā)件(jiàn)绑定骨骼开始换关键词试效果。

ChatGPT之后又一(yī)应用杀(shā)疯了,AIGC或进入可控期,将洗牌科技(jì)行业(yè)?_黑料(liào)正能量(liàng)

通过图片就可以看出来,效(xiào)果(guǒ)十分惊艳。

ChatGPT之后又一应用杀疯了,AIGC或(huò)进(jìn)入可控(kòng)期,将洗牌科技行(xíng)业?_黑料(liào)正(zhèng)能量

ChatGPT之(zhī)后(hòu)又一(yī)应用(yòng)杀(shā)疯(fēng)了(le),AIGC或进入可(kě)控期,将洗(xǐ)牌(pái)科(kē)技行业?_黑(hēi)料正(zhèng)能量

更厉害的是(shì),除了(le)真实的照片,草(cǎo)图也(yě)可以加上(shàng)“魔法”,知乎(hū)大牛“DevPoint”和(hé)“逗(dòu)砂(shā)”介绍到(dào)ControlNet还能实现(xiàn)线(xiàn)稿(gǎo)转全彩图。大神张吕敏其(qí)本(běn)尊也亲(qīn)自回(huí)应。

ChatGPT之后又一应用(yòng)杀疯了(le),AIGC或(huò)进入可(kě)控期,将洗(xǐ)牌(pái)科(kē)技行业?_黑料正(zhèng)能量

不得(dé)不(bù)说当(dāng)下AIGC已经变得(dé)越来越(yuè)强大,甚至输出(chū)的作(zuò)品都已经能以(yǐ)假乱真了。

02

难辨虚(xū)实,AIGC技术力爆发

警惕安全问题

近(jìn)日,“苏州金鸡(jī)湖有(yǒu)游艇party”的消息火遍网络,而(ér)经过(guò)警方辟谣这所谓的“party”可能是全国第一起AI绘图(tú)诈(zhà)骗。

由于这个活动(dòng)里面给(gěi)出的美女照片都是AI制作(zuò)的真人照片(piàn)绘图,因为太逼真,被(bèi)大家当成真事(shì)传播了

ChatGPT之后又一应用杀疯了(le),AIGC或(huò)进入可控期,将洗(xǐ)牌科技行业?_黑料正能(néng)量

不过仔细观(guān)察可以发现,活动发起者提供(gōng)的照片(piàn)中(zhōng)有个很大的漏洞可以发(fā)现并非真人,而是(shì)AI绘图,那便是图片中女性的(de)手指部分有的(de)存在异常。

ChatGPT之后又(yòu)一应用杀(shā)疯了,AIGC或(huò)进入可控期,将洗牌(pái)科技行业?_黑料正能量

有行(xíng)业人(rén)事表示:“现在(zài)因(yīn)为手(shǒu)指(zhǐ)部分的绘画算法比较(jiào)复杂,AI还不太会画人的(de)手,但最新看到的图(tú)片已经有越来越完美的(de)AI模(mó)型出现,以后(hòu)可能就完全没有漏洞了。

类似的AI作图诈骗在国外也已有发(fā)生。据英国广播公(gōng)司报道(dào),土耳其地震期间(jiān),有Tiktok用户使用AI合成(chéng)了儿童受(shòu)灾的假照片发布(bù)到网络,以此诱骗善良的人打赏(shǎng)“捐助”从而实施(shī)诈(zhà)骗。

目(mù)前随着技术发展(zhǎn),AIGC已经(jīng)能做出真人照片般的绘图效果,如果这样的图片被用来诈骗,将(jiāng)非常可怕。

此外AIGC还(hái)引发(fā)了(le)很(hěn)多担忧,一方面(miàn),批判者认(rèn)为AI在“学习(xí)”了(le)大(dà)量前人(rén)的作(zuò)品之后,其创作没有任(rèn)何(hé)情(qíng)绪和灵(líng)魂,难(nán)以(yǐ)和(hé)人类的艺术创(chuàng)作(zuò)相提并论。

另一(yī)方(fāng)面,AIGC背后的版权、目前都并没有得(dé)到有效的(de)解决,还(hái)有AIGC会不会代替人类“至(zhì)高(gāo)无上(shàng)”的创意。

马斯克也(yě)强调,人(rén)工智能的安全(quán)问题需(xū)要得到重(zhòng)视(shì),太晚就(jiù)来不及(jí)了。

03

AIGC下一站除了视频(pín),还有远方(fāng)

技术都(dōu)是有两面性的,潜在(zài)的危害并不能(néng)掩盖(gài)其光辉的贡献(xiàn)。现在看来,人工智能技(jì)术(shù)将是第四次工业革(gé)命的核(hé)心驱动力量(liàng),将创造新的增(zēng)长奇迹。

过(guò)去一年,人(rén)工智能在技术和商业层面都有了(le)巨大(dà)进展,AI绘画就(jiù)是人工智能技(jì)术发生(shēng)方向性改变的一个代表。其下一(yī)站或许就是视频。

此前,Meta和谷歌先后发布了几条引爆科(kē)技(jì)圈的短视频。这些视频引发关注并非内容做(zuò)得多优秀,反(fǎn)而(ér)都非(fēi)常简单,比如一匹正在(zài)喝水的马,一(yī)只画画的玩具熊,或者一段骑摩托车的第一视角录(lù)像(xiàng),随便一个有手机的人都可以随(suí)手录下一段。

ChatGPT之后又一应(yīng)用杀疯(fēng)了,AIGC或进入可控期(qī),将洗牌(pái)科(kē)技行业?_黑料(liào)正能(néng)量

但这些短视频(pín)的创作(zuò)方式非常简单,创作者(zhě)仅仅需要向AI输入(rù)一(yī)段(duàn)话,甚至只是(shì)说一(yī)下(xià)要求,AI就可以根据需(xū)要生成一段视频。

谷歌(gē)发(fā)布的两个AI生成视(shì)频分别来(lái)自(zì)于Imagen Video和Phenaki,前者(zhě)主(zhǔ)要突出的是高(gāo)清(qīng),与Meta的Make-A-Video没有太多的差别。

在Make-A-Video公布了(le)AI生成的视频后,AI圈(quān)就已经玩(wán)了一波梗,一个能够做出更高清视频的AI还不足(zú)以在短时(shí)间(jiān)内戳中兴(xīng)奋点(diǎn)。

Phenaki更加令人震惊的地方在于(yú),它可以制(zhì)作出超过(guò)2分钟的(de)连贯的也(yě)有确切内容(róng)的(de)视(shì)频,这才(cái)是真正让人们感到惊喜的地方。因为无论AI生成(chéng)的视频(pín)多么高清,也只能是为(wèi)内容生产者(zhě)提供一个灵感(gǎn),一个素材,一个过场(chǎng)动(dòng)画。

不过能够制作(zuò)出有具体剧情内容(róng)的(de)视频就意味(wèi)着(zhe),一(yī)些视频创作由AI代(dài)替人(rén)工完成(chéng)已经初(chū)步有(yǒu)了可(kě)能。

当下AI的(de)发(fā)展速度(dù)已经(jīng)超过大部分人的想象。内容(róng)产(chǎn)业的本质是供(gōng)给创造需求,AIGC作为全新(xīn)的(de)内容生产方式(shì),可(kě)以为内容(róng)产业带来(lái)更新(xīn)的(de)内容(róng)风格、更快的生产速度,更低的生产成(chéng)本,这无疑(yí)会驱动内容(róng)产业的大(dà)爆发(fā)。

除了AI绘图、视频,AIGC技术(shù)还能应(yīng)用于音(yīn)乐、代(dài)码、机器人动(dòng)作等多种内容形式的生成。不难发(fā)现该项技术不仅在游(yóu)戏等行业能(néng)得到有效应用,对(duì)于下一代互联网各(gè)种元素的构建亦有关(guān)键意义。

从商业化的角(jiǎo)度来(lái)看,文化娱乐、教育、传(chuán)媒等诸(zhū)多领域,本身就对基于AI的可视化内容(róng)有强烈需求。

因此,AI绘画及(jí)视频或不(bù)是(shì)结果,而只是AI进程中的一块重要拼图(tú),有望在技术(shù)更新(xīn)的加(jiā)持(chí)下实现(xiàn)更大的应(yīng)用价值。

AI从理解(jiě)内容(róng),走(zǒu)向了可以生成(chéng)内容,甚至(zhì)能够创造出独立价值和独立视角的内容。AIGC的再次出圈,更(gèng)代表着未来(lái)的先进(jìn)生(shēng)产力(lì)即将到来(lái)。

ChatGPT之后又(yòu)一应用(yòng)杀疯(fēng)了,AIGC或进入(rù)可控期,将(jiāng)洗牌(pái)科技行(xíng)业?_黑料正能(néng)量

04

紧抓大(dà)模型(xíng)与算力(lì),牢固AIGC底座

从(cóng)技术的发展也可以看(kàn)出,在语言大模型、图像大模型之后,多模态大模(mó)型(xíng)已经成为了(le)新的趋势。

大模型被誉为当前人工智能(néng)发展(zhǎn)的智能底(dǐ)座(zuò),是全球竞争最激(jī)烈的研究(jiū)方向之一,包括谷(gǔ)歌、亚马逊、百(bǎi)度、阿里(lǐ)、腾(téng)讯等众多(duō)头部企业都在竞相发力。

不过训练大(dà)模(mó)型的确价(jià)格不(bù)菲,以国盛证券发布(bù)的《ChatGPT需要多少算力》报告估算,GPT-3训练一次的成本约(yuē)为140万(wàn)美元。而对于一些更大的(de)LLM(大(dà)型语言模型(xíng)),训练成本(běn)则介(jiè)于200万美(měi)元至1200万美元(yuán)高价之(zhī)间(jiān)。

以(yǐ)ChatGPT在2023年(nián)1月的(de)独立访客(kè)平均(jūn)数(shù)1300万计算,其对应芯片需(xū)求为3万多片英伟达A100 GPU,初始投(tóu)入成(chéng)本约为8亿美元(yuán),每(měi)日仅电(diàn)费就在5万美元左右(yòu)。

ChatGPT之后又一应用杀(shā)疯了(le),AIGC或进入可控(kòng)期,将洗牌(pái)科技行业(yè)?_黑料正(zhèng)能量

此外不论是ChatGPT还是(shì)AIGC,都离不开庞大算(suàn)力支(zhī)持。在关注各类大模型的发展同(tóng)时,更应该关注算力网络(luò)的(de)建设(shè)。

算(suàn)力网(wǎng)络正驱动AI产业发展进入史诗级加速进程,让(ràng)AIGC及通(tōng)用AI这一(yī)人(rén)工智能发(fā)展的(de)终极目标离得更(gèng)近。

因为(wèi)算力可以对突(tū)破性(xìng)技术(shù)创新提供大(dà)力的支持。这方面,多模(mó)态大模(mó)型是典型。作为面向未来强人(rén)工(gōng)智能、通用(yòng)人(rén)工智能的重要技术创(chuàng)新,多模态大模型(xíng)已经在人工(gōng)智能(néng)领域提出(chū)了很多(duō)年,业(yè)界也(yě)有不少技术突破(pò),但是,多(duō)模态大模型进(jìn)一(yī)步往下走,算(suàn)力需求呈几何(hé)式上升,一(yī)般的算(suàn)力基础设施(shī)很快将难以胜(shèng)任。

从图(tú)像(xiàng)、文字、语音单独一项的训练,到双模态、三(sān)模态(tài)的跃迁,让人(rén)工智能可以(yǐ)灵活应对不(bù)同模态的(de)转化、像人与世界交互(hù)一样自然,这方面,由(yóu)算(suàn)力(lì)网络来驱动将(jiāng)有明(míng)显(xiǎn)优势(shì)。

ChatGPT之后又一应用(yòng)杀疯了,AIGC或进入(rù)可控期,将洗(xǐ)牌科技行业?_黑料(liào)正能(néng)量(liàng)

此(cǐ)外,还有很(hěn)多需要爆发式(shì)增长(zhǎng)的算力来支(zhī)撑的技术创新,将在人工智能算力网络支(zhī)撑下快(kuài)速推(tuī)进。

AIGC已经露出(chū)曙光,期待在大模(mó)型和(hé)大算力的支持下AIGC能(néng)持续颠覆内容(róng)生产的方式,将创造的边际成(chéng)本降低,让万众受益。

未经允许不得转载:绿茶通用站群 可惜天空不作美的意思,天空不作美的意思下一句

评论

5+2=