绿茶通用站群绿茶通用站群

夜游鸟可以吃吗,夜游鸟吃了有什么好处

夜游鸟可以吃吗,夜游鸟吃了有什么好处 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天机器(qì)人ChatGPT火爆以(yǐ)来,微软公(gōng)司(sī)创始人(rén)比尔·盖茨已多次(cì)公开谈(tán)论(lùn)人工智能(néng)话题。在最近的一次采访中,他再次(cì)表示:“AI可(kě)能会让(ràng)科技行业迎(yíng)来一次剧烈的洗牌”。

这(zhè)个结论是他在(zài)当地(dì)时(shí)间2月20日接受《In Good Company》节目专访时提(tí)出的。

他预期,AI的发展可(kě)能(néng)会威胁到(dào)谷(gǔ)歌(gē)的市(shì)占率,因为微软在(zài)AI方面(miàn)的行(xíng)动相当迅速。而最终科技巨头将(jiāng)把AI整合成用户的“全能助手”,包揽一(yī)切应用,与人(rén)们进(jìn)行沟通并提供建议,可以取代亚马逊、Siri或Outlook等应用。

大佬口中全能助(zhù)手的(de)到来可能尚(shàng)需时日,但(dàn)由ControlNet引发的又一(yī)次AI绘画(huà)浪潮,让AIGC在ChatGPT的话题热点包(bāo)围中杀(shā)出(chū)重围(wéi)。

ChatGPT之后又一应用杀(shā)疯了,AIGC或进入可控期,将洗牌科技行业?_黑料正能量

01

ControlNet颠覆AI绘画新玩法

AIGC向可控靠近

以AI绘画为代表的AIGC上一次爆火(huǒ)的时候,还是(shì)2022年(nián)8月,在美国科(kē)罗拉多州(zhōu)举办的新兴数字艺(yì)术家竞赛中,一幅名(míng)为《太空歌(gē)剧院》的作品获奖。

随(suí)后各大厂(chǎng)商的AI绘(huì)画软(ruǎn)件被广(guǎng)大网友熟知并体验,Stable Diffusion便是(shì)其中代表。

ChatGPT之后又一(yī)应(yīng)用杀疯了,AIGC或进入(rù)可控期,将(jiāng)洗牌科技行(xíng)业?_黑料正能量

用户(hù)们可以(yǐ)在(zài)应用(yòng)中输入一组关键词或者一张(zhāng)照片,就能获得一幅AI创作的(de)画(huà)作。

作画的关(guān)键(jiàn)就是所输入的文(wén)本(běn)。同一组关键词也可以创作出夜游鸟可以吃吗,夜游鸟吃了有什么好处很(hěn)多张风格不(bù)一样的画作,这让创作的过程就(jiù)像开盲盒(hé)。

很多用户很喜欢(huān)这种不(bù)确定的惊喜,他(tā)们会将生成的美(měi)图(tú)当做头像。而另一部(bù)分(fēn)喜欢翻看AI绘画(huà)的“翻(fān)车”作品。在社交媒(méi)体(tǐ)上,许多(duō)用户分(fēn)享AI“翻车现(xiàn)场”,例如(rú),一(yī)位网友(yǒu)的小(xiǎo)狗照(zhào)片被AI画(huà)成了“肌肉男”,还有网友的个人照片(piàn)被AI识别成了建筑。

而如今随(suí)着ControlNet的出现与加持,以往(wǎng)AI绘画的填写关键(jiàn)词游戏可能要被颠覆了。

ChatGPT之后又一应用杀疯了,AIGC或进入可控期(qī),将洗牌科技(jì)行业(yè)?_黑料正能量

ControlNet是一位正在斯坦(tǎn)福读博的中国(guó)人张(zhāng)吕敏创作的(de)一种基于控制点(diǎn)的图像(xiàng)变形(xíng)算法,主要用(yòng)于数字图像处理、计算(suàn)机视觉和(hé)计(jì)算机图形学等领(lǐng)域。

其SD插(chā)件一经发布,在短短(duǎn)的两天内便成为了AI绘画领域(yù)最(zuì)新(xīn)的热点。

在此之(zhī)前,大(dà)家用了很多(duō)方(fāng)法想让AI生成的结果尽可(kě)能的(de)符合要求,但(dàn)是都不(bù)尽如人意,它的出(chū)现代表着AI生(shēng)成开始进入真(zhēn)正的可控时期。

因为ControlNet可以直(zhí)接提取(qǔ)画面的构图,人物(wù)的(de)姿势和画面的深(shēn)度信息(xī)等。有(yǒu)了(le)它的帮助,就不用频繁的用提示(shì)词(cí)来(lái)碰(pèng)运气,抽盲盒式的创作了(le)。

通俗(sú)的说ControlNet相当于给AI绘画加了“魔法”,不少博主的作品已(yǐ)经获得了大量的浏览量,“viggo”就是其中之一(yī),他用朋友的照片直接带她(tā)们走进动漫世界。

ChatGPT之后又(yòu)一应用杀疯(fēng)了,AIGC或进(jìn)入可控期(qī),将洗牌(pái)科技行(xíng)业?_黑料正(zhèng)能量

viggo先用StableDiffusion图片转文字。

再用Text2Prompt插件拓展找到对应的关键词(cí);最后用ControlNet插件绑定骨骼开(kāi)始(shǐ)换关键词(cí)试效(xiào)果。

ChatGPT之后又(yòu)一应用杀(shā)疯了,AIGC或进入可控期,将洗牌科技(jì)行业?_黑(hēi)料正能量

通过图片就可以看(kàn)出来,效(xiào)果(guǒ)十分惊(jīng)艳。

ChatGPT之(zhī)后又一应用杀(shā)疯了,AIGC或进入可(kě)控期,将(jiāng)洗牌(pái)科技行业?_黑(hēi)料正能(néng)量

ChatGPT之后又一(yī)应用杀疯(fēng)了,AIGC或(huò)进入可控期,将洗牌科技行(xíng)业?_黑料正能量(liàng)

更(gèng)厉害的是(shì),除了真(zhēn)实(shí)的(de)照片,草图也可以加上“魔(mó)法”,知(zhī)乎(hū)大牛“DevPoint”和“逗砂(shā)”介绍到ControlNet还能实现线稿转全彩图。大神张吕敏其(qí)本尊也亲自回应。

ChatGPT之后又一应用(yòng)杀疯了,AIGC或进(jìn)入可控(kòng)期,将洗牌科技行业?_黑料正(zhèng)能(néng)量

不得(dé)不说当下AIGC已(yǐ)经变得越(yuè)来越(yuè)强大,甚至输出的作品都已(yǐ)经能以假乱真了。

02

难辨虚实,AIGC技(jì)术力爆发

警惕(tì)安全问题(tí)

近(jìn)日,“苏州金(jīn)鸡湖有游(yóu)艇(tǐng)party”的消(xiāo)息(xī)火遍网络,而(ér)经过警方(fāng)辟(pì)谣这(zhè)所谓的(de)“party”可能是全国第一起AI绘图诈骗。

由(yóu)于这个活动(dòng)里面(miàn)给出的美女照片(piàn)都是(shì)AI制作的真人(rén)照片绘图,因为太逼真,被大(dà)家(jiā)当成真事(shì)传播(bō)了

ChatGPT之(zhī)后又一应用杀(shā)疯(fēng)了(le),AIGC或进(jìn)入可控期,将洗(xǐ)牌科技行业(yè)?_黑料正能量

不过(guò)仔细观察(chá)可以发现,活(huó)动发起者(zhě)提供的照片中(zhōng)有个(gè)很大的漏洞可(kě)以(yǐ)发现并非真(zhēn)人,而(ér)是AI绘图,那便是图片中女性的手指部分有的存在异(yì)常。

ChatGPT之后又一(yī)应(yīng)用杀疯了,AIGC或进入可控期,将洗牌科技行业?_黑料正能量(liàng)

有行业人事表示:“现在因为手指部(bù)分的绘画算法(fǎ)比较(jiào)复(fù)杂,AI还不太会画人(rén)的手,但最新看到的图(tú)片已经有越来(lái)越完美的AI模型出现,以(yǐ)后可能(néng)就完全没夜游鸟可以吃吗,夜游鸟吃了有什么好处有漏洞了。

类(lèi)似的AI作(zuò)图诈骗在国外也已有发生。据英国广(guǎng)播公司报(bào)道,土耳(ěr)其地震期间,有Tiktok用户使用AI合(hé)成了(le)儿童受灾的假(jiǎ)照片发布到(dào)网络(luò),以此(cǐ)诱(yòu)骗善良的人(rén)打赏“捐助”从而(ér)实施(shī)诈(zhà)骗。

目前随(suí)着技术(shù)发展,AIGC已经能做出真人照(zhào)片般的绘图效(xiào)果(guǒ),如果这样(yàng)的图(tú)片被(bèi)用来诈骗(piàn),将非常可怕。

此外AIGC还(hái)引发了很(hěn)多担(dān)忧(yōu),一方面,批判者(zhě)认为AI在“学习”了大量前人的(de)作(zuò)品之后,其创作没(méi)有任何情(qíng)绪和(hé)灵魂,难以和(hé)人(rén)类的(de)艺(yì)术创作相提并论。

另一方面,AIGC背(bèi)后的版权、目(mù)前都并没有得到(dào)有效的解(jiě)决(jué),还有AIGC会不会代(dài)替人类“至(zhì)高(gāo)无上(shàng)”的创(chuàng)意。

马斯克也强调,人工(gōng)智能的安全问题需(xū)要(yào)得到(dào)重(zhòng)视,太晚就来不(bù)及了。

03

AIGC下一站除了视频(pín),还有远方(fāng)

技术(shù)都是有(yǒu)两面性的,潜在的危(wēi)害并不能(néng)掩盖其(qí)光辉的贡献。现在(zài)看来(lái),人(rén)工智能(néng)技术将是第四次工(gōng)业革命的核心驱动力(lì)量,将创造新(xīn)的增长(zhǎng)奇迹。

过(guò)去一年,人(rén)工智能在技(jì)术(shù)和商(shāng)业(yè)层面都(dōu)有(yǒu)了巨大进(jìn)展(zhǎn),AI绘画就(jiù)是人工智能技术发生方向性改变的一个代(dài)表(biǎo)。其下一(yī)站或许(xǔ)就(jiù)是(shì)视频。

此(cǐ)前(qián),Meta和谷歌先后(hòu)发布(bù)了几(jǐ)条引(yǐn)爆科技圈的短(duǎn)视频。这(zhè)些视频引发关(guān)注并非内容做得多优秀,反而(ér)都非常(cháng)简单,比如(rú)一匹正在喝(hē)水的(de)马,一只画画的(de)玩具熊,或者(zhě)一段骑摩托车的(de)第(dì)一视角录像,随(suí)便一个有手机的人都可以随手录下一段。

ChatGPT之后(hòu)又一应用杀疯了,AIGC或进(jìn)入可控期,将洗(xǐ)牌科技行业?_黑料正(zhèng)能量

但这些短视频的创(chuàng)作方式非常简(jiǎn)单,创(chuàng)作者仅仅需要(yào)向AI输入一段话(huà),甚至只是(shì)说(shuō)一下要(yào)求(qiú),AI就可以(yǐ)根据需要生成(chéng)一段视频。

谷歌发布的两个AI生成视(shì)频分别(bié)来自于Imagen Video和(hé)Phenaki,前者(zhě)主要(yào)突出的是(shì)高(gāo)清,与Meta的(de)Make-A-Video没有太(tài)多的差别。

在Make-A-Video公(gōng)布了(le)AI生(shēng)成的视频后,AI圈(quān)就已经玩了一波梗(gěng),一个能(néng)够(gòu)做出(chū)更高清视(shì)频的AI还不足(zú)以在短时间(jiān)内戳(chuō)中兴奋点。

Phenaki更加令人震惊的地(dì)方在于,它可以制作(zuò)出超过2分钟的连贯的也有确(què)切内容的(de)视频,这才是(shì)真正让人们(men)感到惊喜的地方。因为无论(lùn)AI生成(chéng)的视频多么高(gāo)清,也只能是为内容(róng)生产者提(tí)供一个灵(líng)感,一个素材,一个过(guò)场动画。

不过能够制作出有具体剧情内容的视频就意味着,一些(xiē)视频创作由AI代(dài)替人工完(wán)成已经初步有了(le)可能。

当下AI的(de)发展速度(dù)已经超过大部分人(rén)的想(xiǎng)象(xiàng)。内容产(chǎn)业的本质是供(gōng)给(gěi)创造需求,AIGC作为(wèi)全(quán)新的内(nèi)容生产方式,可以为(wèi)内容产业带(dài)来更新的内容风格、更快的生产速度,更低的生产成本,这无(wú)疑会驱动内容产业的(de)大爆发。

除了(le)AI绘(huì)图、视频(pín),AIGC技术还能应用于音乐、代(dài)码、机器人动作(zuò)等多(duō)种内(nèi)容形式(shì)的生(shēng)成。不难(nán)发现该项技术不(bù)仅在游戏等行业能得到有效应(yīng)用,对于下(xià)一代互(hù)联网各种(zhǒng)元素的构建亦有关键意义。

从商业化的角度来看,文化娱乐、教育、传(chuán)媒等诸多(duō)领域,本身就(jiù)对基于AI的可视(shì)化内容有强烈需求。

因此,AI绘画及视(shì)频或不是结果,而只是AI进程中的(de)一块重要(yào)拼图,有望在(zài)技术更新的加(jiā)持(chí)下实现更大的(de)应用价(jià)值。

AI从理解内容,走向了可以生成内容(róng),甚至能(néng)够创造出独立价值和独立视(shì)角的内(nèi)容。AIGC的再次(cì)出(chū)圈,更代表着未来(lái)的(de)先进(jìn)生产力即将到(dào)来。

ChatGPT之后又一应用(yòng)杀疯了(le),AIGC或(huò)进入可控期,将洗牌(pái)科技行(xíng)业?_黑料正(zhèng)能量(liàng)

04

紧抓大模型与算力,牢(láo)固AIGC底座

从技术的(de)发展也可以看出,在(zài)语言大模(mó)型、图像大模型(xíng)之后,多模态大模型已经成为了新的趋势。

大(dà)模型被誉为当前(qián)人工智能发展的智能底座,是全球竞(jìng)争最激烈的研究方向(xiàng)之一,包括(kuò)谷歌、亚马逊、百(bǎi)度、阿里(lǐ)、腾讯等众(zhòng)多头部企业(yè)都在(zài)竞(jìng)相发(fā)力。

不过(guò)训(xùn)练大模(mó)型的确价(jià)格(gé)不菲,以国盛证券(quàn)发布的《ChatGPT需(xū)要多少(shǎo)算力》报(bào)告估(gū)算(suàn),GPT-3训练一(yī)次(cì)的成本约为(wèi)140万美元。而(ér)对于一些(xiē)更(gèng)大的(de)LLM(大(dà)型(xíng)语言模型),训练成本则介于200万美元至1200万美元(yuán)高价之间。

以(yǐ)ChatGPT在2023年1月的(de)独立访客(kè)平均数1300万计算,其(qí)对应芯片需求(qiú)为3万多片英伟达A100 GPU,初始投入成本(běn)约为8亿美(měi)元,每日仅电费(fèi)就在5万(wàn)美元左右。

ChatGPT之后又一应用杀疯(fēng)了,AIGC或进(jìn)入可控(kòng)期,将(jiāng)洗牌科技(jì)行业?_黑料正能量

此(cǐ)外不论是ChatGPT还是(shì)AIGC,都离不开庞大算力支持。在关注(zhù)各类大模型的发展同时(shí),更应该关注算力网络(luò)的建设。

算力网络正驱动AI产业发展进入史诗级加速进(jìn)程(chéng),让AIGC及(jí)通用AI这一人(rén)工智(zhì)能发展的终极目标离得更(gèng)近。

因为算力可以对突破性技术创新提供大力(lì)的支(zhī)持。这(zhè)方(fāng)面,多模态大(dà)模型是典型。作为面向未(wèi)来(lái)强人工智能、通用人工智能的(de)重要技术创新,多模态大模型已经在人工智能领(lǐng)域提出了很多年,业(yè)界也(yě)有不少(shǎo)技术(shù)突破(pò),但是,多模态(tài)大模(mó)型进一步往下走(zǒu),算力需求呈几(jǐ)何(hé)式上升,一般的算(suàn)力基础设(shè)施很快将难以胜任(rèn)。

从图像、文字、语音单独一项的训练,到双模态、三模态的(de)跃(yuè)迁,让人(rén)工智能可以灵活应对不同模态的转化、像人(rén)与世界交互一样自然,这方面(miàn),由算(suàn)力网络来驱(qū)动将(jiāng)有明显优势(shì)。

ChatGPT之后(hòu)又(yòu)一应用杀疯了,AIGC或进入可(kě)控期,将洗牌(pái)科技行(xíng)业?_黑料(liào)正能(néng)量

此外,还(hái)有很多需要(yào)爆(bào)发式增长的(de)算力来支撑的(de)技术创新,将在人工智能算力网络支撑(chēng)下快速推进。

AIGC已(yǐ)经露(lù)出曙光,期待在大模型(xíng)和大算(suàn)力的支(zhī)持(chí)下AIGC能持续颠覆内容生产(chǎn)的方(fāng)式(shì),将创造的边际成(chéng)本降低,让万(wàn)众(zhòng)受益。

未经允许不得转载:绿茶通用站群 夜游鸟可以吃吗,夜游鸟吃了有什么好处

评论

5+2=