你的位置:米兰体育官方网站 > 亚洲盘 >

milan 在B站整夜封神的《牌子》,背后是单个镜头生成3000次的狠东说念主。

发布日期:2026-02-13 12:45    点击次数:127

milan 在B站整夜封神的《牌子》,背后是单个镜头生成3000次的狠东说念主。

{jz:field.toptypename/}

咫尺是2026年2月13日。

7 分钟视频,上线一周,1000 多万次播放,80 多万点赞,30 多万投币。

《流浪地球》导演郭帆看到后转发点赞,YouTube 上亦然一堆老外被畏缩,弹幕里寰球喊着封神,批驳区有东说念主在逐帧分析剧情。差评剪辑部的后期们也在上班时分,酌量到底是怎么作念的。

视频一运行,一个东说念主戴着帽子走进丛林,在看到一个“禁戴帽子”的牌子后,他原地被“消亡”了。镜头马上下拉,帽子滚到画眼前线。

接着音乐统共,短片名《SIGN》出咫尺屏幕前。

张开剩余95%

再紧接着镜头一个丝滑转场,SIGN 成了汽车里的一个按钮,收音机正在播报新闻:

火星上发现了一块普遍“?”警示牌,地球上也运行出现越来越多看不懂的牌子。这些文书牌一出现,教化的事情就会立即发生,即便它不相宜常理。

随着镜头浪荡着转向车窗外,路边一刹出现“奶牛从天而下”的教化牌,下一秒奶牛真的从山坡上滑下来。

后视镜里映出司机的脸,奶牛摔下来的灰尘四溅,急刹车的惯性让司机来了一个大蹒跚。看到这些,差评君照旧坐不住了,要知说念这些物理细节一直王人是 AI 视频最容易穿帮的方位啊。

接下来更绝。

一个长达 20 秒傍边的十字街头镜头,险些是一镜到底的嗅觉。上一个牌子的后果还在触发,下一个牌子照旧到来,滑倒的行东说念主、骑着自行车的熊、各式超当然事件一个接一个在画面里发生。

要知说念 AI 视频模子时时只可生成几秒钟片断,时分一长,场景、东说念主物王人会漂移、变形。我真无法设想这个镜头是怎么撑住的。

终末一张报纸飞过来挡住画面,当它被吹走后,咱们又被带到了下一个场景。转场丝滑到你根蒂刚劲不到这是拼接出来的。

整支片子 7 分钟,险些每一帧王人是这个密度。

剧情也相通塌实:

越来越多看不懂的文书牌让全国堕入弘大,一个巨大的“不言不视不闻”的教化牌从月球砸向地球,东说念主类的翰墨运行被吞吃,无法疏通交流,顺次逐步垮塌。

好在东说念主类发现了交流的本体在于边幅、手势。于是寰球诈欺 emoji 重建了疏通神态。

终末咱们飞回火星踢翻了那块牌子,并插上新的牌子:

这条视频是 UP 主 DiDi_OK 参预 B 站首届 AI 创作大赛的参赛作品。 1 月 5 日,B 站面向全球创作家启动了这场比赛,第别称奖金 100 万,3 月 20 日截稿。比赛还没废除,这条片子照旧提前炸场了。

看完这条视频,我的第一反馈即是,这哥们是谁?他究竟怎么作念到的?我致使想坐窝知说念他每个镜头、每一帧王人用了哪些模子和提醒词?

托一又友关连上 DiDi_OK 之后,差评君坐窝就把语音拨往日了。

DiDi_OK 是河南郑州东说念主,在英国留学学的 3D 动画,毕业后进了伦敦 WPP 总部,全球最大的告白传播集团之一,干了快 4 年。

早在三年前,公司就要求全员构兵 AI,但那会儿的 AI 视频是什么水平呢?差评君估摸着也就威尔·史姑娘第一次吃意面的水平吧。

但他那时摈斥的,倒不是 AI 自己,仅仅以为没到 AI 够用的阿谁时分:我用 Blender 我方作念王人比你快,不伺候。

前年 4 月,Runway 推出了 Gen4,他发现画面运行有物理规定了,石头不错日常地落地、弹开,心里想着“那一天终于照旧来了”。

DiDi_OK 以为这个起先够了,就去参预了一个 AI电影节。公司一看,行你小子,径直给他开了个 AI 导演新的岗亭。

是以咫尺他的生计是这样的:白昼给大客户作念 AI 告白,晚高放工回家我方作念 AI 短片。有时好意思国客户的时差逼得他凌晨 1 点才放工,但他还想再作念一两个小时我方的东西。

DiDi_OK 职责中

《牌子》视频的灵感,来自于一回圣诞假期。

前年圣诞节,DiDi_OK 跑去英国最西边的康沃尔。因为康沃尔有我方的方言和符号风俗,是以他一齐上遭遇一堆看不懂的牌子,导致每次经由王人会留意翼翼。

终末让他下定决心要作念这个选题的,是这边一又友家洗漱台独揽尽然也贴着一张小纸条,上头也写了一排字,看不懂,但他总以为好像有什么不得了的东西。他没问,就让这个疑心一直留着。

一又友家的惊奇号

圣诞节废除后 DiDi_OK 又去了土耳其,这里语言就更欠亨了。他跟出租车司机聊天王人得两东说念主掀开 ChatGPT,彼此翻译着对话。

这一齐上他拍了许多那种看不懂的符号牌,也履历了许多只可靠手势和含笑交流的时刻。

土耳其牌子

平缓地他运行想一个问题:当语言欠亨的时候,东说念主和东说念主之间的疏通会退化到什么景色?

手势、含笑、emoji。

这即是《牌子》视频终末的设定:当东说念主类语言被吞吃后,寰球运行用 emoji 疏通、最终结束反击。

灵感有了,但从灵感到一个 7 分钟的完满故事,中间还有他 2 个月的打磨。

DiDi_OK 的风俗是在 iPhone 备忘录里顺手记灵感,猜测一句就记一句。这个视频的脚本,他前跋文了四五个不同的文档,才运行搭出一个能够的框架。因为对脚本的高要求,有时他一觉悟来会推翻我方写了半个月的东西。

灵感&脚本

在《牌子》的脚本定稿后,DiDi_OK 其实预判到了:比赛周期这样长,中间能够率会有新模子发布。那时他猜是 Google 的 Veo4,废除来的是 Seedance 2.0,后果比他意想的还猛。

但这在他谋划之内——写脚本的时候他就定了一个原则:故事要能扛住时间迭代。

他认为 AI 再怎么发展,最佳的景色也不外是无尽接近实拍和传统 CG 的后果。既然如斯,那从古于今的规定就不会变,好故事遥远是好故事。

诚然在时间上,他也竭力于作念了亿点点模子超标。

比如十字街头阿谁镜头,DiDi_OK 明知说念那时的模子作念那种复杂场景很劳作,但他专爱在阿谁点上死磕,把时间清楚往前推。这样就算新模子出来了,不雅众回头看也不会以为过期。

说到这,重点也来了,寰球一定特兴趣:

《牌子》到底是怎么作念出来的?为什么 DiDi_OK 的 AI这样听他话,能把视频一致性作念得这样强?

嗯,最初,你要失望了。DiDi_OK 的 AI 视频模子也不听话。

DiDi_OK 说他莫得作念分镜的风俗,不是他不想作念,是因为至少在那时的 AI 水平下,milansports就算画了分镜它也不听你的。

是以他其后的计策是靠“体感”。把惬意度区间设在 80 到 100 分之间,专科蕴蓄让他知说念什么是 80 分,而 AI 偶尔会暴击到 100 分以上。

但惬意亦然要代价的,代价即是无尽抽卡。

十字街头阿谁 15-20 秒的镜头,是统共视频里老本最高的。

DiDi_OK 有一次闲着败兴数了一下生成记载:他每次点 4 个一组批量生成,菜单里排了 1000 多组。也即是说,单算那一个镜头,他生成了三四千条视频。

水獭阿谁镜头也折磨东说念主。

因为画面里同期出现大宗动物,AI 很难保证每一只王人莫得 bug。数目一多,模子就顾不上别的了,有时候镜头会疾苦锁定在一个士兵的脸上。DiDi_OK 只可把照旧惬意的构图和运镜保留住来,再用视频生视频的神态重新跑一遍细节。

传单和二维码的镜头也一样。

他但愿有一张传单刚好扑到镜头前边,好让上头二维码能被不雅众扫出来。这种事你没法跟 AI 琢磨,只可一遍随地生成,指望老天爷给你一次契机。

DiDi_OK 其后总结出一套支吾挫败的措施。

他就连气儿闭着眼点生成,老本点够 1000 块钱的,然后就去看电影、打游戏,总结再一个一个看。归正别盯着进程条,否则看着从 99% 终于到 100%,点开一看很差劲,就会以为有内伤。

另外他不会效力一个模子,每个镜头他会字据需求遴荐不同的器用:

Nana Banana 生图最佳,尤其能输出 4K;Veo 的嘴型同步和厚实性最强,唯一波及东说念主物对话就用它,但运镜很古板,扮装总是正对镜头站画面正中间言语;可灵的运镜有张力,能作念很大的推拉,但画面貌易拉伸变形;Runway 的物理后果最牛,但不厚实。

至于许多东说念主兴趣的,《牌子》如何作念到不同场景看起来格调调理,如何保执一致性的。

其实 DiDi_OK 用了一个智谋的想法:他坚执写实格调、低满盈度,而况大部分扮装只出现一次。

不雅众以为一致,不是因为并吞个扮装相接恒久,而是因为举座好意思术调性恒久在一个框架内。这个想路来自他作念游戏主意推测打算和 3D 动画时的蕴蓄。

诚然了,并不是一切职责王人能 100% 交给 AI。

比如馋嘴蛇吃翰墨阿谁片断,蛇和翰墨王人是 AI 生成的,但要作念到可控,就得先把它们滚动成带透明通说念的素材,再通事后期合成叠在统共。

馋嘴蛇跟踪细节

《牌子》惊艳寰球的不仅仅画面。

它的配乐像一条隐形的情感线,前段压抑悬疑,中段弘大加快,到终末 emoji 反攻的时候一下子奋斗起来,整段音乐是随着故事的心跳走的。

这段配乐,是 DiDi_OK 花了整整一周, 用 Suno 生成了 1500 屡次磨出来的。最要道的是,他我方全王人不懂乐理,连五线谱王人不清醒。

他判断锐利的想法很肤浅,让女一又友听。女一又友全程不知说念他在作念什么片子,莫得泡在创作环境里,即是一个纯正的第一次听众。DiDi_OK 说,一个没听过这首歌的脑子,对他来说相当珍重。

统共视频,DiDi_OK 前后打磨了两个月。脚本一个多月,AI生成制作 23 天,也私费了不少钱。

聊到终末,差评君问了阿谁统共东说念主王人想问的问题:AI会取代导演吗?

DiDi_OK 的回复是,不会。

他说 AI 再怎么发展,大前提不会变。它最佳的景色即是全王人等于实拍和传统 CG 的后果。那么,从古于今有一个事情是无谓 AI 寰球王人会的,即是写字。

“写演义谁王人不错写,谁王人不犯罪,但并不是每个东说念主终末王人去写演义了,也不是说会写字的东说念主终末王人作念到了一个我方惬意的景色。”

馋嘴蛇 AI 素材

DiDi_OK 认为 AI 最能匡助到的那类东说念主需要同期赋闲两个要求:知说念我方想要什么,也知说念别东说念主想要什么。但这两个要求其实蛮尖酸,“许多东说念主包括我也巧合知说念我方到底想要什么,而知说念别东说念主想要什么就更难。”

DiDi_OK家里职责区

其实差评君以为,DiDi_OK 我方的履历即是最佳的样本。

他从小学画画,考上了伦敦艺术大学,作念过游戏主意推测打算师,作念过 3D 动画师,咫尺又酿成了 AI 导演。每一次转型,上一个妙技看起来王人被“替代”了,他不再需要花几百个小时手动建模、手动上色、手动改换画。

然则他之前蕴蓄的审好意思判断、叙事智力、对画面的领悟,莫得一样被浪掷。

致使不错说,这些看不见的蕴蓄恰正是他能把 AI 用好的原因。

他之是以知说念哪种敷陈神态更眩惑东说念主,知说念如何用音乐改换情感,知说念 80 分的画面和 60 分的永诀在哪,全靠那些“被替代”的年初里攒下来的东西。

包括《牌子》这个故事自己。

“警示牌带来弘大,emoji 重建疏通”这个灵感,不是 AI 从数据库里算出来的,是从康沃尔看不懂的路牌和土耳其出租车后座上迸发出来的。

AI 是能生成画面,但它莫得生计。没看过文书牌,没坐过那趟出租车,就写不出阿谁故事,更没法用情感弧线、记号叙事、镜头语言去组成了一个完满的导演意图,去打动千千万万东说念主。

就像 DiDi_OK 说,他之是以可爱在 B 站发作品,是因为弹幕,“一个作品加入了寰球统共东说念主的想法之后,才算是老成完成”,寰球的想法亦然 AI 没法给到的东西。

是以 AI确凿替代的东西是什么?

是那些你花在机械奉行上的时分。建模、渲染、调参数、一帧一帧修动画,这些事 AI 确乎越来越颖悟。但你脑子里那套判断系统,不雅众在这个节点需要什么情感,AI 还作念不了。

软件行业也一样,AI出来后,产物想维、领悟意图、要道方案是缔造者们的要点。

前两天差评君我方用 AI 写了两个 App,功能确乎能跑,但交互逻辑稀碎。DiDi_OK 听完也说了一句:一个很顶尖的门径员,他是会比我多出相当多的软件想维、产物想维。

Node.js 之父 Ryan Dahl 本年 1 月也在 X 上写了句话:东说念主类写代码的时期照旧废除了,不是说工程师没活干了,是“径直写语法”这件事不再是重点。

不管是作念视频、写代码、画画,AI 替掉的恒久是并吞样东西:手上那些近似的机械服务。留住来的亦然并吞样东西:你脑子里那套审好意思、叙事、回味、判断系统。

在采访中 DiDi_OK 说了一句话,我以为不错拿来当这篇著述的废除——

AI正在把创造的权力璧还给东说念主。

{jz:field.toptypename/}

但我想补半句: 还给那些有智力接住的东说念主。

撰文:刺猬

剪辑:莽山烙铁头 面线

好意思编:素描

图片、云尔开首:DiDi_OK 提供

发布于:浙江省