獨家獲悉,谷歌高級科學家、卡內(nèi)基梅隆大學(CMU)計算機學院兼職教授蔣路,已經(jīng)加入TikTok。
蔣路是谷歌 VideoPoet 項目負責人,VideoPoet 是谷歌在 2023 年 12 月推出的視頻生成大模型,類似 OpenAI 剛剛發(fā)布的 Sora。
近期,昆侖萬維創(chuàng)始人周亞輝在朋友圈表示,有個論文的作者加入字節(jié)北美做Tech Leader,正是指《VideoPoet: A large language model for zero-shot video generation》論文的作者蔣路。
資料顯示,蔣路先后在西安交通大學、布魯塞爾自由大學、卡內(nèi)基梅隆大學學習計算機,并先后進入微軟亞洲研究院、谷歌研究院、雅虎研究院實習。
2017 年,蔣路畢業(yè)后加入谷歌。他是谷歌云 AI 的創(chuàng)始成員,也是李佳博士和李飛飛博士首次聘請的研究員。此后,蔣路進入谷歌研究院工作。
蔣路的研究曾被應(yīng)用到谷歌多個產(chǎn)品,如 YouTube、云服務(wù)、云 AutoML、廣告、Waymo 和翻譯服務(wù),影響了全球數(shù)十億用戶的日常生活。
蔣路的工作在自然語言處理(ACL)和計算機視覺(CVPR)的頂級會議上被提名為最佳論文。他是研究社區(qū)的活躍成員,擔任美國國家種子基金(NSF SBIR)的 AI 評審專家,并定期擔任 CVPR、ICCV、NeurlPS、ACM Multimedia 和 AAAI 等著名會議的領(lǐng)域主席。
蔣路的研究興趣主要在多媒體交叉領(lǐng)域,他專注于生成式 AI 和視頻創(chuàng)作。2019 年起,他就開始嘗試將 Transformer 用在圖像、視頻生成研究上。
與 Sora 采用的 Diffusion + Transformer 架構(gòu)不同,蔣路負責的 VideoPoet 視頻生成模型采用了單 Transformer 架構(gòu),可以將任何自回歸語言模型或大型語言模型轉(zhuǎn)換為高質(zhì)量的視頻生成器,支持生成方形或縱向視頻,以針對短格式內(nèi)容定制生成視頻,并支持視頻輸入生成音頻。
VideoPoet 采用了名為 Tokenizer 的數(shù)據(jù)處理技術(shù),可以將視頻和音頻片段編碼為離散標記序列(discrete tokens),這些標記也可以被轉(zhuǎn)換回原始表示。其中,視頻和圖像數(shù)據(jù)使用名為 MAGVIT V2 的技術(shù),音頻數(shù)據(jù)使用 SoundStream 的技術(shù)。
VideoPoet 通過使用多個 Tokenizer 訓練一個自回歸語言模型,以學習跨視頻、圖像、音頻和文本模態(tài)。一旦模型根據(jù)某些上下文生成了標記,這些標記就可以通過分詞器解碼器轉(zhuǎn)換回可查看的表示。

3 周前,蔣路本人在職場社交平臺宣布了自己在谷歌的 Last Day,并特別表示對在谷歌所做的視頻生成項目(VideoPoet,MAGVIT,WALT等)感到自豪。
蔣路表示自己將繼續(xù)留在灣區(qū),開始視頻生成領(lǐng)域的新旅程。現(xiàn)在來看,新的旅程就是 TikTok。
值得一提的是,字節(jié)跳動已經(jīng)在大模型領(lǐng)域全面布局,模型層推出了自研的「云雀大模型」以及類 ChatGPT 對話機器人產(chǎn)品豆包。2023 年底,字節(jié)跳動成立新的 AI 應(yīng)用部門 Flow,并在海外推出了 Coze 等多款產(chǎn)品。抖音集團 CEO 張楠也于近期卸任,專注于 AI 工具剪映的發(fā)展。
字節(jié)跳動近期辟謠了推出中文版 Sora,并表示:“還無法完善產(chǎn)品落地,距離國外模型有很大差距。”但另一方面,字節(jié)跳動正在大力招攬人才。
大模型戰(zhàn)場,字節(jié)跳動將會如何攪局?
審核編輯:劉清
-
機器人
+關(guān)注
關(guān)注
213文章
31097瀏覽量
222361 -
計算機視覺
+關(guān)注
關(guān)注
9文章
1715瀏覽量
47639 -
OpenAI
+關(guān)注
關(guān)注
9文章
1245瀏覽量
10104 -
TikTok
+關(guān)注
關(guān)注
2文章
226瀏覽量
8284
原文標題:獨家:TikTok引入前谷歌VideoPoet負責人蔣路,發(fā)力AI視頻生成|甲子光年
文章出處:【微信號:jazzyear,微信公眾號:甲子光年】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
谷歌AI霸主歸來!多線反擊OpenAI,開啟安卓Gemini時代
邊緣AI算力臨界點:深度解析176TOPS香橙派AI Station的產(chǎn)業(yè)價值
放棄 14 億天價合同!前蘋果 AI 負責人龐若鳴棄 Meta 轉(zhuǎn)投 OpenAI
三星電子相關(guān)業(yè)務(wù)負責人一行到訪谷東智能參觀交流
OpenAI Sora 2模型上線微軟Azure AI Foundry國際版
看點:谷歌Veo 3.1迎來重大更新硬剛Sora 2 12英寸硅片國產(chǎn)龍頭西安奕材今日申購
中科創(chuàng)達亮相2025低空經(jīng)濟無人機行業(yè)應(yīng)用技術(shù)交流會
全球首個動漫專屬AI視頻生成平臺Animon,國內(nèi)版"萌動AI"正式發(fā)布
FF任命李雋擔任全球供應(yīng)鏈負責人
RK3576助力智慧安防:8路高清采集與AI識別
美國AI事務(wù)負責人警告:中國半導體設(shè)計能力最多只落后兩年!
4K、多模態(tài)、長視頻:AI視頻生成的下一個戰(zhàn)場,誰在領(lǐng)跑?
人形機器人遇阻?特斯拉“擎天柱”項目負責人離職
AKOOL發(fā)布全球首款實時攝像頭
安森美最新消息:安森美中國區(qū)汽車解決方案負責人吳桐博士出任I.S.I.G.中國區(qū)主席
TikTok引入前谷歌VideoPoet負責人蔣路,發(fā)力AI視頻生成
評論