“別人家的股票”因為“別人家的女兒”站上了風口。
硅谷AI初創新星Pika爆火,不僅讓“女兒概念股”信雅達收獲兩個漲停,還將這股暖風吹到了A股AI應用板塊。
12月1日(周五)午后,昆侖萬維、萬興科技先后漲停,湯姆貓、福昕軟件、國脈文化等多只個股強勢上漲。
不過,信雅達在12月1日盤后再次發布公告:截至本公告日,公司沒有人工智能視頻生成類相關產品和業務;未投資Pika,也未與Pika有任何業務往來,Pika開發團隊創始人之一郭文景未在公司任職。
要充分理解這波“女兒概念股”效應的擴散,首先要理解Pika有何出眾之處。
回到故事的起點Pika,該公司首款產品Pika 1.0是一款視頻生成應用,于北京時間11月29日正式上線。通過輸入文字、圖片,Pika 1.0能夠生成不同風格的3D動畫、動漫、卡通和電影,并支持對于視頻實時編輯和修改。
“文生視頻”是這款應用的核心功能,它與“文生圖”的底層技術一致,但實現起來難度更高、成本更大,可以看作是文本生成圖像的進階版技術,兩者都屬于生成式AI的多模態應用。
可以說,Pika的強大功能再次喚起了市場對于AI應用的無限遐想,也點燃了沉寂已久的AI應用板塊。
▌多模態——AI應用場景拓展的關鍵
多模態指的是多種模態的信息,包括文本、圖像、視頻、音頻等。
AI領域研究一直致力于以技術實現計算機對于人類認知世界方式的高度效仿。人類具備視覺,聽覺,觸覺,味覺和嗅覺五種模態,單模態交互顯然是一個局限的、并不完整的模型。所以“多模態”研究的大勢所趨已十分明朗。
OpenAI發布的GPT-V4附帶語音和圖像處理功能,標志ChatGPT正式進入多模態時代,也向外界展示了這家AI龍頭公司打造多模態AI應用的決心。
與此同時,谷歌、Meta、微軟同樣投入人員和精力參與其中;xAI面向XPremium+用戶推出聊天機器人Grok未來也望發展圖像生成、圖像識別、語音識別等多模態能力……
對于公司而言,多模態能力提高了AI應用的泛化能力,是產品核心競爭力;對于產業而言,多模態是AI應用場景拓展的關鍵,而應用生態的完善將反哺上游,有望進一步推動硬件端迭代。
中信證券判斷,多模態會是推動本輪AI熱點繼續前進的下一個增長點。預計下一代多模態將會快速拓展目前大語言模型有限的應用場景,顯著提高語言模型的泛化能力,并有望在成本方面展現出對傳統專有模型的優勢,從而推動如AI Agent等應用的落地,進而推動自動駕駛、機器人等應用獲得革命性突破。
天風證券表示,多模態GPT-4V API開放,有望把現有的圖像、視頻等轉化為新的訓練數據,有望結合LBS、社交等誕生全新應用,而生態應用的發展將為硬件端發展提供有力支撐。
▌頭部公司尚未拉開身位 比賽才剛剛開始
盡管多模態被賦予了巨大的想象空間,但現實是,相關應用的優化迭代速度和商業化進程均較慢。
即便如Meta和谷歌這樣的硅谷人工智能巨頭,在文生視頻上同樣進展緩慢,它們分別推出的Make-A-Video和Phenaki均尚未公測;而前期火爆的文生圖領域,雖有Lensa AI、妙鴨相機等出圈,但營收持續增長能力仍待驗證。Lensa AI推出人像生成功能后,去年12月前12日內創收2930萬美元,但2023年7月全球收入已回落為100萬美元;妙鴨相機上線即火爆,半月營收估計超過29萬美元,后續須上線新模板、新玩法維持營收增長。
技術不成熟是所有公司面臨的共同問題。以文生視頻為例,其底層模型及技術仍在優化,未篩選出最優模型。這也導致當下的熱門應用,如RunwayGen-2、Zero Scope等存在一些共同問題:復雜人物動作生成幀連續效果較差;非日常場景的視頻架構能力連續能力一般;多主體視頻生成缺乏邏輯連續性等。
這也正是前文所述的Pika誕生的原因——創始人郭文景和同學認為Runway和Adobe Photoshop當時的AI工具并不算好用,才有了自己做類似工具的想法。頗有些“乾坤未定,你我皆是黑馬”的意味。
▌多模態AI應用將帶來哪些投資機會?
對于大模型來說,多模態生成要求的計算量、存儲量遠高于純文本模態。
中信證券表示,在傳統的純文字語言模型中,24MB的存儲空間可以處理約4000-6000個單詞。如果我們假設使用500個單詞來描述圖片中的全部信息,那么處理圖片所需的算力大約是處理文字的8-12倍。
這只是圖片模態和文本模態之間的比較,視頻生成應用的算力、存力需求比圖片生成應用更大。
基于此,AI多模態加速燃燒算力、存力,將為這兩大產業鏈帶來更大的想象空間。
國盛證券看好算力儲備大廠在多模態生成領域的發展,其以文生圖應用Midjourney為例,該應用日活達1500萬,年收入超1億美元,它推出的多版無限量套餐、高速GPU服務反映出市場對算力的巨大需求。該機構分析師認為,目前國內文生圖多為計次付費,尚未出現無限量套餐,或因算力受限,具有算力儲備的云服務廠商在發展視頻生成類應用上具有天然優勢。
從應用端來看,多模態AI工具有望賦能傳媒行業。
華西證券認為,AI天然具備情感陪伴屬性,多模態技術使其能力從文本互動擴大至影視生成。長城證券也表示,多模態能力的突破有助于拓展AI應用場景,傳媒行業中游戲、影視、廣告營銷、數字媒體等板塊均有望受益于AI多模態能力的提升。
國盛證券宋嘉吉旗幟鮮明地指出,AI文生視頻是多模態應用的下一站。該分析師稱,文生視頻技術的日趨成熟和廣泛應用,或將為當下熱門的短劇市場帶來變數,該技術有望極大降低短劇制作的綜合成本,為解決“重制作而輕創作”的共性問題提供解決方案,短劇制作的重心有望回歸高質量劇本創作。
(來源金融界)大眾商報(大眾商業報告)所刊載信息,來源于網絡,并不代表本站觀點。本文所涉及的信息、數據和分析均來自公開渠道,如有任何不實之處、涉及版權問題,請聯系我們及時處理。大眾商報非新聞媒體,不提供任何互聯網新聞相關服務。本文僅供讀者參考,任何人不得將本文用于非法用途,由此產生的法律后果由使用者自負。
如因文章侵權、圖片版權和其它問題請郵件聯系,我們會及時處理:tousu_ts@sina.com。
舉報郵箱: Jubao@dzmg.cn 投稿郵箱:Tougao@dzmg.cn
未經授權禁止建立鏡像,違者將依去追究法律責任
大眾商報(大眾商業報告)并非新聞媒體,不提供任何新聞采編等相關服務
Copyright ©2012-2023 dzmg.cn.All Rights Reserved
湘ICP備2023001087號-2