登錄

選單
当前位置:首页 >> 行業動態

OpenAI發布text-to-video新項目Sora
OpenAI releases text-to-video model: Sora

發佈日期:2024-3-11

海擇短評 Haize Comment

近期OpenAI公示了由文字轉視訊的新項目Sora,在其以生成式AI的項目ChatGPT影響世界後,量變產生質變,Sora再次震驚全球。除了現有的文字轉視訊的創業項目將多數陣亡之外,海擇資本認為,這也將為旅遊行業帶來新的行銷方式,Airbnb的Chesky此前談的視訊應用場景,輪廓已無比明確。


本次Sora展現的demo結果,先不論提示詞的長短,基本已展現OpenAI遠較競品文字轉視訊創業項目更優質的產出。從視角看,它能做到長鏡頭、無人機、超近距離等視角;從表現風格看,有2D卡通、3D貼圖、真人;從描繪場景看,有車輛運行、旅遊街景、人物交流,可以理解為不同提示詞代表的各式視角、風格、場景,都能被完整刻畫。


而從產出的解析度看,此前各式相關項目,無論是Runway、Pika或是Stable Difussion,大體都是1秒-5秒的產出,且物體的邊緣、生成畫面的連貫性,都可以看出基於算法產生的模糊與變化。而Sora一次給到長達60秒的1080P畫面,還能做到複雜的鏡頭切換,這意味著此前無大公司背景的文本轉視訊創業項目,下輪融資大概率會無以為繼。


貼近真實的視訊,是否意味著旅遊也將被替代?這問題在AR與VR盛行時各被討論過一次。海擇資本認為,剛好相反,過往,越是稀有與獨特的旅遊體驗,越是只能靠口耳相傳或是文字論述來理解,現在通過文字轉視訊,旅行者能更直觀的理解極地、跳傘、潮間帶、深海等各種畫面,這會更觸動人的旅遊靈感,更想親身經歷一切。Chesky曾說Airbnb想提供給物業業主的是類似這樣的宣傳工具,讓業主能很好的將住宿與體驗結合,推薦給旅行者,看來他的預想將在不遠之日實現。

----------

Recently, OpenAI launched a new project named Sora, which transforms text into video, following the global impact of its generative AI project, ChatGPT. Haize Capital believes that this will not only lead to the demise of many existing text-to-video startups but also introduce new marketing approaches to the tourism industry. The video application scenarios previously discussed by Airbnb's Chesky have now become distinctly clear.


The demo results showcased by Sora, regardless of the prompt length, have demonstrated OpenAI's superior quality output compared to competitors. From a cinematographic perspective, it can achieve long shots, drone views, and extreme close-ups; in terms of style, it supports 2D cartoons, 3D stickers, and live-action; and from a scene depiction viewpoint, it can illustrate vehicle movement, travel street views, and interpersonal communication. This indicates that various perspectives, styles, and scenes represented by different prompts can be fully depicted.


Looking at the output resolution, previous related projects like Runway, Pika, or Stable Diffusion generally produced 1-second to 5-second videos, where the edges of objects and the continuity of generated scenes revealed the blurriness and variations typical of algorithm-based creations. In contrast, Sora delivers up to 60 seconds of 1080P video in one go, even achieving complex camera transitions. This suggests that text-to-video startups without major corporate backing will likely face challenges in securing further funding.


Does the realism of video mean tourism could be replaced? This question was discussed during the rise of AR and VR. Haizei Capital believes the opposite is true. In the past, rare and unique travel experiences could only be conveyed through word of mouth or written descriptions. Now, with text-to-video technology, travelers can get a more intuitive understanding of scenes like the polar regions, skydiving, tidal zones, and deep sea, which can inspire a greater desire to experience these adventures firsthand. Chesky has mentioned that Airbnb aims to provide property owners with such promotional tools to better integrate accommodation with experiences for travelers, suggesting his vision could soon become a reality.

----------

생성식 AI 프로젝트인 챗GPT가 전 세계적으로 큰 호응을 얻은 데 이어 '오픈AI(OpenAI)'는 최근 '소라(Sora)'라는 새로운 프로젝트를 선보였다. 이 프로젝트는 텍스트를 비디오로 변환한다. 하이저 캐피털은 이것이 많은 기존 문자 전환 동영상 스타트업의 소멸을 초래할 뿐만 아니라 여행업에 새로운 마케팅 방식을 도입할 것이라고 생각한다. Airbnb의 Chesky가 이전에 토론했던 동영상 응용 장면은 이제 더욱 분명해졌다.


Sora가 보여준 시연 결과는 제시어의 길이와 관계없이 OpenAI의 출력 품질이 경쟁사보다 우수하다는 것을 증명했다. 영화 촬영의 관점에서 볼 때, 그것은 긴 렌즈, 드론 뷰 및 초근접 클로즈업을 구현할 수 있다. 스타일에서는 2D 캐릭터, 3D 스티커, 진인을 지원한다. 장면 묘사의 측면에서 볼 때 차량 운동, 여행 거리 풍경과 사람이 교류하는 장면을 만들 수 있다. 이는 서로 다른 제시어 아래의 다양한 시각, 스타일, 장면이 생성식 AI에 의해 완전하게 드러날 수 있음을 보여준다.


출력 해상도로 볼 때, Runway, Pika 또는 Stable Difussion과 같은 이전의 관련 프로젝트는 일반적으로 1초에서 5초의 비디오를 제작하며 알고리즘을 기반으로 생성된 물체의 가장자리와 장면의 일관성은 명확하게 흐려지고 변화한다. 이에 비해 Sora는 60초 분량의 1080P 동영상을 한 번에 제공하며 복잡한 렌즈 변환까지 가능하다. 이는 대기업의 지원이 없는 문자 전환 동영상 스타트업이 추가 융자를 받는 데 도전에 직면할 수 있음을 보여준다.


현실에 가까운 동영상은 여행도 대체될 수 있다는 것을 의미하는가? 이 문제는 AR과 VR이 흥기할 때 논의된 것이다. 하이저 캐피털은 상황이 정반대라고 생각한다. 과거에는 희귀하고 독특한 여행 체험을 구두나 서면으로만 느낄 수 있었다. 이제 문자 전환 비디오 기술이 있으면 사용자는 극지 지역, 스카이다이빙, 조석대와 심해 등의 장면을 더욱 직관적으로 이해할 수 있다. 이것은 사용자들이 이러한 모험을 직접 체험하고 싶어하는 더 큰 여행 욕구를 불러일으킬 수 있다. Chesky는 Airbnb의 목표는 업주에게 이러한 홍보 도구를 제공하여 업주가 숙박과 여행 체험을 결합하여 여행객에게 더 잘 추천할 수 있도록 하는 것이라고 언급했다. Chesky의 비전은 곧 현실이 될 것으로 보인다. 

                                                                        

標籤 Label OpenAI  AI  Sora  Text-to-video  Tourism 

Copyright @2020 Haize Capital