所有人的开源艺术仪器

阿里巴巴推出了一种开源人工智能模型WAN2.1-VACE,旨在撼动我们如何创建和编辑视频。

魏斯没有从空中出现;这是WAN2.1 VAN2.1视频模型的更广泛家庭的一部分。他们对此提出了相当大胆的陈述,并指出这是“行业中的第一个开源模型,以便为生成和编辑视频的各种任务提供一个解决方案。”

如果阿里巴巴可以通过将用户从一个简化的集中器方向操纵几个单独的工具来删除,那么这可能是对游戏的真正重新思考。

那么这件事实际上可以做什么呢?好吧,对于初学者来说,他可以使用所有类型的技巧拍摄视频,包括文本命令,一动不动的图片,甚至其他视频剪辑的片段。

但这不仅是从头开始创建视频。编辑工具支持指向AI领导的图像或特定帧的链接,扩展视频“重新启动”(在第二秒内进行了更多内容),设置了您现有视频的新片段,甚至扩展了视频。阿里巴巴认为,这些功能“提供了各种任务的灵活组合,以提高创造力”。

一个插图显示了具有开源代码VAN2.1-VACE(视频多合一创建和编辑)的AI模型。

想象一下,您想创建一个带有特定角色交互的视频,可能是根据您的一些照片。魏斯声称他可以做到这一点。您是否有一动不动的图像?带有开源代码的AI模型阿里巴巴可以添加自然运动以恢复它。

对于那些喜欢Thin Tuning的人,我之前提到的那些“打破视频”的高级功能。这包括诸如从一个主题到另一个主题的传播,对运动的准确控制,调整深度的感知甚至颜色的变化。

引起我注意的功能之一是它可以“在视频的选择性特定区域中保持添加,修改或删除而不会影响环境”。这是详细权利的巨大优势 – 当您只是试图配置一个小元素时,它不再是破坏背景的机会。此外,这可以更多地完成您的视频,甚至可以用适当的内容填充新空间,从而使所有内容看起来更丰富,更广泛。

您可以拍摄一张平坦的照片,将其变成视频,并在其中说对象,如何移动,伸展路径。您需要用其他内容更改字符或对象,您将作为链接提供什么?没有问题。复兴这些链接字符?制成。准确控制他们的姿势?你明白了。

阿里巴巴甚至举了一个开源模型的示例,该模型删除了一个高大,瘦的垂直图像,并在宽屏幕视频中以横向模式乘以它,自动添加新的蝙蝠,指的是其他图像或提示。这很整洁。

当然,魏斯不仅是魔术。有一些智能技术旨在应对视频编辑的频繁现实。关键部分是阿里巴巴导致视频状态单位(VCU),该单元“支持多模式输入的统一处理,例如文本,图像,视频和掩码”。

然后,他们称之为“适配器上下文的结构”。这种聪明的工程学“使用临时测量和空间测量的形式表示,引入了任务的各种概念”。实际上,考虑一下,让AI对视频中的时间和空间有一个很好的了解。

凭借所有这些智能技术,阿里巴巴认为魏斯将在多个领域受到打击。考虑一下社交网络上的快速片段,有吸引力的广告和营销内容,后期制作和电视的特殊特殊效果,以及创建用户教育和教育视频的特殊效果。

阿里巴巴制作带有开源的WAN2.1-VACE,以传播对AI的热爱

AI模型的创建通常是整个状态,需要巨大的计算能力和大量数据。那么,阿里巴巴用开源制作WAN2.1-VACE?这是一件大事。

阿里巴巴解释说:“开放访问有助于减少更多企业使用AI的障碍,这使他们能够创建高质量的视觉内容,以快速有效地有效地适应其需求。”

实际上,阿里巴巴希望允许更多的人(尤其是较小的企业和个体创作者),总结自己手中最高水平的情况,而不会违反银行。强大乐器的民主化始终是一个受欢迎的奇观。

他们不仅仅是抛出一个版本。对于那些具有严重权力的人来说,有140亿个参数的巨大型号,而更聪明的参数为13亿个,以较轻的设置。您可以立即免费带它们,通过开源代码Alibaba Cloud(模型)通过自己的社区来拥抱您的脸和Github。

(图片来源:www.alibabagroup.com)

参见: 根据人工智能扩散的规则,硬化芯片导出功能,美国蛤braks制动

想进一步了解人工智能和行业领导者的大数据吗? 检查在阿姆斯特丹,加利福尼亚和伦敦举行的AI和大数据博览会。全面的活动以及其他领先活动,包括智力自动化会议,Blockx,一周的数字化转型和网络安全以及云博览会。

基于Techforge在此处探索企业技术和网络研讨会的其他事件。

Source link

Scroll to Top