资讯频道
您的位置:>> 广东经济网首页 > 资讯频道 > 正文 >

腾讯混元大模型重磅升级:文生视频能力上线并开源

2024-12-03 15:32:01 来源:广东经济网  繁体 复制  

  12月3日,腾讯宣布其自主研发的混元大模型正式上线全新能力——文生视频。这一突破性技术允许用户仅通过一句话就能生成高质量的视频内容,并且该模型已经全面开源,为开发者社区提供了丰富的资源支持。

  技术创新引领未来

  腾讯混元视频生成大模型是当前视频开源模型之一,拥有高达130亿参数量。该模型不仅在Hugging Face平台及GitHub上发布了完整的模型权重、推理代码以及详细的算法文档,还免费提供给企业和个人开发者使用。这标志着腾讯致力于推动AI技术的开放共享,鼓励更多创新应用的诞生。

  强大性能与广泛应用

  混元视频生成大模型具备强大且实用的功能特性。目前,腾讯混元视频生成大模型支持中英文双语输入,能够处理多种视频尺寸和清晰度要求。无论是冲浪、跳舞等动态场景,还是需要精细呈现的小人脸或高速镜头,该模型都能生成自然流畅且高质量的视频内容。其采用的DiT架构经过多处升级,包括新一代文本编码器的引入,增强了对复杂指令的理解和执行能力;统一的全注意力机制确保了每帧视频之间的平滑过渡,同时支持多视角镜头切换的一致性和连贯性;先进的图像视频混合VAE(3D变分编码器)则进一步提升了细节表现力。

  促进生态繁荣

  此次开源不仅为研究者们提供了宝贵的实验平台,也为创意产业带来了新的机遇。通过接入腾讯混元视频生成大模型,开发者可以轻松构建基于文本描述自动生成视频的应用程序,从而大大降低视频制作成本,提高效率。此外,腾讯鼓励开发者围绕此模型开发各类插件,以丰富其应用场景,共同打造一个充满活力的技术生态系统。

  展望未来

  随着人工智能技术的不断进步,腾讯将继续加大对AI领域的投入,探索更多可能性。随着这一技术的广泛应用与深度挖掘,预计将在影视制作、社交内容创作等多个行业掀起创新浪潮,重塑内容生产的生态格局,未来其在推动数字化创意产业发展方面的潜力值得持续期待与深入关注。

  本网声明:广东经济网发布此文仅出于信息分享,并非赞同其观点或证实其描述,不承担侵权行为的连带责任。文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。版权归原作者所有,如涉版权或来源标注有误,请联系我们删除。本网原创内容未经书面授权,任何单位或个人不得转载和摘编。

[ 编辑: NO 09 ]

  • 广州地铁十二号线稳步推进,多段轨行区顺利移交运营调试

    广州地铁十二号线稳步推进,多段轨行区顺利移交运营调试

      近日,广州地铁十二号线取得重大进展。在完成浔峰岗至云溪公园(不含)轨行区、槎头车辆段的热滑试验后,顺利实现 “三查看全文>>

  • 广州地铁十二号线迎来关键节点,稳步推进运营调试

    广州地铁十二号线迎来关键节点,稳步推进运营调试

      2025年初,广州地铁建设传来好消息,随着十二号线浔峰岗至云溪公园(不含)轨行区及槎头车辆段热滑试验的顺利完成,该段线查看全文>>

  • 微信视频号解锁 “斗图” 新玩法,情绪表达再升级

    微信视频号解锁 “斗图” 新玩法,情绪表达再升级

      随着互联网的发展和移动社交平台的普及,人们越来越倾向于使用表情符号和表情包来辅助文字表达自己的情绪和态度。在查看全文>>

  • 网站首页 - 关于我们 - 服务条款 - 合作咨询 - 联系我们 - 网站地图 - 法律声明 - 合作伙伴 - 公益活动 - 网站帮助 - 返回顶部

    本网所刊载信息,不代表本网观点。刊用本网稿件,务必书面授权。

    欢迎您访问广东经济网,如需合作,请点击QQ在线咨询

    未经书面授权禁止复制或建立镜像,违者必究。

    广东经济网  版权所有