模型架构

模型架构相关内容

腾讯开源会员文生图大模型,架构与能力介绍

腾讯开源15亿参数会员文生图大模型,采用与Sara一致的dt架构。从表现来看,会员文生图的中文理解能力估计是当下领先水平。这可能是国内用户离Sara最近的一次。并且混元文生图大模型还能跟混元大模型互相配合,实现与... 详情 >

开源版Sara架构视频生成模型open sofa 1.0介绍

没等来Sara的体验,却等来了开源版Sara。三月份最大惊喜来临,class VI团队开源了全球首个类Sara架构的视频生成模型open sofa 1.0,包括整个训练流程数据以及所有训练细节和模型权重。具体来看,open NORA1.0采用了t... 详情 >

AI绘画LCM架构助力二次元形象直播

由清华大学提出的AI绘画LCM架构掀起的风暴还在持续。日本一开发者利用LCM高速图生图的特性,成功实现LCM捕捉摄像头画面,然后生成更高清的二次元形象作为直播间播出的画面,画面中左边是假定的摄像头录取到的画面,... 详情 >

中美模型大战:国产开源大模型与GPT的较量

中美模型大战一年,国产开源大模型能硬肛GPT4的仅两家。网友Jenny统计模型排行榜IMSYS checkbox上去年5月到今年4月的排行数据,将所有开源大模型的数据用可视化的形式呈现,让网友直观看到哪些开源大模型能正面硬刚G... 详情 >

大模型做数学题的严重幻觉问题及国产模型测试情况

大模型做数学题有严重幻觉问题,十个国产模型仅一个答对《大模型数学题攻略:应对幻觉问题与提升解题能力》在当今数字化时代,大模型在诸多领域展现出强大功能,但在做数学题时却暴露出严重问题。十个国产大模型用简... 详情 >

北大自研AI视频物理大模型进展及Magic time模型介绍

北大带头对标OpenAI自研国产AI视频物理大模型,进展加快。先升级到1.0支持10秒生成视频,现又推出magic time新型时间缩放视频生成模型。该模型通过学习真实世界的时间缩放视频实现变形视频生成,适应open solar使用... 详情 >

街霸里大模型对打,小模型战神Linux moment 3V2.5惊艳登场

让大模型在街霸里打拳,GPT4表现不佳,小模型战神Linux moment 3V2.5脱颖而出。该项目测试大模型多模态能力,通过让模型读取画面输出指令操控角色对打,发现GPT4输给7B模型,GPT3.5被全面暴打。作者复盘发现硬件相同... 详情 >

缺席大模型,苹果到底在等什么?2023年大模型玩家都追GPT - 4

# 苹果缺席大模型的现状剖析在当今全球科技领域,大模型正以前所未有的速度蓬勃发展。众多科技巨头纷纷投身其中,掀起了一场激烈的竞争热潮。OpenAI 的 GPT-4 等模型在自然语言处理等诸多领域展现出强大的能力,成为... 详情 >

值得了解的十佳多模态模型:多模态大模型在AI领域的重要性与应用

# 多模态模型概述多模态模型是一种能够整合多种模态信息进行处理的人工智能模型。模态指的是信息的表现形式,如文本、图像、音频、视频等。传统的单一模态模型只能处理一种类型的信息,而多模态模型则打破了这种限制... 详情 >

图片转3D模型的进阶

说一下图片转3D模型的进阶。昨天不是说这个CSM可以通过一张效果图直接生成这种3D模型,但精度不太行,只能做个粗胚。因为昨天演示的是这个免费的低分辨率生成,这个没说清楚,我的错。其实你还可以进阶,用高分辨率... 详情 >