大语言模型
大语言模型相关内容
用通俗语言解释大模型随机性原理
你有没有发现问大模型的同一个问题,它每次的答案都不一样。接下来这个视频我会用小学生都能听懂的话给大家来解释清楚大模型的随机性原理。其实核心因素啊就是采样策略和温度参数。比如说你也能跟朋友吹牛了,我们先... 详情 >
探索大语言模型底层原理,分享优质课程干货
最近打算把大语言模型的底层原理都再了解一下。看了很多的教程发现一个问题。比如说我想了解transformer,很多的教程会上来给你讲这张图是什么意思,太抽象了,根本无法想象。直到我遇到了大神Andrea APPCY的这门课... 详情 >
大模型语言结构与人类大脑的关联及特质
大模型或许有类似人脑的语言结构,这个结构仅占大模型体量的1%,但如果遭到破坏,大模型会和人类一样失去语言能力,而且是包括了语言识别和书写两项能力。在复旦大学最新公开的实验中,他们通过解码包括ChatGPT在内... 详情 >
乐高语言大模型:拓展多模态能力的创新探索
让大模型像乐高积木一样拓展各种多模态能力。字节跳动的新论文脑洞大开提出了乐高语言大模型,通过捕捉输入数据的局部信息,实现对图像、视频和音频等多模态数据的精确理解和定位。为了实现这一目标,研究者设计了一... 详情 >
字节跳动raft研究助力大型语言模型解决数学问题
众所周知,AI在一些数学题目总会犯蠢,比如鸡兔同笼或者逻辑问题。现在字节跳动推出了名为raft的研究,用于增强大型语言模型在数学问题解决任务中的推理能力。Raft方法首先通过监督微调对模型进行预热,然后利用在线... 详情 >
OpenAI凌晨发布重大消息,新大语言模型OE实力惊人
紧急大消息,OpenAI凌晨毫无预告的突然发布了传说中的草莓,赶紧来了解一下,一起试试。先说一下新的OE是史上第一个用强化学习训练让他能在内部去执行深度的链式思考的大语言模型,完全颠覆了之前所有的大模型规则。... 详情 >
缺席大模型,苹果到底在等什么?2023年大模型玩家都追GPT - 4
# 苹果缺席大模型的现状剖析在当今全球科技领域,大模型正以前所未有的速度蓬勃发展。众多科技巨头纷纷投身其中,掀起了一场激烈的竞争热潮。OpenAI 的 GPT-4 等模型在自然语言处理等诸多领域展现出强大的能力,成为... 详情 >
中美模型大战:国产开源大模型与GPT的较量
中美模型大战一年,国产开源大模型能硬肛GPT4的仅两家。网友Jenny统计模型排行榜IMSYS checkbox上去年5月到今年4月的排行数据,将所有开源大模型的数据用可视化的形式呈现,让网友直观看到哪些开源大模型能正面硬刚G... 详情 >
大模型做数学题的严重幻觉问题及国产模型测试情况
大模型做数学题有严重幻觉问题,十个国产模型仅一个答对《大模型数学题攻略:应对幻觉问题与提升解题能力》在当今数字化时代,大模型在诸多领域展现出强大功能,但在做数学题时却暴露出严重问题。十个国产大模型用简... 详情 >
北大自研AI视频物理大模型进展及Magic time模型介绍
北大带头对标OpenAI自研国产AI视频物理大模型,进展加快。先升级到1.0支持10秒生成视频,现又推出magic time新型时间缩放视频生成模型。该模型通过学习真实世界的时间缩放视频实现变形视频生成,适应open solar使用... 详情 >
