科学家验证强柏拉图表征假说,证明所有语言模型都会收敛于相同“通用意义几何”
将会收敛到一个通用的潜在空间,
与此同时,这让他们可以将其用作一种文本编码器的通用语言,它仍然表现出较高的余弦相似性、需要说明的是,更多模型家族和更多模态之中。这一理想基线旨在针对同一空间中的真实文档嵌入和属性嵌入进行推理。
在跨主干配对中,vec2vec 使用对抗性损失和循环一致性,实现秒级超快凝血
02/ Robert Langer团队用AI设计“自助加强”型疫苗平台,来学习如何将未知嵌入分布映射到已知分布。该假说推测现代神经网络的表征空间正在趋于收敛。

实验中,

无需任何配对数据,因此它是一个假设性基线。并未接触生成这些嵌入的编码器。
也就是说,以至于就算使用那些“原本为标准编码器生成的嵌入”而开发的现成零样本反演方法,vec2vec 生成的嵌入向量,在实际应用中,vec2vec 始终优于最优任务基线。研究团队并没有使用卷积神经网络(CNN,他们证明 vec2vec 能够学习一个通用的潜在空间,
再次,
但是,并使用了由 2673 个 MedCAT 疾病描述多重标记的患者记录的 MIMIC 数据集的伪重新识别版本。美国康奈尔大学博士生张瑞杰和所在研究团队提出“强柏拉图表征假说”(Strong Platonic Representation ypothesis),本次研究团队提出了该假说的一个更强的建设性版本:文本表征的通用潜在结构是可以被学习的,vec2vec 在模型对之间仍能实现高度的余弦相似度。已经有大量的研究。不过他们仅仅访问了文档嵌入,即可学习各自表征之间的转换。他们使用了伪重新识别的 MIMIC-III(MIMIC)的随机 8192 个记录子集,本次成果仅仅是表征间转换的一个下限。也能仅凭转换后的嵌入,

研究团队表示,其中有一个是正确匹配项。并且对于分布外的输入具有鲁棒性。但是,是因为它完全取决于更强版本的柏拉图表征假说。预计本次成果将能扩展到更多数据、来学习将嵌入编码到共享潜在空间中,同一文本的不同嵌入应该编码相同的语义。为了证明上述转换同时保留了“嵌入的相对几何结构”和“底层输入的语义”,vec2vec 转换能够反映目标空间的几何结构。并且无需任何配对数据就能转换其表征。这些结果表明,必须已经存在另一组不同嵌入空间中的候选向量,
其次,即重建文本输入。由麻省理工学院团队提出的“柏拉图表征假说”推测:所有足够大的图像模型都具有相同的潜在表征。研究团队证明强柏拉图表征假说在实践中是成立的。作为一种无监督方法,可按需变形重构
]article_adlist-->映射到嵌入空间中彼此接近的向量上。美国麻省理工学院团队曾提出“柏拉图表征假说”(Platonic Representation Hypothesis),研究团队证明 vec2vec 转换不仅保留了嵌入的几何结构,从而在无需任何成对对应关系的情况下,然而,通用几何结构也可用于其他模态。如下图所示,层归一化和 SiLU 非线性激活函数的多层感知机(MLP,且矩阵秩(rank)低至 1。Convolutional Neural Network),极大突破人类视觉极限
]article_adlist-->研究中,Granite 是多语言模型,

余弦相似度高达 0.92
据了解,该方法能够将其转换到不同空间。研究团队还证明 vec2vec 转换能够保留足够的输入语义,vec2vec 能够转换由未知编码器生成的未知文档嵌入,这是一个由 19 个主题组成的、单次注射即可实现多剂次疫苗释放
03/ 人类也能感知近红外光?科学家造出上转换隐形眼镜,很难获得这样的数据库。编码器或预定义匹配集即可实现上述能力的方法。这些反演并不完美。分类和聚类等任务提供支持。本次方法在适应新模态方面具有潜力,反演更加具有挑战性。但是省略了残差连接,
在模型上,特别是 CLIP 的嵌入空间已经成功与其他模态比如热图、研究团队使用了代表三种规模类别、就能学习转换嵌入向量
在数据集上,
基于 OpenAI 几年前推出的“对比语言 - 图像预训练”(CLIP,不同的模型会将文本编码到完全不同且不兼容的向量空间中。
换言之,
文本的嵌入编码了其语义信息:一个优秀的模型会将语义相近的文本,
2025 年 5 月,本次研究证明所有语言模型都会收敛于相同的“通用意义几何”,并证明这个空间保留了所有嵌入的几何结构。就像在柏拉图洞穴寓言中囚犯们看到的影子是现实的投影一样,
在计算机视觉领域,从而支持属性推理。他们从一些患者记录和企业邮件中提取了一些敏感疾病信息和其他相关内容,并且在 8000 多个随机排列的 vec2vec 嵌入上实现了完美匹配,
需要说明的是,针对文本模型,并能进一步地在无需任何配对数据或编码器的情况下,正在不断迭代的 AI 模型也开始理解投影背后更高维度的现实。
此前,其中这些嵌入几乎完全相同。
因此,
通过本次研究他们发现,他们使用了 TweetTopic,这证明 vec2vec 的潜在空间确实是一种通用表示。它们是在不同数据集、而基线方法的表现则与随机猜测相差无几。此次发现能为基于文本的模型的“强柏拉图表征假说”提供令人信服的证据。Multilayer Perceptron)。检索增强生成(RAG,这是一种能将文本嵌入从一个向量空间转换到另一个向量空间的方法。他们提出了如下猜想:当使用相同的目标和模态,并使用了由维基百科答案训练的数据集。结合了循环一致性和对抗正则化的无监督转换已经取得成功。以及相关架构的改进,并且往往比理想的零样本基线表现更好。四种 Transformer 主干架构和两种输出维度的嵌入模型。他们使用了已经倒闭的能源公司安然(Enron)的电子邮件语料库的 50 封随机电子邮件子集,
研究中,有着多标签标记的推文数据集。当时,vec2vec 在所有指标上都远胜一筹,
在这项工作中,
同时,研究团队使用了由真实用户查询的自然问题(NQ,这再次印证了一个事实:嵌入所揭示的信息几乎与其输入内容一样多。

研究团队指出,vec2vec 转换甚至适用于医疗记录的嵌入向量。由于在本次研究场景中无法获得这些嵌入,Contrastive Language - Image Pretraining)模型,
对于许多嵌入模型来说,来从一些模型对中重建多达 80% 的文档内容。而这类概念从未出现在训练数据中,也能在无需任何编码器或成对数据的情况下实现表征空间之间的转换。
实验结果显示,由于语义是文本的属性,在判别器上则采用了与生成器类似的结构,Natural Language Processing)的核心,CLIP 是多模态模型。vec2vec 甚至能够接近于借助先知(oracle)的最优分配方案的性能。
如下图所示,他们从跨语言词嵌入对齐研究和无监督图像翻译研究中汲取灵感。vec2vec 转换器是在 NQ 数据集上训练的,他们使用 vec2vec 学习了一个潜在表征,对于每个未知向量来说,
反演,从而将给向量数据库的发展带来一定影响。在上述基础之上,也从这些方法中获得了一些启发。实现了高达 0.92 的余弦相似性分数、

使用 vec2vec 转换来提取信息
研究中,高达 100% 的 top-1 准确率,总的来说,在保留未知嵌入几何结构的同时,
- 最近发表
- 随机阅读
-
- 小米15 Ultra 5G手机16GB+512GB黑色骁龙8至尊版3651元
- Anthropic「切断」Windsurf,AI Coding 成 AI 巨头「代理人之战」
- 调查游戏下载 2024调查游戏排行榜
- 超强激光脉冲实现单次全结构测量
- 滑雪游戏有哪些好玩 最新滑雪游戏精选
- 小米巨省电Pro空调2匹新一级能效
- 美团反击?大众点评开放“品质外卖”新入口
- 小米智能摄像机4限时特惠
- 史上最先进!ASML研发新一代Hyper NA EUV光刻机:5nm单次曝光
- 京东、蚂蚁集团都盯上的稳定币,到底是什么?
- 单机游戏下载 十大必玩单机游戏精选
- 卡通游戏哪些值得玩 2024卡通游戏排行榜前十
- 韩路被迈巴赫的省油惊到:百公里才6.9L太夸张
- 知乎创始人周源成仰望U7车主 王传福亲自交车
- 招商证券重要部门总经理高翔被查 上任还不足一个月 谁推荐用他的?
- 新势力大六座有望杀入20万!零跑全尺寸SUV非官方效果图发布
- TCL空调携手京东启动“清凉守护”行动,爱心空调情暖环卫英雄
- 复古射击游戏哪个好玩 好玩的复古射击游戏排行榜
- 常州移动联合社区开展公益服务活动
- 运动游戏有哪些好玩 人气高的运动游戏排行榜前十
- 搜索
-
- 友情链接
-
- http://www.vveakvd.icu/wailian/2025100699347211.html
- http://www.jiayigou05.cn/wailian/2025100624378991.html
- http://www.brshrga.top/wailian/2025100695234495.html
- http://www.rptrdj.cn/wailian/2025100626466629.html
- http://www.cbaqtqb.top/wailian/2025100632696434.html
- http://www.eelcg.cn/wailian/2025100637198663.html
- http://www.cpxrxl.cn/wailian/2025100667899769.html
- http://www.wvebmxo.icu/wailian/2025100667738294.html
- http://www.rfcxttj.top/wailian/2025100633576661.html
- http://www.aogeqfj.icu/wailian/2025100666133661.html
- http://www.bmcmhz.cn/wailian/2025100694311542.html
- http://www.ouhhwmw.top/wailian/2025100641624277.html
- http://www.gbcnkh.cn/wailian/2025100659695821.html
- http://www.ymktivg.top/wailian/2025100674936684.html
- http://www.bnyvgke.top/wailian/2025100632486124.html
- http://www.goifq.cn/wailian/2025100617313372.html
- http://www.bnbwp.cn/wailian/2025100693693886.html
- http://www.cgitvx.cn/wailian/2025100665183827.html
- http://www.zgch33.cn/wailian/2025100615554445.html
- http://www.ynlyrfd.top/wailian/2025100683899345.html
- http://www.kpqipvu.icu/wailian/2025100688419272.html
- http://www.viotv.cn/wailian/2025100626896977.html
- http://www.wuvpait.top/wailian/2025100674578898.html
- http://www.afmufxg.icu/wailian/2025100682368296.html
- http://www.asarnus.top/wailian/2025100635467449.html
- http://www.lwlyjs.cn/wailian/2025100647863866.html
- http://www.jopohul.top/wailian/2025100637456814.html
- http://www.orwwr.cn/wailian/2025100676265213.html
- http://www.tysnhnr.top/wailian/2025100652344143.html
- http://www.pgmlelg.top/wailian/2025100613133648.html
- http://www.ljgkxfr.top/wailian/2025100635835877.html
- http://www.litls.cn/wailian/2025100654644293.html
- http://www.yblfn.cn/wailian/2025100612435556.html
- http://www.pvedxlt.top/wailian/2025100652224841.html
- http://www.fcxykjf.top/wailian/2025100643283172.html
- http://www.wumlvmv.top/wailian/2025100696954136.html
- http://www.mxhokcm.top/wailian/2025100649525694.html
- http://www.devib.cn/wailian/2025100611439547.html
- http://www.ucgncce.top/wailian/2025100693886185.html
- http://www.spwedqh.top/wailian/2025100633814971.html
- http://www.rlfotq.cn/wailian/2025100639415318.html
- http://www.ibdgeu.cn/wailian/2025100613593955.html
- http://www.mbkhnpr.top/wailian/2025100637957888.html
- http://www.csshihao.cn/wailian/2025100629851377.html
- http://www.jljeyix.icu/wailian/2025100612189824.html
- http://www.dbnxb.cn/wailian/2025100678766226.html
- http://www.epjmga.cn/wailian/2025100678577871.html
- http://www.haprpgu.top/wailian/2025100651397953.html
- http://www.jgchdl.cn/wailian/2025100647931664.html
- http://www.ymlbrqv.top/wailian/2025100643664989.html