
全球东谈主民翘首以盼,终于在上个周末,把的翻译功能盼来了!

一些灵通步地和应知如下:
升级到最新版块
尝试修改我方的讲话建树,包括小红书建树和手机系统建树
目下只相沿单一讲话的翻译,若是是中英混杂,或者带多情态包,不成得胜触发
照旧没反映的话,有网友提议了「杀后台大法」:褒贬区任性发一句英文,然后退出后台,再再行灵通小红书,就会出现翻译功能

本文截图来自小红书用户,用户名如图所示,下同
太快了,小红书你有手速这样快的要领员干预公司,tt 用户暗意,从来没见过速率这样快的更新,这即是听说中的中国速率吗?

全宇宙东谈主民王人很雀跃,除了有谈辞书。

天然短短一周时代就上线,但翻译的阐述荒芜的好,这下跨国冲浪的确如有神助。

什么 u1s1 啦,yyds 啦,cpdd 啦,这些基于拼音的缩写透澈能准确强健,何况标注出来。

有一说一,隔邻共事暗意她王人不知谈 cpdd 是什么意思——东谈主类不如 GPT 的又一铁证。

小红书你到底是在作念翻译照旧在作念梗百科!
这一波的额外后果是,趁便把方言也给翻译了。

以致若是原文中有诞妄,不仅不会影响翻译,小红书还会贴心注解好。

你是真是为了我学英语在谈判,泪目。
很显豁,此次小红书翻译功能的背后有着 大讲话模子的相沿,网友们迫不足待地运转了对背后模子的调戏。
比如先淡淡作念个翻译,然后写几行诗。

还有淡淡作念个翻译之后,回来一下今天的新闻。

以致还有打出一串摩斯电码让它翻译的——这里是小红书,不是《风声》啊。

片面告示:目下最强的多功能翻译软件是小红书。
大讲话模子处置翻译任务,天然照旧很好使了,然则落在小红书这样践诺无比丰富的社交平台上,照旧有好多挑战。
讲话的万般性即是最具有挑战性的。一些文化特定的术语、习尚抒发或比方,如谚语、俚语,难以准确翻译。
还有一些东谈主名、昵称,模子可能无法很好地分离哪些词需要翻译,哪些词需要保留。
比如这里的「orange man」告成译成了「橙东谈主」,其实这里指的是特朗普。

在准确性除外,普通用户比较难感知到的是翻译所需要的联想资源。
在小红书这样践诺非常丰富的平台上,用户可能只发几个字母,也可能长至几百字的札记。比拟之下,长践诺的翻译会占用更多资源,加多系统负载。
同期,各个国度的用户王人进驻之后,时分离散庸俗,导致系统险些莫得低负载时代。
比及双方王人睡醒了,短短的时区重合区间内,翻译肯求量可能顿然激增,系统需要在短时代内处置无数并发肯求,对并发处置才略是很大的教训。
预判异日,小红书这波在大气层
目下还莫得准确的音尘指出新的翻译功能背后,到底调用的是什么模子。在一些网友的「逼问」之下,似乎是 GPT。

还有的网友「逼问」出来是智谱。

抛开幻觉不谈,考 虑到老本问题,还真不好说用的是什么。 GPT 参数目大,联想老本高,不允洽部署在资源受限的环境中。
比较可行的一种计谋,是经受一个学生模子,并把 GPT 动作西宾模子进行 蒸馏。学生模子泛泛参数目更少,推理速率更快,但尽量保留西宾模子的才略。
恰恰,这种阶梯关于小红书而言,约略更有把抓。
小红书对大讲话模子、多模态等 AI 本领的探索,早就运转了,仅仅一直侧重于算法优化。也曾也作念过一些小小的 AI 功能,咱们之前写过不少。
很少东谈主知谈的是,在 2024 年年头的 AAAI 上,小红书的搜索算法团队,就针对大模子蒸馏提议过一个新想路。

这是一个全新框架, 在蒸馏大模子推理才略的经过中充分哄骗负样本常识。
「负样本」是一个很有趣的成见。传统蒸馏一般只爱护正样本,这并不难清楚:敦厚涵养生,细目是教正确的解题步地,让学生去清楚和师法。
不外,全球上学时细目也有作念过「错题集」,把我方犯过的错、掌抓得不够牢的场地记载下来。 这些错题即是「负样本」,在小红书的褒贬区,那些不够准确的翻译,即是负样本。
比如底下这个「fair point」,是在翻译功能上线之前,这个译文就太机翻了。在这个褒贬区里,翻译成「有益思意思」更合适。

就像「错题」里也包含着蹙迫的信息同样, 「负样本」能够匡助学生模子识别哪些揣摸是不正确的,增强其鉴识才略、擢升对发愤样本的处置,同期能够在复杂的讲话抒发中,保持一致性。
打个比方,目下你想要和番邦友东谈主们褒贬区对线——啊不,对账——一些欢喜联系的词语可能会出现。

比如银行 bank 这个词可能融会常出现,但它还有别的意思:「河床」,同期它还不错动作动词使用。
通过负样本学习,即是在磨砺模子识别多义抒发,校阅翻译逻辑,生成更天然的践诺。
负样本的上风还体目下对小语种的相沿。要知谈,此次不仅仅好意思国用户,还有全球各个场地的用户王人涌上来:塞尔维亚、秘鲁,澳洲某些地区的原住民。

通过哄骗负样本(包括翻译诞妄的常见模式),学生模子能够识别并消亡高频诞妄,擢升低资源讲话的翻译才略。
小红书团队提议的这个框架, 是一种对蒸馏的改进应用,那时是为了从大讲话模子中索求复杂推理的才略并挪动到专科化小模子当中。至于具体不错完成什么任务那时并不明晰,起码看上去,翻译并不是重心。
那时约略没东谈主知谈这个框架,在一年之后,会为小红书成为海酬酢流的桥梁带来匡助。
照旧那句老话:契机持久留给有准备的东谈主。
Powered by 开云官网kaiyun切尔西赞助商 「中国」官方网站 登录入口 @2013-2022 RSS地图 HTML地图