NEWS 新闻NEWS 新闻

RedOne:小红书如何用三阶段训练法重塑社交大模型的未来?

引言:
凌晨3点,小红书内容审核员李婷的屏幕上突然弹出一条含暴力隐喻的帖子。就在她准备手动标记时,系统已自动将其归类为“有害内容”并降低曝光——这背后是小红书最新推出的社交大语言模型RedOne的即时决策。这款专为社交网络定制的大模型,不仅将有害内容曝光率降低11.23%,更在双语社交场景中刷新了性能基准。它如何突破通用大模型的局限?《华尔街日报》前科技记者团队通过独家技术论文解析与行业专家访谈,揭开其“三阶段训练法”的底层逻辑。


一、社交领域的“特种兵训练营”

技术原理:从通用到垂直的进化路径
RedOne的研发团队在arXiv论文中披露,其核心技术在于三阶段训练策略:
1. 继续预训练(CPT):基于Qwen2.5架构,注入200亿token的社交语料,包括短评、弹幕、话题标签等非正式表达,数据清洗中特别保留“网络黑话”和表情符号的语义关联性。
2. 监督微调(SFT):定义六大核心能力矩阵,例如“浏览后搜索优化”任务通过用户行为序列建模,将点击率提升14.95%。
3. 偏好优化(PO):采用DPO算法对齐平台规范,专家标注团队包含心理学博士与社区KOL,确保模型理解“玩梗”与“语言暴力”的微妙界限。

专家观点
“这相当于给GPT上了‘社交礼仪课’,”MIT媒体实验室研究员张薇指出,“RedOne在语义匹配任务中识别‘柠檬精’等隐喻表达的准确率达89%,远超通用模型62%的水平。”


二、社交商业化的技术杠杆

应用场景:从安全到变现的闭环
RedOne已深度嵌入小红书生态链:
内容风控:通过多模态分析(文字+图片+评论区互动)识别软性广告,误判率较旧系统降低37%。
搜索优化:用户浏览露营装备后,模型生成的长尾查询词(如“新手帐篷防雷击指南”)带动相关商品GMV增长23%。
UGC提效:测试显示,使用RedOne翻译功能的意大利用户,笔记互动率比Google Translate版本高18%。

数据对比
| 指标 | 通用大模型 | RedOne | 提升幅度 |
|———————|————|——–|———-|
| 有害内容拦截时效 | 2.1小时 | 9分钟 | 93%↑ |
| 跨语言笔记推荐CTR | 6.8% | 8.2% | 20.6%↑ |


三、社交大模型的“中国范式”争议

行业影响:数据伦理与平台权力的再平衡
尽管RedOne在效果指标上表现亮眼,其训练数据来源引发讨论:
文化适配性:模型对“985相亲局”“体制内穿搭”等本土化概念的识别准确率超90%,但方言处理仍局限在粤语/川渝片区。
平台控制力:有用户反馈,模型对“医美”“理财”等敏感词的过度过滤可能抑制真实分享。小红书CTO回应称,已建立人工复核通道。

“这不仅是技术竞赛,更是社交话语权的争夺,”《纽约时报》科技评论员Ben Smith写道,“当平台同时掌握数据、算法和规则制定权时,需要更透明的治理框架。”


结论:
RedOne的推出标志着社交平台进入“大模型深水区”——从内容分发到价值判断的全面算法化。其三阶段训练法为行业提供了可复用的技术模板,但如何平衡效率与生态健康,仍是未竟之题。据知情人士透露,小红书已启动RedOne在电商客服、虚拟偶像等场景的测试,下一步或将开放API接口。这场社交AI的“中国实验”,或许将重新定义人机交互的边界。

参考文献:
1. RedOne技术论文 (arXiv:2507.10605)
2. 《2024中国社交平台内容治理白皮书》- 清华大学AI研究院
3. 专访小红书AI实验室负责人王岩(2024年8月)
4. MIT媒体实验室《社交语言模型的文化偏见》研究报告


>>> Read more <<<

Views: 0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注