技术博客

春节科技新篇：小红书开源图像编辑技术引领SOTA新突破

春节期间，图像编辑技术迎来重要突破：小红书平台正式推出全新开源图像编辑技术，在多项基准测试中达到当前最高水平（SOTA），显著提升编辑精度与语义一致性。该技术聚焦AI生成内容的可控性与实用性，为开发者与创作者提供高效、透明、可复现的工具链，迅速成为AI图像生成领域极具竞争力的新力量。

图像编辑小红书AI生成开源技术SOTA

2026-02-13

AI赋能笔记革命：Obsidian打造全新知识管理体验

在提升笔记效率的探索中，Obsidian结合AI技术提供了一种全新的解决方案。通过AI赋能，Obsidian能够一键生成Canvas和小红书风格的笔记，显著简化了知识整理与视觉化表达的过程。相比传统笔记工具功能单一、需手动绘图与排版的局限，该组合支持自动构建知识图谱与思维导图，大幅提升工作与学习中的信息组织效率，推动个人知识管理体系迈向智能化。

ObsidianAI笔记知识图思维导图小红书

2026-01-19

CrossVid：引领多模态大型语言模型视频推理新篇章

小红书技术团队近日推出了一项名为CrossVid的全新基准测试，旨在全面评估多模态大型语言模型（MLLMs）在跨视频推理任务中的表现。该基准测试通过设计一系列综合性题目，有效挑战模型在复杂视频内容理解、时序逻辑推理及跨片段语义关联等方面的能力，推动多模态AI技术的发展。目前，CrossVid的全部测试代码与数据集均已开源，向全球研究者和开发者开放使用，助力学术界与工业界共同提升视频理解模型的性能与应用水平。

CrossVid小红书多模态视频推理开源

2025-12-05

小红书算法新突破：EGMN视频时长预估方法的创新与影响

小红书推荐算法团队在2025年RecSys会议上提出了一种创新的视频时长预估模型EGMN，该方法基于指数-高斯先验分布，有效提升了视频消费时长的预测精度。凭借其在真实业务场景中的显著效果与理论创新性，该论文荣获最佳论文提名，展现了小红书在推荐系统前沿研究中的技术实力。

小红书算法视频时长EGMNRecSys

2025-11-14

小红书DeepEyesV2：图像理解迈向工具协同的新篇章

2024年上半年，小红书技术团队正式推出DeepEyesV2，标志着其在多模态智能领域的重大突破。该技术不仅实现了从“看图思考”到“工具协同”的演进，更在图像理解能力上实现了质的飞跃。通过深度融合视觉识别与外部工具调用能力，DeepEyesV2能够主动分析图像内容并联动相关服务完成复杂任务，显著提升了内容理解与用户交互的智能化水平。这一进展体现了小红书在AI驱动内容生态建设方面的前瞻性布局，也为多模态人工智能的发展提供了新的实践路径。

小红书DeepEyesV2图像理解工具协同多模态

2025-11-13

NIPS 2025大会：小红书InstanceAssemble算法引领文本生成图像扩散新篇章

在NIPS 2025会议上，小红书智创AIGC团队提出了一种名为InstanceAssemble的新算法，该技术在文本生成图像扩散模型领域实现了重要突破。通过引入布局控制（Layout-to-Image, L2I）机制，InstanceAssemble显著提升了图像生成过程中对物体位置、比例与空间关系的精确控制能力，解决了传统方法中语义与布局错位的问题。该方法不仅增强了生成图像的结构合理性，也为复杂场景的精准构建提供了新思路，推动了AIGC在内容创作领域的应用边界。

NIPS2025小红书InstanceAssemble布局控制文本生成

2025-11-04

InstanceAssemble算法：引领小红书图像生成新篇章

在NIPS2025会议上，小红书智创AIGC团队提出了一种名为InstanceAssemble的新算法，专注于图像的可控生成技术。该算法通过精细化控制图像元素的布局与组合，显著提升了图像生成的质量与效率，尤其适用于平台用户在文字发布过程中对高质量配图的即时需求。InstanceAssemble融合了语义理解与实例级编辑能力，实现了更精准的内容生成，在AIGC领域展现出强大的应用潜力。目前，该技术已逐步应用于小红书的内容创作生态，助力用户提升视觉表达效果。

图像生成可控技术InstanceAssembleAIGC小红书

2025-11-04

AI热点

2026-05-28

数据传输效率之争：JSON、Protobuf与MessagePack的全面对比

科技热点

数据传输效率之争：JSON、Protobuf与MessagePack的全面对比