废弃(2005)-支持文档__5.12短文本相似度接口-万维易源

[TOC] ###接口说明短文本相似度接口用来判断两个文本的相似度得分。 ####关于模型选择(请求参数中的model) 短文本相似度接口，可由用户自主选择合适的模型： **BOW（词包）模型** 基于bag of words的BOW模型，特点是泛化性强，效率高，比较轻量级，适合任务：输入序列的 term “确切匹配”、不关心序列的词序关系，对计算效率有很高要求； **GRNN（循环神经网络）模型** 基于recurrent，擅长捕捉短文本“跨片段”的序列片段关系，适合任务：对语义泛化要求很高，对输入语序比较敏感的任务； **CNN（卷积神经网络）模型** 模型语义泛化能力介于 BOW/RNN 之间，对序列输入敏感，相较于 GRNN 模型的一个显著优点是计算效率会更高些。 ###请求参数 <table><thead><tr><th>参数</th><th>类型</th><th>是否必须</th><th>描述</th></tr></thead><tbody><tr><td>text_1</td><td>string</td><td>是</td><td>待比较文本1，最大512字节</td></tr><tr><td>text_2</td><td>string</td><td>是</td><td>待比较文本2，最大512字节</td></tr><tr><td>model</td><td>string</td><td>否</td><td>默认为"BOW"，可选"BOW"、"CNN"与"GRNN"</td></tr></tbody></table> ###返回参数 <table><thead><tr><th>参数</th><th>描述</th><th>取值</th></tr></thead><tbody><tr><td>log_id</td><td>uint64</td><td>随机数，请求唯一标识码</td></tr><tr><td>score</td><td>float</td><td>相似度结果取值(0,1]，分数越高说明相似度越高</td></tr></tbody></table>