废弃(2005)-支持文档

[TOC] ###接口说明 短文本相似度接口用来判断两个文本的相似度得分。 ####关于模型选择(请求参数中的model) 短文本相似度接口,可由用户自主选择合适的模型: **BOW(词包)模型** 基于bag of words的BOW模型,特点是泛化性强,效率高,比较轻量级,适合任务:输入序列的 term “确切匹配”、不关心序列的词序关系,对计算效率有很高要求; **GRNN(循环神经网络)模型** 基于recurrent,擅长捕捉短文本“跨片段”的序列片段关系,适合任务:对语义泛化要求很高,对输入语序比较敏感的任务; **CNN(卷积神经网络)模型** 模型语义泛化能力介于 BOW/RNN 之间,对序列输入敏感,相较于 GRNN 模型的一个显著优点是计算效率会更高些。 ###请求参数 <table><thead><tr><th>参数</th><th>类型</th><th>是否必须</th><th>描述</th></tr></thead><tbody><tr><td>text_1</td><td>string</td><td>是</td><td>待比较文本1,最大512字节</td></tr><tr><td>text_2</td><td>string</td><td>是</td><td>待比较文本2,最大512字节</td></tr><tr><td>model</td><td>string</td><td>否</td><td>默认为"BOW",可选"BOW"、"CNN"与"GRNN"</td></tr></tbody></table> ###返回参数 <table><thead><tr><th>参数</th><th>描述</th><th>取值</th></tr></thead><tbody><tr><td>log_id</td><td>uint64</td><td>随机数,请求唯一标识码</td></tr><tr><td>score</td><td>float</td><td>相似度结果取值(0,1],分数越高说明相似度越高</td></tr></tbody></table>