废弃(2005)-支持文档

[TOC] ###接口说明 向用户提供分词、词性标注、专名识别三大功能;能够识别出文本串中的基本词汇(分词),对这些词汇进行重组、标注组合后词汇的词性,并进一步识别出命名实体。 ####词性缩略说明 <table><thead><tr><th><strong>词性</strong></th><th><strong>含义</strong></th><th><strong>词性</strong></th><th><strong>含义</strong></th><th><strong>词性</strong></th><th><strong>含义</strong></th><th><strong>词性</strong></th><th><strong>含义</strong></th></tr></thead><tbody><tr><td>n</td><td>普通名词</td><td>f</td><td>方位名词</td><td>s</td><td>处所名词</td><td>t</td><td>时间名词</td></tr><tr><td>nr</td><td>人名</td><td>ns</td><td>地名</td><td>nt</td><td>机构团体名</td><td>nw</td><td>作品名</td></tr><tr><td>nz</td><td>其他专名</td><td>v</td><td>普通动词</td><td>vd</td><td>动副词</td><td>vn</td><td>名动词</td></tr><tr><td>a</td><td>形容词</td><td>ad</td><td>副形词</td><td>an</td><td>名形词</td><td>d</td><td>副词</td></tr><tr><td>m</td><td>数量词</td><td>q</td><td>量词</td><td>r</td><td>代词</td><td>p</td><td>介词</td></tr><tr><td>c</td><td>连词</td><td>u</td><td>助词</td><td>xc</td><td>其他虚词</td><td>w</td><td>标点符号</td></tr></tbody></table> ####专名识别缩略词含义 <table><thead><tr><th><strong>缩略词</strong></th><th><strong>含义</strong></th><th><strong>缩略词</strong></th><th><strong>含义</strong></th><th><strong>缩略词</strong></th><th><strong>含义</strong></th><th><strong>缩略词</strong></th><th><strong>含义</strong></th></tr></thead><tbody><tr><td>PER</td><td>人名</td><td>LOC</td><td>地名</td><td>ORG</td><td>机构名</td><td>TIME</td><td>时间</td></tr></tbody></table> ###请求参数 <table><thead><tr><th><strong>参数名称</strong></th><th><strong>类型</strong></th><th><strong>详细说明</strong></th></tr></thead><tbody><tr><td>text</td><td>string</td><td>待分析文本,长度不超过20000字节</td></tr></tbody></table> ###返回参数 <table><thead><tr><th>参数名称</th><th>类型</th><th><strong>必需</strong></th><th>详细说明</th></tr></thead><tbody><tr><td>text</td><td>string</td><td>是</td><td>原始单条请求文本</td></tr><tr><td>items</td><td>array of objects</td><td>是</td><td>词汇数组,每个元素对应结果中的一个词</td></tr><tr><td>+item</td><td>string</td><td>是</td><td>词汇的字符串</td></tr><tr><td>+ne</td><td>string</td><td>是</td><td>命名实体类型,命名实体识别算法使用。词性标注算法中,此项为空串</td></tr><tr><td>+pos</td><td>string</td><td>是</td><td>词性,词性标注算法使用。命名实体识别算法中,此项为空串</td></tr><tr><td>+byte_offset</td><td>int</td><td>是</td><td>在text中的字节级offset</td></tr><tr><td>+byte_length</td><td>int</td><td>是</td><td>字节级length</td></tr><tr><td>+uri</td><td>string</td><td>否</td><td>链指到知识库的URI,只对命名实体有效。对于非命名实体和链接不到知识库的命名实体,此项为空串</td></tr><tr><td>+formal</td><td>string</td><td>否</td><td>词汇的标准化表达,主要针对时间、数字单位,没有归一化表达的,此项为空串</td></tr><tr><td>+basic_words</td><td>array of strings</td><td>是</td><td>基本词成分</td></tr><tr><td>+loc_details</td><td>array of objects</td><td>否</td><td>地址成分,非必需,仅对地址型命名实体有效,没有地址成分的,此项为空数组。</td></tr><tr><td>++type</td><td>string</td><td>是</td><td>成分类型,如省、市、区、县</td></tr><tr><td>++byte_offset</td><td>int</td><td>是</td><td>在item中的字节级offset</td></tr><tr><td>++byte_length</td><td>int</td><td>是</td><td>字节级length</td></tr></tbody></table>