废弃(2005)-支持文档

[TOC] ###接口说明 依存句法分析接口可自动分析文本中的依存句法结构信息,利用句子中词与词之间的依存关系来表示词语的句法结构信息(如“主谓”、“动宾”、“定中”等结构关系),并用树状结构来表示整句的结构(如“主谓宾”、“定状补”等)。 --------- ####关于模型选择 依存句法分析接口,可由用户自主选择合适的模型: Query模型:该模型的训练数据来源于用户在百度的日常搜索数据,适用于处理信息需求类的搜索或口语query。 例如: "手机缝隙灰尘怎么清除" "百度智能云登陆首页" "给我订一张明天上海到北京的飞机票" Web模型:该模型的训练数据来源于全网网页数据,适用于处理网页文本等书面表达句子。 例如: "后台任务定义为某过程在用户当时未登录机器期间运行" "一般而言,股份的表现形式可以是股票、股权份额等等” "有两条途径可以让本土的商业智慧在西方发扬光大” ------------ ####词性取值范围 <table><thead><tr><th><strong>词性</strong></th><th><strong>含义</strong></th><th><strong>词性</strong></th><th><strong>含义</strong></th><th><strong>词性</strong></th><th><strong>含义</strong></th><th><strong>词性</strong></th><th><strong>含义</strong></th></tr></thead><tbody><tr><td>Ag</td><td>形语素</td><td>g</td><td>语素</td><td>ns</td><td>地名</td><td>u</td><td>助词</td></tr><tr><td>a</td><td>形容词</td><td>h</td><td>前接成分</td><td>nt</td><td>机构团体</td><td>vg</td><td>动语素</td></tr><tr><td>ad</td><td>副形词</td><td>i</td><td>成语</td><td>nz</td><td>其他专名</td><td>v</td><td>动词</td></tr><tr><td>an</td><td>名形词</td><td>j</td><td>简称略语</td><td>o</td><td>拟声词</td><td>vd</td><td>副动词</td></tr><tr><td>b</td><td>区别词</td><td>k</td><td>后接成分</td><td>p</td><td>介词</td><td>vn</td><td>名动词</td></tr><tr><td>c</td><td>连词</td><td>l</td><td>习用语</td><td>q</td><td>量词</td><td>w</td><td>标点符号</td></tr><tr><td>dg</td><td>副语素</td><td>m</td><td>数词</td><td>r</td><td>代词</td><td>x</td><td>非语素字</td></tr><tr><td>d</td><td>副词</td><td>Ng</td><td>名语素</td><td>s</td><td>处所词</td><td>y</td><td>语气词</td></tr><tr><td>e</td><td>叹词</td><td>n</td><td>名词</td><td>tg</td><td>时语素</td><td>z</td><td>状态词</td></tr><tr><td>f</td><td>方位词</td><td>nr</td><td>人名</td><td>t</td><td>时间词</td><td>un</td><td>未知词</td></tr></tbody></table> ------------ ####依存关系标识 句法依存关系接口可以解析出的依存关系标识如下: **1.定中关系ATT** 定中关系就是定语和中心词之间的关系,定语对中心词起修饰或限制作用。 如:工人/n师傅/n(工人/n ← 师傅/n)。 **2. 数量关系QUN(quantity)** 数量关系是指量词或名词同前面的数词之间的关系,该关系中,数词作修饰成分,依存于量词或名词。 如:三/m天/q(三/m ← 天/q)。 **3.并列关系COO(coordinate)** 并列关系是指两个相同类型的词并列在一起。 如:奔腾/v咆哮/v的怒江激流(奔腾/v → 咆哮/v)。 **4.同位关系APP(appositive)** 同位语是指所指相同、句法功能也相同的两个并列的词或词组。 如:我们大家 (我们 → 大家)。 **5.附加关系ADJ(adjunct)** 附加关系是一些附属词语对名词等成分的一种补充说明,使意思更加完整,有时候去掉也不影响意思。 如:约/d 二十/m 多/m 米/q 远/a 处/n (二十/m → 多/m,米/q → 远/a)。 **6.动宾关系VOB(verb-object)** 对于动词和宾语之间的关系我们定义了两个层次,一是句子的谓语动词及其宾语之间的关系,我们定为OBJ,在下面的单句依存关系中说明;二是非谓语动词及其宾语的关系,即VOB。这两种关系在结构上没有区别,只是在语法功能上,OBJ中的两个词充当句子的谓语动词和宾语,VOB中的两个词构成动宾短语,作为句子的其他修饰成分。 如:历时/v 三/m 天/q 三/m夜/q(历时/v → 天/q)。 **7.介宾关系POB(preposition-object)** 介词和宾语之间的关系,介词的属性同动词相似。 如:距/p球门/n(距/p → 球门/n)。 **8.主谓关系SBV(subject-verb)** 主谓关系是指名词和动作之间的关系。 如:父亲/n 逝世/v 10/m 周年/q 之际/nd(父亲/n ← 逝世/v)。 **9.比拟关系SIM(similarity)** 比拟关系是汉语中用于表达比喻的一种修辞结构。 如:炮筒/n 似的/u 望远镜/n(炮筒/n ← 似的/u)。 **10.时间关系TMP(temporal)** 时间关系定义的是时间状语和其所修饰的中心动词之间的关系。 如:十点以前到公司(以前 ← 到)。 **11.处所关系LOC(locative)** 处所关系定义的是处所状语和其所修饰的中心动词之间的关系,如:在公园里玩耍(在 ← 玩耍)。 **12.“的”字结构DE** “的”字结构是指结构助词“的”和其前面的修饰语以及后面的中心词之间的关系。 如:上海/ns 的/u 工人/n(上海/ns ← 的/u,的/u ← 工人/n)。 **13.“地”字结构DI** “地”字结构在构成上同DE类似,只是在功能上不同,DI通常作状语修饰动词。 如: 方便/a 地/u 告诉/v 计算机/n(方便/a ← 地/u,地/u ← 告诉/v)。 **14.“得”字结构DEI** 助词“得”同其后的形容词或动词短语等构成“得”字结构,对前面的动词进行补充说明。 如:讲/v 得/u 很/d 对/a(讲/v → 得/u,得/u → 对/a)。 **15.“所”字结构SUO** “所”字为一结构助词,后接一宾语悬空的动词做“的”字结构的修饰语,“的”字经常被省略,使结构更加简洁。 如:机电/b 产品/n 所/u 占/v 比重/n 稳步/d 上升/v(所/u ← 占/v)。 **16.“把”字结构BA** 把字句是主谓句的一种,句中谓语一般都是及物动词。 如:我们把豹子打死了(把/p → 豹子/n)。 **17.“被”字结构BEI** 被字句是被动句,是主语接受动作的句子。 如:豹子被我们打死了(豹子/n ← 被/p)。 **18.状中结构ADV(adverbial)** 状中结构是谓词性的中心词和其前面的修饰语之间的关系,中心词做谓语时,前面的修饰成分即为句子的状语,中心词多为动词、形容词,修饰语多为副词,介词短语等。 如:连夜/d 安排/v 就位/v(连夜/d ← 安排/v)。 **19.动补结构CMP(complement)** 补语用于对核心动词的补充说明。 如:做完了作业(做/v → 完)。 **20.兼语结构DBL(double)** 兼语句一般有两个动词,第二个动词是第一个动作所要表达的目的或产生的结果。 如:[7]曾经/d [8]使/v [9]多少/r [10]旅游/n [11]人/n [12]隔/v [13]岸/n [14]惊叹/v [15]!/wp(使 → 人/n ,/v使/v → 惊叹/v)。 **21.关联词CNJ(conjunction)** 关联词语是复句的有机部分。 如:只要他请客,我就来。(只要 ← 请 ,就 ← 来)。 **22.关联结构 CS(conjunctive structure)** 当句子中存在关联结构时,关联词所在的两个句子(或者两个部分)之间通过各部分的核心词发生依存关系CS。 如:只要他请客,我就来。(请 ← 来)。 **23.语态结构MT(mood-tense)** 汉语中,经常用一些助词表达句子的时态和语气,这些助词分语气助词,如:吧,啊,呢等;还有时态助词,如:着,了,过。 如: [12]答应/v [13]孩子/n [14]们/k [15]的/u [16]要求/n [17]吧/u [18],/wp [19]他们/r [20]这/r [21]是/v [22]干/v [23]事业/n [24]啊/u [25]!/wp([12]答应/v ← [17]吧/u,[21]是/v ← [24]啊/u)。 **24.连谓结构VV(verb-verb)** 连谓结构是同多项谓词性成分连用、这些成分间没有语音停顿、书面标点,也没有关联词语,没有分句间的逻辑关系,且共用一个主语。 如:美国总统来华访问。(来华/v → 访问/v)。 **25.核心HED(head)** 该核心是指整个句子的核心,一般是句子的核心词和虚拟词(<EOS>或ROOT)的依存关系。 如:这/r 就是/v恩施/ns最/d]便宜/a的/u出租车/n,/wp相当于/v北京/ns的/u “/wp 面的/n ”/wp 。/wp <EOS>/<EOS>(就是/v ← <EOS>/<EOS>) **26.前置宾语FOB(fronting object)** 在汉语中,有时将句子的宾语前置,或移置句首,或移置主语和谓语之间,以起强调作用,我认识这个人 ← 这个人我认识。 如:他什么书都读(书/n ← 读/v)。 **27.双宾语DOB(double object)** 动词后出现两个宾语的句子叫双宾语句,分别是直接宾语和间接宾语。 如:我送她一束花。(送/v → 她/r,送/v → 花/n)。 **28.主题TOP(topic)** 在表达中,我们经常会先提出一个主题性的内容,然后对其进行阐述说明;而主题部分与后面的说明部分并没有直接的语法关系,主题部分依存于后面的核心成分,且依存关系为TOP。 如:西直门,怎么走?(西直门 ← 走)。 **29.独立结构IS(independent structure)** 独立成分在句子中不与其他成分产生结构关系,但意义上又是全句所必需的,具有相对独立性的一种成分。 如:事情明摆着,我们能不管吗? **30.独立分句IC(independent clause)** 两个单句在结构上彼此独立,都有各自的主语和谓语。 如:我是中国人,我们爱自己的祖国。(是 → 爱) **31.依存分句DC(dependent clause)** 两个单句在结构上不是各自独立的,后一个分句的主语在形式上被省略,但不是前一个分句的主语,而是存在于前一个分句的其他成分中,如宾语、主题等成分。规定后一个分句的核心词依存于前一个分句的核心词。该关系同连谓结构的区别是两个谓词是否为同一主语,如为同一主语,则为VV,否则为DC。 如:大家/r叫/v 它/r “/wp 麻木/a 车/n ”/wp ,/wp 听/v起来/v 怪怪的/a 。/wp(叫/v → 听/v)。 **32.叠词关系VNV (verb-no-verb or verb-one-verb)** 如果叠词被分开了,如“是 不 是”、“看一看”,那么这几个词先合并在一起,然后预存到其他词上,叠词的内部关系定义为:(是1→不;不→是2) 。 **33.一个词YGC** 当专名或者联绵词等切散后,他们之间本身没有语法关系,应该合起来才是一个词。如:百 度。 **34.标点 WP** 大部分标点依存于其前面句子的核心词上,依存关系WP。 ###请求参数 <table><thead><tr><th><strong>参数名称</strong></th><th><strong>类型</strong></th><th><strong>是否必须</strong></th><th><strong>描述</strong></th></tr></thead><tbody><tr><td>text</td><td>string</td><td>是</td><td>待分析文本,长度不超过256字节</td></tr><tr><td>mode</td><td>int</td><td>否</td><td>模型选择。默认值为0,可选值mode=0(对应web模型);mode=1(对应query模型)</td></tr></tbody></table> ###返回参数 <table><thead><tr><th>参数名称</th><th>类型</th><th>详细说明</th></tr></thead><tbody><tr><td>log_id</td><td>uint64</td><td>随机数,本次请求的唯一标识码</td></tr><tr><td>id</td><td>int</td><td>词的ID</td></tr><tr><td>word</td><td>string</td><td>词</td></tr><tr><td>postag</td><td>string</td><td>词性,请参照下方<strong>词性(postag)取值范围</strong></td></tr><tr><td>head</td><td>int</td><td>词的父节点ID</td></tr><tr><td>deprel</td><td>string</td><td>词与父节点的依存关系,请参照下方<strong>依存关系标识</strong></td></tr></tbody></table>