中文分词

最后更新于:2022-04-02 08:17:40

## 中文分词 ![](https://docs.gechiui.com/gc-content/uploads/sites/kancloud/a3/a1/a3a15ce27ec3644a5bc31775f3df0848_200x200.png) > 效率极高的中文分词接口,支持NLP智能分词 ## 接口费用( [点击购买](https://market.topthink.com/product/184)) > 最低 0.001元/次 ## 接口调用([调用须知](https://docs.topthink.com/think-api/1835086)) ## 接口1:中文抽取关键词 ### 请求地址 ``` GET https://api.topthink.com/word/segment ``` ### 请求参数 | 名称 | 类型 | 必填 | 说明 | | --- | --- | --- | --- | | appCode| string| 是|用户授权码,参考[API调用](https://docs.topthink.com/think-api/1835086) | | content| string | 是 | 内容| | num| string | 否 | 返回数量,默认为10,最大5100 ### 返回`data`参数 | 名称 | 类型 | 示例值 | 说明 | | --- | --- | --- | --- | |参考返回示例 ## SDK调用 ``` $client = new Client("YourAppCode"); $result = $client->wordSegment() ->withContent('今天我们去上海外滩和南京东路玩') ->request(); ``` 返回示例: ~~~ { "code":0, "message": "成功", "data": [ "上海", "外滩", "南京东路" ] } ~~~ ## 接口2:中文智能分词 NLP智能分词,快速把一段文本切分为一个个词组,并标注了词性。大文本分词时,应该使用post请求方式。且最大不能超过800个字符。 ### 请求地址 ``` GET https://api.topthink.com/word/nlp ``` ### 请求参数 | 名称 | 类型 | 必填 | 说明 | | --- | --- | --- | --- | | appCode| string| 是|用户授权码,参考[API调用](https://docs.topthink.com/think-api/1835086) | | content| string | 是 | 内容| ### 返回`data`参数 | 名称 | 类型 | 示例值 | 说明 | | --- | --- | --- | --- | | word | string | 今天 | 词语 | | word_tag | string | 132 | 词性代码 | | index | string | 0 | 标号索引 | 词性代码释义如下: | 名称 | 代码 | | --- | --- | | 数词(例如:100、一亿) | 90 | | 名词(例如:妈妈、老师、手机) | 95 | | 人名(例如:马化腾、马小姐、小天) | 96 | | 机构团体名(例如:腾讯公司、北大、中科院) | 97 | | 地名词(例如:上海、外滩、南京东路) | 102 | | 数词开头的名词(例如:一个好人、三个和尚) | 103 | | 以代词开头的名词(例如:该同学、某人) | 104 | | 动量词(例如:次、遍、趟) | 111 | | 时间量词(例如:年、月、日) | 112 | | 货币量词(例如:美元、英镑) | 113 | | 历史量词(例如:唐朝、清初) | 133 | | 谓词(例如:理发、洗澡) | 171 | | 不及物谓词(例如:腰酸、头疼) | 200 | ## SDK调用 ``` $client = new Client("YourAppCode"); $result = $client->wordNlp() ->withContent('今天小天和kitty去上海外滩和南京东路玩') ->request(); ``` 返回示例: ~~~ { "code":0, "message": "成功", "data": [ { "word": "今天", "word_tag": "132", "index": "0" }, { "word": "小天", "word_tag": "96", "index": "1" }, { "word": "和", "word_tag": "108", "index": "2" }, { "word": "kitty", "word_tag": "95", "index": "3" }, { "word": "去", "word_tag": "170", "index": "4" }, { "word": "上海", "word_tag": "102", "index": "5" }, { "word": "外滩", "word_tag": "102", "index": "6" }, { "word": "和", "word_tag": "108", "index": "7" }, { "word": "南京东路", "word_tag": "102", "index": "8" }, { "word": "玩", "word_tag": "170", "index": "9" } ] } ~~~
';