1 | import { SubSModuleTokenizer } from '../mod';
|
2 | import { IWord, IDICT } from '../Segment';
|
3 | export declare class ChsNameTokenizer extends SubSModuleTokenizer {
|
4 | protected _TABLE: IDICT<IWord>;
|
5 | name: string;
|
6 | _cache(): void;
|
7 | /**
|
8 | * 对未识别的单词进行分词
|
9 | *
|
10 | * @param {array} words 单词数组
|
11 | * @return {array}
|
12 | */
|
13 | split(words: IWord[]): IWord[];
|
14 | /**
|
15 | * 匹配包含的人名,并返回相关信息
|
16 | *
|
17 | * @param {string} text 文本
|
18 | * @param {int} cur 开始位置
|
19 | * @return {array} 返回格式 {w: '人名', c: 开始位置}
|
20 | */
|
21 | matchName(text: string, cur?: number): IWord[];
|
22 | }
|
23 | export declare const init: typeof SubSModuleTokenizer.init;
|
24 | export default ChsNameTokenizer;
|