UNPKG

760 BTypeScriptView Raw
1import { SubSModuleTokenizer } from '../mod';
2import { IWord, IDICT } from '../Segment';
3export declare class ChsNameTokenizer extends SubSModuleTokenizer {
4 protected _TABLE: IDICT<IWord>;
5 name: string;
6 _cache(): void;
7 /**
8 * 对未识别的单词进行分词
9 *
10 * @param {array} words 单词数组
11 * @return {array}
12 */
13 split(words: IWord[]): IWord[];
14 /**
15 * 匹配包含的人名,并返回相关信息
16 *
17 * @param {string} text 文本
18 * @param {int} cur 开始位置
19 * @return {array} 返回格式 {w: '人名', c: 开始位置}
20 */
21 matchName(text: string, cur?: number): IWord[];
22}
23export declare const init: typeof SubSModuleTokenizer.init;
24export default ChsNameTokenizer;