Skip to content

WordDictionary LoadDict Invalid line #13

@tangjialang

Description

@tangjialang

我在jieba文档上看到自定义词典的时候:词典格式和 dict.txt 一样,一个词占一行;每一行分三部分:词语、词频(可省略)、词性(可省略),用空格隔开,顺序不可颠倒。
但是我现在只有词语这时候就会导致WordDictionary在LoadDict的时候进行var tokens = line.Split(' ');的时候出现问题
if (tokens.Length < 2)
{
Debug.Fail(string.Format("Invalid line: {0}", line));
continue;
}
我尝试看了很多版本的jieba他们似乎没有这个问题并且兼容了:词语、词频(可省略)、词性(可省略)我不太清楚目前是无法做到还是因为写错了

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions