语言无关 – “停止词”列表英文?

我正在为一些英文文本生成一些统计数据,我想跳过不感兴趣的单词,如“a”和“the”。

>哪里可以找到这些不感兴趣的话的列表?
这些单词的列表与英文中最常用的单词列表相同吗?

更新:这些显然被称为“停止词”而不是“跳过单词”。

放入Google的魔术词是“停止的话”。这个上升了a reasonable-looking list

MySQL也有一个built-in list of stop words,但这对我的口味来说太全面了。例如,在我们的大学图书馆,我们遇到了问题,因为“第三世界”的“第三”被认为是一个停顿词。

翻译自:https://stackoverflow.com/questions/1218335/stop-words-list-for-english

转载注明原文:语言无关 – “停止词”列表英文?