设为首页收藏本站language 语言切换
查看: 1081|回复: 1
收起左侧

自然语言处理工具 OpenNLP 1.8.0 发布啦!

[复制链接]
发表于 2017-5-30 21:11:40 | 显示全部楼层 |阅读模式

导读
Apache OpenNLP 1.8.0 发布了,OpenNLP 是一个机器学习工具包,用于处理自然语言文本。支持大多数常用的 NLP 任务,例如:标识化、句子切分、部分词性标注、名称抽取、组块、解析等。
此版本带来了许多新功能、改进和错误修复。API 已经得到改进以获得更好的一致性,并且删除了许多不被赞同的方法。

更新如下:
  • POS Tagger context generator now supports feature generation XML
  • Add a Name Finder feature generator that adds POS Tag features
  • Add CONLL-U format support
  • Improve default Name Finder settings
  • TokenNameFinderEvaluator CLI now support nameTypes argument
  • Stupid backoff is now the default in NGramLanguageModel
  • Language codes now are ISO 639-3 compliant
  • Add many unit tests
  • Distribution package now includes example parameters file
  • Now prefix and suffix feature generators are configurable
  • Remove API in Document Categorizer for user specified tokenizer
  • Learnable lemmatizer now returns all possible lemmas for a given word and pos tag
  • Lemmatizer API backward compatibility break: no need to encode/decode lemmas anymore, now LemmatizerME lemmatize method returns the actual lemma
  • Add stemmer, detokenizer and sentence detection abbreviations for Irish
  • Chunker SequenceValidator signature changed to allow access to both token and POS tag

免费提供最新Linux技术教程书籍,为开源技术爱好者努力做得更多更好,开源站点:http://www.linuxprobe.com/

您需要登录后才可以回帖 登录 | 论坛注册

本版积分规则

QQ|Archiver|手机版|小黑屋|sitemap|鸿鹄论坛 ( 京ICP备14027439号 )  

GMT+8, 2025-3-13 19:08 , Processed in 0.310079 second(s), 23 queries , Redis On.  

  Powered by Discuz!

  © 2001-2025 HH010.COM

快速回复 返回顶部 返回列表