OpenNLP
Apache OpenNLP库是一个基于机器学习的自然语言文本处理的开发工具包,它支持自然语言处理中一些共有的任务,例如:標記化、句子分割、詞性標注、固有實體提取(指在句子中辨認出專有名詞,例如:人名)、淺層分析(句字分塊)、語法分析及指代。這些任務通常都需要較為先進的文字處理服務功能[1] [2]。
開發者 | Apache软件基金会 |
---|---|
首次发布 | 2004年4月22日 |
当前版本 | 2.3.0(2023年8月3日 | )
源代码库 | |
编程语言 | Java |
操作系统 | 跨平台 |
类型 | 自然語言處理 |
许可协议 | Apache许可证第二版 |
网站 | opennlp |
參考資料
编辑- ^ Apache OpenNLP Website. [2012-04-20]. (原始内容存档于2012-04-13).
- ^ Apache OpenNLP Proposal. [2012-04-20]. (原始内容存档于2012-04-19).
參看
编辑- 非結構化信息管理架構(Unstructured Information Management Architecture,UIMA)
- 一般文字工程架構(General Architecture for Text Engineering,GATE)
- cTAKES