paCy是一个用Python和Cython进行高级自然语言处理的库。它建立在最新研究的基础上,从第一天起就被设计用于实际产品中。spaCy附带了预训练的管道,目前支持60多种语言的标记化和训练。它具有最先进的速度和用于标记、解析、命名实体识别、文本分类等的神经网络模型,使用诸如BERT之类的预训练变压器进行多任务学习,以及生产准备好的培训系统和简单的模型打包、部署和工作流管理。
软件特色
非破坏性标记化
指定实体的确认
预训练的统计模型和单词向量
迅猛的速度
强大的、经过严格评估的精度
简单的深度学习集成
语音部分标签
标签化依赖性解析
方便的字符串到哈希值映射
句法驱动的句子分割
内置的语法和NER的可视化工具。
高效的二进制序列化
Numpy数据数组导出
简单的模型包装和部署
支持50多种语言
软件评论 您的评论需要经过审核才能显示
网友评论